読者です 読者をやめる 読者になる 読者になる

kitak.blog

Kみたいなエンジニアになりたいブログ

RubyでWebページの本文抽出をするAPIをつくってみた

かなりシンプルですが,この記事のライブラリをWebAPIを通して利用できるようにしました.ブラウザ拡張とかで使うと便利だとおもいます.このライブラリは1.9系では動きませんが,ここを参考にパッチをあてたものを利用しています.

利用方法

リクエスト

APIのURL
VPSをリセットしたので今は以下のURLで叩けません!!!

http://extract_content_api.kitakee.net?url=本文抽出するWebページのURL

レスポンス

JSON形式

// 成功時
{
  status: "success",
  contents: [本文,]
}

// 失敗時
{
  status: "error",
  contents: null
}

コード

Githubで公開しています. PullReqお待ちしております.
extract_content_api

TODO

  • READMEをつくる
  • HTMLを投げることができるように機能追加