RubyでWebページの本文抽出をするAPIをつくってみた
かなりシンプルですが,この記事のライブラリをWebAPIを通して利用できるようにしました.ブラウザ拡張とかで使うと便利だとおもいます.このライブラリは1.9系では動きませんが,ここを参考にパッチをあてたものを利用しています.
利用方法
リクエスト
APIのURL
VPSをリセットしたので今は以下のURLで叩けません!!!
http://extract_content_api.kitakee.net?url=本文抽出するWebページのURL
レスポンス
JSON形式
// 成功時 { status: "success", contents: [本文,] } // 失敗時 { status: "error", contents: null }
コード
Githubで公開しています. PullReqお待ちしております.
extract_content_api
TODO
- READMEをつくる
- HTMLを投げることができるように機能追加