PHPでYahoo!デベロッパーネットワークのテキスト解析 – キーフレーズ抽出をやってみた!

Yahoo!デベロッパーネットワーク(YDN)に登録してない場合は登録する

リクエストを送る時、アプリケーションIDが必須ですので、Yahoo!デベロッパーネットワークに登録してない場合は登録して、アプリケーションIDを手に入れます。

Yahoo!デベロッパーネットワーク - テキスト解析 - キーフレーズ抽出の詳細

Yahoo!デベロッパーネットワークにリクエストを送る

PHPを使うので、パラメーターに「php」をリクエスト、レスポンスはPHP Serializeで受け処理します。

リクエストURL

http://jlp.yahooapis.jp/KeyphraseService/V1/extract

必須パラメーター

  • appid アプリケーションID。
  • sentence 解析対象のテキストです。
  • output レスポンス形式。「php」を指定します。
[php] $baseurl = 'http://jlp.yahooapis.jp/KeyphraseService/V1/extract?'; $appid = 'あなたのアプリケーションID'; $sentence = '【新作】TANGO(タンゴ) 財布 W-DELIT-A [T067]【送料無料】'; //解析対象のテキスト $sentence = urlencode($sentence); //空白などをエンコードする $output='php'; // リクエストURL生成 $url = $baseurl . 'appid=' . $appid . '&sentence=' . $sentence . '&output=' . $output; //リクエストを送る $response = file_get_contents($url); //Serializeされたデータを元に戻す $data = unserialize($response); print_r($data); [/php]

レスポンス

Array
(
    [W-DELIT-A] => 100
    [T067] => 69
    [タンゴ] => 46
    [TANGO] => 41
    [送料無料] => 29
    [財布] => 27
    [新作] => 25
)
  • 数値のScoreは、重要度を示す目安の数値です。先頭のKeyphraseのScoreは100となり、以下相対的な重要度に応じて 100以下の値が割り当てられます。

レスポンスの処理

配列が返ってきたので、array_keysでキーだけ抜くなり、どうとでも処理できます。

「PHP」の関連記事