2012-04-13 1 views
4

これが可能かどうかはわかりませんが、いくつかの文章を分析して文章があるかどうかを判断する方法(あらかじめ書かれたライブラリまたは既知の科学的検出スキーム)韻?同僚は、最初と最後の単語を比較し、シソーラスを使用するように提案しましたが、それがどのように機能するかはわかりません。PHPで韻を検出するための英文テキストの分析

高精度は私が目指しているものではなく、20%の精度ですばらしいものになります。ちょっとしたウェブアプリケーションのアイデアのために、私は何も重要でないと思っていました。

私は他の言語を試してみたいと思っています。おそらく私が聞いたことのあるPythonでさえ、テキストの解析には最適ですが、PHPが望ましいでしょう。

+0

申し訳Hakre、はい英語テキストのみの。 –

答えて

6

Metaphoneのhttp://www.php.net/manual/en/function.metaphone.php

あなたは音声学(音)に入力を分類し、同じ音が頻繁に表示されるかどうかを確認できます。それぞれが音節と一致する必要があるので、既知のパターンに合っているかどうかを調べるために、レーベンシュタイン距離を計算することができます(一致の間の音節を数えます)。俳句。

http://www.php.net/manual/en/function.levenshtein.php

http://php.net/manual/en/function.soundex.php

+0

うわー、ちょうどうわー。私はPHP内に存在するそれらの機能についても知らなかった。私はあなたが何かここにいると思う。韻の根拠が類似した響きの単語であることを考慮すると、これらの3つの機能の組み合わせは実際に韻を検出するための非常に高い精度のレートをもたらすだろう。 –

+1

@Dwayne:サンドボックスだけのものであっても、何か起き上がればここにリンクを残しておいてください。 – hakre

+0

心配する必要はありませんハク、私はそれを計画していた。すでにドメイン名を購入済みです。私は毎日の作業を中断するのを助ける開発練習として週に1回1時間のアプリケーションを作成しようとしています。うまくいけばそれはうまくいくかもしれない、楽しいかもしれない。アイデアは、Twitterのつぶやきに基づいて韻を生成することです。 –

関連する問題