2016-08-13 4 views
1

Google Cloud Natural Language APIを使用して、テキストを分析し、品詞タグでラベル付けされた各単語を含む構文解析ツリーを返すことができます。Google Cloud Natural Language APIで複数形を見つける方法

名詞が複数であるかどうかを判断する方法はありますか?

GoogleクラウドNLは補題をうまくできるようであれば、おそらく情報がありますが、APIを通じて返しませんか?

答えて

4

更新

NL APIのGAの打ち上げでは、annotateTextエンドポイントは、今の単語は、単数、複数、またはデュアルであるかを示す各トークンについてnumberキーを返します。文について「いくつかの猫がここにありますが、」APIは「猫のための次のトークンのデータを返します(numberPLURALであることに注意):

{ 
     "text": { 
     "content": "cats", 
     "beginOffset": -1 
     }, 
     "partOfSpeech": { 
     "tag": "NOUN", 
     "aspect": "ASPECT_UNKNOWN", 
     "case": "CASE_UNKNOWN", 
     "form": "FORM_UNKNOWN", 
     "gender": "GENDER_UNKNOWN", 
     "mood": "MOOD_UNKNOWN", 
     "number": "PLURAL", 
     "person": "PERSON_UNKNOWN", 
     "proper": "PROPER_UNKNOWN", 
     "reciprocity": "RECIPROCITY_UNKNOWN", 
     "tense": "TENSE_UNKNOWN", 
     "voice": "VOICE_UNKNOWN" 
     }, 
     "dependencyEdge": { 
     "headTokenIndex": 1, 
     "label": "DOBJ" 
     }, 
     "lemma": "cat" 
} 

は完全なマニュアルhereを参照してください。

+0

この機能が追加されましたが、正しく機能しているかどうかわかりません。複数形を検出するのはひどいですね! 私はhttps://cloud.google.com/natural-language/ にAPIのデモに簡単な文章を入れて、それが間違った結果を与える時間のほとんどを試してみました。 朝食のためにバナナを食べました。バナナ=単色? 彼女はリビングのためにチェリーを選んだ。チェリー=シングルス? 電子が核を回る。 Electrons = SINGULAR? 確かにこれらは複数である必要がありますか? – user759885

2

NL APIをお試しいただきありがとうございます。

現在、基本単語が補題と異なり、複数であるかどうかを推測する以外に、複数形を検出するクリーンな方法はありません(英語では、-sで終わることもあります)。

はしかし、我々は複数のような形態学的情報を検出するより良い方法をリリースする予定なのでお楽しみに。

+0

モルフォロジーが生きている今、これを行う方法を説明するSaraのコメントを参照してください。 –

関連する問題