2016-12-01 3 views
2

基本的には、オブジェクトと直接オブジェクトの代名詞を動詞から分離することに問題があります。NLTKまたはPattern-esでスペイン語のテキストをトークン化する方法

これは理想的には2つの別個のエンティティとしてトークン化されるべきであり、「dimelo」は3つのトークン化されるべきである。私は両方の図書館でさまざまなタガを試しましたが、今のところ私が望む結果は得られていません。しかし、これは共通の問題でなければならないと確信しています。

答えて

関連する問題