2016-08-30 6 views
-1

複雑な正規表現演算を使用して、名前、役割、指定をpythonで取り出すことは可能ですか?私は私の必要条件のために写真を添付し​​ました。 enter image description here正規表現で名前、電話番号、URL、ロールを取得

+1

正規表現操作でこれを達成する予定がある場合、なぜあなたの投稿に 'nltk'というタグを付けましたか? – lenz

+0

https://wit.ai/ – alvas

答えて

0

いいえ、実際の自然言語処理が必要です。

0

答えははいといいえです。

正規表現はパターンマッチングです。電話番号やURLのような特定のパターンに従っているものは、Regexを使って情報を抽出することができます。

を参照してください:アンカーとして使用される管理しやすいリストがある場合の役割&指定については

Regex for phone number

Regex for url

を、この情報を取得するために正規表現を使用することも可能です。

名前の取得は、データのキャプチャの仕方によっては難しくなります。私はスペースで区切られた最初の文字を大文字にした2つの連続した単語を探す簡単な例を共有しました。しかし、このパターンに従わないケースを含めるには、調整する必要があるかもしれません。

^([A-Z]\w+)\s([A-Z]\w+).*? 

だから要約すると、私はそうあなたが延びるが、それはしてもしなくてもよい、あなたが達成しようとしているものに応じて最善の解決策になるかもしれないいくつかの正規表現を使用することができると言うでしょう。

関連する問題