2009-05-28 13 views
12

私は、いくつかのテキストを解析する方法を知るために、いくつかのサンプル行を供給する必要があるパーサーについて読んでいます。Pythonでパーサを学習する

可変部分が何であるかを知るために、2つの行の違いを判断するだけです。私はそれがPythonで書かれていると思ったが、わからない。誰が何のライブラリを知っていますか?

+0

非常に曖昧ですが、この質問にもかかわらず、非常に興味深いです。私はまた、そのような「自己学習型」パーサがあるかどうか不思議です(特にPythonで書かれている場合)。 – shylent

+0

私はそれが曖昧であることを知っていますが、私はそれについてもっと教えてくれる手がかりを持っていません。 – Ikke

+0

@shylentこの問題は公に利用可能なコードではないようですが、いくつかの研究が行われました:tinyurl.com/nrpmorのPDF、Sakakibaraの「文脈自由文法の効率的な学習」を参照してください。 –

答えて

10

おそらくあなたはTemplateMakerを意味し、より多くの(私はまだそれを試していないが、それはよく研究最長共通部分文字列アルゴリズムに基づいていますので、合理的に動作するはずです...あなたは別のことに興味があるなら複合語)に近づくと、「ラッパー誘導」または「テンプレート誘導」というクエリを使用して、Google Scholarで多くの資料を簡単に見つけることができます。

+0

ええ、これは私が見たものです。実際はパーサではありませんが、それは近いです;) – Ikke

2

Reverendと思われるかもしれませんか?

+0

いいえ、それは本当に探していたものではありません。 – Ikke