特殊なカテゴリが含まれているフレーズが大きい(650k)フレーズリストに含まれているかどうかをテストするにはどうすればよいですか?いくつかのワイルドカードを含む大きなリストのメンバーシップテスト
たとえば、フレーズ["he", "had", "the", "nerve"]
がリストに含まれているかどうかをテストしたいとします。それはありますが、["he", "had", "!DETERMINER", "nerve"]
の下にあります。"!DETERMINER"
は、いくつかの選択を含む単語クラスの名前です(a, an, the)
。私は約350の単語クラスを持っていて、そのうちのいくつかはかなり長いので、リスト内の各単語クラスが1つ(またはそれ以上)の単語クラスを列挙することは実現可能ではないと思います。
ゆっくりリストの中で作業する代わりに、これらのフレーズのセットを使用したいと思いますが、ワードクラスのばらつきにどう対処するかわかりません。私はこの比較を毎回数十回行う必要があるので、スピードはかなり重要です。スタートとして
うわー、それは素晴らしいです。どうもありがとう! –