のリストの中で最もマッチした文字列検索するには:Pythonの:どのように私は私が必要なものを詳細に説明しよう弦
を私はfeedparserを使用してPythonでRSSフィードを解析しています。このフィードには、もちろん、一般的なRSSフィードと同様に、タイトル、リンク、説明付きの項目のリストがあります。
一方、アイテムの説明で見つけ出す必要のあるキーワードを含む文字列のリストがあります。
RSSフィード
<channel>
<item>
<title>Lion</title>
<link>...</link>
<description>
The lion (Panthera leo) is one of the four big cats in the genus
Panthera, and a member of the family Felidae.
</description>
</item>
<item>
<title>Panthera</title>
<link>...</link>
<description>
Panthera is a genus of the Felidae (cats), which contains
four well-known living species: the tiger, the lion, the jaguar, and the leopard.
</description>
</item>
<item>
<title>Cat</title>
<link>...</link>
<description>
The domestic cat is a small, usually furry, domesticated,
carnivorous mammal. It is often called the housecat, or simply the
cat when there is no need to distinguish it from other felids and felines.
</description>
</item>
</channel>
キーワードリスト
['cat', 'lion', 'panthera', 'family']
:私がする必要がどのような
は、ほとんどのキーワードマッチ
例を持っているアイテムを見つけるです
この場合、4つのキーワードがすべて含まれているため、(唯一の 'cat'ではなく 'cats'とは関係ありません。)リテラルキーワード
私はいくつかの説明に 'cat'キーワードが100回(他のキーワードはありません)含まれていても、ほとんどのキーワードを探しているのでこれは勝者にはならないことを明確にしましょう、キーワードが表示される回数はほとんどありません。
今、私はrss項目をループして、「手動で」、キーワードが表示された回数を数えます(ただし、上記の問題があります)。
私はPythonで非常に新しく、別の種類の言語(C#)から来ているので、これはかなり些細なことですが残念です。
どのようにこの問題にアプローチしますか?
以下の回答すべての偉大ですが、部分的な一致を注意してください( '' cat'の発生などconcatenate'、カウントしていますか?)と大文字( '猫を行います'合致としてカウントする、' CAT'についてはどうすればよい?) –
はい、 '連結'は 'cat'の出現としてカウントし、大文字と小文字を区別する必要はありません。警告をありがとう。 – emzero