テキストファイルの各文に含まれる単語の数と平均の長さを出力するには、Pythonを使用する必要があります。この割り当てにNLTKまたはRegexを使用することはできません。文中の単語を数えて平均化する
ファイル内の文は、ピリオド、感嘆符、または疑問符で終わります。ハイフン、ダッシュ、またはアポストロフィは文を終了しません。引用符は文を終わらせません。しかし、ある期間は文章を終わらせない。例えば、Mrs.、Mr.、Dr.、Fr.、Jr.、St.は、すべて一般的な略語である。例えば
入力テキストがある場合、:
"My name? Bob. Your name? Lily! Hi there"
...出力は次のようになります。
[(no. of words, mean length of words in sentence1),
(no. of words, mean length of words in sentence2),
...]
コード:
p= ("Mrs.","Mr.","St.")
def punct_after_ab(texts):
new_text = texts
for abb in p:
new_text = new_text.replace(abb,abb[:-1])
return print(new_text)
import numpy
def word_list(text):
special_characters = ["'",","]
clean_text = text
for string in special_characters:
clean_text = clean_text.replace(string, "")
count_list = [len(i) for i in clean_text.split()]
count = [numpy.mean(count_list)]
return print((count_list),(count))
しかし、私はこれをテストしたとき文を分割しません。
SOは無料のコーディングサービスではないため、この質問を議論の対象外としています。 – TigerhawkT3
あなたのためにいくつかのコードを書きたいと思うようです。多くのユーザーは、苦労しているコーダーのコードを作成したいと考えていますが、通常、ポスターが既に問題を解決しようとしているときにのみ役立ちます。この努力を実証する良い方法は、これまでに書いたコード、サンプル入力(もしあれば)、期待される出力、実際に得られる出力(出力、トレースバックなど)を含めることです。あなたが提供する詳細があれば、受け取る可能性のある回答が増えます。 [FAQ](http://stackoverflow.com/tour)と[How to Ask](http://stackoverflow.com/questions/how-to-ask)を確認してください。 – TigerhawkT3
私のコードを追加しましたが、何らかのガイダンスを探しています... – Bala