文字列の区切り文字に対して文を分割して単語の頻度を数える方法はありますか?Javaで複数の区切り文字で分割する
String delimiters = "\t,;.?!-:@[](){}_*/";
私のテキストファイルは次のとおりです。
Billy_Reeves
Smorz
Nationalist_Left_-_Youth
Ancient_Greek_units_of_measurement
Jiuting_(Shanghai_Metro)
Blodgett,_MO
Baekjeong
Matt_Brinkman
National_Vietnam_Veterans_Art_Museum
私は自分の解決策を見つける多分これは他の人のために参考になります:
BufferedReader br = null;
int index=0;
String sCurrentLine;
br = new BufferedReader(new FileReader(fileName));//file name with path
while ((sCurrentLine = br.readLine()) != null)
{
for(int i=0; i<sCurrentLine.length(); i++)
{
for(int j=0; j<delimiters.length(); j++)
{
if(sCurrentLine.charAt(i) == delimiters.charAt(j))
{
int startIndex = 0;
int endIndex = i;
String subStr=sCurrentLine.substring(0, endIndex);
String subStr2=sCurrentLine.substring(endIndex+1,sCurrentLine.length());
sCurrentLine = subStr.concat(subStr2);
}
}
}
}
何を試しましたか? – Thomas
これは私のクラウドコンピューティングの宿題です。私は、各行のすべての区切り文字(区切り文字として区切られています)を分割することによって、指定されたtxtファイルの単語の頻度をカウントするReduceの例をマップしようとしています。 –