2009-10-25 14 views
5

私はカンマで区切られた5000ワードを含む.csvファイル(words.csv)を持っています。ほとんどの文字列は繰り返し値です。グループとカウントの項目

私は次の操作を行うためにLINQを使用することができます:Appleは5回繰り返されており、バナナ3 times..itが表示されるかどうかを繰り返し言葉そう

のまとめ

A.グループ一般的な単語やショーの数を5
バナナ - -

リンゴとして

B.上の3 ので、重複を除い別のテキストファイルを作成します。

答えて

1

Linqには個別のキーワードがあります。

from word in words 
group word into occurrences 
select new 
{ 
    Word = occurrences.Key, 
    Count = occurrences.Count() 
} 

かで

"純粋な" C#メソッドの呼び出し::

http://www.shawson.co.uk/codeblog/linq-distinct/

6

確かに、ここではC#でLINQの構文です

words.GroupBy(w => w) 
    .Select(o => new 
        { 
        Word = o.Key, 
        Count = o.Count() 
        }); 

と言葉の明確なリストを作成するためには、あなたDistinct演算子を使用してください:

words.Distinct(); 
関連する問題