2017-04-14 3 views
0

hashtagを削除するには、ユーザーが&のURLをツイートから引用しています。 ツイート:Twitter4jライブラリ(評判分析)はこれらのノイズワードハットタグ、ユーザーのコメント&URLをツイートから削除するにはどうすればいいですか? Twitter4jライブラリ(センチメント解析)がこれらのノイズワードで正しく動作しない

例では正常に動作しません - こんにちは偉大な朝今日は@evilpriest @holysinner https://goo.le/asxmo/dataloadを#summermorning .......

は次のようになります。こんにちはおはようございます。今日はサマーマレーン

twitter4J自体に利用可能な方法やユーティリティはありますか?それとも独自のものを書く必要がありますか?ご案内ください。

+0

を独自の方法を記述する必要があります – FeanDoe

答えて

0

センテンス分析パイプラインで文を解析する前に正規表現を使用して#を除外します。 使用この:

String withoutHashTweet = originalTweet.replaceAll("[#]", ""); 

だから、「ハロー偉大な朝今日@evilpriest @holysinnerを#summermorning」返す必要があります:「こんにちは素晴らしい朝は今日@evilpriest @holysinnerをsummermorning」

は、同様にして、コードにハッシュを置き換え@それぞれの記号にそのような

0

何か削除するには:

let tweet = "@arthurlacoste check this link : http://lit.ly/hugeLink ! so #nsfw"; 

tweet = tweet.replace(/(?:https?|ftp):\/\/[\n\S]+/g, '') // remove links 
     //.replace(/\#\w\w+\s?/g, '') remove hashtags words 
     .replace('#', '') // remove hashtags only 
     .replace(/\@\w\w+\s?/g, ''); // remove mentions 

console.log(tweet); 

// output : "check this link : ! so nsfw" 
関連する問題