data-cleansing

    0

    2答えて

    私は特殊な文字のいくつかのジャンクアップデータをクリーニングしようとしていますが、いくつかはまだ通過します。以前は正規表現スニペットが見つかりましたが、アスタリスクのような文字は削除されません。は $clean_body = $raw_text; $clean_title = preg_replace("/[^!&\/A-Za-z0-9_ ]/","", $clean_body);

    4

    3答えて

    私はColdfusion 9最近(主にPHPのバックグラウンド)で作業していましたが、ユーザーが入力した入力/文字列をどのように 'きれいにする/消毒する'かを理解しようとしています。 私はそれをHTMLSAFEにしたいと思っています。いつものjavascriptやSQLクエリインジェクションを排除したいのです。 私は、すでにCF9に付属している何らかの機能を見逃してくれることを願っています。 誰

    0

    4答えて

    一部のデバッグ情報をExcelシートにコピーして貼り付けました。 しかし、1つの列のいくつかのセルにはいくつかの "奇妙な"文字が含まれています。 VBAを使用してそのような文字を削除する最も簡単な方法は何ですか?例を以下のリストに示します。 1 **'␁'** <- I'm trying to get rid of the part that I have bolded 2 '␂' 3 '␃

    2

    1答えて

    冗長な不良データを持つデータベースがあります。例として、記事の一部の名前には大文字の小文字の違いがあり、その他にはアクセントの問題、他は不足している文字などがあります。アイデアは、実際に同じdbレコードをマージすることです。 はそこに簡単にクリーンアップデータベース、理想的には、これは自動的に行われないことになるために許可するが

    2

    1答えて

    テキスト調査回答からウェブサイトを抽出する必要があります。アルゴリズムは広く一致する必要があります。例えば、「私のような患者」または「patientslikeme」は、「patientslikeme.org」として認識されるべきです。 以下のデータセットの回答を記載しました。私はこれを行うためのスクリプトを書き始めましたが、追加のフィルタと辞書を受け入れる堅牢なデザインパターンを使用していないこと