2016-05-23 4 views
0

Really Simple Traffic Loggerを使用して、Webサイトのユーザーが日付、タイムスタンプ、IPおよび訪問先サイトを保存しています。ExcelはURLパラメータを元にしてCSV形式で複製前に重複を自動的に削除する

"DATE","TIME","IP","LOOKING_FOR" 
"2016-05-22","07:30:40","XX.XX.XX.XX","/site.php?=dTM_c1_uid7" 
"2016-05-22","07:31:10","XX.XX.XX.XX","/site.php?=dTM_c1_uid7" 
"2016-05-22","07:31:19","XX.XX.XX.XX","/site.php?=dTM_c1_uid8" 

情報がCSV-に格納されています

http://www.domain.com/site.php?=dTM_c1_uid7 

dTM = customer, 
c1 = category 1, 
uid7 = uid for person 7 

保存されたCSVファイルには、以下が含まれます。ウェブサイトを訪問する各ユーザーは次の形式でURLにパラメータによってUIDが割り当てられ、ファイルでは、リアルタイムで別のスクリプトによって視覚化されるデータの結果を合計しようとしています。しかし、多くの訪問者が同じWebサイトを2回以上訪問しているため、合計を計算する前にURLのUIDパラメータに基づいてこれらを削除したいので、各カウント(ヒット)を一意のヒットとして計算できます。

したがって、合計を計算する前に、 "_uid7"パラメータを含む複製を自動削除する式を試してみようとしています。

自動的に行うことができるExcelで数式を作成するスマートな方法はありますか?

ありがとうございます。あなたのデータを仮に

+0

提出された回答のデータを処理するための式を提案しました。私はあなたの要求を正しく理解しているかどうかを知りたいと思っています。 – skkakkar

答えて

1

A1から始まるカウントすることができますまたは他の処理を行うことができたB1に次の式を投稿し、あなたがuid7なりますcolumn A

=TRIM(SUBSTITUTE(MID(A1,(SEARCH("dTM_c1_",A1,1)+7),99),CHAR(34),REPT(CHAR(32),99))) 

のデータとcolumn Bを下に記入し、uid8などしてください。あなたのコメントにし、発生の"dTM_c1_uidnn.."文字列カウントを取っ基づき Screenshot for csv datascreenshot for csv data2

EDIT は、次のスナップショットに示されています。私はヘルパー列を隠す2つのスナップショットを示しました。

snapshot1snapshot2

これは私が現時点で何ができる最善の方法です。列Bは、Excelネイティブの重複削除またはVBAルーチンのいずれかでフィルタリングできます。 Frequency Functionを使うと数値のユニークな値を見つけることは比較的簡単ですが、チュートリアルに続いて何度も試行した後、テキスト文字列の結果を得ることができませんでした。私はあなたのフィードバックを肯定的または否定的に感謝します。私の努力は、最適な解決策を探し続けるでしょう。

+0

skkakkar、ご返信ありがとうございます。大変感謝しています。特定のUIDが含まれている場合は、各文字列を1回だけカウントする必要があります。 /site.php?=dTM_c1_uid7は、複数のヒットがあっても1回だけカウントする必要があります。私は、リスト全体をチェックし、ユニークなUIDを持つものだけを数える式を期待していました。それは可能ですか?その理由は、ユニークなUIDに基づいてdTMと_c1をカウントする必要があるのですが、各UIDに複数のエントリがあると、統計が失われます。 – user3926924

+0

おそらく、私は一行が一意のUIDで一度だけ数えられるべきだと言及するべきです。 – user3926924

+0

@ user3926924いずれの場合も、一意のIDを数えるために文字列の一部を抽出する必要があります。独自のID文字列を表すもの。それはuidnnですか、それとも別のデータですか。あなたのサンプルデータから、dTMとc1が一般的であるように見えますが、私はその番号で任意の長さのuidを選択しました。この仮定は大丈夫です。もしdTMがすべての腸内で同じであり、c1も変化しないならば。この部分が変化し、あなたの一意のIDの一部である場合、その部分はカウントのために抽出することができます。ユニークなカウントは大きな問題ではありません。一意のIDを示す約7-8の代表的なサンプル行を表示することができる場合、この予備的な作業の上に適切な数式を入力すると、 – skkakkar

関連する問題