は、次のように私は、このようなデータフレームがあると、データフレームの列の各行の単語を検索して、新しい列を追加する - Pythonの
data
id URL
1 www.pandora.com
2 m.jcpenney.com
3 www.youtube.com
4 www.facebook.com
を私はgrepすると見つけ、特定の単語をURLにして作成したいですその中に新しい列があります。
id URL host
1 www.pandora.com None
2 m.jcpenney.com None
3 www.youtube.com youtube
4 www.facebook.com facebook
URLは、実際のデータセットで非常に複雑であり、また、行数は(〜4M)非常に高いです、私はここだけで、私の理想的な出力は次のようになりユーチューブやフェイスブックを見つけたいとします。だから私は3-4の特定のホストだけを見つけて、新しいコラムでそれらを識別したいと思っています。続き
は、私の試みである
for i in data['URL']:
re.search('youtube', i)
が、私はここで、
TypeError: expected string or buffer
エラーを取得しています。私は3-4ホストのための条件を与えると同じデータフレーム内の新しい列を作成し、残りの列にはないだろう。誰か助けてくれますか?私たちは、データフレームをインスタンス化し、新しい列host
を作成することから始めましょう
おかげ
Pandas DataFramesの部分文字列検索の例については、この[質問](http://stackoverflow.com/questions/11350770/pandas-dataframe-select-by-partial-string)をご覧ください。 – SNygard
@SNygardそのリンクをありがとう。今では、それぞれを別々のデータフレームに分割できます。しかし、私は異なる条件に基づいて新しい列を作成したい。あなたはそれを手伝ってくれますか? – haimen