私は、列1(文字列はスペースで区切られた例:United Nations)の組織のリストを持っていて、関連するURL(www.un.org/など)列1は検索文字列としての値です。ジオコーディング手順はかなり簡単です(http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial#Geocoding_names_and_addresses)ので、Google検索や他のWebサービスを使用してこのタスクを実行する方法があるのだろうかと思います。ヒット・アンド・ミス・アプローチですが、手作業での編集に勝ちます。ありがとう!openRefine上の単語リストからURLを取得する
0
A
答えて
0
具体的な例がなくても広範な質問に答えることは難しいです。もちろん、Open Refineを使用して、大量のAPIを使用してデータを豊かにするか、Webスクレイピングを行うことができます。ほとんどの場合、手順はほぼ同じです.URLを再構築し、「URLを取得して列を追加」し、HTML、XML、またはJSONファイルの結果の列を解析します。
ここでは、名前のリストからWikipedia search APIを呼び出す方法の例を示します。 URLを再構築
は非常に簡単です:
"https://en.wikipedia.org/w/api.php?action=opensearch&search="
+ value.escape('url')
+ "&limit=10&namespace=0&format=xml"
何、value='United Nations'
ため、これを与える:XMLコンテンツはその後、抽出するために解析できる
あなたが必要とするアイテム。たとえば、Wikipediaのページの説明を得るには、
value.parseHtml().select('Description').htmlText()
関連する問題
- 1. 単語のリストから最長の単語を取得
- 2. 単語リストから特定の長さのランダムな単語を取得
- 3. Linqリストから単語を取得する
- 4. javascript:単語とスラッシュの間にURLからIDを取得
- 5. 全文検索辞書から単語リストを取得する方法
- 6. Haskellのリスト内の単語の長さを取得する
- 7. URLからSharePointリストを取得
- 8. Prolog:合計X音節の単語のリストを取得する
- 9. LuceneのSpanNearQueryから一致する単語を取得する
- 10. 英語のバージョンから "Speaking URL path segment"を取得する
- 11. java最後の単語を文字列から取得する
- 12. AndroidのCurrentInputConnectionから単語を取得する方法は?
- 13. stringから特定の単語を取得するORACLE
- 14. テキストファイルから単一リンクリストへの単語の取得方法
- 15. .htaccessでURLから言語を取得する
- 16. gensim Doc2Vecから単語ベクトルを取得するには?
- 17. 単語の同義語を取得
- 18. 単語の文脈を取得する
- 19. firebaseリストから単一のアイテムを取得する
- 20. 述語に一致するリストからサブリストを取得
- 21. 単語リストのテキスト "x"のインスタンス数を取得
- 22. 構造体リスト内の単語を検索し、すべての単語を後置式で取得する
- 23. SharePoint 2013 - JavaScriptがリストからURLを取得する
- 24. リストからhtmldocumentを取得する方法url?
- 25. ワンクリックで単語を取得
- 26. タプル(単語、値)のリストから単一のタプル(単語、値)のリストを返す方法は?
- 27. 単語リストからユーザーが選択した単語を削除する
- 28. 投稿されたURLのリストからホストURLを取得する方法
- 29. fgetsからの最初の単語を取得
- 30. PHPリストから単語をランダムな単語に置き換えますか?
ありがとう。これはウィキペディアのAPIと完全に連携しています。あるいは、私が前に気にしていたように、Googleマップを使っています。しかし、私はそれをGoogleの検索と連携させることはできません。 – Herbert
"http://www.google.com/uds?action=opensearch&search=" + value.escape( 'url')+ "&limit = 10&namespace = 0&format = xml"を試してみました。 私はCSE(カスタム検索エンジン)とそれに対応するAPIキーと検索エンジンIDを代わりに使うと思います。しかし、これらをコードに追加する方法はわかりません。私はこれを試してみました(そして失敗しました):https://www.googleapis.com/customsearch/v1?key=KEY_HERE&cx=CX_HERE?action=opensearch&search=United+Nations&limit=10&namespace=0&format=xml – Herbert
私は誤解があると思います。メソッドは、私はウィキペディアのURLで動作する説明した。別のサービスの場合は、別のURLを使用します。 「Opensearch」または「xml」はgoogle.comでの検索で意味をなさない。とにかく、あなたはGoogleを掻きすることはできません。 Googleは世界で最大の詐欺師であり、誰もそれを同じようにすることはできません。いくつかのGoogle APIを使用する必要があります。 –