ステップ1:汎用BLOBストレージ(ブロックBLOB)とコンテナ(アクセスポリシーを「コンテナ」に設定)を作成しました。 19ドキュメント(pdf、xlsx、docx、ppt、png、jpg、txt)が追加され、すべてのドキュメントがazure portal - > Blob Storage Containerに表示されます。Azure Blobストレージの検索が機能していません。
ステップ2:Azure検索(基本層)を作成し、この記事に従い、以下を実行しました。
ステップ3:作成したデータソース
POST https://anysearch.search.windows.net/datasources?api-version=2015-02-28-Preview
Content-Type: application/json
api-key: adminkey
{
"name" : "blob-datasource",
"type" : "azureblob",
"credentials" : { "connectionString" : "DefaultEndpointsProtocol=https;AccountName=mystorage;AccountKey=givenkey==" },
"container" : { "name" : "containername"}
}
ステップ4:作成したインデックス
POST https://anysearch.search.windows.net/indexes?api-version=2015-02-28-Preview
Content-Type: application/json
api-key: adminkey
{
"name" : "my-target-index",
"fields": [
{ "name": "id", "type": "Edm.String", "key": true, "searchable": false },
{ "name": "content", "type": "Edm.String", "searchable": true, "filterable": false, "sortable": false, "facetable": false }
]
}
ステップ5:インデクサーを作成しました。
POST https://anyearch.search.windows.net/indexers?api-version=2015-02-28-Preview
Content-Type: application/json
api-key: adminkey
{
"name" : "blob-indexer",
"dataSourceName" : "blob-datasource",
"targetIndexName" : "my-target-index",
"schedule" : { "interval" : "PT5M" }
}
ステップ6:実行して、インデックスの統計と以下の結果を得た - DOCUMENTCOUNT = 0
GET https://anysearch.search.windows.net/indexes/my-target-index/stats?api-version=2015-02-28-Preview
api-key: [admin key]
{
"@odata.context": "https://mydocsearch.search.windows.net/$metadata#Microsoft.Azure.Search.V2015_02_28_Preview.IndexStatistics",
"documentCount": 0,
"storageSize": 1728
}
ステップ7:単語 "プロセス" を検索し、以下の結果を得た
GET https://anysearch.search.windows.net/indexes/my-target-index/docs?api-version=2015-02-28&search=process
{
"@odata.context": "https://mydocsearch.search.windows.net/indexes('my-target-index')/$metadata#docs(id,content)",
"value": []
}
ここで何がうまくいかなかったのですか?なぜドキュメント数が0ですか?なぜ「プロセス」という言葉や他の検索語が結果を返さないのですか?
助けてください。
おかげ
Bhanu。
それは魅力的なように機能しました!本当にありがとう。サポートされていないファイルはインデクサーによって無視されると私は考えました。それを指摘してくれてありがとう。私はブロブからjpegとpngファイルを削除し、再度インデクサーを実行しました。出来た。 – Bhanu
それを聞いてうれしいです。インデクサーがサポートされていないフォーマットのテキスト抽出を自動的にスキップしても(ただし、まだ一部のストレージメタデータを抽出する場合)、この[UserVoiceの提案](https://feedback.azure.com/forums/263029-azure-search/)に投票してください。提案/ 15094944-blob-indexer-should-continue-indexing-documents-af) –