2012-05-07 12 views
7

私はTRECフォーマットの仕様をお探しです。私はたくさんのグーグルで行ってきましたが、私は手がかりを見つけませんでした。TREC形式とは何ですか?

情報の入手先を知っている人はいますか?発見

答えて

3

私の知る限りTRECは、NISTのテキスト検索会議の略称です。インデクサーが文書の境界がファイル内のどこにあるかを知るためには、各文書には開始文書と終了文書のタグが必要です。これらのタグはHTMLタグまたはXMLタグに似ており、実際にはTREC文書のフォーマットです。

TrecParser:このパーサーは、TEXT、HL、HEAD、HEADLINE、TTL、およびLPフィールドのテキストを認識します。

出典:TREC Wikipedia

出典:Lemur Guide

0

IBM Watsonがナレッジ・インテークに使用するファイル形式でもあります。

関連する問題