この質問に過去に尋ねられているかどうかはわかりません。 私は複数のウェブサイトからプロモーション、価格、商品説明の情報を抽出するためのウェブクローラーを作成しています。クロールされたページセマンティクスのデータベースの選択
複数のWebサイトからの同じ製品の識別に基づいて、プロモーションや価格のデータをメモリ内比較するのに理想的なデータベースはどれですか。
私は、設計がスクレーパー、HTMLDataProcessor、およびストレージの複雑なものになるだろうと知っています。しかし、私はデータ層の選択肢の解決を探しています。
これについてのご支援をお待ちしております。
私はElasticSearchを選択しました。 – uniqrish