分散キャッシュにhdfsに格納された一連の依存関係を追加しようとしています。私はこの記事のアドバイスに従っています:http://www.datasalt.com/2011/05/handling-dependencies-and-configuration-in-java-hadoop-projects-efficiently/。私の質問です:クラスパスに依存関係を含むフォルダを追加することは可能ですか?分散キャッシュを使用してHadoopにファイルのディレクトリを追加しますか?
DistributedCache.addFileToClassPath(new Path("/tmp/lib/"), job.getConfiguration());
個々の依存関係を個別に追加する必要がありますか?
for (Path dependency : dependencies) {
DistributedCache.addFileToClassPath(dependency, job.getConfiguration());
}
そして、すべてのスレーブノードのクラスパスに依存関係が実際に追加されたことを確認するにはどうすればよいですか?
ありがとうございました。