0
sbtコンソールでのCrawler4jの使用が機能します。Crawler4Jは、TikaでのFatJarでのsbtアセンブリのエンコーディングを検出しません。
java -jar crawler.jar
を始めたときfatjarティカを作成するために、SBT-アセンブリを使用して(?)、もはやページのエンコーディングを検出することができるように思われなかった場合ティカは、エンコーディングを検出するためには何が欠けていますか?
ERROR edu.uci.ics.crawler4j.parser.Parser - Failed to detect the character
encoding of a document, while parsing
マージ戦略は
assemblyMergeStrategy in assembly := {
case PathList("META-INF", xs @ _*) => MergeStrategy.discard
case _ => MergeStrategy.first
}