2011-04-15 5 views
0

私は(タイガーOCRライブラリを使用してPDFにTIFFを変換するためのAlfresco ECMを使用しています)AlfrescoはECMコンテンツ変換

マイカスタム変換のXML(OCR-トランスコンテキスト)は

<?xml version='1.0' encoding='UTF-8'?> 
<!DOCTYPE beans PUBLIC '-//SPRING//DTD BEAN//EN' 'http://www.springframework.org/dtd/spring-beans.dtd'> 

<beans> 

    <bean id="transformer.Ocr.Tiff2Pdf" class="org.alfresco.repo.content.transform.RuntimeExecutableContentTransformerWorker"> 
     <property name="checkCommand"> 
     <bean class="org.alfresco.util.exec.RuntimeExec"> 
      <property name="commandsAndArguments"> 
       <map> 
        <entry key=".*"> 
        <list> 
         <value>c:\ocr\ocr.exe</value> 
         <value>--about</value> 
        </list> 
        </entry> 
       </map> 
      </property> 

     </bean> 
     </property> 
     <property name="transformCommand"> 
     <bean class="org.alfresco.util.exec.RuntimeExec"> 
      <property name="commandsAndArguments"> 
       <map> 
        <entry key="Windows.*"> 
        <list> 
         <value>c:\ocr\ocr.exe</value> 
         <value>--replace</value> 
         <value>--replace</value> 
         <value>--language en</value> 
         <value>--pdf</value> 
         <value>--output-file</value> 
         <value>${target}</value> 
         <value>${source}</value> 
        </list>      
        </entry> 
       </map> 
      </property> 

     </bean> 
     </property> 
     <property name="explicitTransformations"> 
     <list> 
      <bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" > 
       <property name="sourceMimetype"><value>image/tiff</value></property> 
       <property name="targetMimetype"><value>application/pdf</value></property> 
      </bean> 
      <bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" > 
       <property name="sourceMimetype"><value>image/tiff</value></property> 
       <property name="targetMimetype"><value>text/plain</value></property> 
      </bean>   
     </list> 
     </property> 
    </bean> 
</beans> 

Iであります会社のホームフォルダにTIFFファイルをインポートするコンテンツをPDFに変換することを期待しています。今私は、変換が自動的であると仮定して正しいか、またはスペース上でルールを呼び出す必要がありますか?

また、私はDEBUGに変換にロギングを設定しているし、これは私がAlfrescoはログに何を参照してください

DEBUG [util.exec.RuntimeExec] 実行結果である:OS:
Windows XPのコマンド:
[C:\ OCR \ ocr.exe、--about]
が成功:真終了コード:0
アウト:Intelliant OCRのコマンドラインユーティリティ 、バージョン1.1.0。著作権©2006

クレジット:

TIFFライブラリの著作権(C)1988から1997 サムレフラー著作権(C) 1991年から1997年のSilicon Graphics、Inc.の

にIndependent JPEG Groupライブラリ
著作権(C)1991から1919 ユーザ:管理DEBUG [content.transform.ContentTransformerRegistry] トランス検索結果:ソース MIMEタイプ:画像/ TIFF対象 MIMEタイプ:テキスト/ plainトランスフォーマ: []

実際にPDFに変換する必要があるときにtext/plainのターゲットを検索しているようです。私はここで何が欠けていますか? Plsヘルプ

答えて

1

自動的に実行されるトランスフォームは、フルテキストインデックス作成に使用される1つのテキストプレーンです。

共有を使用している場合、共有はさらに2つの変換を実行しようとします。まず、ファイルを含むフォルダを表示すると、(レンディションサービスを介して)サムネイルを生成しようとします。これを行うには、通常、新しいMIMEタイプからimage/jpegへのトランスフォーマーを定義します。さらに、Shareでドキュメントの詳細を表示すると、Webプレビューが表示されます。

アップロード時にドキュメントのPDF版を生成したい場合は、ルールを定義することをお勧めします。トランスフォームコンテンツルールを使用してこれを行うこともできますし、レンディションサービスを使用するスクリプトを作成して、たくさんのコントロールを必要とする場合もあります。

関連する問題