2011-09-03 6 views
1

テキストをプレーンテキストファイルに含む<paragraph>タグを持つXML文書を処理しています。奇妙な場所で線が折れることがあり、時には長すぎることもあります。私は単純にapply-templateアクションを実行し、いくつかの改行を追加する段落のテンプレートを持っています。 (正規化された幅にテキストの流れをrewraps)UNIX「FMT」コマンドに似た段落内XSLからテキスト、 'fmt'の等価物

(テキストを再フォーマットする方法はあります)後に適用され、テンプレートが他を処理する機会を持っています段落内のタグ(太字、emなど)

また、プレーンテキスト文書のブロック引用で通常行うように、各改行された行をインデントする方法はありますか?

+0

"unix 'fmt'"が何をしているか知る人はいないと思っています。 XML文書の完全な例、正確な出力、変換が満たすべきルールを提供してください。 –

+0

良い質問、+1。 FXSLテンプレート 'str-split-to-lines'を使用する簡単なXSLT 1.0ソリューションの私の答えを見てください。 –

+0

だから、@ JeffG、私の答えは役に立ちましたか? –

答えて

1

一つの簡単な解決策は次のようにFXSLからstr-split-to-linesテンプレートを使用することです。この

<text> 
Dec. 13 — As always for a presidential inaugural, security and surveillance were 
extremely tight in Washington, DC, last January. But as George W. Bush prepared to 
take the oath of office, security planners installed an extra layer of protection: a 
prototype software system to detect a biological attack. The U.S. Department of 
Defense, together with regional health and emergency-planning agencies, distributed 
a special patient-query sheet to military clinics, civilian hospitals and even aid 
stations along the parade route and at the inaugural balls. Software quickly 
analyzed complaints of seven key symptoms — from rashes to sore throats — for 
patterns that might indicate the early stages of a bio-attack. There was a brief 
scare: the system noticed a surge in flulike symptoms at military clinics. 
Thankfully, tests confirmed it was just that — the flu. 
</text> 

:この変換は、この1のようなXML文書に適用され

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform" 
xmlns:f="http://fxsl.sf.net/" 
xmlns:ext="http://exslt.org/common" 
xmlns:str-split2lines-func="f:str-split2lines-func" 
exclude-result-prefixes="xsl f ext str-split2lines-func" 
> 


    <xsl:import href="dvc-str-foldl.xsl"/> 

    <str-split2lines-func:str-split2lines-func/> 

    <xsl:output indent="yes" omit-xml-declaration="yes"/> 

    <xsl:template match="/"> 
     <xsl:call-template name="str-split-to-lines"> 
     <xsl:with-param name="pStr" select="/*"/> 
     <xsl:with-param name="pLineLength" select="50"/> 
     <xsl:with-param name="pDelimiters" select="' &#9;&#10;&#13;'"/> 
     </xsl:call-template> 
    </xsl:template> 

    <xsl:template name="str-split-to-lines"> 
     <xsl:param name="pStr"/> 
     <xsl:param name="pLineLength" select="60"/> 
     <xsl:param name="pDelimiters" select="' &#9;&#10;&#13;'"/> 

     <xsl:variable name="vsplit2linesFun" 
        select="document('')/*/str-split2lines-func:*[1]"/> 

     <xsl:variable name="vrtfParams"> 
     <delimiters><xsl:value-of select="$pDelimiters"/></delimiters> 
     <lineLength><xsl:copy-of select="$pLineLength"/></lineLength> 
     </xsl:variable> 

     <xsl:variable name="vResult"> 
      <xsl:call-template name="dvc-str-foldl"> 
      <xsl:with-param name="pFunc" select="$vsplit2linesFun"/> 
      <xsl:with-param name="pStr" select="$pStr"/> 
      <xsl:with-param name="pA0" select="ext:node-set($vrtfParams)"/> 
      </xsl:call-template> 
     </xsl:variable> 

     <xsl:for-each select="ext:node-set($vResult)/line"> 
     <xsl:for-each select="word"> 
      <xsl:value-of select="concat(., ' ')"/> 
     </xsl:for-each> 
     <xsl:value-of select="'&#xA;'"/> 
     </xsl:for-each> 
    </xsl:template> 

    <xsl:template match="str-split2lines-func:*" mode="f:FXSL"> 
     <xsl:param name="arg1" select="/.."/> 
     <xsl:param name="arg2"/> 

     <xsl:copy-of select="$arg1/*[position() &lt; 3]"/> 
     <xsl:copy-of select="$arg1/line[position() != last()]"/> 

     <xsl:choose> 
     <xsl:when test="contains($arg1/*[1], $arg2)"> 
      <xsl:if test="string($arg1/word)"> 
      <xsl:call-template name="fillLine"> 
       <xsl:with-param name="pLine" select="$arg1/line[last()]"/> 
       <xsl:with-param name="pWord" select="$arg1/word"/> 
       <xsl:with-param name="pLineLength" select="$arg1/*[2]"/> 
      </xsl:call-template> 
      </xsl:if> 
     </xsl:when> 
     <xsl:otherwise> 
      <xsl:copy-of select="$arg1/line[last()]"/> 
      <word><xsl:value-of select="concat($arg1/word, $arg2)"/></word> 
     </xsl:otherwise> 
     </xsl:choose> 
    </xsl:template> 

     <!-- Test if the new word fits into the last line --> 
    <xsl:template name="fillLine"> 
     <xsl:param name="pLine" select="/.."/> 
     <xsl:param name="pWord" select="/.."/> 
     <xsl:param name="pLineLength" /> 

     <xsl:variable name="vnWordsInLine" select="count($pLine/word)"/> 
     <xsl:variable name="vLineLength" 
     select="string-length($pLine) + $vnWordsInLine"/> 
     <xsl:choose> 
     <xsl:when test="not($vLineLength + string-length($pWord) 
          > 
          $pLineLength)"> 
      <line> 
      <xsl:copy-of select="$pLine/*"/> 
      <xsl:copy-of select="$pWord"/> 
      </line> 
     </xsl:when> 
     <xsl:otherwise> 
      <xsl:copy-of select="$pLine"/> 
      <line> 
      <xsl:copy-of select="$pWord"/> 
      </line> 
      <word/> 
     </xsl:otherwise> 
     </xsl:choose> 
    </xsl:template> 

</xsl:stylesheet> 

必要な出力(最大幅50の行に折り返された単語)が生成されます

Dec. 13 — As always for a presidential inaugural, 
security and surveillance were extremely tight in 
Washington, DC, last January. But as George W. 
Bush prepared to take the oath of office, security 
planners installed an extra layer of protection: a 
prototype software system to detect a biological 
attack. The U.S. Department of Defense, together 
with regional health and emergency-planning 
agencies, distributed a special patient-query 
sheet to military clinics, civilian hospitals and 
even aid stations along the parade route and at 
the inaugural balls. Software quickly analyzed 
complaints of seven key symptoms — from rashes to 
sore throats — for patterns that might indicate 
the early stages of a bio-attack. There was a 
brief scare: the system noticed a surge in flulike 
symptoms at military clinics. Thankfully, tests 
confirmed it was just that — the flu. 
+0

非常に役に立ちます。ありがとうございました。 – JeffG

+0

@JeffG:どうぞよろしくお願いいたします。 –