私はPythonにはかなり新しくなっていますので、私の質問はばかげているかもしれませんが、たくさんのスレッドを読み込んでも私の質問には答えが見つかりませんでした。Pythonの「生の」Unicode文字列を読む
私は、html、xml、latex、およびその他のtextformatsを含む混合ソース文書を持っています。これはラテックスのみの形式にしようとしています。
したがって、Pythonを使用して、さまざまなコマンドを通常の表現として認識し、適切なlatexコマンドに置き換えました。これまでにすべてがうまくいきました。
今、ギリシャ文字のような「生のタイプ」のUnicode記号が残っています。残念なことに、それは手で行うことだけです。したがって、これをスマートに行う方法を探しています。 Pythonがそれらを認識/読み込む方法はありますか?そして、私はどのようにPythonに認識/読み込みを指示しますか? Piはギリシャ文字で書かれていますか?
私が使用するコードの最低限の例は次のとおりです。
fh = open('SOURCE_DOCUMENT','r')
stuff = fh.read()
fh.close()
new_stuff = re.sub('READ','REPLACE',stuff)
fh = open('LATEX_DOCUMENT','w')
fh.write(new_stuff)
fh.close()
私はそれが重要な情報であるかどうかわからないが、私はWindows上で実行されているのPython 2.6を使用しています。
誰かが私にヒントを与えることができれば、少なくとも情報に基づいた情報を見つけるか、またはこれがどのように機能するかについて、私は本当にうれしく思います。または、私が完全に間違っているかどうか、そしてPythonはこの仕事をすることができません...
事前に多くのおかげです。
乾杯、
ブリタ
あなたが話している「生のタイプのUnicode記号」の例を挙げてください。世界中の誰もこの言葉を以前に使ったり聞いたりしたことはないと確信しています。 –
「認識する」とはどういう意味ですか? PythonはUnicode文字列を扱うことは可能ですが、あなたはそれらで何をしたいのか、現時点ではうまくいかないのか説明しません。 –
ラテックスがUnicode文字を気に入らないという問題はありますか?もしそうなら、[この質問](http://stackoverflow.com/questions/219853/entering-unicode-characters-in-latex)が役に立ちます。 –