2
A
答えて
0
Pythonではもっと簡単かもしれません。ここでは、テキストファイルを読み込んで2つの出力ファイルを作成するスクリプトを示します.1つはlow-ASCIIで、もう1つはその他のものです。 PythonのサポートがVimでコンパイルされている場合は、Vimの中で以下のものも使用する必要があります(最小限の変更で)。
import codecs
mixedInput = codecs.open('mixed.txt', 'r', 'utf-8')
lowAsciiOutput = codecs.open('lowAscii.txt', 'w', 'utf-8')
otherOutput = codecs.open('other.txt', 'w', 'utf-8')
for rawline in mixedInput:
line = rawline.rstrip()
for c in line:
if ord(c) < 2**7:
lowAsciiOutput.write(c)
else:
otherOutput.write(c)
otherOutput.write('\n')
lowAsciiOutput.write('\n')
mixedInput.close()
lowAsciiOutput.close()
otherOutput.close()
例入力ファイル(mixed.txt):
欢迎来到Mifos管理区域
それはあなたがやりたいのか?
要旨として保存:https://gist.github.com/855545
+0
ありがとう!それはまさに私が欲しいものです! –
関連する問題
- 1. PHP以外の文字を文字列から削除するには?
- 2. 正規表現以外のキーボード文字を削除する
- 3. アラビア語UTF8 +英文字列以外の英数字を削除する
- 4. 数字、 "、"、 "。"以外の文字列からすべての文字を削除する方法Rubyを使って?
- 5. 文字、数字、スペース、感嘆符、疑問符以外の文字列をすべて削除するには?
- 6. 文字列から数字、ドットまたはマイナス以外の文字列をすべて削除する方法
- 7. 空白以外のすべての数字以外の文字を削除してください
- 8. UTF8文字列から英数字以外の文字を削除する正規表現
- 9. WPF:Fonts.SystemFontFamiliesから非ローマ字フォントを除外する方法は?
- 10. RegEx:文字以外のUTF-8をすばやく削除する
- 11. PHP - 数値以外の文字をすべて文字列から削除する
- 12. ユニコードテキストのローマ字
- 13. 正規表現以外の文字を削除する正規表現
- 14. 文字列から大文字小文字を削除する
- 15. Javascript regex - セミコロン以外のすべての特殊文字を削除します
- 16. vim完了で型付きの文字が削除される
- 17. c#文字列のRegex文字以外の文字
- 18. 文字列からコントロールカー以外の印刷可能なutf8文字を削除します。
- 19. 正規表現 - すべての英数字以外の文字を削除するCRLFの問題
- 20. 文字列を部分に分割する方法 - ローマ数字
- 21. アルファベット以外の文字で文字列を分割する
- 22. SuspensionManager.SessionStateに文字列以外の文字を格納する
- 23. 削除文字列
- 24. PHP文字列から-zA-Z0-9、_、 - 以外の文字を取り除く
- 25. ASCII拡張文字を128以降で削除する(SQL)
- 26. gitをローマ字以外の言語で使用していますか?
- 27. 文字列の最初の文字を削除する場合
- 28. 文字列の最後の文字を削除する$ variable
- 29. 文字列の最後の文字を削除する
- 30. 文字列内の一連の文字を削除する
ファイルのエンコードは何ですか? – Benoit
UTF-8でエンコードされています。 –