私は
のような奇妙な文字はすべてがラインの下のどこかの時点で破損する原因となる当社のデータベースに表示されるデータとの一定の問題を抱えています。私は、Microsoft Officeから貼り付けることができるこれらの狂ったことのすべてを通し、特定の文字を通過させ、無視するシステムを用意する必要があります。このようなものが組み込まれているのですか、または最初から始めなければなりませんか?すべてタイプの文字を削除
答えて
まあ、このような文字をすべて削除することができます。 $text = preg_replace('@[^\d\w\s,.;:]@', '', $text);
ここで、[^\d\w\s,.;:]
は、保持する文字のセットです(\ d \ w \ sはすべての数字、文字、スペースを意味します)。あなたが保持したい他の文字でセットを修正してください。
しかし、それは間違ったアプローチです。代わりに、アプリケーション全体がUTF-8を一から使用して処理していることを確認して、それらの文字を正しく保存して処理できるようにする必要があります。この日および年齢ではASCIIまたはISOラテン語のサイトを作ることだけで奇妙で、基本的に起因する人々が実際に使用して文字を切り出すにデータ損失が発生する...
[OK]を、私は、文字エンコーディングには専門家ではないが、約言われましたこの特定の問題となぜそれを得る。上記の私のコメントで述べたように、すべての文字セットが一致していることを確認する必要があります。 [?]
「の文字のその特定の配列が あなたが見る[不明]の文字のための3バイトのUTF-8のコードは次のとおりです。あなたは、文字の特定のセットを取得する理由
しかし、ここにありますFirefoxで。あなたは、フォームでUTF-8のように1バイトのWindows-1252文字を表示し、 とき がデータベースに戻ってそれを提出することを取得します。ブラウザは、3バイトのUTF-8 文字を送信して場所」文字セットを理解
あなたはこの課題についてもっと読むことを強くお勧めします。ここでは良いスタートです:Character Sets/Character Encoding Issues
リンクの追加(および吸い上げ):http://www.joelonsoftware.com/articles/Unicode.html – cmbuckley
- 1. 「š»ż」または「」文字を取り除く方法
- 2. テキストファイルからの読み込みの最初の文字:
- 3. >>�に変換
- 4. 文字列と文字列をすべて文字列から削除する
- 5. 私のウェブサイトで私のë、ï、öなどが違って見える
- 6. PDF-writerが無効なマルチバイト文字(US-ASCII)keyword_end content = "%PDF - #{@ version} \ n%â\Ï\ n" Rails 3
- 7. 文字列のすべてを削除しますが、Rのスペース、ダッシュ、文字は削除しますか?
- 8. javascript文字列内のすべての文字を削除します
- 9. Javascriptで文字列内のすべての文字を削除するには?
- 10. URLからすべてのクエリ文字列を削除する
- 11. すべての大文字を削除するC関数
- 12. 文字列から絵文字をすべて削除するには -
- 13. 文字列からホワイトリストにない文字をすべて削除します
- 14. 数字、 "、"、 "。"以外の文字列からすべての文字を削除する方法Rubyを使って?
- 15. 削除文字列
- 16. Regexを繰り返してすべての文字を削除する
- 17. 文字、数字、スペース、感嘆符、疑問符以外の文字列をすべて削除するには?
- 18. 文字列から数字、ドットまたはマイナス以外の文字列をすべて削除する方法
- 19. NSCharacterSetを使用して不要な文字をすべて削除する
- 20. 文字列のリストからすべてのエスケープシーケンスを削除するには?
- 21. Javaのすべての配列値から文字を削除します
- 22. jQueryでコンマの後にあるすべての文字を削除します
- 23. 文字列のn番目の要素をすべて削除します
- 24. 正規表現の前にあるすべての文字を削除する
- 25. Javascript regex - セミコロン以外のすべての特殊文字を削除します
- 26. 削除のNULL文字列::
- 27. 文字列から大文字小文字を削除する
- 28. 長い文字列からすべての改行を削除する
- 29. C++:文字列からすべてのHTML書式を削除しますか?
- 30. Pythonリストから文字列内の単語をすべて削除します
最も簡単な解決策は、プレーンテキストに貼り付け入力を強制的にフロントエンドにjsのハンドラを追加することであってもよいです。確かにどのように実装するかわからないが、私はいくつかのプロジェクトのFCK/CKエディタでオンになっているオプションがあることを知っている。クライアント側でこれを行うことで、ユーザーは書式がどのように見えるかを知ることができます。 – prodigitalson
あなたの問題のようなサウンドは、文字エンコーディングの競合です。すべての文字セット、データベース、データを追加するために使用されたWebページの文字セット、および受け入れられた応答と応答された文字セットのHTTPヘッダを確認しましたか? –