2012-06-20 12 views
7

ベンガル語のExcelファイルがあります。ベンガル語のテキストを正しく表示するには、PCにインストールされているベンガル語のフォントが必要です。ベンガル語のテキストがUnicode CSVファイルに表示されない

Office 2010を使用してExcelファイルをCSV形式に変換しました。ベンガル語の文字の代わりにマーク。それから、Google Docsを使って同じ問題を抱えていましたが、 '?'ではなく、読めない文字がありました。私はそのファイルから抽出したファイルをHTMLファイルに貼り付け、それをブラウザでうまく表示しようとしました。

ベンガル語の.xlsxファイルからCSVファイルを取得して、そのファイルをMySQLデータベースにインポートするにはどうすればよいですか?

を編集してください:this SOで受け付けられた質問はGoogle Docsに送られました。

答えて

3

Excel to CSV with UTF8 encodingの回答によれば、Googleドキュメントは、「ANSI」エンコーディングで表現できないすべての文字が破棄されるExcelとは異なり、CSVを正しく保存する必要があります。しかし、おそらく彼らはこれを変えたのかもしれないし、何か間違っている、あるいは状況の分析が間違っているかもしれない。

MS Officeプログラムで正しく処理されたBangla(ベンガル語)の場合、Arial Unicode MSフォント(Officeに同梱)にはBangla文字が含まれているため、「Banglaフォント」は必要ありません。実際には、特別にエンコードされたフォントに依存する非標準のエンコーディングのデータがありますか?その場合、最初にUnicodeに変換する必要がありますが、そのフォントを一貫して使用するプログラムを使用して管理することも可能です。

名前を付けて保存を使用する場合、Excelでは「Unicode text(* .txt)」を選択できます。 UTF-16エンコーディングでTSV(タブ区切り値)としてデータを保存します。その後、タブの代わりにコンマを区切り記号として使用するか、UTF-16からUTF-8に変換する必要があります。しかし、元のデータが正しくエンコードされている場合にのみ機能します。

+0

タブの代わりに区切り記号としてカンマを使用する方法、および/またはUTF-16からUTF-8に変換する方法はありますか? excelファイルはBanglaフォントをうまく示しました。元のデータは正しくエンコードされていると推測できます。右 ? –

+0

私は変換を 'unicode text(.txt)'として 'save as'タイプを選択しましたが、それでも '?'前と同じようにマークが現れました。 –

+0

@Istiaque Ahmed、元のデータが正しくエンコードされていないように見えます。非標準の8ビットエンコーディングを使用すると、特定のフォントを使用するプログラムでは正常に見えますが、通常のフォントが使用されても機能しない場合や、データ変換によってデータが混乱する可能性があります。どのBanglaフォントを使用していますか? –

関連する問題