2016-05-18 8 views
20

ブラジルの社会経済的マイクロデータセット(国勢調査、PNADなど)のインポートを容易にするパッケージを作成しています。ブラジルのRパッケージのバイリンガル(英語とポルトガル語)のドキュメント

  • ユーザー、 ポルトガル語の文書と使いやすさでより感じることがあります。 は、私はパッケージのユーザーの2つのグループを予見します。おそらく英語をある程度理解することはできますが、 の外国語では、パッケージの感触が少なくなるかもしれません "人間工学に基づいた"。

  • 広範な国際ユーザーコミュニティ(英語 のドキュメントが必要条件となる可能性があります)。

それはドキュメントがユーザーに表示言語はその国/言語設定に依存することは、「バイリンガル」(英語とポルトガル語)であり、その方法でパッケージを記述することは可能ですか?

また、

これはroxygen2のドキュメントフレームワーク内で実行可能ですか?

複雑さが増し、メンテナンスが困難であるのに対して、バイリンガルにすることで、パッケージをより使いやすくするというトレードオフが実現しました。以前のexpirienceからのこのトレードオフに関する一般的なコメントも歓迎されます。

EDIT:コメントの提案に続いて、私はr-package-devel maillingリストをクロス投稿しました。 HEREと入力し、下部にある回答に従ってください。ダンカンマードックは(怒鳴る)答える@Brandonsものの一部をカバーする興味深い答えを掲載対象とするだけでなく、私が便利だと思う二つの追加提案を含む:

  • は一つの言語でパッケージを持っていますが、異なる ためビネット言語。私はこのアドバイスに従います。

  • は、パッケージのバージョンに持っている、のは、各 言語Ropensciによると

+1

ここで役に立つ回答が得られない場合は、[r-package-devel](https:// stat.ethz.ch/mailman/listinfo/r-package-devel)メーリングリスト... –

+0

@BenBolkerあなたは正解でした。ここの日は無回答でしたので、メーリングリストに投稿しました(上記の編集を参照)。 2時間後にはすでに答えがあります。 TKs – LucasMation

+2

大きな質問です。私はそれが他の人にとって有益であると感じていますので、あなたがメーリングリストで受け取った回答に基づいて答えを集めたいなら、それは素晴らしいでしょう。 –

答えて

13

に1.1と1.2、一つ言わせて、は、英語以外の言語にパッケージのドキュメントを翻訳するための標準的な機構もありません。次のように彼らはinternationalization/localizationの典型的なプロセスを説明します。英語以外のドキュメントを作成するには

は 補足.Rdファイルまたはパッケージビネットの手動で作成する必要があります。 英語以外のドキュメントを供給

パッケージは、 DESCRIPTIONファイルにLanguageフィールドを含める必要があります。

そしてLanguageフィールド上のいくつかの詳細情報:これはコンマ区切りのリストでなければなりません:

「言語」フィールドには、パッケージ ドキュメントは英語にないかどうかを示すために使用することができます現在、RFC 5646で定義されて などの標準の (プライベートではありません使用や適用除外)IETF言語タグ(https://tools.ietf.org/html/rfc5646、 はhttps://en.wikipedia.org/wiki/IETF_language_tagも参照)、すなわち、本質的である 言語サブタグを使用します2文字のISO 639-1 (https://en.wikipedia.org/wiki/ISO_639-1)または3文字のISO 639-3 (https://en.wikipedia.org/wiki/ISO_639-3)言語コード。

パッケージにASCII以外のテキストが含まれている場合、特に複数のロケールで使用する場合は注意が必要です。 DESCRIPTIONファイルと.Rdファイルで使用されているエンコーディングをマークすることは可能です。あなたが本当に非ASCIIテキストが必要な場合は、エンコーディングについて

...

まず、慎重に検討します。 Rの多くの ユーザーは、ネイティブの 言語グループ(西ヨーロッパ、東ヨーロッパ、簡体字 中国語など)とASCII.72で正しくテキストを表示できます。他の文字は全くレンダリングされないかもしれません。 が正しくレンダリングされないか、Rコードがエラーを引き起こします。 .Rd のドキュメントでは、エンコーディングをマークし、ASCIIの の字句を含めると、合理的な仕事をする可能性があります。一般的にサポートされている 文字の集合は、2000年頃には よりも広くなりましたが、非ラテンアルファベット(ギリシャ語、ロシア語、グルジア語...)はまだ で、幅が2文字の文字です。 、日本語、韓国語)は、 を正しくレンダリングするために専門フォントが必要なことがよくあります。関連ノートで

、R しかし、"errors and warnings" in different languagesためのサポートを提供し、を行う - 「R-及びCレベルのエラーメッセージと警告メッセージを翻訳するメカニズムがあり、Rがある場合にのみ利用可能です。 NLSサポートでコンパイルされます(configureオプション--enable-nlsによって要求されます)。

3

バイリンガルのドキュメントに加え、次のコメントを許可してください。あなたの2つの「ターゲット」グループがあると、一部のユーザーは英語以外のOS(通常はポルトガル語のWindows)を実行することが想定されます。時系列データ(または実際の日付エントリ)をインポートするとき、異なる「日付」フォーマット(英語対英語以外)のため、英語にインポートするときに異なる「結果」(すなわち、誤った日付エントリ)を取得することがあります/英語以外のマシン。私はこれらの問題(私はしばしばチェコ語ベースのOSで動作します)とアドホックコーディング以外のいくつかの経験を持っています。私は簡単な解決策を見つけることはできません。 (このトピックが見つからない場合は、気軽に削除してください)

関連する問題