2016-12-15 6 views
2

私は、文章の一部を翻訳できるようにする必要のあるアプリケーションに取り組んでいます。問題は、私はGoogle翻訳のような翻訳APIにパーツを送信する場合、翻訳は多くの場合、彼らが発生したコンテキストで意味を成さないことです例:。 文脈に基づいて文章の一部を翻訳する

建物

を任意の目的言語に翻訳すると、おそらく "ツリーの葉"のコンテキストで結果が得られますが、この例では当然意味がありません。したがって、翻訳では文脈を考慮する必要があります。翻訳文をに展開すると、彼はになります。の正しい翻訳が得られます。になります。しかし、私はの翻訳を失う、これは私が探している言葉です。

これにどのようにアプローチすればよいですか? Google Translate APIは有料のAPIなので、APIからリクエストする翻訳の量を最小限に抑えたいと思います。

答えて

3

文脈なしで翻訳することは絶望的であることを指摘するのは間違いありません。

Google翻訳APIは、Chromeの統合と同様に、HTMLタグ(デフォルトのパラメータにはformat=htmlが含まれています)に精通しています。

1つの良い選択肢はです。あなたがHTMLタグに興味のある単語またはフレーズをラップすることです。

コンソールでこれを試すことができます。

enter image description here

それは、あなたがlemmatiseことができ、バックアウトHTMLタグの内容を解析しに簡単にする必要があります。

注1
消費者向けのスタンドアロンGoogleのUIの翻訳では、APIコンソールを介して、またはプログラムで翻訳し、やChromeでページを変換する必要があり、それを試して、このオプションを公開しません。

注2:1:
翻訳の単語は、本質的に1ではないので、いくつかのニュアンスがあります。単語が2つの単語になることがあり、時にはその単語がターゲット言語のヌル表現を持つこともあります。

1:2の例:
EN:He <span>left</span> the building.
その:Ha <span>lasciato</span> l'edificio.
[おそらくヘクタールも含まれるべきです。]

1:0例:
EN:How <span>are</span> you?
RU:Как вы?
[することが通常ロシアドロップされる]
EN:How are <span>you</span>?
は:Come stai?
[代名詞がしばしばありますイタリア語でドロップされました]

2:1例:
en:He is always <span>screwing</span> things up.
it:Sempre <span>spiegazza</span> le cose.
[英語と他の言語はseparable verbsです。ここでは、実際の入力がネジする、ないを台無しにすることである。]

あなたのためにこれはいくつかの作業ですが、それは実際にも非常に有用な情報で、とにかくあなたが lasciato を処理するために簡単です正しい補助定理を得るためにlasciare

は、単一の単語のために非常に固溶体のように聞こえるが、何句の詳細パラメータのドキュメントのためのcloud.google.com/translate/docs/reference/rest

+1

これはしばらくしていますが、これに感謝します。私は上司と協力して、Pythonの単純な実装を書いています。https://github.com/mircealungu/python-translators – Yaeger

+0

私の喜びは、役に立つと思います。 –

1

私の考え:

送信は「彼は葉」、そして「彼は」と「葉」であり、これは一部のローカル対訳辞書を維持する(「葉」のすべての可能な翻訳と交差している部分を理解することすべての可能なすべての言葉のすべての形の翻訳)

+0

を参照してください? 2つまたは3つの単語は、しばしば、依然として翻訳のための十分な文脈ではない。しかし、あなたの貢献に感謝します。私はそれが一言の翻訳のためにうまくいくと思います。私はその有効性をテストするためにこれを試しています。 – Yaeger

+0

あなたは文全体を送信し、その文中の各単語の可能な翻訳に対して翻訳をマッチさせ、翻訳したい単語またはフレーズの場所を探します。 – user31264

+1

弱い部分、imhoはどこにありますか、どのようにすべての形式のすべての単語(すべての形式の翻訳を含む)を含む辞書を作成しますか?たとえば、ドイツ語では4件あり、一部の言語ではさらに多くのケースがあります。あなたはhundes、hund、hunde、またはhundenであることができるので、ちょうどhundとして犬を翻訳することはできません – user31264

関連する問題