私はpyspeech APIを使用してmp3(音声からテキスト)を書きたいと思います。しかし、これが可能かどうかはわかりません。pyspeech(python) - mp3ファイルを転記しますか?
ですか?どうやって?
私はpyspeech APIを使用してmp3(音声からテキスト)を書きたいと思います。しかし、これが可能かどうかはわかりません。pyspeech(python) - mp3ファイルを転記しますか?
ですか?どうやって?
pyspeechは、通常のWindowsの音声APIとは単にPythonのインタフェースであるようです。ほとんどの場合、そのスピーチAPIが聞くオーディオソースとして、MP3再生を扱ういくつかの方法を作成します。
pyspeechについてはわかりませんが、Microsoft音声APIのPythonラッパーであれば、他の投稿が役立つかもしれません。
Microsoft音声エンジンは、マイク入力を必要としません。彼らはオーディオファイルを受け入れることができます。
転記をしている場合は、口述文法が必要です。ディクテーションの文法は、Windows 7およびVistaに付属するMicrosoft音声エンジンのクライアントバージョンに含まれています。ディクテーション文法は、Microsoftが提供するサーバーエンジン上では提供されていません。
System.Speech名前空間とC#でディクテーション文法を使用しての簡単な例は、あなたがより完全な詳細にこれを実行する方法を説明してもらえSAPI and Windows 7 Problem
StackOverflowの質問にありますか? –
また、私はMacを持っています。これが私の言論の自由を妨げるのだろうか? –
あなたのMacでWindowsを実行する必要があります。ハードウェアまたは仮想マシン(Parallels、VMWareなど)に直接接続します。 MacOSはWindows APIをサポートしていません。それを行う方法については、私は知らない。私はWin32プログラマではありません。しかし、Windows APIはオーディオソースを「聴く」ために、プログラムでmp3をAPIが聞くオーディオデバイスにする必要があります。 –