2017-09-24 7 views
0

まず、私がしようとしていることを広く述べ、助言を求めます。次に私の現在のアプローチを説明し、私の現在の問題に対する答えを尋ねます。私は英語で話す人のMP3ファイルを持っているオーディオファイルのすべての音声語をmp3で自動的に検索して削除する

問題

はポッドキャストでの話です。私はそれを単語に大まかに対応するセグメントに分割したいと思います。 (私は手動でやっていますが、切断や分離が必要なデータは何時間も話しています)。

これを自動的に行う方法についてアドバイスがありましたら、私はそれを聞いてみたいです。

現在のアプローチ

私は手動でのみのAudacityで切断す​​ることができます。

答えて

1

まず、あなたの質問には、MP3やそれがどんなコーデックで始まるかは関係ありません。意味のある処理を行うには、それを通常のPCMストリームに変換する必要があります。 FFmpegはこれには最適ですが、MP3のための他の多くのツールがあります。

次に、音声認識ライブラリを調べることをおすすめします。それを裸のコンポーネントに取り除くと、単語の境界線が得られるかもしれません。

この問題は、オーディオの静かな点を探してカットするほど簡単ではありません。話すときのほとんどの人々は、そこからの空気の流れと音の出力を制御するアーティキュレーションが連続した息と音でそうします。これは特に専門家の場合です。何が話されているのかを把握しておく必要があります。そのため、音声認識ライブラリが始めるのに適していると思います。

関連する問題