2015-12-14 18 views
8

私の仕事は音声/音声/音声の比較を扱うプロジェクトに取り組んでいます。このプロジェクトは、競技会で勝者を判断するために使用されます(模倣)。実際には、ユーザーの音声/声をキャプチャし、元のオーディオファイルと比較し、一致率を返します。私はR言語でこれを開発する必要があります。と音声の比較R

私はすでにR(tuneR、audio、seewave)で音声関連パッケージを試していましたが、私の検索では比較関連情報を取得できません。

このタイプの問題を処理するための最良の方法である私の仕事に関する情報がどこにあるのか、そしてその場合、これらのタイプのオーディオを処理するための前提条件は何か作業。

+0

私はオーディオ処理のエキスパートではありませんが、あなたに役立つ可能性のある 'seewave'を使ってたくさんのことをすることができます。あなたの特定の問題については、スペクトログラムと振幅の正規化が私の頭に浮かびます。どちらも 'seewave'で簡単に実行できます。 – cryo111

+0

ご提案のための屋のおかげで、私は私の知識あたりとして、私たちは、私はあなたがそれについてどんな考えを持っているなら、私に知らせてください見つけることができ、正規化をしながら正当な値を持っている必要があり、seewaveパッケージにおける振幅の正規化を試みたが、していました。もう一度あなたに感謝します。 – Dinesh

答えて

5
  • 基本的には、スピーチ/音声比較のために使用される最高の機能はMFCCです。

は、これらの係数を抽出するために使用できるいくつかのソフトウェアがあります。Praat website
ます。また、これらの係数を抽出するためのlibを見つけることを試みること。
[編集:私はそれはMFCCを抽出する機能を有することをtuneR documentationで見つけた - 機能melfcc()の検索]

  • あなたがこれらの機能を抽出した後、あなたは機械学習(SVM、RandomForestsかを使用することができますそのようなもの)を分類器を開発する。

私は、スピーカー認識システムについて紹介したセミナーを見て、それを参考にしてみてください。 (Seminar)

あなたは時間と関心を持っている場合は、あなたが読んでALGOができます:あなたは」は、
Authors: Kinnunen, T., & Li, H. (2010)
Paper: an overview of text-independent speaker recognition: From features to supervectors

をあなたが(MFCCおよび/または他の機能との)各オーディオサンプルに対する特徴ベクトルを取得した後特徴ベクトル(Bから特長対から機能)のペアを比較する必要があるでしょう:
あなたはこれらの差の絶対値を使用しようとすることができましていますctors:

  • ABS(から特徴ベクトル - Bから特徴ベクトル)

以上の動作の結果は、すべての要素が> = 0であり、特徴ベクトルでありますA(またはB)特徴ベクトルと同じサイズを有する。

また、AとBの間の機能要素毎の乗算をテストできます。

  • A1 * B1のA2の*のB2を...アン* Bnを

次に、あなたは)人物A ==人物B0場合は人物A!=人物B場合は、各特徴ベクトル
1にラベルを付ける必要があります。

通常絶対差は、乗算特徴ベクトルよりもパフォーマンスが向上しますが、両方のベクターを追加すると同時に、ABSデフ乗算機能の両方を使用して分類器のパフォーマンスをテストすることができます。

+1

素晴らしい答えですが、作者は競​​技会を参照しました。私はオーディオ処理の背景を持っていないので、これは非常に興味深いものです。しかし、あなたは、2つのベクトルのノルムのようないくつかの関数を見たいと思わないでしょうか?1つのベクトルは、模倣しようとしているものと他のものが競合するものです。 –

+1

私は模倣したことがありませんでしたが、私はすでにスピーカー認識システム(SRS)で作業しています。この模擬問題を解決するために、私はSRSで使用されているのと同じアプローチを使用します。 SRSでは、偽装(および模倣)に対して堅牢でなければならない分類子を開発しています。なりすましを処理する1つの方法は、分類子を予測子として使用することです(分類子の確率応答を得る)。ノルムを探すのではなく、競合他社とあなたが模倣しようとしていることの間のこの確率を見てみましょう。擬似問題は、話者認識システムのなりすまし問題に類似していると思うので、私は上記のアプローチを選択します。 –

+0

Normは通常、最良のアプローチではありませんが、実装するのが最も簡単です。ノルムの代わりに、A(競合者)とB(模倣しようとする)の特徴ベクトルを計算し、両方の特徴ベクトル間のコサイン類似度(または相関)を計算する方がより簡単なアプローチになります。 –