2017-04-04 3 views
1

私は顧客ケアデータに関する音声の感情分析に取り組んでいます。カスタマーケア担当者が質問し、顧客がレビューを行ったオーディオファイルがあります。Pythonでオーディオファイルを分割する方法

私は、顧客が、幸せな悲しいか中立であるかどうか、このオーディオを分割し、感情分析を行うために、お客様からのレビューのみ部分を取得する必要があります。

オーディオファイルを分割して顧客の音声のみを取得する方法を教えてください。オーディオは、フォーマット「.aac」である

今のところ、これは私がやっていることです:

from os import path 
AUDIO_FILE = path.join(path.dirname(path.realpath('C:\\Users\\anagha\\Documents\\Python Scripts')),"Python Scripts\\audioa.aac") 

halfway_point = len(AUDIO_FILE)/2 
+0

サイズや無音に基づいて分割したいのであればあなたはhttp://stackoverflow.com/questions/37725416/pydub-combine-split-on-silence-with-minimum-length-file-size を見ることができます。しかし、私はあなたが最初にどのように決定する必要があると信じています顧客とクライアントのオーディオを区別します。おそらく、音声認識ツールが役立つでしょう。 –

+0

ありがとう、どのように顧客とクライアントのオーディオの間のdefferentiateに任意の提案? – Anagha

答えて

2

あなたがここにpydub

from pydub import AudioSegment 
sound = AudioSegment.from_file(AUDIO_FILE) 

halfway_point = len(sound) // 2 
first_half = sound[:halfway_point] 

# create a new file "first_half.mp3": 
first_half.export("/path/to/first_half.mp3", format="mp3") 
+0

ありがとうございます。しかし、どのように出力を取得し、それがカットされているかどうかを確認するには?どのように出力をエクスポートするのですか? – Anagha

+0

@Anaghaは輸出ラインで回答を更新しました – Jiaaro

0
でそれを行う方法ですが、pydubタグを使用するので

私は元の質問に答えるには遅すぎると思っていますが、この質問につまずいている人は、この手順が役に立つかもしれません。

- >データをダイアライドするツールを使用してください。私はLIUM(http://www-lium.univ-lemans.fr/diarization/doku.php

を使用していた

- > SO(Parsing LIUM Speaker Diarization Output

を投稿するこの美しくシンプルに基づいて出力を解釈して、最終的にはオーディオファイルをスプライスするために、上記で得られたタイミングを使用します!音声をテキストに変換することはまったく別の課題であり、(Googleのような)大量のデータを使った深いアプローチやAPIプロバイダに依存する必要があります

関連する問題