librosa

    1

    1答えて

    私はlibrosaを使用して音楽信号を分析し、必要な機能を抽出することに決めました。現在、私はいつも音楽のスペクトルを視覚化しようとしています。私は図書館でSTFTしてスペクトルを返すこのmethodを見つけました。しかし、スペクトラムが特定のフレームで計算された行列を返します。 このライブラリを使用して、時間をかけてスペクトルを計算することは可能でしょうか、何らかの方法で所定の行列を処理するか、

    0

    1答えて

    私はいくつかの.wavファイルから1秒を60秒の長さに切断して、いくつかのデータを生成するためにlibrosaを使用しようとしています。 この部分の作品は、私はすべての私のファイルを作成して、私はまた、任意のプレーヤー経由でそれらを聞くことができますが、私はlibrosa.loadでそれらを開こうとする場合、私は、このエラーが表示されます。 >>> librosa.load('.\\train\\

    0

    1答えて

    私はこれがある を私tensorflowコードでlibrosa で使用されているすべてのデフォルトパラメータに一致するようにしようと、異なる結果を持っている lybrosa MFCC tensorflow MFCC私のpythonと同じ結果を与える作るしようとしています私が使用しているtensorflowコード: waveform = contrib_audio.decode_wav( audio

    0

    1答えて

    librosa、wave、またはsoundfileライブラリのいずれかを使用してPythonでファイルを読み込んでいて、チャンク(任意のサイズ)をHTTPストリームにプッシュする必要があります。仕様では、ストリーム文字列入力では、フレームをRAW s16le形式に変換する必要があります。 は私が含む複数のオプションを試してみました: soundarray,rate = librosa.load(p

    0

    1答えて

    次のコードでは、各ループの繰り返しでオーディオファイルの10フレームを保持するバッファを作成しました。 import collections import librosa import wave my_buffer = collections.deque(maxlen=10) f = wave.open('Desktop/0963.wav',"rb") num_frames = f.ge

    1

    1答えて

    私はPython(Anaconda3、Ubuntu 16.04)で書かれた深い学習コードを持っています。基本的には、訓練されたモデルに基づいて特定の動画の広告を検出し、動画が広告かどうかを返す必要があります(単発撮影と仮定しています)。現在利用できない私の同僚はこれを書きました。 元のファイルには、ショットのリストを繰り返し再生する(複数のショット用)ループがありました。この時点では、そのショット

    0

    1答えて

    .mp3のファイルをDSX for Music Information Retrievalで処理します。私はこの目的のためにPythonでlibrosaライブラリを使用しています。しかし、ffmpegがないため、ファイル.mp3をロードできません。 DSXに.mp3ファイルをロードするには、ffmpegをDSXやその他のウォークアラウンドにインストールする方法はありますか?

    0

    1答えて

    私はこのコードでグラフをプロットしてみてください。 db = librosa.core.amplitude_to_db(y) plt.title('Noise level') plt.xlabel('Time') plt.ylabel('Volume, db') plt.plot(db) 結果として私は、このようなグラフを得た: 。 そうでなければ、私はx軸とy軸でデシベルため時間に

    1

    2答えて

    私はラズベリーパイ3でlibrosaを実行しようとしています。 インターネットで検索したところ、最終的にはインストールできましたが、インポートしようとするとエラーが発生します。まず、依存関係llvmliteのインストールに問題がありました。私はついに次のコードでそれをインストールしました:conda install -c numba llvmlite 私はminicondaでpython 3.4ビ

    0

    1答えて

    与えられたサウンドファイルのfftを計算し、その形状の配列を取得します。 (100,257)、100行と257個の周波数ビンがあります。私は、ニューラルネットワークの入力ベクトルとしてこれを使用したいが、私は https://librosa.github.io/librosa/generated/librosa.util.normalize.html#librosa.util.normalize