1、librosa
1
2
3
4
|
import librosa filepath = "/users/birenjianmo/desktop/learn/librosa/mp3/in.wav" y,sr = librosa.load(filepath) mfcc = librosa.feature.mfcc( y,sr,n_mfcc = 13 ) |
返回结构为(13,none)的np.array,none表示任意数量
2、python_speech_features
1
2
3
4
|
from python_speech_features import mfcc as pmfcc filepath = "/users/birenjianmo/desktop/learn/librosa/mp3/in.wav" (rate,sig) = wav.read(filepath) amfcc = pmfcc( sig, rate ).t |
返回结构为(none,13)的np.array,通过 .t 可转为(13,none)
3、这两种方式的mfcc还是有明显的区别的,上面两个子图是从(1)librosa得到的 mfcc[0] 和 mfcc[1],下面的是(2)python_speech_features得到的 amfcc[0] 和 amfcc[1]
以上这篇对python使用mfcc的两种方式详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/seTaire/article/details/85707088