2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Мел-кепстральные коэффициенты (mfcc)
Сообщение28.05.2015, 09:49 
Аватара пользователя
Здравствуйте. Я хочу получить мел-кепстральные коэффициенты для дискретного сигнала. Они вычисляются следующим образом.

$B(f) = 1125\ln(1+\frac{f}{700})$ - формула перевода частоты в мел.

$x[n], 0 \leqslant n < N$ - исходный сигнал, $N$ - количество отсчётов.

$X[k] = \sum^{N-1}_{n=0} x[n]e^{\frac{-2\pi i}{N} k n}, 0 \leqslant k < N$ - дискретное преобразование Фурье.

$\begin{equation*}
H_{m}(k) = 
 \begin{cases}
   0 & k < f[m-1]\\
   \frac{(k-f[m-1])}{(f[m]-f[m-1])} & f[m-1] \leqslant k < f[m]\\
\frac{(f[m+1]-k)}{(f[m+1]-f[m])} & f[m] \leqslant k \leqslant f[m+1]\\
0 & k > f[m+1]
 \end{cases}
\end{equation*}$
- треугольные фильтры на которые мы будем "накладывать" спектр нашего сигнала.

$f[m] = (\frac{N}{F_{s}})B^{-1}(B(f_{1}) + m \frac{B(f_{h}) - B(f_{1})}{M+1})$, где M - количество фильтров (сколько коэффициентов мы хотим получить).

$S[m] = \ln(\sum^{N-1}_{k=0}abs(X[k])^2 H_{m}[k]), 0 \leqslant m < M$ - логарифмированная энергия сигнала для каждого фильтра.

$c[n] = \sum^{M-1}_{m=0}S[m]\cos(\frac{\pi n(m+\frac{1}{2})}{M}), 0 \leqslant n < M$ - дискретное косинусное преобразование.

Мне непонятно следующее.
$f_{1}$ и $f_{h}$ - минимальная и максимальная частоты фильтров. Имеется ввиду, что в качестве $f_{1}$ и $f_{h}$ нужно брать нужный нам диапазон? Например, диапазон воспринимаемых человеческим ухом частот?

 
 
 [ 1 сообщение ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group