Если посмотреть на спектр человеческого голоса, произносящего гласные

то можно увидеть, что
горизонтальные структуры (форманты) образуются "частоколом"
вертикальных структур.
Какова природа этих структур? Являются ли они приборным эффектом, возникающим, например, от того, что спектр вычисляется путём разбиения сигнала на 10 мс кусочки?
Или они реально существуют в звуке? Если "да", то что это такое?