Home » Баяндамалар » Акустика речи

Акустика речи

Речевые сигналы – это совокупность  элементов  акустической  энергии  с быстро меняющимися  амплитудами  и частотами.

Особенности звуков речи определяются  различием  их  акустических  свойств: высоты, силы, тембра и длительности. Волновой сигнал гласных  звуков более прост по сравнению  с волновой  формой согласного звука, так  как  обладает  значительной степенью периодичности. С точки зрения акустики  гласные звуки  отличаются от  сложных звуков.

Спектры  гласных  звуков  неравномерны и, как правило, имеют подъемы, которые  называются формантами. Так, звуки  «у»   и  « ы» характеризуются  низкими  формантами —  от 200  до  600Гц. Звук а независимо  от того, голосом  какой  высоты он произнесен, обладает  своеобразной формантой  в области от 1000 до 1400Гц. Спектры согласных  звуков  имеют  более сложные  акустические  характеристики. Наряду с периодическими  колебаниями звонким согласным свойственны  непериодические  колебания высокой частоты. Для других согласных п, ш и др. Характерны только  непериодические  колебания  различной  частоты.

Основная  частота  голоса F определяет частоту следования импульсов, генерируемых  голосовыми связками. В  среднем  для мужского  голоса F=120Гц, для женского – 140-150Гц. Первая и вторая форманты  речи соответственно обозначаются как   F и F 2. Они определяют область  частот, на  которых в спектре  речевых звуков  обнаруживаются  максимумы.

Чтобы  звуковые  колебания  могли  стать  средством  общения  между   людьми, они  должны  как-то  отличаться и состоять  из  каких — либо  отдельных   звуковых  единиц. Согласно современной  теории  речеобразования и восприятия речи, такими звуковыми  единицами  являются  фонемы. Последовательность фонем  образуют слово, а последовательность  слов — сообщение.

Изменения порядка следования  фонем или  их числа приводит к  изменению слова.

Для каждого  языка  характерно  определенное  число звуковых единиц . В немецком языке имеется — 24 согласных и 15 гласных  фонем, в английском  насчитывается 33 согласных дифтонга и 12 гласных фонем.

Каждая  фонема имеет свой спектр, в котором  форманты  располагаются  в определенном  диапозоне  частот.  При этом, несмотря на наличие межиндивидуальных  различий  в  спектральной  картине  отдельных  звуков  речи, произнесенных   женщиной, мужчиной  или ребенком, частотные и амплитудные соотношения  между отдельными   формантами, их длительность и характер изменений практически остаются стабильными. Именно поэтому  звуки  речи  относительно легко распознаются  человеком.  Максимальное число формант в спектре  речи может достигать семи, однако для распознания  отдельныхъ фонем  наиболее  важным являются только  первая, вторая и третья форманты.

Разборчивость речи

Чтобы речь была услышана, ее уровень должен  быть выше порога слышимости  или  порога  обнаружения.  Только в этом случае  слушающий  начинает  различать  отдельные  слова.

Основным  методом количественной  оценки  разборчивости речевых  сигналов является   артикуляционный   метод, согласно  которому  определяют  количество  слогов,  слов  или предложений, произнесенных     диктором  или записанных   на  магнитный  носитель и правильно  повторенных   слушателем. Разборчивость  речи  выражают через  коэффициент   разборчивости  или в  процентах.

Многочисленными  экспериментами  установлено, что с повышением интенсивности  речевых сигналов  их  разборчивость   повышается. Пороги  разборчивости  зависят  как  от  фонемного  состава  речевого  материала  и количества  слогов  в  слове,  так и от частоты  их употребления,  а также  от наличия и  характера  шумовой помехи.  Разборчивость  речи зависит  не только  от  морфологических,  синтаксических и  лингвистических   особенностей  речевого  материала, но также  и от акустических  условий и других  физических  факторов, влияющих  на  качество  звука  и  его  воспроизведение.

Эксперементы  по  разборчивости  речи, пропущенной  через  фильтры  низких  и высоких  частот, позволили  установить   влияние  различных   участков    частного  диапазона  на  качество  звучания  речи и разборчивость (Д.Ликлайдер, Д.Миллер,1963; М.М.Эфрусси,1975). Результаты этих  исследований показали, что  частоты  выше 3400 Гц   практически не вносят  вклада  в  разборчивость,  поскольку  диапозон  частот  от 100  до 3400 Гц  обеспечивает  более 90 %  разборчивости  речи.

На  разборчивость  речи влияют такжет  ее амплитудные   ограничения.  Типичным амплитудным искажением   является клиппирование   звуковых сигналов. При этом  если  ограничение  пиковых  амплитуд  сигнала  составляет  0-20 дБ  от  их  максимальных  значений, то  разборчивость  речи  снижается  до 90-96 %  по  сравнению  с разборчивостью  речи  без  клиппирования.

Искажения  возникают,если не совпадают  скорость  воспроизведения и скорость записи.При этом меняется тембровая  окраска  речевых  звуков, что обусловлено   изменением  спектрального  состава речи.

Аналогичные  искажения  речи происходят  и при сдвиге  спектра  речевого сигнала в сторону  высоких или низких  частот (Ю.В.Крылов и др., 1980 Д.Ликлайдер,Д. Милер,1963). Такой  вид частотных   искажений  иногда наблюдается  при  передаче  и приеме   речевых   сигналов  через приемопередающие  системы.  Линейный сдвиг  спектра  речи  приводит к резкому  нарушению ее  разборчивости  пропорциональна    величине  сдвига  спектра  речи.

 

Мадина Мусабаева,

методист по инклюзивному образованию,

методический кабинет Южно – Казахстанской области

Сіз не дейсіз оқырман?

Е-мэйлыңыз жарияланбайды.