Методы применения VAD в системах распознавания казахской речи

Автор: Калимолдаев Максат Нурадилович, Мусабаев Рустам Рафикович, Мамырбаев Оркен Жумажанович, Тусупова Белла Борисовна

Журнал: Проблемы информатики @problem-info

Рубрика: Средства и системы обработки и анализа данных

Статья в выпуске: 1 (18), 2013 года.

Бесплатный доступ

Рассмотрена возможность применения алгоритма “Voice activity detection” в системе распо­знавания казахской речи. Предложены математическая модель VAD и способы обнаружения речевых данных: пауз между фразами, словами, отдельными звуками. Алгоритм VAD при­способлен к распознаванию казахской речи с учетом ее основных свойств. Впервые проведено исследование обнаружения голосовой активности в казахской речи.

Распознавание речи, обнаружение голосовой активности, речевой сигнал.

Короткий адрес: https://sciup.org/14320193

IDR: 14320193

Список литературы Методы применения VAD в системах распознавания казахской речи

  • Дорохин О. А., Старушко Д. Г. Сегментация речевого сигнала//Искусств. интеллект. 2000. №3. С. 450-478.
  • Шелепов В. Ю., Ниценко А. В. Амплитудная сегментация речевого сигнала, использую­щая фильтрацию и известный фонетический состав//Искусств. интеллект. 2003. №6. С. 120-123.
  • Lamel L. F., Rabiner L. R., Rosenberg A. E., Wilpon J. G. An improved endpoint detector for isolated word recognition//IEEE Trans. Acoust., Speech, Signal Process. 1981. V. 29, N 4. P. 23-31.
  • Rabiner L. Fundamentals of speech recognition/L. Rabiner, Juang Biing-Hwang. Englewood Cli.s: Prentice Hall, 1993.
  • Deller J. R. (Jr.). Discrete-time processing of speech signals/J. R. Deller(Jr.), J.H.L.Hansen, J. G. Proakis.John Wiley and Sons. IEEE Press.
  • Nilsson M., Ejnarsson M. Speech recognition using hidden Markov model//2002. Degree of Master of Science in Electrical Engineering. Blekinge Institute of Technology. Karlskrona: Kazerntryckriet AB, 2002.
  • Aida-Zade К. R. Investigation of combined use of MFCC and LPC features in speech recognition systems/К. R. Aida-Zade, C. Ardil, S. S. Rustamov. World Acad. of Sci., Eng. and Technol. 2006.
  • Rabiner L. R., Sambur M. R. An algorithm for determining the endpoints of isolated utterances//Bell System Tech. J. 1975. P. 298-315.
  • Atal B., Rabiner L. A pattern recognition approach to voiced-unvoiced-silence classi.cation with applications to speech recognition//IEEE Trans.Acoust.,Speech, Signal Process. V.24. P.201-212,197.
  • Rabiner L. R. Digital processing of speech signals/L. R. Rabiner, R. W. Schafer. Englewood Cli.s: Prentice Hall, 1978. P. 666-667.
  • Рабинер Л. Р. Цифровая обработка речевых сигналов/Л. Р. Рабинер, Р. В. Шафер. М.: Радио и связь, 1981.
Еще
Статья научная