Перейти к основному содержимому
Обработка речи в информационно-телекоммуникационных системах

Информация о курсе

В рамках курса «Обработка речи в информационно-телекоммуникационных системах» изложены базовые понятия информационного обмена в информационно-телекоммуникационных системах, освещены вопросы, связанные с хранением, обработкой и передачей аудиоданных. Отдельное внимание уделено вопросам моделирования и обработки речевых сигналов на основе частотных представлений. Дано описание модели восприятия звука человеком (психоакустическая модель), представлены методы и алгоритмы обработки речевых данных, разработанные в рамках исследований научного направления НИУ «БелГУ» «Информационно-коммуникационные технологии и компьютерное моделирование».

В результате освоения дисциплины слушатели будут иметь возможность получить не только теоретические знания, но и практические навыки применения и разработки технологий обработки речевых данных под руководством опытных преподавателей, будут уметь представления о методах и алгоритмах уменьшения объемов битовых представлений речевых данных при их хранении и передаче, познакомятся с системами распознания речи и дикторов; с системами синтеза речи на основе текстовых данных.

При успешном осовении онлайн-курса возможно получение сертификата онлайн-платформы.

Формируемые компетенции

• ПК-О-6 Способность к сбору, обработке, распределению и контролю выполнения заявок на техподдержку оборудования с помощью инфокоммуникационных систем и баз данных.

Результаты обучения

После успешного завершения курса слушатель будет:
• знать – основные инфокоммуникационные системы, используемые для обработки речевых данных;
• уметь – использовать основные инфокоммуникационные системы, применяемые для обработки речевых данных;
• владеть – навыками использования инфокоммуникационных систем в задаче обработки речевых данных.

Требования к слушателям курса

Слушатели должны иметь полное среднее образование и/или СПО по направлению подготовки «Инженерное дело, технологии и технические науки».

Программа курса

Модуль 1.Проблемы организации речевого обмена в ИТС
Основные понятия информационного обмена в ИТС. Способы его реализации.
Проблемы хранения, обработки, передачи и защиты информации.
Речевые сообщения и сигналы. Распространённые технологии информационного обмена на основе речевых сообщений.
Модели речеобразования.
Модель речевого тракта как линейной системы.
Структурные модели речевого сигнала.
Слуховой аппарат человека.
Области слухового восприятия человека.
Психоакустическая модель восприятия звука человеком.

Модуль 2. Моделирование и обработка речевых сигналов на основе частотных представлений
Математические основы частотной обработки речевых сигналов.
Дискретизация речевых сигналов с позиций частотных представлений.
Представление точного значения доли энергии отрезка дискретного сигнала в заданном частотном интервале.
Фильтрация речевого сигнала на основе КИХ-фильтров.
Оптимальное разделение отрезка речевого сигнала на аддитивные компоненты (линейная частотная фильтрация).
Субполосное кодирование речевого сигнала на основе использования банков КИХ-фильтров.
Оптимальное субполосное преобразование речевого сигнала на основе базиса собственных векторов матрицы субполосного анализа.
Интерполяция речевого сигнала. Методы интерполяции.
Интерполяционная формула Котельникова-Шеннона.
Интерполяция речевых сигналов на основе частотных представлений.

Модуль 3. Методы распознавания и синтеза речи
Технологии распознавания речи.
Система распознавания цифр и цифровых последовательностей.
Система распознавания с большим объемом словаря.
Системы распознавания дикторов.
Применение нейронных сетей для распознавания речи.
Синтез речевого сигнала.
Параметрический синтез речи.
Компиляционный синтез.
Полный синтез речи по правилам.
Предметно-ориентированный синтез.

Модуль 4. Уменьшение объёмов битовых представлений (сжатие) речевых данных в ИТС
Преобразование речевых данных при сжатии.
Основы метода линейного предсказания.
Кодирование с линейным предсказанием.
Сжатие речевых данных на основе кодирования пауз в речевых сообщениях.
Обнаружение участков речевого сигнала, соответствующих паузам речи, за счет учета различий в распределении энергий шумов и звуковых данных в частотной области.
Сжатие речевых сигналов на основе субполосных преобразований.
Методы статистического кодирования.

Команда курса

Course Staff Image #2

Жиляков Евгений Георгиевич

доктор технических наук, профессор кафедры информационно-телекоммуникационных систем и технологий НИУ «БелГУ»

Course Staff Image #2

Балабанова Татьяна Николаевна

кандидат технических наук, доцент кафедры информационно-телекоммуникационных систем и технологий НИУ «БелГУ»

Course Staff Image #2

Прохоренко Екатерина Ивановна

кандидат технических наук, доцент кафедры информационно-телекоммуникационных систем и технологий НИУ «БелГУ»

Course Staff Image #2

Трубицына Диана Игоревна

старший преподаватель кафедры информационно-телекоммуникационных систем и технологий НИУ «БелГУ»

Направление подготовки

по укрупненным группам специальностей и направлений подготовки высшего образования – 11.00.00 Электроника, радиотехника и системы связи, 10.00.00 Информационная безопасность 09.00.00 Информатика и вычислительная техника

Область деятельности

Инженерное дело, технологии и технические науки

Часто задаваемые вопросы

Какой веб-браузер я должен использовать?

Открытая платформа edX лучше всего работает с текущими версиями Chrome, Firefox или Safari, или с Internet Explorer версии 9 и выше.

Смотрите список поддерживаемых браузеров для получения самой последней информации.

Начало: 01.09.2022
Конец: 01.01.2029
Внести в список