Облако 2 июля 2024

Студентка МАИ разработала компьютерную программу по переозвучиванию сленговых слов в аудиофайлах

Студенты Московского авиационного института разрабатывают IT-инструменты, помогающие в жизни. Один из них представила студентка кафедры 806 «Вычислительная математика и программирование» Дарья Иванченко. Её программа способна распознавать в аудиофайлах сленговые слова и заменять их на литературные варианты.

Студентка МАИ разработала компьютерную программу по переозвучиванию сленговых слов в аудиофайлах

Принцип работы с программой прост. Сначала необходимо создать словарь: записать сленговые выражения, которые необходимо обнаруживать в аудиозаписях. Программа преобразует звуки в набор коэффициентов, т.е. попросту говоря, в числа. После чего через такое преобразование проходит исходная аудиодорожка, которую нужно проверить на сленг. Затем динамический алгоритм программы сравнивает оба набора коэффициентов, и в том месте, где они наиболее похожи, он и находит искомое слово и заменяет его на литературный аналог.

Разработка Дарьи не имеет аналогов в России. До сих пор работу по замене в аудиотреке нежелательных слов специалистам приходиться делать «руками». Ещё одно важное преимущество инструмента — в том, что замена производится голосом говорящего, тем самым добиваясь органичного звучания речи.

— Работая над проектом, я открыла для себя много нового: узнала, как в целом работает аудио, как программа понимает его и обрабатывает. Сложнее всего оказалось добиться более или менее приемлемой точности, приходилось долго подбирать нужные коэффициенты, — рассказала Дарья.

Уже сейчас Дарья использует свою разработку для понимания аудиосообщений своих друзей, содержащих непонятные ей сленговые слова. В будущем её можно адаптировать для работы с потоковой речью. В этом случае программа сможет очищать речь говорящего от сленговых и нецензурных слов в прямых эфирах средств массовой информации.

Однако для этого программе предстоит ещё многому научиться: пока она умеет распознавать только чуть более 50% вводимых сленговых слов.

Материал подготовлен при поддержке Минобрнауки России.

Актуальное