История башкирского народа, быт, семья, национальная кухня, изготовление юрт
8 (927) 338-31-66 minasaba@mail.ru г. Уфа, ул. Кустарёво, 15д
Главная » Новости » Нейронные сети на службе башкирского языка
Нейронные сети на службе башкирского языка


Современные информационные технологии позволяют во многом упростить нашу жизнь. Например, как прочитать книгу, статью, литературное произведение, если у вас:
- во-первых, есть желание, но не хватает на это времени;
- во-вторых, вы лучше воспринимаете текст на родном башкирском языке, а материал написан на русском.

Решить эту задачу можно так: перевести текст с русского языка на башкирский, а затем башкирский текст перевести в аудио формат, то есть озвучить. А потом, раз не хватает времени на чтение, слушать этот аудиотекст, например, в машине, на кухне и т.п. 

Вроде все просто, но как это сделать? Во-первых, машина должна перевести текст не только быстро, но и правильно, без искажения смысла. Во-вторых, машина должна озвучивать переведенный текст с необходимой интонацией, ударениями и паузами, приятным голосом. Как бы сложно это не представлялось, задача решена. Помогли в этом возможности современного нейронно-сетевого моделирования. Поистине, первым примером стал перевод на башкирский язык и последующее озвучивание рассказа Антона Чехова «Дама с собачкой».

В полученный аудиоматериал пока не внесены правки, но даже в таком первичном виде он является достаточным для понимания и правильного восприятия текста. В последующем напрашивается доработанный цельный программный продукт, которым мог бы легко воспользоваться рядовой пользователь, будь то школьник, родитель, ну и вообще любой заинтересованный человек. Кстати, например, так можно сформировать и отправить голосовое сообщение, поздравление, письмо любимому человеку, родителям и др. на башкирском языке, если автор сам плохо говорит или вообще не владеет башкирским языком.

Вот так при грамотном подходе нейронные сети могут помочь кардинально расширить границы использования башкирского языка. И дело это, без преувеличения, - государственной важности.

 

Вот, что пишут о проделанной работе сами разработчики:
Данная переводная автоаудиокнига была создана в июне 2022 г. в презентационных целях, чтобы показать современные технологические возможности башкирского языка. 
И, похоже, что она первая в своем роде, созданная исключительно на нейросетях.
 
Необходимо включить субтитры.
Перевод русского текста на башкирский язык осуществлён автоматически с помощью машинного переводчика https://bashkortsoft.ru/. В перевод людьми не было внесено ни одной правки, хотя это можно делать в будущем для промышленного изготовления подобных аудиокниг по принципу "само переводит, само читает". До этого данный рассказ Чехова никогда никем не переводился на башкирский язык.
 
Озвучка башкирского текста сделана с помощью авточтеца - синтезатора искусственной человеческой речи (за основу взят голос Наиля Юнусова). Скорость воспроизведения можно регулировать в настройках самого ютуба.
 
Над проектом работали:
Машинное обучение - Айдар Хусаинов (г. Казань)
Идея - Искандер Шакиров (г. Уфа) [http://ihtika.ru/project]
Алгоритм автоматической расстановки таймкодов в субтитрах - Марсель Ишимбаев (г. Москва)
 
Русский оригинал произведения можно послушать здесь: https://youtu.be/8JqFcMye6iU
 
Существует и башкирский женский искусственный синтетический голос-ассистент, созданный командой Айгиза Кунафина (https://vk.com/bashkort_voice), но его еще нужно довести до ума. Кстати Айгиз тоже много раз подавал заявки на гранты Главы РБ в области сохранения и развития языков, но теперь даже больше и не пытается.
 
Мы приглашаем носителей башкирского языка и всех желающих принять участие в совершенствовании русско-башкирского переводчика присоединиться к нашему телеграм-боту: https://t.me/bashkort_translate_bot
 
P.S. Мы надеемся, что власти Республики Башкортостан поддержат эту нашу работу в области цифровизации башкирского языка, ведь необходимо улучшать голоса и качество перевода. Пока же языковые активисты занимаются этим много лет на голом энтузиазме.