Родная раскладка. Как научить компьютер понимать удмуртский язык

Ребят легче увлечь изучением языка через игру. © / Станислав Ломакин / АиФ

Программист и андроид-разработчик из Ижевска Григорий Григорьев с лёгкостью переходит с русского на удмуртский и обратно. Удмуртский он не просто знает и любит, а делает всё, чтобы увлечь им как можно больше людей. Благодаря ему на родном языке Григория заговорил «Яндекс. Навигатор», ижевчанин создал клавиатуру, включающую удмуртские буквы, работает над созданием синтезатора речи.

   
   

Alt + буква

Марина Медведева, «АиФ в Удмуртии»: С чем связан такой пристальный интерес к языку? Как он вошёл в вашу жизнь?

Григорий Григорьев: Удмуртский язык для меня родной, на нём я говорю с самого детства. Я вырос в д. Новая Монья Малопургинского района, и удмуртский был основным языком общения. На русском, впрочем, там тоже говорили, так что с раннего возраста привык пользоваться сразу двумя языками. Позже, когда я переехал в Ижевск, мне стало очень не хватать общения на удмуртском. Так как я программист, то увидел, что не хватает, а то и вовсе нет инструментов для переписки на родном языке – той же раскладки для клавиатуры с нашими буквами. Так всё и началось.

– Говорят, что люди, которые с детства говорят на одном и более языках (билингвы), более развиты, им проще учиться, осваивать новое. Как вы думаете, это действительно так?

– Могу сказать, что осваивать языки точно проще. По работе мне необходимо знание английского, и я заметил, что у него с удмуртским есть общие черты. Например, в наших языках нет родов. Сначала я изучал удмуртский естественным путём, в живом общении, потом, конечно, в школе. Когда начал работать над проектами, понял, что не хватает более глубоких знаний. Ещё во время учёбы в университете я начал создавать словарь правописания удмуртского языка. Это было нужно для программы проверки правописания на компьютере. Пришлось начать более серьёзно изучать правила, конструкции и т. д.

– Почему вы решили разработать словарь?

– Когда в мессенджерах и соцсетях общался с друзьями на удмуртском, то сразу увидел проблему – система постоянно пыталась исправить текст, так как не узнавала язык. Вот я и подумал: если она его не знает, то надо научить. Поэтому и начал создавать словарь правописания. Его я разработал в 2012 г. Примерно в то же время создал специальную клавиатуру для компьютера, включающую пять дополнительных букв, которых нет в обычной раскладке.

   
   

– А куда вы их добавили, ведь клавиатуры всегда типовые?

– Да, была такая проблема. Самый удобный – через клавишу Alt. Вы нажимаете эту клавишу одновременно с нужной вам буквой и получаете нужную вам букву с точками. Есть специальный сайт, с него можно скачать файл, где есть все необходимые инструменты для добавления удмуртского языка с буквами на ваш компьютер.

Навигатор по-удмуртски

– Вы разработали приложение для изучения удмуртского языка. Насколько это было сложно и для кого вы его создавали?

– Идея приложения появилась сама собой. Я чувствовал, что той информации, которую мы получаем в школе и университете, недостаточно, поэтому нужен какой-то простой и понятный инструмент для изучения языка. Прежде были только печатные ресурсы (книги, статьи, самоучители), а вот электронных не было. Так как сейчас многие пользуются телефонами и приложениями, мне показалось, что это очень хорошая идея. Приложение больше подходит для тех, кто не знает язык, но собирается его изучать. Детей легче увлечь через игру. Вместе с детьми из лагеря «Шундыкар» разработали игру «Ӧлиас». Её суть – в угадывании слов. Интерфейс на удмуртском языке, но есть и перевод для начинающих изучать.

– Ещё вы научили говорить по-удмуртски навигатор…

– Да, я считаю, что удмуртского языка должно быть больше в ежедневном общении. Люди часто пользуются навигаторами, и это ещё больше может погрузить их в языковую среду. У приложения два варианта озвучки, причём мужской голос говорит на литературном удмуртском языке, а у женского – алнашский диалект. Так видно разнообразие использования языка. Это очень интересно.

– Как вы думаете, готова ли молодёжь изучать удмуртский язык?

– Мне кажется, интерес есть. Недавно общался с человеком, который родился в Удмуртии, но учится в Екатеринбурге. На удмуртском в семье говорит только дед. Родители языка не знают. У него проснулся интерес, поэтому он начал сам изучать. И сейчас уже может на нём общаться.

– Почему старшее поколение хорошо владеет языком, а с каждым последующим – всё меньше?

– Часто бывает, что родители, которые знают удмуртский, не общаются на нём с детьми. Вариантов может быть несколько. Один из них – они боятся, что у ребёнка появится акцент и возникнут какие-то проблемы в общении. Кроме того, многие привыкли, что во внешней среде, вне семей, много общения на русском. Поэтому родители хотят, чтобы ребёнок проще встраивался в общество, где бы он ни жил.

– В республике многое делают для популяризации родного языка. Что бы вы добавили?

– Думаю, что должно быть больше инструментов для изучения. Человека должна окружать языковая среда, чтобы он мог изучать язык, параллельно что-то делая. Можно, например, включить курсы удмуртской кухни. В этом случае есть возможность и готовить, и изучать слова.

– Вы и сами создаёте такую среду, являясь соучредителем сообщества «Куара». О чём этот проект и на что он направлен?

– Куара в переводе с удмуртского означает «звук». Мы создаём видеоконтент (клипы, проморолики, обучающие видео) на удмуртском языке. Недавно был проект по созданию клипов. Мы создавали видео для артистов, которые поют на удмуртском. Так мы продвигаем родную культуру.

– Вы стали обладателем премии «Признание». Во время награждения вам также вручили сертификат на разработку нейронных сетей для синтезатора по распознаванию удмуртской речи. Как идёт работа над проектом?

– Она продолжается. Синтезатор создаётся на основе нейронной сети. Сначала нужно её обучить, а затем на основе этих данных сохраняется алгоритм. Уже готовы восемь тысяч аудиофайлов – восемь часов записи. Когда работа будет завершена, на сайте можно будет ввести текст, который система озвучит.

Сообщество близких людей

– Нейросети становятся всё более популярными. Так и переводчики скоро будут не нужны?

– Пока они часто ошибаются, потому что учатся на тех же данных, которые создают. Полностью доверять им не стоит, но они развиваются. Считаю это направление перспективным и в будущем, возможно, полностью перейду на разработку нейросетей. Это очень востребовано, так как нейросети будут всё больше интегрированы в нашу жизнь. Множество программ будут использовать их для увеличения скорости и качества работы. Это будет повсеместно. Что касается переводчиков, то русско-английский машинный перевод уже на довольно высоком уровне. В будущем качество будет ещё расти, и машинный перевод будет на уровне с профессионалами. Возможно, переводчики действительно могут уже не понадобиться.

– Язык – это отражение культуры. Что особенного в удмуртской культуре?

– Для нас очень важна природа и люди, которые нас окружают. Раньше удмурты жили в основном в деревнях, и было сообщество людей, которые знали друг друга. Есть даже такое слово – боляк (община). Такое объединение близких людей, которые общаются, дружат и друг другу помогают. Сейчас эта важная традиция, к сожалению, ушла. Люди общаются реже и всё чаще в мессенджерах. Конечно, хорошо быть всегда на связи, но не хватает живого общения. Я это особенно остро чувствую, так как работаю удалённо. По возможности, стараюсь посещать интересные события и мероприятия. Например, недавно прошла премьера очередного фильма на удмуртском языке. Очень здорово, что он появился. Таких мало – всего четыре-пять. Они как раз важны для создания и поддержания языковой среды.