Мы, «Удмурт диджитал», совместно с телеграм-каналом «О чём поёт вотячка» сделали перевод сборника рассказов «Перепеч» Багай Аркаша с помощью нейронных сетей! Это первый перевод произведения с удмуртского языка, сделанный с помощью современных больших языковых моделей. И кажется, что это первый нейросетевой перевод книги для миноритарного языка России.
Перевод осуществлён моделью Claude 3 Opus с последующей редактурой человека. Подробнее о процессе перевода можно ознакомиться в книге.
Над проектом работали: Егор Лебедев (перевод с удмуртского), Анастасия Шумилова (редактура), Вера Штыкова (вёрстка, художественное оформление).
Перевод осуществлён моделью Claude 3 Opus с последующей редактурой человека. Подробнее о процессе перевода можно ознакомиться в книге.
Над проектом работали: Егор Лебедев (перевод с удмуртского), Анастасия Шумилова (редактура), Вера Штыкова (вёрстка, художественное оформление).
В наше время часто возникает потребность преобразовать текст с удмуртского языка на другой и обратно. Нехватка собственных знаний может затруднить этот процесс, а онлайн-словари не учитывают контекст слова и его частотность. В таком случае не остаётся ничего, кроме как обратиться к нейросетевым переводчикам. Эти инструменты могут быть полезны для тех, кто изучает удмуртский язык, работает с удмуртоязычными документами или просто интересуется культурой и литературой Удмуртии. Предлагаем ознакомиться с основными и наиболее распространёнными из них.
1. «Яндекс.Переводчик»
Один из первых удмуртских машинных переводчиков, появившихся в интернете. Главный недостаток — низкое качество текста. Система не справляется даже со склонением простых глаголов, поскольку обучалась на ограниченном наборе данных. Последнее обновление происходило в 2016 году, поэтому пользоваться этим сервисом не рекомендуем.
2. «Neurotõlge»
Создан специалистами Тартуского университета в Эстонии. Допускает значительно меньше ошибок по сравнению с «Яндекс.Переводчиком», но всё ещё требует доработок. Обучался на 33 тысячах параллельных предложениях. В наборе присутствуют почти все финно-угорские языковые пары.
3. «Майбыр Переводчик»
Базируется на разработках всё той же группы TartuNLP (Тартуский университет). Сервис разработан коми-активистом Алексеем Ивановым. На настоящий момент самый совершенный машинный переводчик для удмуртского языка. Поддерживает синтез речи. Также интерфейс включает локализацию на удмуртском языке. Рекомендуем использовать именно его.
А для того чтобы качество переводчиков стало ещё лучше, вы можете присоединиться к сбору параллельного корпуса на платформе «Tatoeba». Там мы переводим предложения с русского языка на удмуртский, пополняя тем самым базу данных. Ранее мы делали пост с инструкцией по регистрации на этом сервисе.
Суред: Чудья Жени.
1. «Яндекс.Переводчик»
Один из первых удмуртских машинных переводчиков, появившихся в интернете. Главный недостаток — низкое качество текста. Система не справляется даже со склонением простых глаголов, поскольку обучалась на ограниченном наборе данных. Последнее обновление происходило в 2016 году, поэтому пользоваться этим сервисом не рекомендуем.
2. «Neurotõlge»
Создан специалистами Тартуского университета в Эстонии. Допускает значительно меньше ошибок по сравнению с «Яндекс.Переводчиком», но всё ещё требует доработок. Обучался на 33 тысячах параллельных предложениях. В наборе присутствуют почти все финно-угорские языковые пары.
3. «Майбыр Переводчик»
Базируется на разработках всё той же группы TartuNLP (Тартуский университет). Сервис разработан коми-активистом Алексеем Ивановым. На настоящий момент самый совершенный машинный переводчик для удмуртского языка. Поддерживает синтез речи. Также интерфейс включает локализацию на удмуртском языке. Рекомендуем использовать именно его.
А для того чтобы качество переводчиков стало ещё лучше, вы можете присоединиться к сбору параллельного корпуса на платформе «Tatoeba». Там мы переводим предложения с русского языка на удмуртский, пополняя тем самым базу данных. Ранее мы делали пост с инструкцией по регистрации на этом сервисе.
Суред: Чудья Жени.
Приглашаем удмуртских переводчиков принять участие в проекте SuperMinor. Цель проекта — собрать данные, состоящие из инструкций, преимущественно на миноритарных языках России. Такой датасет нужен, чтобы улучшить навыки генерации больших языковых моделей на данных языках.
Как показывают недавние эксперименты, уже сейчас нейросети дают достаточно качественные ответы на удмуртском. Например, на вопрос: «Кин со Кузебай Герд?» («Кто такой Кузебай Герд?») — модель Claude 3 Opus выдает приемлемый ответ.
В дальнейшем собранные сведения помогут в создании виртуальных ассистентов, чат-ботов и систем машинного перевода для удмуртского языка. Наиболее активных участников автор проекта обещает поощрять денежными призами, а также книгами про языки и искусственный интеллект.
Не упустите шанс внести свой вклад в развитие удмуртского языка и технологий искусственного интеллекта! Для тех, кто заинтересовался и хотел бы поучаствовать в проекте — пишите в личные сообщения: @odomort. Для координирования мы добавим вас в чат переводчиков.
Автор проекта: Сергей Аверкиев (@doomgrad)
Сайт проекта: http://sumi.ac/
Как показывают недавние эксперименты, уже сейчас нейросети дают достаточно качественные ответы на удмуртском. Например, на вопрос: «Кин со Кузебай Герд?» («Кто такой Кузебай Герд?») — модель Claude 3 Opus выдает приемлемый ответ.
В дальнейшем собранные сведения помогут в создании виртуальных ассистентов, чат-ботов и систем машинного перевода для удмуртского языка. Наиболее активных участников автор проекта обещает поощрять денежными призами, а также книгами про языки и искусственный интеллект.
Не упустите шанс внести свой вклад в развитие удмуртского языка и технологий искусственного интеллекта! Для тех, кто заинтересовался и хотел бы поучаствовать в проекте — пишите в личные сообщения: @odomort. Для координирования мы добавим вас в чат переводчиков.
Автор проекта: Сергей Аверкиев (@doomgrad)
Сайт проекта: http://sumi.ac/
Знаете ли вы, что в мессенджере Telegram есть возможность выбрать удмуртский в качестве языка интерфейса? К сожалению, на данный момент перевод выполнен лишь на 1%. Но у нас есть отличная возможность исправить эту ситуацию и значительно увеличить процент. Сделать это очень просто:
- Переходим по ссылке и авторизуемся;
- Нажимаем на раздел Untranslated («непереведенное»);
- Приступаем к переводу строк интерфейса.
Участвовать в этом важном деле может любой пользователь Telegram, однако окончательное утверждение перевода остается за администратором.
Платформа предоставляет переводчикам возможность предлагать различные варианты перевода, голосовать за наиболее подходящие из них, а также оставлять комментарии и обсуждать нюансы. Это позволяет выбрать точные и естественно звучащие формулировки.
Чем больше людей присоединится к инициативе, тем быстрее удмуртский появится в списке доступных языков интерфейса Telegram. Объединение усилий сделает мессенджер еще более доступным для удмуртоязычных пользователей. Кстати, интерфейс другой популярной социальной сети «ВКонтакте» уже переведен на удмуртский на 80% — отличный пример для подражания.
Присоединяйтесь к переводу Telegram на удмуртский, чтобы вместе развивать и популяризировать наш родной язык в цифровом пространстве.
Суред: Чудья Жени.
- Переходим по ссылке и авторизуемся;
- Нажимаем на раздел Untranslated («непереведенное»);
- Приступаем к переводу строк интерфейса.
Участвовать в этом важном деле может любой пользователь Telegram, однако окончательное утверждение перевода остается за администратором.
Платформа предоставляет переводчикам возможность предлагать различные варианты перевода, голосовать за наиболее подходящие из них, а также оставлять комментарии и обсуждать нюансы. Это позволяет выбрать точные и естественно звучащие формулировки.
Чем больше людей присоединится к инициативе, тем быстрее удмуртский появится в списке доступных языков интерфейса Telegram. Объединение усилий сделает мессенджер еще более доступным для удмуртоязычных пользователей. Кстати, интерфейс другой популярной социальной сети «ВКонтакте» уже переведен на удмуртский на 80% — отличный пример для подражания.
Присоединяйтесь к переводу Telegram на удмуртский, чтобы вместе развивать и популяризировать наш родной язык в цифровом пространстве.
Суред: Чудья Жени.
Пришла отличная новость: команда «КУАРА» выиграла грант на создание первого удмуртского IT-класса «Вотэс» («Сеть»). Инициатива получила финансовую поддержку Фонда президентских грантов. Главная цель проекта — формирование сообщества молодых удмуртоязычных программистов, способствующих появлению IT-продуктов на удмуртском языке.
«Сейчас жизненно необходимо обучить новое поколение удмуртских программистов для будущего нашего языка», — отмечает министр национальной политики Удмуртии Эдуард Петров.
В рамках проекта 15 школьников 7-11 классов, владеющих удмуртским языком, пройдут специальное обучение по программированию игр на платформе Unity. Причем занятия будут вестись не только на русском, но и на удмуртском языке. После обучающего этапа участники разделятся на команды и под руководством наставников-программистов приступят к разработке собственных мобильных игр для детей дошкольного и школьного возрастов. Созданные игры помогут восполнить дефицит интернет-продуктов на удмуртском языке и станут ценным подспорьем для воспитания детей-билингвов, изучения родного языка в игровой форме. Завершится проект публичной презентацией разработанных приложений в Ижевске и районах Удмуртии.
Команда проекта, в состав которой входят Ольга Степанова, Гриша Григорьев, Влад Степанов, Егор Лебедев и Владимир Гурьянов, при поддержке партнёра «IT-КУБ.Ижевск», несомненно, внесет значительный вклад в сохранение и популяризацию удмуртского языка в цифровую эпоху.
Суред: Чудья Жени.
«Сейчас жизненно необходимо обучить новое поколение удмуртских программистов для будущего нашего языка», — отмечает министр национальной политики Удмуртии Эдуард Петров.
В рамках проекта 15 школьников 7-11 классов, владеющих удмуртским языком, пройдут специальное обучение по программированию игр на платформе Unity. Причем занятия будут вестись не только на русском, но и на удмуртском языке. После обучающего этапа участники разделятся на команды и под руководством наставников-программистов приступят к разработке собственных мобильных игр для детей дошкольного и школьного возрастов. Созданные игры помогут восполнить дефицит интернет-продуктов на удмуртском языке и станут ценным подспорьем для воспитания детей-билингвов, изучения родного языка в игровой форме. Завершится проект публичной презентацией разработанных приложений в Ижевске и районах Удмуртии.
Команда проекта, в состав которой входят Ольга Степанова, Гриша Григорьев, Влад Степанов, Егор Лебедев и Владимир Гурьянов, при поддержке партнёра «IT-КУБ.Ижевск», несомненно, внесет значительный вклад в сохранение и популяризацию удмуртского языка в цифровую эпоху.
Суред: Чудья Жени.
Сегодня стало известно, что «Google Переводчик» добавил поддержку удмуртского языка. Благодаря использованию языковой модели PaLM 2 Google расширяет количество поддерживаемых языков. В последнем обновлении добавилось 110 новых языков, среди которых абхазский, башкирский, чеченский, бурятский, осетинский, удмуртский, якутский и другие.
Наши предварительные тесты показали, что качество перевода с удмуртского языка, хотя и не идеальное, уже находится на достаточно высоком уровне для практического использования. Переводчик всё ещё может иногда неправильно склонять формы глаголов, путать местоимения, тем не менее это важный шаг в продвижении удмуртского языка в интернет-пространстве.
Таким образом, «Google Переводчик» пополнил список сервисов, с помощью которых можно переводить удмуртские тексты. Мы надеемся, что в будущем качество перевода будет только улучшаться и подобные переводчики станут полезными помощниками для всех, кто интересуется удмуртским языком.
Наши предварительные тесты показали, что качество перевода с удмуртского языка, хотя и не идеальное, уже находится на достаточно высоком уровне для практического использования. Переводчик всё ещё может иногда неправильно склонять формы глаголов, путать местоимения, тем не менее это важный шаг в продвижении удмуртского языка в интернет-пространстве.
Таким образом, «Google Переводчик» пополнил список сервисов, с помощью которых можно переводить удмуртские тексты. Мы надеемся, что в будущем качество перевода будет только улучшаться и подобные переводчики станут полезными помощниками для всех, кто интересуется удмуртским языком.
Всем привет! На связи Лебедев Егор, создатель «Удмурт диджитал». Сегодня исполняется ровно год нашему проекту! На протяжении целого года мы делились с вами полезным контентом, связанным с цифровизацией удмуртского языка. Предлагаем сегодня подвести небольшие итоги. За этот год нам удалось:
— Написать 34 уникальных поста;
— Рассказать о 26 шрифтах, поддерживающих удмуртский язык;
— Набрать суммарно более 600 подписчиков в VK и Telegram;
— Создать удмуртский чат на >230 участников;
— Рассказать о 10 удмуртских стикерпаках для Telegram;
— Выпустить сервис по проверке правописания «Янгыштэк»;
— Сделать перевод сборника рассказов Багай Аркаша «Перепеч» с помощью нейронных сетей.
И это только начало, дальше — больше!
— Написать 34 уникальных поста;
— Рассказать о 26 шрифтах, поддерживающих удмуртский язык;
— Набрать суммарно более 600 подписчиков в VK и Telegram;
— Создать удмуртский чат на >230 участников;
— Рассказать о 10 удмуртских стикерпаках для Telegram;
— Выпустить сервис по проверке правописания «Янгыштэк»;
— Сделать перевод сборника рассказов Багай Аркаша «Перепеч» с помощью нейронных сетей.
И это только начало, дальше — больше!
Стартовал набор на обучение для молодых удмуртских программистов «Вотэс». С сегодняшнего дня и до 25 августа принимаются заявки от школьников 7-11-х классов. Обучение начнётся в сентябре и завершится в январе. В результате будет создано не менее 3-х игр на удмуртском языке с помощью платформы Unity, которые будут презентованы в феврале следующего года.
Будущие разработчики Удмуртии, ваше время пришло! Присоединяйтесь к проекту, развивайте свои навыки программирования и создавайте игры на родном языке. Подавайте заявку сегодня и станьте частью инновационного будущего!
Записаться можно по этой ссылке.
Будущие разработчики Удмуртии, ваше время пришло! Присоединяйтесь к проекту, развивайте свои навыки программирования и создавайте игры на родном языке. Подавайте заявку сегодня и станьте частью инновационного будущего!
Записаться можно по этой ссылке.
Появился новый антикварный шрифт, поддерживающий удмуртский язык, под названием «Waterway». Данный шрифт находится ещё в демоверсии, поэтому может не содержать некоторые базовые символы. Waterway отлично подходит для создания заголовков и текстов на латинице и кириллице. Бесплатен для персонального и коммерческого использования.
Автор: Эдуард Чернов (Behance)
Суредъёс: Zarni_uli
Автор: Эдуард Чернов (Behance)
Суредъёс: Zarni_uli
Состоялось открытие первого удмуртского IT-класса «Вотэс». В течение этого полугода 15 талантливых школьников из Ижевска и районов Удмуртии будут осваивать основы программирования и разрабатывать собственные приложения на родном языке. Презентация их проектов широкой публике запланирована на февраль следующего года.
Также на открытии класса выступила команда «Куара», которая поделилась опытом реализации своих проектов. Кроме того, руководитель проекта Гриша Григорьев провел для участников вводное занятие, погрузив их в мир программирования.
Надеемся, что проект сможет стать важным шагом в развитии технологического образования в регионе и способствовать появлению нового поколения удмуртских программистов.
Также на открытии класса выступила команда «Куара», которая поделилась опытом реализации своих проектов. Кроме того, руководитель проекта Гриша Григорьев провел для участников вводное занятие, погрузив их в мир программирования.
Надеемся, что проект сможет стать важным шагом в развитии технологического образования в регионе и способствовать появлению нового поколения удмуртских программистов.