Закончилась конференция OpenTalks AI 2023 в Ереване. Всем спасибо за два насыщенных дня! Делимся фоточкой 🖖
Собрали презентации с последних выступлений:
🔳 Все презентации ИИшнницы "AI Señoritas"
🔳 Папка с презентациями исследователей Института на OpenTalks AI
До встречи на следующих конференциях!
Собрали презентации с последних выступлений:
До встречи на следующих конференциях!
Please open Telegram to view this post
VIEW IN TELEGRAM
Семинары AIRI по искусственному интеллекту проходят по средам раз в две недели 🖇
Делимся подробностями следующего #AIRI_Seminars:
🔵 Дата и время: 15 марта в 17:00 на YouTube-канале AIRI
🔵 Тема: «Нет размеченных данных? Решаем проблему с помощью активного обучения»
🔵 Докладчик: Артем Шелманов, AIRI, MBZUAI
🔵 Оппонент: Евгений Цымбалов, Amazon
🔵 Описание: несмотря на значительный успех в создании методов обучения без учителя, экспертная разметка данных остается очень ценным источником знаний для систем ИИ. Циклическая разметка (HiL), в которой процесс ручной разметки и обучение модели чередуются, недавно стали широко распространены. Например, HiL является одним из важнейших компонентов недавно появившихся языковых моделей с дообучением на инструкции пользователей.
Во многих областях, таких как обработка медицинских или юридических документов, экспертная разметка весьма дорогая. Одним из подходов HiL, который решает эту проблему, является активное обучение (AL). В AL предсказания модели используются для выбора примеров, которые будут показываться пользователям. Выбираются только те примеры, которые являются информативными для обучения последующих версий модели. AL может сократить объем ручного труда в ходе разметки, необходимый для достижения определенного уровня производительности модели, в несколько раз. Это особенно важно в таких областях, где краудсорсинг проблематичен. AL как концепция была предложена довольно давно. Тем не менее, из-за ряда препятствий, на практике AL используется мало.
В этом докладе исследователи представят результаты нескольких работ, опубликованных в EACL, ACL, NAACL и других конференциях, которые обходят некоторые серьезные препятствия на пути к созданию надежных технологий разметки с помощью AL.
📹 Cсылка на плейлист с прошедшими семинарами.
Делимся подробностями следующего #AIRI_Seminars:
Во многих областях, таких как обработка медицинских или юридических документов, экспертная разметка весьма дорогая. Одним из подходов HiL, который решает эту проблему, является активное обучение (AL). В AL предсказания модели используются для выбора примеров, которые будут показываться пользователям. Выбираются только те примеры, которые являются информативными для обучения последующих версий модели. AL может сократить объем ручного труда в ходе разметки, необходимый для достижения определенного уровня производительности модели, в несколько раз. Это особенно важно в таких областях, где краудсорсинг проблематичен. AL как концепция была предложена довольно давно. Тем не менее, из-за ряда препятствий, на практике AL используется мало.
В этом докладе исследователи представят результаты нескольких работ, опубликованных в EACL, ACL, NAACL и других конференциях, которые обходят некоторые серьезные препятствия на пути к созданию надежных технологий разметки с помощью AL.
📹 Cсылка на плейлист с прошедшими семинарами.
Please open Telegram to view this post
VIEW IN TELEGRAM
Рассказываем последние новости о жизни Института 👇
🔳 Сходили на подкаст РИА Новостей и рассказали про то, как исследователи AIRI ищут новые молекулы. Делимся ссылкой на запись.
🔳 Провели ИИшницу "AI Señoritas". Если вдруг не успели на прямой эфир, то запись можно посмотреть тут.
🔳 Выложили в открытый доступ научный семинар по теме «Методы анализа данных при исследовании активности мозга в парадигмах замкнутого контура», смотрите по ссылке.
🔳 Завтра примем участие в «Неделе высоких технологий и технопредпринимательства». Две трансляции с исследователями AIRI можно посмотреть по ссылке.
⚡ Кстати, завтра в 17:00 пройдет #AIRI_Seminars, все подробности в прошлом посте, до встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
AIRI Institute
Семинары AIRI по искусственному интеллекту проходят по средам раз в две недели 🖇 Делимся подробностями следующего #AIRI_Seminars: 🔵 Дата и время: 15 марта в 17:00 на YouTube-канале AIRI 🔵 Тема: «Нет размеченных данных? Решаем проблему с помощью активного…
Семинар начнется по ссылке через пару минут, подключайтесь! 🖇
Вышел наш первый пост на Хабр про то, как мы использовали ChatGPT в качестве замены NLP модуля для соревнования по разработке интерактивного агента IGLU 👾
Читайте статью по ссылке 🖇
Читайте статью по ссылке 🖇
Хабр
Инъекция от синдрома выученной беспомощности для ChatGPT: или как промтами (почти) выиграть NeurIPS соревнование IGLU
В прошлом году я много следил за релизами нейросетей Stable Diffusion, Dalle-2 и ChatGPT. Мне было интересно попробовать их и понять, на что они способны в разработке ИИ-сервисов. В статье расскажу,...
Сегодня в серии интервью с исследователями – руководитель группы «Вероятностные методы машинного обучения» Дмитрий Ветров 💡
▫️Почему наука?
«Я родился и вырос в наукограде, среди друзей моих родителей было много ученых и инженеров, так что научная стезя не была чем-то необычным. Мне кажется, что наукой я хотел заниматься с младших классов. Когда я стал студентом, мне такая возможность представилась и я ей воспользовался, о чем ни дня не жалел».
▫️Вдохновение
«Мне очень нравится, когда из отдельных обрывочных наблюдений формируется общая картинка происходящего, которая дает новое понимание явления. Это может быть как объективный процесс познания чего-то нового, так и субъективное восприятие известных вещей. Но любые такие озарения это всегда очень здорово».
▫️На работе
«Я разгадываю загадки и решаю головоломки. Они возникают при попытках объяснить необычные эффекты, наблюдаемые при обучении нейронных сетей; при поисках некорректностей в математических моделях и ошибок в их программной реализации; при работе над решением задачи, которую никто до тебя не решал, и никто не знает, можно ли ее решить с приемлемым качеством».
▫️В свободное время
«Я со школы интересуюсь всемирной историей. В свободное время читаю историческую литературу и просматриваю исторические лекции. Мне кажется, что если бы люди лучше знали историю человечества, многих современных проблем удалось бы избежать. Еще одно мое хобби – астрономические наблюдения».
▫️Интересные факты
«Я побывал на пяти континентах; выполнял фигуры высшего пилотажа на спортивном самолете; дважды попадал в зону массовых беспорядков; пересекал главный андский хребет по стопам Симона Боливара; ходил под парусом на трехместной яхте; гулял по кратеру потухшего вулкана; был на подводной лодке и на авианосце».
⚡️Наука – это
«Это то, что дает мне возможность сохранять оптимизм и не впадать в отчаяние, какие бы катаклизмы не происходили вокруг».
Все интервью с исследователями собраны по тегу #AIRIвлицах, приятного чтения😁
▫️Почему наука?
«Я родился и вырос в наукограде, среди друзей моих родителей было много ученых и инженеров, так что научная стезя не была чем-то необычным. Мне кажется, что наукой я хотел заниматься с младших классов. Когда я стал студентом, мне такая возможность представилась и я ей воспользовался, о чем ни дня не жалел».
▫️Вдохновение
«Мне очень нравится, когда из отдельных обрывочных наблюдений формируется общая картинка происходящего, которая дает новое понимание явления. Это может быть как объективный процесс познания чего-то нового, так и субъективное восприятие известных вещей. Но любые такие озарения это всегда очень здорово».
▫️На работе
«Я разгадываю загадки и решаю головоломки. Они возникают при попытках объяснить необычные эффекты, наблюдаемые при обучении нейронных сетей; при поисках некорректностей в математических моделях и ошибок в их программной реализации; при работе над решением задачи, которую никто до тебя не решал, и никто не знает, можно ли ее решить с приемлемым качеством».
▫️В свободное время
«Я со школы интересуюсь всемирной историей. В свободное время читаю историческую литературу и просматриваю исторические лекции. Мне кажется, что если бы люди лучше знали историю человечества, многих современных проблем удалось бы избежать. Еще одно мое хобби – астрономические наблюдения».
▫️Интересные факты
«Я побывал на пяти континентах; выполнял фигуры высшего пилотажа на спортивном самолете; дважды попадал в зону массовых беспорядков; пересекал главный андский хребет по стопам Симона Боливара; ходил под парусом на трехместной яхте; гулял по кратеру потухшего вулкана; был на подводной лодке и на авианосце».
⚡️Наука – это
«Это то, что дает мне возможность сохранять оптимизм и не впадать в отчаяние, какие бы катаклизмы не происходили вокруг».
Все интервью с исследователями собраны по тегу #AIRIвлицах, приятного чтения
Please open Telegram to view this post
VIEW IN TELEGRAM
Директор по развитию прикладных проектов Манвел Аветисян поделился размышлениями о GPT-4 с Forbes, читайте по ссылке 🖇
Forbes.ru
Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4
С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аве
🦣 Мысли в многомерном пространстве, интуитивно доступные данные и «расплющивание мамонта» – все это в новом исследовании, которое мы провели совместно с коллегами из Сколтех.
Все подробности читайте по ссылке на портале Naked Science 🔗
Все подробности читайте по ссылке на портале Naked Science 🔗
Naked Science
Ученые визуализировали «форму» многомерных данных
Исследователи из Сколтеха и Института искусственного интеллекта AIRI представили метод визуализации, который в отличие от существующих аналогов делает сложные биомедицинские, финансовые и иные данные доступными человеку с сохранением многомерной структуры…
Научный семинар по искусственному интеллекту #AIRI_Seminars уже на следующей неделе, рассказываем все подробности:
🔵 Дата и время: 29 марта в 17:00 на YouTube-канале AIRI
🔵 Тема: «Белковые языковые модели для решения биологических задач»
🔵 Докладчик: Никита Иванисенко, AIRI
🔵 Оппонент: Николай Русских
🔵 Описание: предобученные белковые языковые модели показывают высокую эффективность в решении задач предсказания структур, свойств, а также направленной оптимизации последовательности аминокислот.
На семинаре будет рассказано про применение языковых моделей для разработки имуннологической платформы SEMA, которая может использоваться при исследовании свойств белков-антигенов, таких как наличие B-клеточных конформационных эпитопов (сайтов посадки антител), пост-трансляционных модификаций и кросс-иммунитета.
Дополнительно будет обсуждаться разработанная в AIRI модель, которая основана на предобученной ESM-2, для предсказания изменения стабильности белков, а также недавний опыт участия в соревновании Kaggle “Novozymes Enzyme Stability Prediction”.
📼 До встречи на трансляции в среду!
На семинаре будет рассказано про применение языковых моделей для разработки имуннологической платформы SEMA, которая может использоваться при исследовании свойств белков-антигенов, таких как наличие B-клеточных конформационных эпитопов (сайтов посадки антител), пост-трансляционных модификаций и кросс-иммунитета.
Дополнительно будет обсуждаться разработанная в AIRI модель, которая основана на предобученной ESM-2, для предсказания изменения стабильности белков, а также недавний опыт участия в соревновании Kaggle “Novozymes Enzyme Stability Prediction”.
Please open Telegram to view this post
VIEW IN TELEGRAM
В сегодняшней подборке 3 онлайн-события с участием исследователей AIRI, которые пройдут на этой неделе 👇
🔵 Завтрашний семинар по NLP, на котором коллеги обсудят современные языковые модели: руководствуются ли они теми же правилами грамматики, что и люди, и как сильно это меняется от языка к языку? Все подробности в Twitter по ссылке.
🔵 Семинар по искусственному интеллекту «Белковые языковые модели для решения биологических задач» в среду, подробности в прошлом посте.
🔵 Выступление руководителя группы «Вычислительный интеллект» Ивана Оселедеца с темой «Поумнее некоторых. Эра ChatGPT» в четверг на крупнейшей IT-конференции TRUE TECH DAY, регистрация тут.
До встречи!
🎁 #интересное_в_понедельник: делимся ссылкой на выпуск подкаста про ChatGPT с научным сотрудником группы NLP Олегом Сериковым, слушайте по ссылке.
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
AIRI Institute
Научный семинар по искусственному интеллекту #AIRI_Seminars уже на следующей неделе, рассказываем все подробности: 🔵 Дата и время: 29 марта в 17:00 на YouTube-канале AIRI 🔵 Тема: «Белковые языковые модели для решения биологических задач» 🔵 Докладчик: Никита…
Трансляция по ссылке, подключайтесь! 🍿
Делимся подборкой вакансий в области искусственного интеллекта 👇
🔵 Институт AIRI ищет технического писателя – человека, который способен понимать научные публикации (с помощью наших исследователей) и писать о них понятным языком. Все подробности по ссылке.
🔵 «Сбер» ищет руководителя AI R&D B2C, который поможет выстроить мост между двумя направлениями, для бизнеса – сформулировать правильные задачи и найти оптимального контрагента, для R&D подразделений – найти применение своих уникальных наработок и экспертизы в реальных задачах, подробнее на сайте.
🔵 В Лабораторию машинного обучения Альфа-банка ищут Junior/Middle Data Scientist в области NLP. Нужно будет развивать модели ассистента оператора для ускорения обслуживания клиентов в чате и голосовом канале. Например, рекомендовать лучшие варианты ответов и интерфейсов со справочной информаций, вакансия в канале.
🔵 МТС Digital в поисках Data Analyst (Senior). Задачи: собирать и анализировать требования со стороны внутреннего и внешнего заказчика, анализировать источники данных, проектировать витрины и модели данных для подключения к конструктору отчетов. Ссылка на вакансию тут.
Для новичков: открыт набор студентов в Лабораторию Тинькофф. Все подробности на сайте.
Кстати, вакансии AIRI всегда публикуются по ссылке, сохраняйте в закладки! 🖇
Для новичков: открыт набор студентов в Лабораторию Тинькофф. Все подробности на сайте.
Кстати, вакансии AIRI всегда публикуются по ссылке, сохраняйте в закладки! 🖇
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня ровно два года, как исследователи AIRI создают и развивают технологии искусственного интеллекта в России и мире ✨
Интересные цифры про научные публикации, команды и мероприятия – в карточках. Наша любимая – последняя❤
Впереди много новых открытий. Спасибо, что вы с нами на протяжении двух лет!
Интересные цифры про научные публикации, команды и мероприятия – в карточках. Наша любимая – последняя
Впереди много новых открытий. Спасибо, что вы с нами на протяжении двух лет!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 Пополнение в репозитории GENA новой моделью на архитектуре BigBird!
Исследователи из групп «Биоинформатика» и «Новые нейросетевые архитектуры» сделали еще один шаг на пути к универсальной языковой модели ДНК и начали пополнять репозиторий GENA дополнительными решениями.
Результаты экспериментов показали, что для разных прикладных задач требуются разные архитектуры с разной входной длиной последовательности и скоростью обучения.
🌐 Gena-lm-bigbird-base-t2t – это трансформерная модель на архитектуре BigBird, основанная на кодовой базе HuggingFace и обученная на полном геноме человека T2T в рамках работы над развитием проекта GENA_LM (прочитать подробнее про Gena можно тут).
Новая модель может работать с последовательностями ДНК длинной до 24000 нуклеотидов, что в 8 раз превышает возможности предшественника.🧪
🧬 Дальше – больше! Исследователи активно экспериментируют с обучением других нейросетевых архитектур – ждите очередного пополнения репозитория в ближайшее время.
🖇 Ищите модель и веса по ссылке и следите за обновлениями!
Исследователи из групп «Биоинформатика» и «Новые нейросетевые архитектуры» сделали еще один шаг на пути к универсальной языковой модели ДНК и начали пополнять репозиторий GENA дополнительными решениями.
Результаты экспериментов показали, что для разных прикладных задач требуются разные архитектуры с разной входной длиной последовательности и скоростью обучения.
🌐 Gena-lm-bigbird-base-t2t – это трансформерная модель на архитектуре BigBird, основанная на кодовой базе HuggingFace и обученная на полном геноме человека T2T в рамках работы над развитием проекта GENA_LM (прочитать подробнее про Gena можно тут).
Новая модель может работать с последовательностями ДНК длинной до 24000 нуклеотидов, что в 8 раз превышает возможности предшественника.🧪
🧬 Дальше – больше! Исследователи активно экспериментируют с обучением других нейросетевых архитектур – ждите очередного пополнения репозитория в ближайшее время.
🖇 Ищите модель и веса по ссылке и следите за обновлениями!
👾 Искусственный интеллект «прочитал» книги о «Властелине колец» и научился анализировать литературу
Илья Макаров из AIRI и Анастасия Ященко из ВШЭ описали алгоритм автоматического анализа литературных произведений на основе ИИ через исследование системы персонажей книг Джона Рональда Руэла Толкина 🧙♂️
Метод позволяет узнавать персонажей по их репликам и описаниям, а также определять характер их взаимоотношений. Модель успешно распознала, в каких отношениях находились свыше 880 наименованных сущностей в книгах британского писателя.
Технология применима: для обучения диалоговых ботов и переводчиков, а также для экономии времени при поиске информации в больших объемах текста.
🖇 Ссылка на научную статью
*Картинка сгенерирована Kandinsky 2.1
Илья Макаров из AIRI и Анастасия Ященко из ВШЭ описали алгоритм автоматического анализа литературных произведений на основе ИИ через исследование системы персонажей книг Джона Рональда Руэла Толкина 🧙♂️
Метод позволяет узнавать персонажей по их репликам и описаниям, а также определять характер их взаимоотношений. Модель успешно распознала, в каких отношениях находились свыше 880 наименованных сущностей в книгах британского писателя.
Технология применима: для обучения диалоговых ботов и переводчиков, а также для экономии времени при поиске информации в больших объемах текста.
🖇 Ссылка на научную статью
*Картинка сгенерирована Kandinsky 2.1
Следующий семинар AIRI по искусственному интеллекту пройдет уже 12 апреля в 17:00, делимся подробностями:
🔳 Тема: «Генерация доказательств математических теорем с помощью языковых моделей»
🔳 Докладчик: Ермек Капушев, AIRI
🔳 Оппонент: Лев Беклемишев, МИАН, академик РАН
🔳 Описание: в докладе будет рассмотрена задача генерации доказательств математических теорем на формальном языке Lean.
Современные большие языковые модели (LLM) умеют решать широкий круг задач, включая математические, но не гарантируют корректность сгенерированных ответов. Использование формальных языков позволяет обойти эту проблему.
На семинаре будут рассмотрены особенности задачи генерации доказательств на формальном языке, подходы на основе языковых моделей, Monte Carlo Tree Search, попытки применения LLM. Также будут обсуждаться возможности и ограничения таких моделей.
📹 #AIRI_Seminars всегда проходят на YouTube, подписывайтесь по ссылке.
Современные большие языковые модели (LLM) умеют решать широкий круг задач, включая математические, но не гарантируют корректность сгенерированных ответов. Использование формальных языков позволяет обойти эту проблему.
На семинаре будут рассмотрены особенности задачи генерации доказательств на формальном языке, подходы на основе языковых моделей, Monte Carlo Tree Search, попытки применения LLM. Также будут обсуждаться возможности и ограничения таких моделей.
📹 #AIRI_Seminars всегда проходят на YouTube, подписывайтесь по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM