📬Утренняя подборка
● «Московская техническая школа» с 2022 года подготовила более 200 специалистов в сфере ИИ
● АНО «Цифровая экономика», Ассоциация Коммуникационных Агентств России, «Рунити», SPLAT Global и «Домклик» подписали Кодекс этики в сфере искусственного интеллекта
● Yandex Cloud открыла сторонним разработчикам доступ к тестированию нейросети 🏷YandexART для создания иллюстраций
● Разработчик Directum внедрил генеративный ИИ в систему управления документооборотом и цифровыми процессами 🏷Directum RX
● «Ростелеком» и «МегаФон» не планируют разрабатывать собственные ИИ-модели, но намерены использовать нейросети в своей деятельности
🗺За рубежом
● Власти Южной Кореи собираются инвестировать 9,4 трлн вон ($6,9 млрд) в индустрию ИИ до 2027 года, а также создать фонд для поддержки производителей ИИ-чипов
● Microsoft в течение двух лет инвестирует $2,9 млрд в развитие ИИ и облачной инфраструктуры в Японии
● Google представила Gemini Code Assist — ИИ-систему для помощи в написании программного кода, а также анонсировала собственный чип Axion для решения задач в сфере ИИ
● Американская компания Intel в рамках конкуренции с NVIDIA объявила о выходе новой версии своего чипа для ИИ. Он получит название Gaudi 3 и будет доступен в III квартале 2024 года
● Ученые Университета Нотр-Дам (США) применили машинное обучение для создания оконной пленки, блокирующей ультрафиолетовый и инфракрасный спектры
📈Аналитика
● Согласно информации iKS-Consulting в 2023 году на российском рынке облачных услуг доля аренды серверов для обучения ИИ-моделей составила 5,4%
● По данным CNews Analytics, развитие решений на основе Big Data вошло в число трендов 2023 года на рынке услуг среди операторов фискальных данных
🏅Конкурсы
● ИИ-решение от разработчика 🗂NtechLab для планирования транспортных и туристических потоков победило в конкурсе «Digital Awards 2023 РБК Петербург»
📎Материалы
● Интервью «Коммерсанта» с директором бизнес-группы поиска и рекламных технологий «Яндекса» Дмитрием Масюком о фокусировке компании на нейросетевых и других продуктах
● Материал The Wall Street Journal о росте дипфейков в финансовом секторе
● Статья «Коммерсанта» о регулировании ИИ в России и мире
● Мониторинг новостей СМИ по искусственному интеллекту за 9–10 апреля, составленный Национальным центром развития искусственного интеллекта при правительстве РФ
● Мониторинг новостей СМИ по искусственному интеллекту за 10–11 апреля, составленный Национальным центром развития искусственного интеллекта при правительстве РФ
● «Московская техническая школа» с 2022 года подготовила более 200 специалистов в сфере ИИ
● АНО «Цифровая экономика», Ассоциация Коммуникационных Агентств России, «Рунити», SPLAT Global и «Домклик» подписали Кодекс этики в сфере искусственного интеллекта
● Yandex Cloud открыла сторонним разработчикам доступ к тестированию нейросети 🏷YandexART для создания иллюстраций
● Разработчик Directum внедрил генеративный ИИ в систему управления документооборотом и цифровыми процессами 🏷Directum RX
● «Ростелеком» и «МегаФон» не планируют разрабатывать собственные ИИ-модели, но намерены использовать нейросети в своей деятельности
🗺За рубежом
● Власти Южной Кореи собираются инвестировать 9,4 трлн вон ($6,9 млрд) в индустрию ИИ до 2027 года, а также создать фонд для поддержки производителей ИИ-чипов
● Microsoft в течение двух лет инвестирует $2,9 млрд в развитие ИИ и облачной инфраструктуры в Японии
● Google представила Gemini Code Assist — ИИ-систему для помощи в написании программного кода, а также анонсировала собственный чип Axion для решения задач в сфере ИИ
● Американская компания Intel в рамках конкуренции с NVIDIA объявила о выходе новой версии своего чипа для ИИ. Он получит название Gaudi 3 и будет доступен в III квартале 2024 года
● Ученые Университета Нотр-Дам (США) применили машинное обучение для создания оконной пленки, блокирующей ультрафиолетовый и инфракрасный спектры
📈Аналитика
● Согласно информации iKS-Consulting в 2023 году на российском рынке облачных услуг доля аренды серверов для обучения ИИ-моделей составила 5,4%
● По данным CNews Analytics, развитие решений на основе Big Data вошло в число трендов 2023 года на рынке услуг среди операторов фискальных данных
🏅Конкурсы
● ИИ-решение от разработчика 🗂NtechLab для планирования транспортных и туристических потоков победило в конкурсе «Digital Awards 2023 РБК Петербург»
📎Материалы
● Интервью «Коммерсанта» с директором бизнес-группы поиска и рекламных технологий «Яндекса» Дмитрием Масюком о фокусировке компании на нейросетевых и других продуктах
● Материал The Wall Street Journal о росте дипфейков в финансовом секторе
● Статья «Коммерсанта» о регулировании ИИ в России и мире
● Мониторинг новостей СМИ по искусственному интеллекту за 9–10 апреля, составленный Национальным центром развития искусственного интеллекта при правительстве РФ
● Мониторинг новостей СМИ по искусственному интеллекту за 10–11 апреля, составленный Национальным центром развития искусственного интеллекта при правительстве РФ
База знаний AI
Команда SberDevices выложила в открытый доступ класс моделей GigaAM для обработки речи Модель GigaAM (Giga Acoustic Мodel) была обучена на датасете из 50 тыс. часов разнообразных русскоязычных данных. Она подходит для адаптации под различные задачи работы…
📌 Для удобства собрали информацию о классе моделей 🏷GigaAM в одной карточке. Здесь — описание решения со ссылками на источники, презентация с анонса и контакты разработчиков.
Говорит и показывает «Яндекс»
На этой неделе ИТ-компания сделала ряд заявлений о нейросетях и их внедрении.
📎 Графическую нейросеть 🏷YandexART теперь можно протестировать на Yandex Cloud через API-сервис Foundation Models.
📎 Языковая модель 🏷YandexGPT вчера была внедрена в «Яндекс Карты», а самая последняя версия модели — GPT 3 Pro — появилась сегодня в голосовом помощнике «Алиса».
📎 По словам главы поискового бизнеса «Яндекса» Дмитрия Масюка, большие языковые модели, которые внедряет компания, дороже в разработке и эксплуатации, чем обычные технологии. «Стоимость ответов на основе YandexGPT примерно в семь раз выше в пересчете на одного пользователя. В подобные разработки заложены достаточно большие инженерные вложения, и надо понимать, как отбивать инвестиции», — отметил Масюк.
На этой неделе ИТ-компания сделала ряд заявлений о нейросетях и их внедрении.
📎 Графическую нейросеть 🏷YandexART теперь можно протестировать на Yandex Cloud через API-сервис Foundation Models.
📎 Языковая модель 🏷YandexGPT вчера была внедрена в «Яндекс Карты», а самая последняя версия модели — GPT 3 Pro — появилась сегодня в голосовом помощнике «Алиса».
📎 По словам главы поискового бизнеса «Яндекса» Дмитрия Масюка, большие языковые модели, которые внедряет компания, дороже в разработке и эксплуатации, чем обычные технологии. «Стоимость ответов на основе YandexGPT примерно в семь раз выше в пересчете на одного пользователя. В подобные разработки заложены достаточно большие инженерные вложения, и надо понимать, как отбивать инвестиции», — отметил Масюк.
Forwarded from AIRI Institute
Мы выложили в открытый доступ OmniFusion 1.1. — первую в России мультимодальную модель искусственного интеллекта 🚀
🔥 О модели
OmniFusion 1.1. — это передовая мультимодальная модель искусственного интеллекта, предназначенная для расширения возможностей традиционных систем обработки языка за счет интеграции дополнительных модальностей данных, например, изображений, а в перспективе — аудио, 3D- и видеоконтента. Модель – SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, модель хорошо справляется со сложными задачами и понимает русский язык.
🔖 Открытый код
В этот раз мы выкладываем модель в открытый доступ! Делимся ссылкой на GitHub и Technical Report на arXiv. Модель можно использовать как в некоммерческой, так и в коммерческой деятельности.
🌐 Статья на Хабр
В статье мы рассказали об особенностях модели, процессе обучения и примерах ее использования. Также подсветили архитектуру, проделанные эксперименты как в части архитектурных трюков, так и в работе с данными. А еще собрали интересные кейсы использования на английском и русском языках.
На Hugging Face статья про архитектуру OmniFusion уже на первом месте в списке daily papers 🔥
OmniFusion 1.1. — это передовая мультимодальная модель искусственного интеллекта, предназначенная для расширения возможностей традиционных систем обработки языка за счет интеграции дополнительных модальностей данных, например, изображений, а в перспективе — аудио, 3D- и видеоконтента. Модель – SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, модель хорошо справляется со сложными задачами и понимает русский язык.
В этот раз мы выкладываем модель в открытый доступ! Делимся ссылкой на GitHub и Technical Report на arXiv. Модель можно использовать как в некоммерческой, так и в коммерческой деятельности.
В статье мы рассказали об особенностях модели, процессе обучения и примерах ее использования. Также подсветили архитектуру, проделанные эксперименты как в части архитектурных трюков, так и в работе с данными. А еще собрали интересные кейсы использования на английском и русском языках.
На Hugging Face статья про архитектуру OmniFusion уже на первом месте в списке daily papers 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
📬Утренняя подборка
● Участники Альянса в сфере искусственного интеллекта создадут базу научных публикаций по ИИ
● «Сбер» задействовал ИИ в 85% процессов компании, а ожидаемая прибыль от технологии в 2024 году может составить 400–450 млрд руб., заявил первый заместитель председателя правления компании Александр Ведяхин
● Институт искусственного интеллекта AIRI выложил в открытый доступ мультимодальную ИИ-модель 🏷OmniFusion 1.1 для расширения возможностей систем обработки языка за счет интеграции дополнительных модальностей данных
● В МФТИ создали технологию для автоматической подготовки нейросетями текстовых данных, необходимых для обучения ИИ
● 🏷Whoosh начал тестирование в Санкт-Петербурге собственного инструмента «Антитандем» на базе ИИ для выявления количества людей на самокате
🗺За рубежом
● По данным СМИ, генеральный директор OpenAI Сэм Альтман (Sam Altman) работает над созданием глобальной коалиции с несколькими странами и компаниями для поддержки и развития ИИ
● Google Cloud (США) и фармкомпания Bayer создадут ИИ-платформу для помощи рентгенологам в постановке диагнозов
● Американский ИИ-стартап Symbolica, разрабатывающий ИИ-модели, привлек $33 млн от Khosla Ventures, Abstract Ventures, Buckley Ventures и других инвесторов
● Английская Botswana Diamonds, имеющая лицензию на геологоразведку на территории пустыни Калахари в Ботсване, будет применять ИИ для поиска новых месторождений алмазов
📈Аналитика
● По данным Ecoplatform и «Самолет», Московский регион лидирует в рейтинге российских субъектов по сбору вторсырья с помощью ИИ
● Согласно опросу онлайн-школы программирования «Хекслет» 65% ИТ-специалистов используют искусственный интеллект для улучшения своих разработок
● По данным Brand Analytics, «Шедеврум» (🏷YandexGPT, 🏷YandexArt) и 🏷Kandinsky вошли в топ-5 нейросетей, которые чаще всего упоминаются в соцсетях
💬Мнения
● Директор по цифровизации «Росатома» Екатерина Солнцева — о сокращении сроков проектирования АЭС при помощи ИИ
📎Материалы
● Колонка в Forbes директора по развитию бизнеса Just AI Светланы Захаровой об игроках рынка ИИ в России и факторах, замедляющих внедрение генеративного ИИ в бизнес-процессы
● Материал «Ведомостей» по мотивам форума «Телеком 2024» с мнениями представителей компаний «Яндекс», «Самолетум» и Альянс искусственного интеллекта о возможностях ИИ
● Участники Альянса в сфере искусственного интеллекта создадут базу научных публикаций по ИИ
● «Сбер» задействовал ИИ в 85% процессов компании, а ожидаемая прибыль от технологии в 2024 году может составить 400–450 млрд руб., заявил первый заместитель председателя правления компании Александр Ведяхин
● Институт искусственного интеллекта AIRI выложил в открытый доступ мультимодальную ИИ-модель 🏷OmniFusion 1.1 для расширения возможностей систем обработки языка за счет интеграции дополнительных модальностей данных
● В МФТИ создали технологию для автоматической подготовки нейросетями текстовых данных, необходимых для обучения ИИ
● 🏷Whoosh начал тестирование в Санкт-Петербурге собственного инструмента «Антитандем» на базе ИИ для выявления количества людей на самокате
🗺За рубежом
● По данным СМИ, генеральный директор OpenAI Сэм Альтман (Sam Altman) работает над созданием глобальной коалиции с несколькими странами и компаниями для поддержки и развития ИИ
● Google Cloud (США) и фармкомпания Bayer создадут ИИ-платформу для помощи рентгенологам в постановке диагнозов
● Американский ИИ-стартап Symbolica, разрабатывающий ИИ-модели, привлек $33 млн от Khosla Ventures, Abstract Ventures, Buckley Ventures и других инвесторов
● Английская Botswana Diamonds, имеющая лицензию на геологоразведку на территории пустыни Калахари в Ботсване, будет применять ИИ для поиска новых месторождений алмазов
📈Аналитика
● По данным Ecoplatform и «Самолет», Московский регион лидирует в рейтинге российских субъектов по сбору вторсырья с помощью ИИ
● Согласно опросу онлайн-школы программирования «Хекслет» 65% ИТ-специалистов используют искусственный интеллект для улучшения своих разработок
● По данным Brand Analytics, «Шедеврум» (🏷YandexGPT, 🏷YandexArt) и 🏷Kandinsky вошли в топ-5 нейросетей, которые чаще всего упоминаются в соцсетях
💬Мнения
● Директор по цифровизации «Росатома» Екатерина Солнцева — о сокращении сроков проектирования АЭС при помощи ИИ
📎Материалы
● Колонка в Forbes директора по развитию бизнеса Just AI Светланы Захаровой об игроках рынка ИИ в России и факторах, замедляющих внедрение генеративного ИИ в бизнес-процессы
● Материал «Ведомостей» по мотивам форума «Телеком 2024» с мнениями представителей компаний «Яндекс», «Самолетум» и Альянс искусственного интеллекта о возможностях ИИ
Аналитики Google Cloud назвали пять ИИ-трендов этого года
В первую очередь в компании говорят о том, что генеративный ИИ ускорит доступ нетехнических специалистов к аналитической информации. Такого мнения придерживаются около 2/3 руководителей, ответственных за работу с данными. Всего аналитики в рамках глобального исследования опросили более 400 директоров и менеджеров по ИТ.
Кроме того, 80% респондентов признают, что разграничения между специальностями, связанными с работой с данными, начинают стираться, например между аналитиками (Data Analysts) и исследователями (Data Scientists).
Третьим трендом аналитики называют зависимость инноваций в области ИИ от эффективного управления данными. По оценкам авторов исследования, менее половины респондентов (44%) полностью уверены в качестве данных своей организации.
Еще один тренд заключается в том, что операционные данные раскроют потенциал генеративного ИИ в сфере корпоративных приложений. 71% опрошенных организаций планирует интегрировать инструменты генеративного ИИ в свои базы данных, отмечается в документе.
В заключении аналитики Google Cloud сообщают, что 2024 год станет годом быстрой модернизации платформ обработки данных, отмечая, что только в 1% организаций удовлетворены тем, как их текущие базы данных поддерживают применение ИИ.
👉🏻 Изучить исследование
В первую очередь в компании говорят о том, что генеративный ИИ ускорит доступ нетехнических специалистов к аналитической информации. Такого мнения придерживаются около 2/3 руководителей, ответственных за работу с данными. Всего аналитики в рамках глобального исследования опросили более 400 директоров и менеджеров по ИТ.
Кроме того, 80% респондентов признают, что разграничения между специальностями, связанными с работой с данными, начинают стираться, например между аналитиками (Data Analysts) и исследователями (Data Scientists).
Третьим трендом аналитики называют зависимость инноваций в области ИИ от эффективного управления данными. По оценкам авторов исследования, менее половины респондентов (44%) полностью уверены в качестве данных своей организации.
Еще один тренд заключается в том, что операционные данные раскроют потенциал генеративного ИИ в сфере корпоративных приложений. 71% опрошенных организаций планирует интегрировать инструменты генеративного ИИ в свои базы данных, отмечается в документе.
В заключении аналитики Google Cloud сообщают, что 2024 год станет годом быстрой модернизации платформ обработки данных, отмечая, что только в 1% организаций удовлетворены тем, как их текущие базы данных поддерживают применение ИИ.
👉🏻 Изучить исследование
📬Утренняя подборка
● В Московской области планируется задействовать нейросеть для выявления очередей на остановках для дальнейшей передачи данных перевозчику, сообщили в Министерстве государственного управления, информационных технологий и связи региона
● Разработчик беспилотных авиационных систем (БАС) «Геоскан» разработал для «Российского экологического оператора» систему мониторинга объектов размещения ТКО с применением БАС и ИИ
● В СПбГУ создали нейросеть для составления плана лечения пациентов с заболеваниями сердца на основе клинических данных, ЭХОКГ, КТ аорты и других исследований
● Компания VK запустила открытое бета-тестирование генеративных нейросетей для всех пользователей сервисов Mail.ru с целью оценки развития ИИ в новых сценариях
🗺За рубежом
● Технологический институт Джорджии (США) в сотрудничестве с NVIDIA создал суперкомпьютерный центр ИИ для обучения студентов
● Южнокорейская компания Samsung анонсировала обновление пакета функций Galaxy AI, среди которых автоматический перевод голосовых звонков на русский язык в режиме реального времени
● Apple (США) готовит к обновлению линейку компьютеров Mac, в которых будет установлен процессор М4 с расширенной поддержкой ИИ
● Американская Meta (признана экстремистской и запрещена в РФ) анонсировала внедрение ИИ-чипа нового поколения Artemis в продукты компании
● Разработчик Adobe начал покупать видео для создания собственного ИИ-генератора видео по текстовому описанию
● Amazon включил в состав совета директоров Эндрю Ына (Andrew Ng), который ранее руководил ИИ-проектами в Alphabet и Baidu
📎Материалы
● Статья «Парламентская газета» о регулировании ИИ в России
● Мониторинг новостей СМИ по искусственному интеллекту за 11–12 апреля, составленный Национальным центром развития искусственного интеллекта при правительстве РФ
🙋Ищут
● В команду компании «Тинькофф» ищут Data Engineer. Ознакомиться с подробностями можно здесь, откликнуться — в Telegram @angel_gilmutdinova
🧑🏻💻Разработчикам
● Инструмент gpt-llm-trainer от HyperWriteAI для упрощения процесса дообучения ИИ-моделей под конкретную задачу
📌 Утренняя подборка со следующей недели уходит на короткие каникулы. Новый выпуск выйдет в понедельник, 22 апреля
● В Московской области планируется задействовать нейросеть для выявления очередей на остановках для дальнейшей передачи данных перевозчику, сообщили в Министерстве государственного управления, информационных технологий и связи региона
● Разработчик беспилотных авиационных систем (БАС) «Геоскан» разработал для «Российского экологического оператора» систему мониторинга объектов размещения ТКО с применением БАС и ИИ
● В СПбГУ создали нейросеть для составления плана лечения пациентов с заболеваниями сердца на основе клинических данных, ЭХОКГ, КТ аорты и других исследований
● Компания VK запустила открытое бета-тестирование генеративных нейросетей для всех пользователей сервисов Mail.ru с целью оценки развития ИИ в новых сценариях
🗺За рубежом
● Технологический институт Джорджии (США) в сотрудничестве с NVIDIA создал суперкомпьютерный центр ИИ для обучения студентов
● Южнокорейская компания Samsung анонсировала обновление пакета функций Galaxy AI, среди которых автоматический перевод голосовых звонков на русский язык в режиме реального времени
● Apple (США) готовит к обновлению линейку компьютеров Mac, в которых будет установлен процессор М4 с расширенной поддержкой ИИ
● Американская Meta (признана экстремистской и запрещена в РФ) анонсировала внедрение ИИ-чипа нового поколения Artemis в продукты компании
● Разработчик Adobe начал покупать видео для создания собственного ИИ-генератора видео по текстовому описанию
● Amazon включил в состав совета директоров Эндрю Ына (Andrew Ng), который ранее руководил ИИ-проектами в Alphabet и Baidu
📎Материалы
● Статья «Парламентская газета» о регулировании ИИ в России
● Мониторинг новостей СМИ по искусственному интеллекту за 11–12 апреля, составленный Национальным центром развития искусственного интеллекта при правительстве РФ
🙋Ищут
● В команду компании «Тинькофф» ищут Data Engineer. Ознакомиться с подробностями можно здесь, откликнуться — в Telegram @angel_gilmutdinova
🧑🏻💻Разработчикам
● Инструмент gpt-llm-trainer от HyperWriteAI для упрощения процесса дообучения ИИ-моделей под конкретную задачу
📌 Утренняя подборка со следующей недели уходит на короткие каникулы. Новый выпуск выйдет в понедельник, 22 апреля
Зарубежные ученые задействовали ML для расшифровки спонтанных мыслей
Исследователи из Центра по нейронаучным исследованиям Института фундаментальных наук (Южная Корея) в сотрудничестве с Дартмутским колледжем (США) смогли предсказать эмоции человека, которые возникают вместе с мыслями во время чтения или в состоянии свободного мышления.
Для этого ученые использовали данные о мозговой активности человека при проведении функциональной магнитно-резонансной томографии. В этот момент 49 испытуемым были предложены индивидуально сгенерированные истории, отражающие прошлый опыт и эмоции тестируемого.
Эти данные и методы ML были использованы для обучения предсказательных моделей, чтобы расшифровать «эмоциональные аспекты» мыслей в реальном времени. Модели прогнозировали эмоции во время чтения, в процессе свободного мышления или в состоянии покоя, а также показали свою способность предсказывать самооценку.
📎 Источник 1: https://medicalxpress.com/news/2024-04-decoding-spontaneous-thoughts-brain-machine.html
📎 Источник 2: https://www.ferra.ru/news/techlife/mrt-i-mashinnoe-obuchenie-pomogut-predskazyvat-emocii-11-04-2024.htm
***
📎 Исследование опубликовано в журнале Proceedings of the National Academy of Sciences
Исследователи из Центра по нейронаучным исследованиям Института фундаментальных наук (Южная Корея) в сотрудничестве с Дартмутским колледжем (США) смогли предсказать эмоции человека, которые возникают вместе с мыслями во время чтения или в состоянии свободного мышления.
Для этого ученые использовали данные о мозговой активности человека при проведении функциональной магнитно-резонансной томографии. В этот момент 49 испытуемым были предложены индивидуально сгенерированные истории, отражающие прошлый опыт и эмоции тестируемого.
Эти данные и методы ML были использованы для обучения предсказательных моделей, чтобы расшифровать «эмоциональные аспекты» мыслей в реальном времени. Модели прогнозировали эмоции во время чтения, в процессе свободного мышления или в состоянии покоя, а также показали свою способность предсказывать самооценку.
📎 Источник 1: https://medicalxpress.com/news/2024-04-decoding-spontaneous-thoughts-brain-machine.html
📎 Источник 2: https://www.ferra.ru/news/techlife/mrt-i-mashinnoe-obuchenie-pomogut-predskazyvat-emocii-11-04-2024.htm
***
📎 Исследование опубликовано в журнале Proceedings of the National Academy of Sciences
This media is not supported in your browser
VIEW IN TELEGRAM
📖 Почитать на выходных: перевод статьи на «Хабре» о тестировании различных LLM с помощью Street Fighter
Перевод Cloud4Y статьи о тестировании 14 больших языковых моделей с необычной стороны. Вместо привычных ответов на вопросы модели заставили соревноваться между собой в видеоигре Street Fighter III.
Выбор моделей для сравнения осуществлялся случайным образом. Каждая из них отслеживала несколько параметров, необходимых для схватки друг с другом. При этом была отмечена взаимосвязь: «меньшие модели превосходили более крупные, вероятно, из-за меньшей задержки». В конце приводится таблица победителей, закономерности подхода LLM к игре и другие обнаруженные факты.
👉🏻 Читать материал
📃 Код и мануалы для самостоятельного тестирования
Перевод Cloud4Y статьи о тестировании 14 больших языковых моделей с необычной стороны. Вместо привычных ответов на вопросы модели заставили соревноваться между собой в видеоигре Street Fighter III.
Выбор моделей для сравнения осуществлялся случайным образом. Каждая из них отслеживала несколько параметров, необходимых для схватки друг с другом. При этом была отмечена взаимосвязь: «меньшие модели превосходили более крупные, вероятно, из-за меньшей задержки». В конце приводится таблица победителей, закономерности подхода LLM к игре и другие обнаруженные факты.
👉🏻 Читать материал
📃 Код и мануалы для самостоятельного тестирования
Ученые МФТИ предложили способ улучшения работы чат-ботов
Для этого они создали полуавтоматизированный алгоритм разметки диалоговых данных для ИИ.
Специалисты провели эксперимент, основной задачей которого была автоматизация аннотации, и попробовали сымитировать человеческую разметку данных для обучения моделей с помощью ChatGPT. Схемы аннотаций разработали лингвисты. По словам ученых, теперь эксперты требуются только для предварительной разметки и разработки иерархической схемы разметки.
«Эксперты тратят в среднем 14,5 минут на аннотацию одного диалога, в то время как краудсорсеры (разметчики на фрилансе — прим.ред.) затрачивают 29 минут на ту же работу. Время, необходимое для выполнения задачи с помощью ChatGPT, всегда разное, тем не менее, в среднем небольшой диалог может быть аннотирован за 10 минут», — отметили в МФТИ. Стоимость аннотирования с помощью ChatGPT составляет, по словам ученых, «от 0,03$ до 0,07$, в то время как работникам краудсорсинга необходимо платить от 0,12$ до 0,22$ за аннотацию одного диалога».
Специалисты также отмечают, что аналогичный подход к разметке диалогов может иметь широкое применение и уже зарекомендовал себя в работе над одним из совместных научно-исследовательских проектов МФТИ и Сбербанка.
Схема аннотации данных с помощью больших языковых моделей представлена на скриншоте.
🔗 Источник: https://mipt.ru/news/chego-khochet-polzovatel-uchenye-mfti-nashli-sposob-kak-uluchshit-rabotu-chat-botov
***
📎 Результаты исследования опубликованы в журнале ACL Anthology
Для этого они создали полуавтоматизированный алгоритм разметки диалоговых данных для ИИ.
Специалисты провели эксперимент, основной задачей которого была автоматизация аннотации, и попробовали сымитировать человеческую разметку данных для обучения моделей с помощью ChatGPT. Схемы аннотаций разработали лингвисты. По словам ученых, теперь эксперты требуются только для предварительной разметки и разработки иерархической схемы разметки.
«Эксперты тратят в среднем 14,5 минут на аннотацию одного диалога, в то время как краудсорсеры (разметчики на фрилансе — прим.ред.) затрачивают 29 минут на ту же работу. Время, необходимое для выполнения задачи с помощью ChatGPT, всегда разное, тем не менее, в среднем небольшой диалог может быть аннотирован за 10 минут», — отметили в МФТИ. Стоимость аннотирования с помощью ChatGPT составляет, по словам ученых, «от 0,03$ до 0,07$, в то время как работникам краудсорсинга необходимо платить от 0,12$ до 0,22$ за аннотацию одного диалога».
Специалисты также отмечают, что аналогичный подход к разметке диалогов может иметь широкое применение и уже зарекомендовал себя в работе над одним из совместных научно-исследовательских проектов МФТИ и Сбербанка.
Схема аннотации данных с помощью больших языковых моделей представлена на скриншоте.
🔗 Источник: https://mipt.ru/news/chego-khochet-polzovatel-uchenye-mfti-nashli-sposob-kak-uluchshit-rabotu-chat-botov
***
📎 Результаты исследования опубликованы в журнале ACL Anthology
НИУ ВШЭ: 43% студентов используют в учебе ИИ
Из них 52% готовы доверить искусственному интеллекту подготовку материалов, которые в дальнейшем будет проверять преподаватель. Такие данные приводит онлайн-кампус НИУ ВШЭ, опросив почти 1,4 тыс. человек.
По мнению 42% студентов, доля участия генеративных моделей в итоговом материале должна составлять 20–40%, а 32% респондентов отведут для них 40–60%. В список наиболее популярных инструментов входят 🏷YandexGPT (54%), боты в Telegram на основе нейросетей (47%), 🏷«Шедеврум» (35%).
Еще студенты пояснили, что 52% из них запрашивают у ИИ для проверки данных ссылки на источники, 18% проверяют каждое предложение, а 16% сверяют цифры, даты, места событий.
В свою очередь преподаватели в большинстве своем спокойно реагируют на применение ИИ студентами. 37% опрошенных студентов не сталкивались с критикой из-за использования ИИ, 21% — всего несколько раз, а 16% часто встречали неодобрение. При этом 13% отметили, что преподаватели поощряли использование технологий.
👉🏻Изучить исследование
Из них 52% готовы доверить искусственному интеллекту подготовку материалов, которые в дальнейшем будет проверять преподаватель. Такие данные приводит онлайн-кампус НИУ ВШЭ, опросив почти 1,4 тыс. человек.
По мнению 42% студентов, доля участия генеративных моделей в итоговом материале должна составлять 20–40%, а 32% респондентов отведут для них 40–60%. В список наиболее популярных инструментов входят 🏷YandexGPT (54%), боты в Telegram на основе нейросетей (47%), 🏷«Шедеврум» (35%).
Еще студенты пояснили, что 52% из них запрашивают у ИИ для проверки данных ссылки на источники, 18% проверяют каждое предложение, а 16% сверяют цифры, даты, места событий.
В свою очередь преподаватели в большинстве своем спокойно реагируют на применение ИИ студентами. 37% опрошенных студентов не сталкивались с критикой из-за использования ИИ, 21% — всего несколько раз, а 16% часто встречали неодобрение. При этом 13% отметили, что преподаватели поощряли использование технологий.
👉🏻Изучить исследование
В России создают Национальную суперкомпьютерную инфраструктуру
Это позволит решить задачу кратного увеличения суперкомпьютерных мощностей в стране, говорят в Российской академии наук (РАН). Основными принципами единой сети должны быть децентрализация управления и унификация доступа пользователей.
«Кроме того, необходимо создать отечественные облачные сервисы, в том числе на основе технологий искусственного интеллекта, обеспечивающие доступ к суперкомпьютерным ресурсам различного класса <...> широкому кругу пользователей из организаций науки, образования и промышленности, работающих в различных регионах», — отмечают в РАН. Предполагается, что сеть суперкомпьютерных центров обеспечит «магистральную связность не менее 400 Гбит/с и подключение центров к магистрали со скоростями не менее 10 Гбит/с».
Сейчас, по словам ученых, Россия занимает десятое место в мире по суммарным суперкомпьютерным мощностям, уступая США, КНР, Японии, Финляндии, Италии, Германии, Франции, Южной Корее и Бразилии. При этом наиболее производительные отечественные суперкомпьютеры принадлежат компаниям. «По удельным показателям обеспеченности российских ученых и исследователей суперкомпьютерными ресурсами мы отстаем от мировых лидеров на два порядка. Удельное значение производительности суперкомпьютеров в области науки и образования на одного исследователя в США, Японии, Европе и КНР составляет около 2,5, 1,2, 1,0, 0,15 Тфлопс соответственно, а для России значение этого показателя всего лишь 0,012 Тфлопс».
🔗 Источник: https://tass.ru/obschestvo/20545861
***
📎 Ранее ученые вместе с Минобрнауки разработали концепцию суперкомпьютерной инфраструктуры. Однако пока не сообщается, на какой стадии утверждения находится документ.
Это позволит решить задачу кратного увеличения суперкомпьютерных мощностей в стране, говорят в Российской академии наук (РАН). Основными принципами единой сети должны быть децентрализация управления и унификация доступа пользователей.
«Кроме того, необходимо создать отечественные облачные сервисы, в том числе на основе технологий искусственного интеллекта, обеспечивающие доступ к суперкомпьютерным ресурсам различного класса <...> широкому кругу пользователей из организаций науки, образования и промышленности, работающих в различных регионах», — отмечают в РАН. Предполагается, что сеть суперкомпьютерных центров обеспечит «магистральную связность не менее 400 Гбит/с и подключение центров к магистрали со скоростями не менее 10 Гбит/с».
Сейчас, по словам ученых, Россия занимает десятое место в мире по суммарным суперкомпьютерным мощностям, уступая США, КНР, Японии, Финляндии, Италии, Германии, Франции, Южной Корее и Бразилии. При этом наиболее производительные отечественные суперкомпьютеры принадлежат компаниям. «По удельным показателям обеспеченности российских ученых и исследователей суперкомпьютерными ресурсами мы отстаем от мировых лидеров на два порядка. Удельное значение производительности суперкомпьютеров в области науки и образования на одного исследователя в США, Японии, Европе и КНР составляет около 2,5, 1,2, 1,0, 0,15 Тфлопс соответственно, а для России значение этого показателя всего лишь 0,012 Тфлопс».
🔗 Источник: https://tass.ru/obschestvo/20545861
***
📎 Ранее ученые вместе с Минобрнауки разработали концепцию суперкомпьютерной инфраструктуры. Однако пока не сообщается, на какой стадии утверждения находится документ.
Разработчики создали базу данных с русскоязычными материалами об ИИ
Специалисты сервиса для масштабирования продаж на Wildberries с помощью Mamod AI создали бесплатную базу данных с русскоязычными материалами об искусственном интеллекте. Она объединяет статьи, новости, видеоролики, анонсы курсов и мероприятий, а также другие материалы. Разработчики планируют обновлять базу раз в две недели.
По их словам, проект ориентирован на маркетологов, журналистов, аналитиков, консалтинговые компании, которые смогут провести с его помощью рыночный анализ, мониторинг упоминаний и другое.
👉🏻 Изучить базу данных
🔗 Источник: https://rb.ru/news/ai-database/
Специалисты сервиса для масштабирования продаж на Wildberries с помощью Mamod AI создали бесплатную базу данных с русскоязычными материалами об искусственном интеллекте. Она объединяет статьи, новости, видеоролики, анонсы курсов и мероприятий, а также другие материалы. Разработчики планируют обновлять базу раз в две недели.
По их словам, проект ориентирован на маркетологов, журналистов, аналитиков, консалтинговые компании, которые смогут провести с его помощью рыночный анализ, мониторинг упоминаний и другое.
👉🏻 Изучить базу данных
🔗 Источник: https://rb.ru/news/ai-database/
«Т1» и МФТИ создали СП «Квантовые и оптимизационные решения» для разработки ИИ-продуктов
Одним из направлений деятельности совместного предприятия (СП) является создание продуктов по решению задач оптимизации, в том числе на основе теории квантовых вычислений. «Т1» выступит как вендор по взаимодействию с госструктурами и компаниями, а также вместе с МФТИ будет заниматься R&D.
В СП создадут платформу «Оптимизатор». Она должна стать основой линейки продуктов для различных отраслей. Предполагается, что платформа на базе оптимизационных математических алгоритмов сможет выстроить стратегию для решения многофакторных задач, в том числе оптимизации загрузки производственных линий, складских запасов, генерации электроэнергии, планирования и управления процессом производства нефтепродуктов. Как пояснили в «Т1», уже ведутся переговоры по реализации проекта в нефтегазовой отрасли.
Совместное предприятие создано в апреле 2024 года. Гендиректором компании является Руслан Габбасов. 50% долей СП принадлежит «Т1», 37% — разработчику ПО «Информационные системы оптимизации» и еще 13% сосредоточены у МФТИ.
🔗 Источник: https://www.vedomosti.ru/technology/articles/2024/04/17/1032301-t1-i-mfti-zaimutsya-razrabotkoi-ii-reshenii-dlya-biznesa
Одним из направлений деятельности совместного предприятия (СП) является создание продуктов по решению задач оптимизации, в том числе на основе теории квантовых вычислений. «Т1» выступит как вендор по взаимодействию с госструктурами и компаниями, а также вместе с МФТИ будет заниматься R&D.
В СП создадут платформу «Оптимизатор». Она должна стать основой линейки продуктов для различных отраслей. Предполагается, что платформа на базе оптимизационных математических алгоритмов сможет выстроить стратегию для решения многофакторных задач, в том числе оптимизации загрузки производственных линий, складских запасов, генерации электроэнергии, планирования и управления процессом производства нефтепродуктов. Как пояснили в «Т1», уже ведутся переговоры по реализации проекта в нефтегазовой отрасли.
Совместное предприятие создано в апреле 2024 года. Гендиректором компании является Руслан Габбасов. 50% долей СП принадлежит «Т1», 37% — разработчику ПО «Информационные системы оптимизации» и еще 13% сосредоточены у МФТИ.
🔗 Источник: https://www.vedomosti.ru/technology/articles/2024/04/17/1032301-t1-i-mfti-zaimutsya-razrabotkoi-ii-reshenii-dlya-biznesa
Датасет Skoltech3D назван одним из лучших для трехмерной реконструкции изображений — Stanford HAI
Специалисты Стэнфордского центра Institute for Human-Centered AI (Stanford HAI) в своем отчете AI Index Report 2024 подвели итоги развития трендов искусственного интеллекта в 2023 году. Рассматривая возможности ИИ в области компьютерного зрения и создания изображений, аналитики упомянули датасет Skoltech3D, предназначенный для многоракурсной 3D-реконструкции. Его в мае 2023 года представили ученые «Сколтеха», Института AIRI, МИФИ, Технического университета Мюнхена (Германия) и Нью-Йоркского университета (США).
Также среди некоторых выводов отчета:
● LLM открыли новые возможности в робототехнике. Мировым лидером по внедрению сервисных роботов является Китай, а Россия входит в топ-10 стран по производству таких устройств;
● более четверти всех частных инвестиций в ИИ в 2023 году пришлось на генеративный ИИ. Основными игроками в этом сегменте являются OpenAI, Anthropic, Hugging Face и Inflection;
● число ИИ-разработок на базе Open Source активно увеличивается. В 2023 году их количество на GitHub выросло более чем на 59%;
● закрытые LLM (Closed Source LLM) работают в среднем на 24,2% эффективнее открытых моделей;
● передовые ИИ-модели (Frontier AI) становятся все более дорогими. Так, в OpenAI потратили $78 млн на обучение GPT-4, а компания Google на Gemini Ultra — $191 млн.
👉🏻 Другие выводы отчета (502 стр.)
Специалисты Стэнфордского центра Institute for Human-Centered AI (Stanford HAI) в своем отчете AI Index Report 2024 подвели итоги развития трендов искусственного интеллекта в 2023 году. Рассматривая возможности ИИ в области компьютерного зрения и создания изображений, аналитики упомянули датасет Skoltech3D, предназначенный для многоракурсной 3D-реконструкции. Его в мае 2023 года представили ученые «Сколтеха», Института AIRI, МИФИ, Технического университета Мюнхена (Германия) и Нью-Йоркского университета (США).
Также среди некоторых выводов отчета:
● LLM открыли новые возможности в робототехнике. Мировым лидером по внедрению сервисных роботов является Китай, а Россия входит в топ-10 стран по производству таких устройств;
● более четверти всех частных инвестиций в ИИ в 2023 году пришлось на генеративный ИИ. Основными игроками в этом сегменте являются OpenAI, Anthropic, Hugging Face и Inflection;
● число ИИ-разработок на базе Open Source активно увеличивается. В 2023 году их количество на GitHub выросло более чем на 59%;
● закрытые LLM (Closed Source LLM) работают в среднем на 24,2% эффективнее открытых моделей;
● передовые ИИ-модели (Frontier AI) становятся все более дорогими. Так, в OpenAI потратили $78 млн на обучение GPT-4, а компания Google на Gemini Ultra — $191 млн.
👉🏻 Другие выводы отчета (502 стр.)
База знаний AI
НИУ ВШЭ: 43% студентов используют в учебе ИИ Из них 52% готовы доверить искусственному интеллекту подготовку материалов, которые в дальнейшем будет проверять преподаватель. Такие данные приводит онлайн-кампус НИУ ВШЭ, опросив почти 1,4 тыс. человек. По мнению…
📌 Больше информации о применении ИИ студентами вузов можно найти в карточке исследования. Также добавили графики с исходными данными НИУ ВШЭ.