База знаний AI
7.12K subscribers
675 photos
33 videos
3 files
3.69K links
Telegram-канал открытой базы знаний об искусственном интеллекте ict.moscow/ai

Новости, аналитика, вакансии, кейсы, мероприятия об ИИ, больших данных, робототехнике и беспилотниках

Связь: [email protected]

Наши вакансии: https://clck.ru/3BoDXh
加入频道
Команда SberDevices выложила в открытый доступ класс моделей GigaAM для обработки речи

Модель GigaAM (Giga Acoustic Мodel) была обучена на датасете из 50 тыс. часов разнообразных русскоязычных данных. Она подходит для адаптации под различные задачи работы со звуком. Модель существует в двух дообученных состояниях: GigaAM-CTC — для распознавания речи и GigaAM-Emo — для определения эмоций.

Обучение GigaAM-CTC проходило на корпусах Golos SberDevices, Sova, CommonVoice и LibriSpeech. Качество тестировали на семи срезах данных, учитывая как запросы для умных колонок, так и записи из телефонных каналов. В коротких запросах она допускает на 20–35% меньше ошибок в словах, чем такие решения, как NeMo-Conformer-RNNT и Whisper-Large-v3, сообщили в SberDevices.

Модель GigaAM-Emo для определения эмоций дообучали на наборе Dusha: он состоит из записей речи продолжительностью до 20 секунд. Часть аудио записали актеры озвучки, остальные собраны из подкастов. Каждой записи приписано одно из четырех состояний: злость, грусть, нейтральная эмоция или счастье.

👉🏻 GigaAM, GigaAM-CTC и GigaAM-Emo на GitHub

🔗 Источник 1: https://yangx.top/c/1943754373/71
🔗 Источник 2: https://habr.com/ru/companies/sberdevices/articles/805569/
В Москве создадут Центр искусственного интеллекта в строительстве

Организация появится на базе «Мосстройинформ». Она будет анализировать тенденции в градостроительной отрасли и проблемы, с которыми сталкиваются участники инвестиционно-строительного процесса.

Сейчас Центр уже начал работу над задачами в рамках создания двух сервисов. Первый — по квартирографии — позволит генерировать оптимальные планировки в многоквартирных домах на основании заданных пользовательских параметров. С помощью второго решения — по нормоконтролю — можно будет проверять проектную и рабочую документацию на соблюдение норм оформления. Кроме того, оно выдает перечень несоответствий, осуществляя так называемый входной контроль документации.

🔗 Источник: https://stroi.mos.ru/press_releases/v-stroitiel-nom-komplieksie-sozdaietsia-tsientr-iskusstviennogho-intielliekta
📬Утренняя подборка

● В образовательную платформу 🏷«Московская электронная школа» в течение трех лет планируется внедрить ИИ-сервисы

● Технологическая компания Sitronics Group намерена представить в текущем году электрическое судно с системой автономного управления

● Разработчик Rocket Group и ИТМО заключили соглашение о совместном развитии инструментов генерации цифровых моделей промышленных территорий с помощью ИИ

● Специалисты МТУСИ применили машинное обучение для выявления аномалий в интернет-трафике

● В Университете «Сириус» к 2026 году планируется создать ИИ-систему управления производственными роботами

🗺За рубежом
● Microsoft открыла центр ИИ в Лондоне, который возглавит Джордан Хоффман (Jordan Hoffmann) из стартапа Inflection AI

● Apple в рамках соглашения с американской Shutterstock будет использовать данные (стоковые фото и видео) компании для обучения своих ИИ-моделей. Сумма сделки могла составить до $50 млн

● Американский производитель электрических автомобилей Tesla в августе намерен представить собственный беспилотник

● ИИ-стартап Cohere (США) создал ИИ-модель Command R+, которая, по словам разработчиков, может конкурировать с решениями OpenAI при выполнении «критически важных для бизнеса» задач, но с меньшими затратами

● ИИ-стартап из США Higgsfield AI, разрабатывающий нейросеть для создания видео, привлек $8 млн от Menlo Ventures на развитие

📈Аналитика
Рейтинг CB Insights, в котором представлены 100 лучших стартапов из 16 стран, развивающих ИИ в 30 различных направлениях

💬Мнения
● Генеральный директор SoftBank Масаёши Сон (Masayoshi Son) — о сроках создания AGI

📎Материалы
● Составленная FirstMark карта ИИ-стартапов, отражающая ландшафт 2024 года

Статья на «Хабре» аспиранта Сколтеха и участника научной группы Fusion Brain в институте AIRI Антона Разжигаева о наблюдении за пространством эмбеддингов на промежуточных слоях по мере обучения больших и маленьких языковых моделей

Заметка Reuters о стратегиях крупных компаний по приобретению данных для обучения ИИ

Мониторинг новостей СМИ по искусственному интеллекту за 8–9 апреля, составленный Национальным центром развития искусственного интеллекта при правительстве РФ
ИИ-стартап Cohere представил новую LLM Command R+ для автоматизации бизнес-процессов

Модель стала самой мощной LLM Cohere в линейке R. Она имеет контекстное окно на 128 тыс. токенов. По словам разработчиков, Command R+ поддерживает корпоративные варианты использования в таких задачах, как финансы, управление персоналом, продажи, маркетинг, в том числе генерация маркетинговых текстов, и другие.

Для уменьшения галлюцинаций модели разработчики задействовали генерацию с дополненной выборкой (RAG). Модель поддерживает более 10 языков, включая английский, французский, испанский, итальянский, немецкий, португальский, японский, корейский, арабский и китайский.

Пока Command R+ доступна через Microsoft Azure. В дальнейшем Cohere планирует расширить доступ к LLM через другие платформы.

🔗 Источник: https://txt.cohere.com/command-r-plus-microsoft-azure/

***
📎 Прошлая версия LLM Command R была представлена в марте.
📆 Какие мероприятия об искусственном интеллекте можно посетить на этой неделе

На ICT.Moscow вышла очередная подборка ИТ-мероприятий на ближайшую неделю. Вот наиболее интересное по теме ИИ из нее:

Среда–четверг

📍Открытые инновации | Офлайн (Большой бул., д.42, стр.1)

Форум «Сколково», в рамках которого пройдут сессии, посвященные AGI, применению генеративного ИИ в бизнесе и дальнейшему развитию ИИ в медицине, а также будущему рынка отечественных решений на базе искусственного интеллекта.

Четверг

📍Индустрия 4.0 | Офлайн (ул. Неверовского, д.15)

Форум, организованный Центром компетенций «Умный город». На мероприятии поговорят о цифровой трансформации строительной отрасли, применении искусственного интеллекта в проектировании, цифровых информационных моделях стройматериалов для проектирования с использованием российского ПО.

📍Х5 Tech Talk: Наводим порядок в данных | Офлайн (Валовая улица, д.28) и онлайн

Митап X5 Group, на котором расскажут про успешные внедрения в последние годы открытых каталогов данных на базе OpenMetadata и DataHub.
📬Утренняя подборка

● «Московская техническая школа» с 2022 года подготовила более 200 специалистов в сфере ИИ

● АНО «Цифровая экономика», Ассоциация Коммуникационных Агентств России, «Рунити», SPLAT Global и «Домклик» подписали Кодекс этики в сфере искусственного интеллекта

● Yandex Cloud открыла сторонним разработчикам доступ к тестированию нейросети 🏷YandexART для создания иллюстраций

● Разработчик Directum внедрил генеративный ИИ в систему управления документооборотом и цифровыми процессами 🏷Directum RX

● «Ростелеком» и «МегаФон» не планируют разрабатывать собственные ИИ-модели, но намерены использовать нейросети в своей деятельности

🗺За рубежом
● Власти Южной Кореи собираются инвестировать 9,4 трлн вон ($6,9 млрд) в индустрию ИИ до 2027 года, а также создать фонд для поддержки производителей ИИ-чипов

● Microsoft в течение двух лет инвестирует $2,9 млрд в развитие ИИ и облачной инфраструктуры в Японии

● Google представила Gemini Code Assist — ИИ-систему для помощи в написании программного кода, а также анонсировала собственный чип Axion для решения задач в сфере ИИ

● Американская компания Intel в рамках конкуренции с NVIDIA объявила о выходе новой версии своего чипа для ИИ. Он получит название Gaudi 3 и будет доступен в III квартале 2024 года

● Ученые Университета Нотр-Дам (США) применили машинное обучение для создания оконной пленки, блокирующей ультрафиолетовый и инфракрасный спектры

📈Аналитика
● Согласно информации iKS-Consulting в 2023 году на российском рынке облачных услуг доля аренды серверов для обучения ИИ-моделей составила 5,4%

● По данным CNews Analytics, развитие решений на основе Big Data вошло в число трендов 2023 года на рынке услуг среди операторов фискальных данных

🏅Конкурсы
● ИИ-решение от разработчика 🗂NtechLab для планирования транспортных и туристических потоков победило в конкурсе «Digital Awards 2023 РБК Петербург»

📎Материалы
Интервью «Коммерсанта» с директором бизнес-группы поиска и рекламных технологий «Яндекса» Дмитрием Масюком о фокусировке компании на нейросетевых и других продуктах

Материал The Wall Street Journal о росте дипфейков в финансовом секторе

Статья «Коммерсанта» о регулировании ИИ в России и мире

Мониторинг новостей СМИ по искусственному интеллекту за 9–10 апреля, составленный Национальным центром развития искусственного интеллекта при правительстве РФ

Мониторинг новостей СМИ по искусственному интеллекту за 10–11 апреля, составленный Национальным центром развития искусственного интеллекта при правительстве РФ
Говорит и показывает «Яндекс»

На этой неделе ИТ-компания сделала ряд заявлений о нейросетях и их внедрении.

📎 Графическую нейросеть 🏷YandexART теперь можно протестировать на Yandex Cloud через API-сервис Foundation Models.

📎 Языковая модель 🏷YandexGPT вчера была внедрена в «Яндекс Карты», а самая последняя версия модели — GPT 3 Pro — появилась сегодня в голосовом помощнике «Алиса».

📎 По словам главы поискового бизнеса «Яндекса» Дмитрия Масюка, большие языковые модели, которые внедряет компания, дороже в разработке и эксплуатации, чем обычные технологии. «Стоимость ответов на основе YandexGPT примерно в семь раз выше в пересчете на одного пользователя. В подобные разработки заложены достаточно большие инженерные вложения, и надо понимать, как отбивать инвестиции», — отметил Масюк.
Forwarded from AIRI Institute
Мы выложили в открытый доступ OmniFusion 1.1. — первую в России мультимодальную модель искусственного интеллекта 🚀

🔥О модели
OmniFusion 1.1. — это передовая мультимодальная модель искусственного интеллекта, предназначенная для расширения возможностей традиционных систем обработки языка за счет интеграции дополнительных модальностей данных, например, изображений, а в перспективе — аудио, 3D- и видеоконтента. Модель – SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, модель хорошо справляется со сложными задачами и понимает русский язык.

🔖Открытый код
В этот раз мы выкладываем модель в открытый доступ! Делимся ссылкой на GitHub и Technical Report на arXiv. Модель можно использовать как в некоммерческой, так и в коммерческой деятельности.

🌐Статья на Хабр
В статье мы рассказали об особенностях модели, процессе обучения и примерах ее использования. Также подсветили архитектуру, проделанные эксперименты как в части архитектурных трюков, так и в работе с данными. А еще собрали интересные кейсы использования на английском и русском языках.

На Hugging Face статья про архитектуру OmniFusion уже на первом месте в списке daily papers 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
📬Утренняя подборка

● Участники Альянса в сфере искусственного интеллекта создадут базу научных публикаций по ИИ

● «Сбер» задействовал ИИ в 85% процессов компании, а ожидаемая прибыль от технологии в 2024 году может составить 400–450 млрд руб., заявил первый заместитель председателя правления компании Александр Ведяхин

● Институт искусственного интеллекта AIRI выложил в открытый доступ мультимодальную ИИ-модель 🏷OmniFusion 1.1 для расширения возможностей систем обработки языка за счет интеграции дополнительных модальностей данных

● В МФТИ создали технологию для автоматической подготовки нейросетями текстовых данных, необходимых для обучения ИИ

🏷Whoosh начал тестирование в Санкт-Петербурге собственного инструмента «Антитандем» на базе ИИ для выявления количества людей на самокате

🗺За рубежом
● По данным СМИ, генеральный директор OpenAI Сэм Альтман (Sam Altman) работает над созданием глобальной коалиции с несколькими странами и компаниями для поддержки и развития ИИ

● Google Cloud (США) и фармкомпания Bayer создадут ИИ-платформу для помощи рентгенологам в постановке диагнозов

● Американский ИИ-стартап Symbolica, разрабатывающий ИИ-модели, привлек $33 млн от Khosla Ventures, Abstract Ventures, Buckley Ventures и других инвесторов

● Английская Botswana Diamonds, имеющая лицензию на геологоразведку на территории пустыни Калахари в Ботсване, будет применять ИИ для поиска новых месторождений алмазов

📈Аналитика
● По данным Ecoplatform и «Самолет», Московский регион лидирует в рейтинге российских субъектов по сбору вторсырья с помощью ИИ

● Согласно опросу онлайн-школы программирования «Хекслет» 65% ИТ-специалистов используют искусственный интеллект для улучшения своих разработок

● По данным Brand Analytics, «Шедеврум» (🏷YandexGPT, 🏷YandexArt) и 🏷Kandinsky вошли в топ-5 нейросетей, которые чаще всего упоминаются в соцсетях

💬Мнения
● Директор по цифровизации «Росатома» Екатерина Солнцева — о сокращении сроков проектирования АЭС при помощи ИИ

📎Материалы
Колонка в Forbes директора по развитию бизнеса Just AI Светланы Захаровой об игроках рынка ИИ в России и факторах, замедляющих внедрение генеративного ИИ в бизнес-процессы

Материал «Ведомостей» по мотивам форума «Телеком 2024» с мнениями представителей компаний «Яндекс», «Самолетум» и Альянс искусственного интеллекта о возможностях ИИ
Аналитики Google Cloud назвали пять ИИ-трендов этого года

В первую очередь в компании говорят о том, что генеративный ИИ ускорит доступ нетехнических специалистов к аналитической информации. Такого мнения придерживаются около 2/3 руководителей, ответственных за работу с данными. Всего аналитики в рамках глобального исследования опросили более 400 директоров и менеджеров по ИТ.

Кроме того, 80% респондентов признают, что разграничения между специальностями, связанными с работой с данными, начинают стираться, например между аналитиками (Data Analysts) и исследователями (Data Scientists).

Третьим трендом аналитики называют зависимость инноваций в области ИИ от эффективного управления данными. По оценкам авторов исследования, менее половины респондентов (44%) полностью уверены в качестве данных своей организации.

Еще один тренд заключается в том, что операционные данные раскроют потенциал генеративного ИИ в сфере корпоративных приложений. 71% опрошенных организаций планирует интегрировать инструменты генеративного ИИ в свои базы данных, отмечается в документе.

В заключении аналитики Google Cloud сообщают, что 2024 год станет годом быстрой модернизации платформ обработки данных, отмечая, что только в 1% организаций удовлетворены тем, как их текущие базы данных поддерживают применение ИИ.

👉🏻 Изучить исследование
📬Утренняя подборка

● В Московской области планируется задействовать нейросеть для выявления очередей на остановках для дальнейшей передачи данных перевозчику, сообщили в Министерстве государственного управления, информационных технологий и связи региона

● Разработчик беспилотных авиационных систем (БАС) «Геоскан» разработал для «Российского экологического оператора» систему мониторинга объектов размещения ТКО с применением БАС и ИИ

● В СПбГУ создали нейросеть для составления плана лечения пациентов с заболеваниями сердца на основе клинических данных, ЭХОКГ, КТ аорты и других исследований

● Компания VK запустила открытое бета-тестирование генеративных нейросетей для всех пользователей сервисов Mail.ru с целью оценки развития ИИ в новых сценариях

🗺За рубежом
● Технологический институт Джорджии (США) в сотрудничестве с NVIDIA создал суперкомпьютерный центр ИИ для обучения студентов

● Южнокорейская компания Samsung анонсировала обновление пакета функций Galaxy AI, среди которых автоматический перевод голосовых звонков на русский язык в режиме реального времени

● Apple (США) готовит к обновлению линейку компьютеров Mac, в которых будет установлен процессор М4 с расширенной поддержкой ИИ

● Американская Meta (признана экстремистской и запрещена в РФ) анонсировала внедрение ИИ-чипа нового поколения Artemis в продукты компании

Разработчик Adobe начал покупать видео для создания собственного ИИ-генератора видео по текстовому описанию

● Amazon включил в состав совета директоров Эндрю Ына (Andrew Ng), который ранее руководил ИИ-проектами в Alphabet и Baidu

📎Материалы
Статья «Парламентская газета» о регулировании ИИ в России

Мониторинг новостей СМИ по искусственному интеллекту за 11–12 апреля, составленный Национальным центром развития искусственного интеллекта при правительстве РФ

🙋Ищут
● В команду компании «Тинькофф» ищут Data Engineer. Ознакомиться с подробностями можно здесь, откликнуться — в Telegram @angel_gilmutdinova

🧑🏻‍💻Разработчикам
● Инструмент gpt-llm-trainer от HyperWriteAI для упрощения процесса дообучения ИИ-моделей под конкретную задачу

📌 Утренняя подборка со следующей недели уходит на короткие каникулы. Новый выпуск выйдет в понедельник, 22 апреля
Зарубежные ученые задействовали ML для расшифровки спонтанных мыслей

Исследователи из Центра по нейронаучным исследованиям Института фундаментальных наук (Южная Корея) в сотрудничестве с Дартмутским колледжем (США) смогли предсказать эмоции человека, которые возникают вместе с мыслями во время чтения или в состоянии свободного мышления.

Для этого ученые использовали данные о мозговой активности человека при проведении функциональной магнитно-резонансной томографии. В этот момент 49 испытуемым были предложены индивидуально сгенерированные истории, отражающие прошлый опыт и эмоции тестируемого.

Эти данные и методы ML были использованы для обучения предсказательных моделей, чтобы расшифровать «эмоциональные аспекты» мыслей в реальном времени. Модели прогнозировали эмоции во время чтения, в процессе свободного мышления или в состоянии покоя, а также показали свою способность предсказывать самооценку.

📎 Источник 1: https://medicalxpress.com/news/2024-04-decoding-spontaneous-thoughts-brain-machine.html
📎 Источник 2: https://www.ferra.ru/news/techlife/mrt-i-mashinnoe-obuchenie-pomogut-predskazyvat-emocii-11-04-2024.htm

***
📎 Исследование опубликовано в журнале Proceedings of the National Academy of Sciences
This media is not supported in your browser
VIEW IN TELEGRAM
📖 Почитать на выходных: перевод статьи на «Хабре» о тестировании различных LLM с помощью Street Fighter

Перевод Cloud4Y статьи о тестировании 14 больших языковых моделей с необычной стороны. Вместо привычных ответов на вопросы модели заставили соревноваться между собой в видеоигре Street Fighter III.

Выбор моделей для сравнения осуществлялся случайным образом. Каждая из них отслеживала несколько параметров, необходимых для схватки друг с другом. При этом была отмечена взаимосвязь: «меньшие модели превосходили более крупные, вероятно, из-за меньшей задержки». В конце приводится таблица победителей, закономерности подхода LLM к игре и другие обнаруженные факты.

👉🏻 Читать материал

📃 Код и мануалы для самостоятельного тестирования