База знаний AI
6.59K subscribers
623 photos
31 videos
3 files
3.52K links
Telegram-канал открытой базы знаний об искусственном интеллекте ict.moscow/ai

Новости, аналитика, вакансии, кейсы, мероприятия об ИИ, больших данных, робототехнике и беспилотниках

Связь: [email protected]

Наши вакансии: https://clck.ru/3BoDXh
加入频道
Ученые МГУ сообщили о повышении точности анализа трафика сетей 5G с помощью ML

Специалисты факультета ВМК МГУ представили результаты исследования о развитии вероятностно-информированного подхода в ML для прогнозирования характеристик сетевого трафика и детектирования событий в нем. В частности, они предложили регрессионную модель глубокой гауссовой смеси, в которой сначала выполняется предварительная кластеризация на основе нейронной сети и конечных нормальных смесей. Затем эта информация используется в качестве входных данных для алгоритмов машинного обучения с учителем.

По словам ученых, развитие предлагаемых методов актуально для решения задач оптимизации производительности телеком-сетей и управления качеством обслуживания. Это способствует повышению эффективности, надежности и устойчивости к внешним сбоям, а также снижению затрат на эксплуатацию и обслуживание.

🔗 Источник: https://msu.ru/news/novosti-nauki/uchenye-mgu-povysili-tochnost-analiza-trafika-5g-setey.html

***
📃 Результаты исследования опубликованы в журнале Computer Networks
Разработчики смогут получить открытые данные ведомств для обучения ИИ

Минэкономразвития разработало порядок раскрытия данных госведомств в интернете. Из него следует, что теперь государственный или муниципальный орган может признать информацию общедоступной по запросу физических и юридических лиц и опубликовать ее на сайте ведомства в виде массива в разделе под названием «Открытые данные».

Принимать решение о размещении госорганы будут на основе общественной потребности в такой информации. По словам представителя Минэкономразвития, в спецразделах будут публиковаться разные данные, кроме персональных (ПД). Компании смогут использовать сведения для обучения моделей ИИ бесплатно.

🔗 Источник: https://www.vedomosti.ru/technology/articles/2024/06/17/1044118-kompanii-poluchat-otkritie-dannie-vedomstv-dlya-obucheniya-ii

***
📃 Текст документа
Искусственный интеллект в инженерном ПО

Эксперты Центра стратегических разработок (ЦСР) в своем новом докладе определили отечественный контекст и ключевые тренды развития искусственного интеллекта (ИИ) в инженерном программном обеспечении (ПО).

Авторы выделили следующие тренды, которые будут определять развитие индустрии:

стали заметны генеративный и инверсивный дизайн;

фронтиром развития генеративного дизайна будет моделирование динамичных систем, способных менять свойства и состояния в различных сценариях;

реализация инверсивного дизайна возможна с применением методов машинного (ML) и глубокого (DL) обучения, когда решения находятся путем перебора и фильтрации вариантов до получения необходимого результата;

использование генеративных моделей ИИ и обработки естественного языка позволяет реализовать эволюционные стратегии инверсивного дизайна, включающие анализ и синтез научных публикаций искусственным интеллектом;

еще один тренд — облегченные симуляции на основе ИИ и машинного обучения. Они могут быть использованы для имитации комплексных физических процессов, когда интересующий результат не может быть легко вычислен. В целях инженерного моделирования традиционно используются методы контролируемого машинного обучения. Строится модель, которая делает прогнозы на основе фактических данных в условиях неопределенности. Примером является суррогатное моделирование, при котором обученные статистические модели применяются для замены исходных компьютерных симуляций, что позволяет существенно сократить длительность симуляции;

четвертый тренд — это экспансия ИИ в инженерное ПО на основе больших языковых моделей (LLM). Если в цифровой трансформации движущей силой рынка в области инженерного ПО были PLM-системы и цифровые двойники, то в период ИИ-трансформации на эту позицию претендуют LLM и суррогатные модели объектов и процессов;

внедрение LLM может происходить по меньшей мере в таких аспектах, как профессиональные ассистенты на основе LLM, интеллектуальное планирование и LLM для проблемно-ориентированных сред;

последним стал тренд на общий инженерный ИИ на основе мультиагентного взаимодействия.

Скачать доклад

#искусственный_интеллект #генеративный_ИИ

🗣 Больше аналитики в разделе «Исследования»
Please open Telegram to view this post
VIEW IN TELEGRAM
В Китае представили открытую LLM-модель DeepSeek-Coder-V2

DeepSeek представила модель DeepSeek-Coder-V2, специализирующуюся на коде. Она построена на архитектуре MoE (Mixture-of-Experts), поддерживает 338 языков программирования и длину контекста в 128 тыс. токенов.

Модель существует в двух видах: DeepSeek-Coder-V2 размером 236 млрд параметров и DeepSeek-Coder-V2-Lite размером 16 млрд параметров. Как заявляют разработчики, в математических задачах и задачах на кодирование DeepSeek-Coder-V2 превосходит модели с закрытым исходным кодом (например, GPT-4 Turbo, Claude 3 Opus и Gemini 1.5 Pro).

🔗 Источник: https://habr.com/ru/news/822503/

***
📎 DeepSeek-Coder-V2 на GitHub и на HuggingFace
В SoftBank создают ИИ-инструмент для колл-центров по переводу речи клиентов из эмоциональной в спокойную

Сейчас решение SoftVoice находится на стадии исследований, его коммерческое внедрение ожидается в 2025 году. Процесс работы SoftVoice состоит из двух этапов: сначала ИИ используется для идентификации голоса разгневанного абонента и извлечения его ключевых комментариев, а затем при помощи акустических инструментов создается вежливый тон голоса.

Для обучения ИИ разработчики использовали более 10 тыс. элементов голосовых данных. Инженеры компании также попросили 10 актеров записать около 100 фраз с различными эмоциями: криками, обвинениями и требованиями извинений.

Отмечается также, что инструмент не изменяет слова абонента, только смягчает его интонацию. При этом сам абонент не слышит свою измененную речь.

🔗 Источник 1: https://www.techinsider.ru/news/news-1647237-v-pomoshch-sotrudnikam-koll-centrov-v-yaponii-razrabotali-ii-perevodyashchii-gnevnye-kriki-v-spokoinuyu-rech/
🔗 Источник 2: https://www.softbank.jp/en/sbnews/entry/20240607_01
MTS AI запустила ИИ-сервис Kodify для генерации кода

Сервис создан на базе собственной большой языковой модели Cotype, пояснили в МТС. Он может генерировать код с нуля по текстовому описанию на естественном языке или предложить продолжение кода на основании того, что содержится до и после выбранного фрагмента. Kodify поддерживает языки Python и Java. Также он может перевести код с одного языка на другой, например для оптимизации устаревшего софта или интеграции с другим проектом.

В компании отмечают, что в будущем ассистент сможет помочь в анализе и оптимизации кода: проверить его на наличие ошибок и уязвимостей, провести автоматические тесты, предложить варианты рефакторинга, а также составить документацию по выделенному фрагменту.

🔗 Источник 1: https://www.forbes.ru/tekhnologii/514918-kod-v-pomos-v-mts-sozdali-ii-assistenta-dla-programmistov
🔗 Источник 2: https://mts.ai/ru/product/generative-ai-solutions/

***
📎 Подробнее можно прочитать в статье на «Хабре»
В Smart Engines разработали тип нейросетей со сниженным потреблением энергии

Специалисты Smart Engines представили и запатентовали в США модель нейросетей, называемых биполярными морфологическими сетями (Bipolar Morphological Networks, БМ-сети). По информации компании, они отличаются от классических моделей тем, что они исключают умножение из вычислений нейрона, используя вместо этого сложение и взятие максимума. Этот подход делает нейроны вычислительно более эффективными, а их поведение напоминает функционирование биполярных нейронов в биологии, которые отвечают за возбуждение и торможение.

Разработка направлена на создание автономных нейросетей, работающих на персональных устройствах типа компьютеров и умных часов. Эти сети также позволяют создать ускоритель для нейросетевых моделей, что может привести к улучшению аппаратных характеристик на 30–40% без ущерба для производительности.

🔗 Источник: https://smartengines.ru/news/rossijskie-uchenye-sozdali-usovershenstvovannyj-analog-nejrosetevogo-uskoritelya-google/

***
📃 Изучить патент
РЖД вместе с Центром экономики инфраструктуры создают программный комплекс с ИИ «Прогнозирование пассажиропотоков»

Система позволяет анализировать влияние социально-экономических параметров территории и других видов пассажирского транспорта. ИИ применяется для верификации массивов исходных данных, анализа статистических «выбросов». Система построена на микросервисной архитектуре, отечественных компонентах и на ПО с открытым кодом (без использования открытых GPL-лицензий). Программный комплекс разворачивается на отечественной операционной системе «Ред ОС» и на российской СУБД PostgreSQL Pro.

Сейчас в опытную эксплуатацию введены три модуля системы: «Пассажиропоток», «Агломерация» и «ТПУ и вокзалы». Первый модуль — «Пассажиропоток» — отвечает за прогнозирование междугородних и межрегиональных пассажиропотоков. В его основе детализированная информация о параметрах всех видов транспорта, включая железнодорожный, воздушный, автобусный и личный автомобильный. Программный продукт содержит информацию о времени в пути, стоимости проезда, частоте сообщения по каждой корреспонденции.

В рамках второго модуля — «Агломерация» — производится моделирование пассажиропотоков на внутрирегиональном уровне. Среди главных функций модуля — прогнозирование пригородных пассажиропотоков, в том числе для проектов «городских электричек», а также поиск оптимальной локации для размещения транспортно-пересадочных узлов.

В модуле «ТПУ и вокзалы» производится микромоделирование поведения пассажиров в транспортно-пересадочных узлах и вокзальных комплексах.

В планах разработчиков создание еще шести модулей, в том числе решения, которое будет отвечать за прогнозирование грузопотоков и распределение их по железнодорожной сети. Отдельный модуль будет посвящен оценке социально-экономических и бюджетных эффектов.

🔗 Источник: https://rzddigital.ru/projects/tekhnologii-pomogut-organizovat-i-raspredelit-passazhiropotoki/
«Ростелеком»: производство и потребление контента все более зависит от ИИ

Компания «Ростелеком» при участии Института развития интернета представила обзор главных трендов в области потребительских коммуникационных сервисов. Он основан на данных публичной аналитики, обзоре новостной повестки и регуляторных инициатив. Как отмечают авторы документа, развитие цифровой креативной индустрии, производство и потребление контента во всем мире все более зависят от ИИ, включая негативное влияние дипфейков. Одновременно генеративные нейросети сами стали потребительским сервисом, аудитория которых стремительно растет.

В частности, пользователи привыкают применять сервисы генерации текстового и визуального контента и широко используют их как в личных, так и в профессиональных целях. 2023 год можно назвать годом инвестиций в генеративный ИИ и смежные отрасли: этот сектор привлек более $50 млрд, такую оценку приводят авторы обзора.

Несмотря на то что решения для выявления сгенерированного контента разрабатываются в России и по всему миру, говорить об их масштабном применении пока преждевременно. Например, российские разработчики подобных систем не спешат разглашать информацию о точности их работы, отмечается в обзоре.

👉🏻 Изучить обзор
Компания Anthropic выпустила ИИ-модель Claude 3.5 Sonnet

Модель превосходит Claude 3 Opus. Она, по заявлению компании, работает в два раза быстрее и показывает лучшие результаты в различных задачах, включая написание программного кода, работу с большими запросами, интерпретацию диаграмм и графиков.

Согласно результатам тестирования, проведенного Anthropic, Claude 3.5 Sonnet превзошла модели GPT-4o, Gemini 1.5 Pro и Llama 3 400B от Meta (признана экстремистской и запрещена в РФ) в 7 из 9 общих тестов производительности. В задачах распознавания изображений новая модель Anthropic также показала лучшие результаты.

🔗 Источник 1: https://3dnews.ru/1106817/anthropic-vipustil-novuyu-moshchnuyu-iimodelclaude-35-sonnet
🔗 Источник 2: https://www.anthropic.com/news/claude-3-5-sonnet
Ассоциация ФинТех перечислила ключевые тренды искусственного интеллекта

Среди трендов на ближайшие пару лет аналитики называют:
– демократизацию генеративного ИИ. Она проявляется в доступности ИИ-решений, тренд формируется благодаря распространению сервисов Low-Сode и No-Сode, свободному проникновению решений в деятельность пользователей;

– новые бизнес-модели и сервисы на основе ИИ. Используя технологию, компании могут преодолеть барьеры, провести глубокие изменения, разработать инновационные бизнес-модели и внедрить на рынок новые сервисы;

– развитие мультимодального ИИ, что расширяет способы применения больших языковых моделей;

– применение ИИ в биометрии. Технология обеспечивает высокие темпы развития биометрических сервисов;

– совершенствование мультиагентных систем. Здесь аналитики говорят о сети автономных агентов на базе ИИ, которые взаимодействуют и обладают способностью к автономному принятию решений, общению с другими агентами и координации действий для выполнения сложных задач.

Среди трендов на ближайшие пять лет — формирование рынка данных, синергия естественного и искусственного интеллекта, дефицит высококачественных данных для ИИ-моделей.

👉🏻 Изучить исследование
В ННГУ им. Н.И. Лобачевского смоделировали прототип сверхпроводниковой нейроморфной сети

Ученые университета предложили дизайн нейроморфного процессора на сверхпроводниках для высокоскоростной обработки больших массивов данных, в том числе широкополосных космических сигналов. По словам специалистов, преимущество «модели в том, что подобная нейросеть может работать и в классическом, и в квантовом режиме. Например, использоваться как сопроцессор для обработки квантовой информации».

Нейроморфный процессор на сверхпроводниках по энергоэффективности и быстродействию в десятки раз превосходит полупроводниковые аналоги, отмечают ученые. Благодаря меньшему числу задействованных трансформаторов разработка позволяет минимизировать потерю сигналов. Также авторы описали взаимодействие нейронов и рассчитали оптимальные параметры компонентной базы элементов для дальнейших исследований. «Предлагаемая система может быть изготовлена «в железе» в ближайшее время», — говорит автор исследования, руководитель лаборатории теории наноструктур ННГУ им. Н.И. Лобачевского Марина Бастракова.

🔗 Источник: http://www.unn.ru/site/about/news/pervyj-prototip-sverkhprovodnikovoj-nejromorfnoj-seti-smodelirovali-v-nngu

***
📃 Результаты исследования опубликованы в журнале Nanomaterials
Развитие технологий искусственного интеллекта в Москве — 2023

Департамент информационных технологий города Москвы изучил, как изменилось отношение жителей столицы к искусственному интеллекту (ИИ) с 2019 года.

Жители столичного региона, как показывают результаты, стали более осознанно относиться к технологии по сравнению с 2019 годом. Они видят больше преимуществ, чем недостатков в искусственном интеллекте и сходятся во мнении, что технология может ускорить выполнение рутинных задач или заменить человека при выполнении опасных для жизни работ. Основные опасения у них вызывает возможность использования ИИ против людей и нарушение частных границ.

• 69% респондентов заявили, что базово и хорошо знакомы с технологией (+11% п. п. к 2019 году). Число тех, кто очень хорошо знаком с ней, выросло на 4 п. п., до 14%. Также улучшилась осведомленность среди жителей в возрасте 35–46 лет и старше 65 лет. Уровень знания оказался выше среди тех, кто работает или учится.

• 33% из общей выборки применяли генеративный ИИ за последний год. Среди них самые активные — молодежь в возрасте от 18 до 35 лет (67%), 13% их них пользуются технологией ежедневно.

• 9 из 10 участников пользовались решениями с применением ИИ хотя бы раз за прошедший год.

Изучить все исследование(11 стр.)

#искусственный_интеллект #генеративный_ИИ #нейросети

🗣 Больше аналитики в разделе «Исследования»
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
В Стэнфордском университете представили открытый проект человекоподобного робота HumanPlus

На первом этапе исследователи подготовили 40 часов данных с движениями людей и обучили на них модель, использовав среду от NVIDIA. Датасета хватило для того, чтобы робот мог в реальном времени анализировать движения человека с камеры и повторять их.

По словам исследователей, особенность проекта заключается в том, что робот также запоминает движения с камеры и потом может выполнять их самостоятельно. Для этого надо повторить движение около 40 раз. С вероятностью 60–100% робот запомнит его. Самостоятельные действия робот пока выполняет медленно, но исследователи утверждают, что это проблема нехватки вычислительных ресурсов.

🔗 Источник: https://habr.com/ru/news/824202/

***
📃 Научная статья
🌐 Датасет
🧠 HumanPlus на GitHub
🤖 Дополнительная информация для сборки
НИУ ВШЭ: количество выпускников по профилю ИИ достигло 3,8 тыс. человек

Такие данные на начало октября 2023 года приводят в НИУ ВШЭ. Показатель составляет 0,7% от общего выпуска бакалавриата, специалитета и магистратуры. Аналитики прогнозируют, что в дальнейшем возможен существенный рост выпуска молодых ИИ-специалистов: через четыре года количество выпускников-бакалавров можно ожидать на уровне 8,7 тыс. человек, а магистров через два года — около 6 тыс. человек.

Бóльшая часть (70,1%) студентов программ по профилю ИИ обучаются по специальностям и направлениям подготовки «инженерное дело, технологии и технические науки»; примерно четверть (27,3%) — по направлениям, связанным с математическими и естественными науками; 1,4% приходится на науки об обществе.

В гораздо более широких масштабах ведется подготовка кадров по программам, содержащим модуль по ИИ, отмечают аналитики. Количество таких выпускников в 2023 году составило 64,6 тыс. человек.

👉🏻 Изучить исследование
«ЕвроХим» протестировал использование робособаки в шахте

Испытания проходили на Усольском калийном комбинате в Пермском крае. В ходе тестов оценивались сразу два роботизированных решения — робособака (Deep Robotics X20) и программно-аппаратный комплекс на гусеничной платформе. В компании отмечают, что робособака справилась с задачами лучше. Устройствам необходимо было обследовать горные выработки, мониторить состояние рудника, искать неисправности оборудования.

Робособака, которая участвовала в испытаниях, оснащена системой 3D-навигации, способна преодолевать препятствия, двигаться автономно по заранее построенному маршруту, а также управляться оператором с помощью пульта. На устройство были установлены световые радары, лазерные сканеры, датчики температуры, влажности и тепла, а также газоанализаторы, которые оценивали содержание в воздухе метана и водорода.

Ранее «ЕвроХим» представил концепцию «рудника будущего». Она предполагает активное использование роботов в местах, опасных для человека. Кроме того, концепция подразумевает применение цифровых инструментов, таких как ИИ, IoT-датчики, аудио- и видеоаналитика, для эффективного управления производством.

🔗 Источник 1: https://yangx.top/eurochemofficial/1511
🔗 Источник 2: https://trends.rbc.ru/trends/industry/cmrm/667ab80f9a79477e68825d6c
Зарубежные ученые представили бенчмарк для оценки обучающих датасетов языковых моделей

Специалисты Вашингтонского, Колумбийского, Стэнфордского и ряда других университетов, а также технологических компаний разработали бенчмарк DataComp-LM (DCLM), оценивающий обучающие датасеты для языковых моделей.

DCLM предоставляет стандартизированный набор текстовых данных объемом 240 трлн токенов из репозитория Common Crawl, а также методики предобучения и задачи для оценки качества данных. Тест поддерживает работу с моделями размером от 412 млн до 7 млрд параметров и должен позволить разработчикам проверять эффективность стратегий работы с данными (дедупликация, фильтрация и смешивание). Как выяснили авторы работы, фильтрация при помощи LLM является ключевой для формирования качественного обучающего набора данных.

Отмечается также, что созданный исследователями датасет DCLM-Baseline позволяет обучить языковую модель с 7 млрд параметров так, что она сможет набрать 64 балла в бенчмарке MMLU. По своей эффективности такая нейросеть превосходит существующие открытые алгоритмы, потребляя при этом в несколько раз меньше вычислительных ресурсов.

🔗 Источник: https://ai.sber.ru/post/predstavlen-benchmark-dlya-ocenki-obuchaushchih-datasetov-yazykovyh-modelej

***
📃Статья на arxiv.org