MTS AI представила ИИ-сервис Kodify для генерации кода
Сервис создан на базе собственной большой языковой модели Cotype, пояснили в МТС. Он может генерировать код с нуля по текстовому описанию на естественном языке или предложить продолжение кода на основании того, что содержится до и после выбранного фрагмента. Kodify поддерживает языки Python и Java. Также он может перевести код с одного языка на другой, например для оптимизации устаревшего софта или интеграции с другим проектом.
В компании отмечают, что в будущем ассистент сможет помочь в анализе и оптимизации кода: проверить его на наличие ошибок и уязвимостей, провести автоматические тесты, предложить варианты рефакторинга, а также составить документацию по выделенному фрагменту.
🔗 Источник 1: https://www.forbes.ru/tekhnologii/514918-kod-v-pomos-v-mts-sozdali-ii-assistenta-dla-programmistov
🔗 Источник 2: https://mts.ai/ru/product/generative-ai-solutions/
***
📎 Подробнее можно прочитать в статье на «Хабре»
Сервис создан на базе собственной большой языковой модели Cotype, пояснили в МТС. Он может генерировать код с нуля по текстовому описанию на естественном языке или предложить продолжение кода на основании того, что содержится до и после выбранного фрагмента. Kodify поддерживает языки Python и Java. Также он может перевести код с одного языка на другой, например для оптимизации устаревшего софта или интеграции с другим проектом.
В компании отмечают, что в будущем ассистент сможет помочь в анализе и оптимизации кода: проверить его на наличие ошибок и уязвимостей, провести автоматические тесты, предложить варианты рефакторинга, а также составить документацию по выделенному фрагменту.
🔗 Источник 1: https://www.forbes.ru/tekhnologii/514918-kod-v-pomos-v-mts-sozdali-ii-assistenta-dla-programmistov
🔗 Источник 2: https://mts.ai/ru/product/generative-ai-solutions/
***
📎 Подробнее можно прочитать в статье на «Хабре»
В Smart Engines разработали тип нейросетей со сниженным потреблением энергии
Специалисты Smart Engines представили и запатентовали в США модель нейросетей, называемых биполярными морфологическими сетями (Bipolar Morphological Networks, БМ-сети). По информации компании, они отличаются от классических моделей тем, что они исключают умножение из вычислений нейрона, используя вместо этого сложение и взятие максимума. Этот подход делает нейроны вычислительно более эффективными, а их поведение напоминает функционирование биполярных нейронов в биологии, которые отвечают за возбуждение и торможение.
Разработка направлена на создание автономных нейросетей, работающих на персональных устройствах типа компьютеров и умных часов. Эти сети также позволяют создать ускоритель для нейросетевых моделей, что может привести к улучшению аппаратных характеристик на 30–40% без ущерба для производительности.
🔗 Источник: https://smartengines.ru/news/rossijskie-uchenye-sozdali-usovershenstvovannyj-analog-nejrosetevogo-uskoritelya-google/
***
📃 Изучить патент
Специалисты Smart Engines представили и запатентовали в США модель нейросетей, называемых биполярными морфологическими сетями (Bipolar Morphological Networks, БМ-сети). По информации компании, они отличаются от классических моделей тем, что они исключают умножение из вычислений нейрона, используя вместо этого сложение и взятие максимума. Этот подход делает нейроны вычислительно более эффективными, а их поведение напоминает функционирование биполярных нейронов в биологии, которые отвечают за возбуждение и торможение.
Разработка направлена на создание автономных нейросетей, работающих на персональных устройствах типа компьютеров и умных часов. Эти сети также позволяют создать ускоритель для нейросетевых моделей, что может привести к улучшению аппаратных характеристик на 30–40% без ущерба для производительности.
🔗 Источник: https://smartengines.ru/news/rossijskie-uchenye-sozdali-usovershenstvovannyj-analog-nejrosetevogo-uskoritelya-google/
***
📃 Изучить патент
РЖД вместе с Центром экономики инфраструктуры создают программный комплекс с ИИ «Прогнозирование пассажиропотоков»
Система позволяет анализировать влияние социально-экономических параметров территории и других видов пассажирского транспорта. ИИ применяется для верификации массивов исходных данных, анализа статистических «выбросов». Система построена на микросервисной архитектуре, отечественных компонентах и на ПО с открытым кодом (без использования открытых GPL-лицензий). Программный комплекс разворачивается на отечественной операционной системе «Ред ОС» и на российской СУБД PostgreSQL Pro.
Сейчас в опытную эксплуатацию введены три модуля системы: «Пассажиропоток», «Агломерация» и «ТПУ и вокзалы». Первый модуль — «Пассажиропоток» — отвечает за прогнозирование междугородних и межрегиональных пассажиропотоков. В его основе детализированная информация о параметрах всех видов транспорта, включая железнодорожный, воздушный, автобусный и личный автомобильный. Программный продукт содержит информацию о времени в пути, стоимости проезда, частоте сообщения по каждой корреспонденции.
В рамках второго модуля — «Агломерация» — производится моделирование пассажиропотоков на внутрирегиональном уровне. Среди главных функций модуля — прогнозирование пригородных пассажиропотоков, в том числе для проектов «городских электричек», а также поиск оптимальной локации для размещения транспортно-пересадочных узлов.
В модуле «ТПУ и вокзалы» производится микромоделирование поведения пассажиров в транспортно-пересадочных узлах и вокзальных комплексах.
В планах разработчиков создание еще шести модулей, в том числе решения, которое будет отвечать за прогнозирование грузопотоков и распределение их по железнодорожной сети. Отдельный модуль будет посвящен оценке социально-экономических и бюджетных эффектов.
🔗 Источник: https://rzddigital.ru/projects/tekhnologii-pomogut-organizovat-i-raspredelit-passazhiropotoki/
Система позволяет анализировать влияние социально-экономических параметров территории и других видов пассажирского транспорта. ИИ применяется для верификации массивов исходных данных, анализа статистических «выбросов». Система построена на микросервисной архитектуре, отечественных компонентах и на ПО с открытым кодом (без использования открытых GPL-лицензий). Программный комплекс разворачивается на отечественной операционной системе «Ред ОС» и на российской СУБД PostgreSQL Pro.
Сейчас в опытную эксплуатацию введены три модуля системы: «Пассажиропоток», «Агломерация» и «ТПУ и вокзалы». Первый модуль — «Пассажиропоток» — отвечает за прогнозирование междугородних и межрегиональных пассажиропотоков. В его основе детализированная информация о параметрах всех видов транспорта, включая железнодорожный, воздушный, автобусный и личный автомобильный. Программный продукт содержит информацию о времени в пути, стоимости проезда, частоте сообщения по каждой корреспонденции.
В рамках второго модуля — «Агломерация» — производится моделирование пассажиропотоков на внутрирегиональном уровне. Среди главных функций модуля — прогнозирование пригородных пассажиропотоков, в том числе для проектов «городских электричек», а также поиск оптимальной локации для размещения транспортно-пересадочных узлов.
В модуле «ТПУ и вокзалы» производится микромоделирование поведения пассажиров в транспортно-пересадочных узлах и вокзальных комплексах.
В планах разработчиков создание еще шести модулей, в том числе решения, которое будет отвечать за прогнозирование грузопотоков и распределение их по железнодорожной сети. Отдельный модуль будет посвящен оценке социально-экономических и бюджетных эффектов.
🔗 Источник: https://rzddigital.ru/projects/tekhnologii-pomogut-organizovat-i-raspredelit-passazhiropotoki/
«Ростелеком»: производство и потребление контента все более зависит от ИИ
Компания «Ростелеком» при участии Института развития интернета представила обзор главных трендов в области потребительских коммуникационных сервисов. Он основан на данных публичной аналитики, обзоре новостной повестки и регуляторных инициатив. Как отмечают авторы документа, развитие цифровой креативной индустрии, производство и потребление контента во всем мире все более зависят от ИИ, включая негативное влияние дипфейков. Одновременно генеративные нейросети сами стали потребительским сервисом, аудитория которых стремительно растет.
В частности, пользователи привыкают применять сервисы генерации текстового и визуального контента и широко используют их как в личных, так и в профессиональных целях. 2023 год можно назвать годом инвестиций в генеративный ИИ и смежные отрасли: этот сектор привлек более $50 млрд, такую оценку приводят авторы обзора.
Несмотря на то что решения для выявления сгенерированного контента разрабатываются в России и по всему миру, говорить об их масштабном применении пока преждевременно. Например, российские разработчики подобных систем не спешат разглашать информацию о точности их работы, отмечается в обзоре.
👉🏻 Изучить обзор
Компания «Ростелеком» при участии Института развития интернета представила обзор главных трендов в области потребительских коммуникационных сервисов. Он основан на данных публичной аналитики, обзоре новостной повестки и регуляторных инициатив. Как отмечают авторы документа, развитие цифровой креативной индустрии, производство и потребление контента во всем мире все более зависят от ИИ, включая негативное влияние дипфейков. Одновременно генеративные нейросети сами стали потребительским сервисом, аудитория которых стремительно растет.
В частности, пользователи привыкают применять сервисы генерации текстового и визуального контента и широко используют их как в личных, так и в профессиональных целях. 2023 год можно назвать годом инвестиций в генеративный ИИ и смежные отрасли: этот сектор привлек более $50 млрд, такую оценку приводят авторы обзора.
Несмотря на то что решения для выявления сгенерированного контента разрабатываются в России и по всему миру, говорить об их масштабном применении пока преждевременно. Например, российские разработчики подобных систем не спешат разглашать информацию о точности их работы, отмечается в обзоре.
👉🏻 Изучить обзор
Компания Anthropic выпустила ИИ-модель Claude 3.5 Sonnet
Модель превосходит Claude 3 Opus. Она, по заявлению компании, работает в два раза быстрее и показывает лучшие результаты в различных задачах, включая написание программного кода, работу с большими запросами, интерпретацию диаграмм и графиков.
Согласно результатам тестирования, проведенного Anthropic, Claude 3.5 Sonnet превзошла модели GPT-4o, Gemini 1.5 Pro и Llama 3 400B от Meta (признана экстремистской и запрещена в РФ) в 7 из 9 общих тестов производительности. В задачах распознавания изображений новая модель Anthropic также показала лучшие результаты.
🔗 Источник 1: https://3dnews.ru/1106817/anthropic-vipustil-novuyu-moshchnuyu-iimodelclaude-35-sonnet
🔗 Источник 2: https://www.anthropic.com/news/claude-3-5-sonnet
Модель превосходит Claude 3 Opus. Она, по заявлению компании, работает в два раза быстрее и показывает лучшие результаты в различных задачах, включая написание программного кода, работу с большими запросами, интерпретацию диаграмм и графиков.
Согласно результатам тестирования, проведенного Anthropic, Claude 3.5 Sonnet превзошла модели GPT-4o, Gemini 1.5 Pro и Llama 3 400B от Meta (признана экстремистской и запрещена в РФ) в 7 из 9 общих тестов производительности. В задачах распознавания изображений новая модель Anthropic также показала лучшие результаты.
🔗 Источник 1: https://3dnews.ru/1106817/anthropic-vipustil-novuyu-moshchnuyu-iimodelclaude-35-sonnet
🔗 Источник 2: https://www.anthropic.com/news/claude-3-5-sonnet
Ассоциация ФинТех перечислила ключевые тренды искусственного интеллекта
Среди трендов на ближайшие пару лет аналитики называют:
– демократизацию генеративного ИИ. Она проявляется в доступности ИИ-решений, тренд формируется благодаря распространению сервисов Low-Сode и No-Сode, свободному проникновению решений в деятельность пользователей;
– новые бизнес-модели и сервисы на основе ИИ. Используя технологию, компании могут преодолеть барьеры, провести глубокие изменения, разработать инновационные бизнес-модели и внедрить на рынок новые сервисы;
– развитие мультимодального ИИ, что расширяет способы применения больших языковых моделей;
– применение ИИ в биометрии. Технология обеспечивает высокие темпы развития биометрических сервисов;
– совершенствование мультиагентных систем. Здесь аналитики говорят о сети автономных агентов на базе ИИ, которые взаимодействуют и обладают способностью к автономному принятию решений, общению с другими агентами и координации действий для выполнения сложных задач.
Среди трендов на ближайшие пять лет — формирование рынка данных, синергия естественного и искусственного интеллекта, дефицит высококачественных данных для ИИ-моделей.
👉🏻 Изучить исследование
Среди трендов на ближайшие пару лет аналитики называют:
– демократизацию генеративного ИИ. Она проявляется в доступности ИИ-решений, тренд формируется благодаря распространению сервисов Low-Сode и No-Сode, свободному проникновению решений в деятельность пользователей;
– новые бизнес-модели и сервисы на основе ИИ. Используя технологию, компании могут преодолеть барьеры, провести глубокие изменения, разработать инновационные бизнес-модели и внедрить на рынок новые сервисы;
– развитие мультимодального ИИ, что расширяет способы применения больших языковых моделей;
– применение ИИ в биометрии. Технология обеспечивает высокие темпы развития биометрических сервисов;
– совершенствование мультиагентных систем. Здесь аналитики говорят о сети автономных агентов на базе ИИ, которые взаимодействуют и обладают способностью к автономному принятию решений, общению с другими агентами и координации действий для выполнения сложных задач.
Среди трендов на ближайшие пять лет — формирование рынка данных, синергия естественного и искусственного интеллекта, дефицит высококачественных данных для ИИ-моделей.
👉🏻 Изучить исследование
В ННГУ им. Н.И. Лобачевского смоделировали прототип сверхпроводниковой нейроморфной сети
Ученые университета предложили дизайн нейроморфного процессора на сверхпроводниках для высокоскоростной обработки больших массивов данных, в том числе широкополосных космических сигналов. По словам специалистов, преимущество «модели в том, что подобная нейросеть может работать и в классическом, и в квантовом режиме. Например, использоваться как сопроцессор для обработки квантовой информации».
Нейроморфный процессор на сверхпроводниках по энергоэффективности и быстродействию в десятки раз превосходит полупроводниковые аналоги, отмечают ученые. Благодаря меньшему числу задействованных трансформаторов разработка позволяет минимизировать потерю сигналов. Также авторы описали взаимодействие нейронов и рассчитали оптимальные параметры компонентной базы элементов для дальнейших исследований. «Предлагаемая система может быть изготовлена «в железе» в ближайшее время», — говорит автор исследования, руководитель лаборатории теории наноструктур ННГУ им. Н.И. Лобачевского Марина Бастракова.
🔗 Источник: http://www.unn.ru/site/about/news/pervyj-prototip-sverkhprovodnikovoj-nejromorfnoj-seti-smodelirovali-v-nngu
***
📃 Результаты исследования опубликованы в журнале Nanomaterials
Ученые университета предложили дизайн нейроморфного процессора на сверхпроводниках для высокоскоростной обработки больших массивов данных, в том числе широкополосных космических сигналов. По словам специалистов, преимущество «модели в том, что подобная нейросеть может работать и в классическом, и в квантовом режиме. Например, использоваться как сопроцессор для обработки квантовой информации».
Нейроморфный процессор на сверхпроводниках по энергоэффективности и быстродействию в десятки раз превосходит полупроводниковые аналоги, отмечают ученые. Благодаря меньшему числу задействованных трансформаторов разработка позволяет минимизировать потерю сигналов. Также авторы описали взаимодействие нейронов и рассчитали оптимальные параметры компонентной базы элементов для дальнейших исследований. «Предлагаемая система может быть изготовлена «в железе» в ближайшее время», — говорит автор исследования, руководитель лаборатории теории наноструктур ННГУ им. Н.И. Лобачевского Марина Бастракова.
🔗 Источник: http://www.unn.ru/site/about/news/pervyj-prototip-sverkhprovodnikovoj-nejromorfnoj-seti-smodelirovali-v-nngu
***
📃 Результаты исследования опубликованы в журнале Nanomaterials
Forwarded from Мониторинг аналитики об IT
Развитие технологий искусственного интеллекта в Москве — 2023
Департамент информационных технологий города Москвы изучил, как изменилось отношение жителей столицы к искусственному интеллекту (ИИ) с 2019 года.
Жители столичного региона, как показывают результаты, стали более осознанно относиться к технологии по сравнению с 2019 годом. Они видят больше преимуществ, чем недостатков в искусственном интеллекте и сходятся во мнении, что технология может ускорить выполнение рутинных задач или заменить человека при выполнении опасных для жизни работ. Основные опасения у них вызывает возможность использования ИИ против людей и нарушение частных границ.
• 69% респондентов заявили, что базово и хорошо знакомы с технологией (+11% п. п. к 2019 году). Число тех, кто очень хорошо знаком с ней, выросло на 4 п. п., до 14%. Также улучшилась осведомленность среди жителей в возрасте 35–46 лет и старше 65 лет. Уровень знания оказался выше среди тех, кто работает или учится.
• 33% из общей выборки применяли генеративный ИИ за последний год. Среди них самые активные — молодежь в возрасте от 18 до 35 лет (67%), 13% их них пользуются технологией ежедневно.
• 9 из 10 участников пользовались решениями с применением ИИ хотя бы раз за прошедший год.
Изучить все исследование → (11 стр.)
#искусственный_интеллект #генеративный_ИИ #нейросети
🗣 Больше аналитики в разделе «Исследования» →
Департамент информационных технологий города Москвы изучил, как изменилось отношение жителей столицы к искусственному интеллекту (ИИ) с 2019 года.
Жители столичного региона, как показывают результаты, стали более осознанно относиться к технологии по сравнению с 2019 годом. Они видят больше преимуществ, чем недостатков в искусственном интеллекте и сходятся во мнении, что технология может ускорить выполнение рутинных задач или заменить человека при выполнении опасных для жизни работ. Основные опасения у них вызывает возможность использования ИИ против людей и нарушение частных границ.
• 69% респондентов заявили, что базово и хорошо знакомы с технологией (+11% п. п. к 2019 году). Число тех, кто очень хорошо знаком с ней, выросло на 4 п. п., до 14%. Также улучшилась осведомленность среди жителей в возрасте 35–46 лет и старше 65 лет. Уровень знания оказался выше среди тех, кто работает или учится.
• 33% из общей выборки применяли генеративный ИИ за последний год. Среди них самые активные — молодежь в возрасте от 18 до 35 лет (67%), 13% их них пользуются технологией ежедневно.
• 9 из 10 участников пользовались решениями с применением ИИ хотя бы раз за прошедший год.
Изучить все исследование → (11 стр.)
#искусственный_интеллект #генеративный_ИИ #нейросети
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
В Стэнфордском университете представили открытый проект человекоподобного робота HumanPlus
На первом этапе исследователи подготовили 40 часов данных с движениями людей и обучили на них модель, использовав среду от NVIDIA. Датасета хватило для того, чтобы робот мог в реальном времени анализировать движения человека с камеры и повторять их.
По словам исследователей, особенность проекта заключается в том, что робот также запоминает движения с камеры и потом может выполнять их самостоятельно. Для этого надо повторить движение около 40 раз. С вероятностью 60–100% робот запомнит его. Самостоятельные действия робот пока выполняет медленно, но исследователи утверждают, что это проблема нехватки вычислительных ресурсов.
🔗 Источник: https://habr.com/ru/news/824202/
***
📃 Научная статья
🌐 Датасет
🧠 HumanPlus на GitHub
🤖 Дополнительная информация для сборки
На первом этапе исследователи подготовили 40 часов данных с движениями людей и обучили на них модель, использовав среду от NVIDIA. Датасета хватило для того, чтобы робот мог в реальном времени анализировать движения человека с камеры и повторять их.
По словам исследователей, особенность проекта заключается в том, что робот также запоминает движения с камеры и потом может выполнять их самостоятельно. Для этого надо повторить движение около 40 раз. С вероятностью 60–100% робот запомнит его. Самостоятельные действия робот пока выполняет медленно, но исследователи утверждают, что это проблема нехватки вычислительных ресурсов.
🔗 Источник: https://habr.com/ru/news/824202/
***
📃 Научная статья
🌐 Датасет
🧠 HumanPlus на GitHub
🤖 Дополнительная информация для сборки
НИУ ВШЭ: количество выпускников по профилю ИИ достигло 3,8 тыс. человек
Такие данные на начало октября 2023 года приводят в НИУ ВШЭ. Показатель составляет 0,7% от общего выпуска бакалавриата, специалитета и магистратуры. Аналитики прогнозируют, что в дальнейшем возможен существенный рост выпуска молодых ИИ-специалистов: через четыре года количество выпускников-бакалавров можно ожидать на уровне 8,7 тыс. человек, а магистров через два года — около 6 тыс. человек.
Бóльшая часть (70,1%) студентов программ по профилю ИИ обучаются по специальностям и направлениям подготовки «инженерное дело, технологии и технические науки»; примерно четверть (27,3%) — по направлениям, связанным с математическими и естественными науками; 1,4% приходится на науки об обществе.
В гораздо более широких масштабах ведется подготовка кадров по программам, содержащим модуль по ИИ, отмечают аналитики. Количество таких выпускников в 2023 году составило 64,6 тыс. человек.
👉🏻 Изучить исследование
Такие данные на начало октября 2023 года приводят в НИУ ВШЭ. Показатель составляет 0,7% от общего выпуска бакалавриата, специалитета и магистратуры. Аналитики прогнозируют, что в дальнейшем возможен существенный рост выпуска молодых ИИ-специалистов: через четыре года количество выпускников-бакалавров можно ожидать на уровне 8,7 тыс. человек, а магистров через два года — около 6 тыс. человек.
Бóльшая часть (70,1%) студентов программ по профилю ИИ обучаются по специальностям и направлениям подготовки «инженерное дело, технологии и технические науки»; примерно четверть (27,3%) — по направлениям, связанным с математическими и естественными науками; 1,4% приходится на науки об обществе.
В гораздо более широких масштабах ведется подготовка кадров по программам, содержащим модуль по ИИ, отмечают аналитики. Количество таких выпускников в 2023 году составило 64,6 тыс. человек.
👉🏻 Изучить исследование
«ЕвроХим» протестировал использование робособаки в шахте
Испытания проходили на Усольском калийном комбинате в Пермском крае. В ходе тестов оценивались сразу два роботизированных решения — робособака (Deep Robotics X20) и программно-аппаратный комплекс на гусеничной платформе. В компании отмечают, что робособака справилась с задачами лучше. Устройствам необходимо было обследовать горные выработки, мониторить состояние рудника, искать неисправности оборудования.
Робособака, которая участвовала в испытаниях, оснащена системой 3D-навигации, способна преодолевать препятствия, двигаться автономно по заранее построенному маршруту, а также управляться оператором с помощью пульта. На устройство были установлены световые радары, лазерные сканеры, датчики температуры, влажности и тепла, а также газоанализаторы, которые оценивали содержание в воздухе метана и водорода.
Ранее «ЕвроХим» представил концепцию «рудника будущего». Она предполагает активное использование роботов в местах, опасных для человека. Кроме того, концепция подразумевает применение цифровых инструментов, таких как ИИ, IoT-датчики, аудио- и видеоаналитика, для эффективного управления производством.
🔗 Источник 1: https://yangx.top/eurochemofficial/1511
🔗 Источник 2: https://trends.rbc.ru/trends/industry/cmrm/667ab80f9a79477e68825d6c
Испытания проходили на Усольском калийном комбинате в Пермском крае. В ходе тестов оценивались сразу два роботизированных решения — робособака (Deep Robotics X20) и программно-аппаратный комплекс на гусеничной платформе. В компании отмечают, что робособака справилась с задачами лучше. Устройствам необходимо было обследовать горные выработки, мониторить состояние рудника, искать неисправности оборудования.
Робособака, которая участвовала в испытаниях, оснащена системой 3D-навигации, способна преодолевать препятствия, двигаться автономно по заранее построенному маршруту, а также управляться оператором с помощью пульта. На устройство были установлены световые радары, лазерные сканеры, датчики температуры, влажности и тепла, а также газоанализаторы, которые оценивали содержание в воздухе метана и водорода.
Ранее «ЕвроХим» представил концепцию «рудника будущего». Она предполагает активное использование роботов в местах, опасных для человека. Кроме того, концепция подразумевает применение цифровых инструментов, таких как ИИ, IoT-датчики, аудио- и видеоаналитика, для эффективного управления производством.
🔗 Источник 1: https://yangx.top/eurochemofficial/1511
🔗 Источник 2: https://trends.rbc.ru/trends/industry/cmrm/667ab80f9a79477e68825d6c
Зарубежные ученые представили бенчмарк для оценки обучающих датасетов языковых моделей
Специалисты Вашингтонского, Колумбийского, Стэнфордского и ряда других университетов, а также технологических компаний разработали бенчмарк DataComp-LM (DCLM), оценивающий обучающие датасеты для языковых моделей.
DCLM предоставляет стандартизированный набор текстовых данных объемом 240 трлн токенов из репозитория Common Crawl, а также методики предобучения и задачи для оценки качества данных. Тест поддерживает работу с моделями размером от 412 млн до 7 млрд параметров и должен позволить разработчикам проверять эффективность стратегий работы с данными (дедупликация, фильтрация и смешивание). Как выяснили авторы работы, фильтрация при помощи LLM является ключевой для формирования качественного обучающего набора данных.
Отмечается также, что созданный исследователями датасет DCLM-Baseline позволяет обучить языковую модель с 7 млрд параметров так, что она сможет набрать 64 балла в бенчмарке MMLU. По своей эффективности такая нейросеть превосходит существующие открытые алгоритмы, потребляя при этом в несколько раз меньше вычислительных ресурсов.
🔗 Источник: https://ai.sber.ru/post/predstavlen-benchmark-dlya-ocenki-obuchaushchih-datasetov-yazykovyh-modelej
***
📃Статья на arxiv.org
Специалисты Вашингтонского, Колумбийского, Стэнфордского и ряда других университетов, а также технологических компаний разработали бенчмарк DataComp-LM (DCLM), оценивающий обучающие датасеты для языковых моделей.
DCLM предоставляет стандартизированный набор текстовых данных объемом 240 трлн токенов из репозитория Common Crawl, а также методики предобучения и задачи для оценки качества данных. Тест поддерживает работу с моделями размером от 412 млн до 7 млрд параметров и должен позволить разработчикам проверять эффективность стратегий работы с данными (дедупликация, фильтрация и смешивание). Как выяснили авторы работы, фильтрация при помощи LLM является ключевой для формирования качественного обучающего набора данных.
Отмечается также, что созданный исследователями датасет DCLM-Baseline позволяет обучить языковую модель с 7 млрд параметров так, что она сможет набрать 64 балла в бенчмарке MMLU. По своей эффективности такая нейросеть превосходит существующие открытые алгоритмы, потребляя при этом в несколько раз меньше вычислительных ресурсов.
🔗 Источник: https://ai.sber.ru/post/predstavlen-benchmark-dlya-ocenki-obuchaushchih-datasetov-yazykovyh-modelej
***
📃Статья на arxiv.org
«Яндекс» подвел итоги первого года работы YandexGPT
Компания представила свою большую языковую модель 🏷YandexGPT весной 2023 года. За это время:
– она интегрирована в 17 сервисов «Яндекса», таких как «Поиск», «Браузер», «Алиса», «Шедеврум», Yandex Cloud, «Авто. ру»;
– нейросетевыми функциями «Яндекс Браузера» воспользовались 55 млн раз;
– более 10 тыс. компаний тестируют YandexGPT API, из них 69% — это малый бизнес, а 31% — крупные и средние компании;
– 1,5 тыс. организаций используют YandexGPT API ежедневно;
– 🏷«Шедеврум» вошло в топ-3 приложений на основе генеративного ИИ, по версии Data. ai.
🔗 Источник 1: https://yangx.top/yandex/2117
🔗 Источник 2: https://ir-docs.s3.yandex.net/sustainability/YA%20RU%20[23]%20Report.pdf
Компания представила свою большую языковую модель 🏷YandexGPT весной 2023 года. За это время:
– она интегрирована в 17 сервисов «Яндекса», таких как «Поиск», «Браузер», «Алиса», «Шедеврум», Yandex Cloud, «Авто. ру»;
– нейросетевыми функциями «Яндекс Браузера» воспользовались 55 млн раз;
– более 10 тыс. компаний тестируют YandexGPT API, из них 69% — это малый бизнес, а 31% — крупные и средние компании;
– 1,5 тыс. организаций используют YandexGPT API ежедневно;
– 🏷«Шедеврум» вошло в топ-3 приложений на основе генеративного ИИ, по версии Data. ai.
🔗 Источник 1: https://yangx.top/yandex/2117
🔗 Источник 2: https://ir-docs.s3.yandex.net/sustainability/YA%20RU%20[23]%20Report.pdf
This media is not supported in your browser
VIEW IN TELEGRAM
«Сбер» объявил о начале разработки GigaPevt
Компания называет его мультимодальным медицинским диагностическим ассистентом на базе 🏷GigaChat. В основе разработки — применение бесконтактных методов измерения медицинских параметров и диалоговых возможностей больших языковых моделей.
Речь идет о том, что технология дистанционной фотоплетизмографии (метод скрининговой диагностики состояния сосудов) позволит по видео лица оценить ключевые социодемографические показатели и некоторые медицинские параметры, например значение индекса массы тела. Второй компонент ассистента, основанный на GigaChat, позволит выстроить и реализовать сценарий медицинской консультации.
Разработкой занимаются специалисты Лаборатории искусственного интеллекта и Центра индустрии здоровья. В августе 2024 года демоверсия разработки будет представлена на конференции по искусственному интеллекту IJCAI (A*) в Южной Корее.
🔗 Источник: https://www.sberbank.com/ru/news-and-media/press-releases/article?newsID=8969b365-9a13-498e-8c7d-18f6bd44d245&blockID=7®ionID=77&lang=ru&type=NEWS
***
📃 Статья на arxiv.org
Компания называет его мультимодальным медицинским диагностическим ассистентом на базе 🏷GigaChat. В основе разработки — применение бесконтактных методов измерения медицинских параметров и диалоговых возможностей больших языковых моделей.
Речь идет о том, что технология дистанционной фотоплетизмографии (метод скрининговой диагностики состояния сосудов) позволит по видео лица оценить ключевые социодемографические показатели и некоторые медицинские параметры, например значение индекса массы тела. Второй компонент ассистента, основанный на GigaChat, позволит выстроить и реализовать сценарий медицинской консультации.
Разработкой занимаются специалисты Лаборатории искусственного интеллекта и Центра индустрии здоровья. В августе 2024 года демоверсия разработки будет представлена на конференции по искусственному интеллекту IJCAI (A*) в Южной Корее.
🔗 Источник: https://www.sberbank.com/ru/news-and-media/press-releases/article?newsID=8969b365-9a13-498e-8c7d-18f6bd44d245&blockID=7®ionID=77&lang=ru&type=NEWS
***
📃 Статья на arxiv.org
В НИУ ВШЭ утвердили этические принципы использования ИИ
Соответствующая декларация была утверждена ученым советом. Среди девяти принципов:
– информированное использование, что подразумевает обучение сотрудников и студентов вуза принципам работы ИИ;
– академическая честность. Использование ИИ как дополнения, а не в качестве замены естественного интеллекта, самостоятельность в выполнении работ. Это включает в себя проверку результатов ИИ на достоверность и соответствие этическим нормам;
– конфиденциальность и защита интеллектуальных прав. Этот принцип предполагает обеспечение ИИ защиты персональных данных и интеллектуальной собственности. «Недопустимо вводить конфиденциальную информацию в ИИ-системы без соответствующего разрешения», — говорится в сообщении университета;
– прозрачность. Под этим принципом предполагается, что сотрудники и студенты обязаны указывать, где и как использовался ИИ, особенно в научных и образовательных проектах. Это также касается программ, имитирующих человеческое общение;
– разумные ограничения, что подразумевает важность осознания рисков и последствий использования ИИ. «Университет оставляет за собой право вводить ограничения на разработку и использование ИИ, если это необходимо для защиты интересов университета и его сообщества», — поясняют в вузе.
🔗 Источник: https://www.hse.ru/news/expertise/937054242.html
Соответствующая декларация была утверждена ученым советом. Среди девяти принципов:
– информированное использование, что подразумевает обучение сотрудников и студентов вуза принципам работы ИИ;
– академическая честность. Использование ИИ как дополнения, а не в качестве замены естественного интеллекта, самостоятельность в выполнении работ. Это включает в себя проверку результатов ИИ на достоверность и соответствие этическим нормам;
– конфиденциальность и защита интеллектуальных прав. Этот принцип предполагает обеспечение ИИ защиты персональных данных и интеллектуальной собственности. «Недопустимо вводить конфиденциальную информацию в ИИ-системы без соответствующего разрешения», — говорится в сообщении университета;
– прозрачность. Под этим принципом предполагается, что сотрудники и студенты обязаны указывать, где и как использовался ИИ, особенно в научных и образовательных проектах. Это также касается программ, имитирующих человеческое общение;
– разумные ограничения, что подразумевает важность осознания рисков и последствий использования ИИ. «Университет оставляет за собой право вводить ограничения на разработку и использование ИИ, если это необходимо для защиты интересов университета и его сообщества», — поясняют в вузе.
🔗 Источник: https://www.hse.ru/news/expertise/937054242.html
⚙️Изучить на досуге: свежая аналитика об искусственном интеллекте
🖍От российских авторов
• Регулирование генеративного ИИ: правовой анализ и риски для РФ («Яков и Партнёры»): авторы определили наиболее благоприятные страны для развития искусственного интеллекта. Среди них США, Израиль, Сингапур, ОАЭ и Россия.
• Роль государства в развитии здравоохранения с применением искусственного интеллекта (Kept): как выяснили аналитики, США, Китай и Россия переходят к комбинированному подходу в регулировании ИИ, совмещая относительную свободу для инноваций с ограничительными мерами для контроля развития и использования ИИ на государственном уровне.
• Развитие технологий искусственного интеллекта в Москве — 2023 (ДИТ Москвы): в документе говорится о том, что жители города стали более осознанно относиться к технологии по сравнению с 2019 годом. Теперь они видят больше преимуществ, чем недостатков в ИИ и сходятся во мнении, что технология может ускорить выполнение рутинных задач.
• Подготовка высококвалифицированных кадров в области искусственного интеллекта (НИУ ВШЭ): по оценкам аналитиков, по состоянию на начало октября 2023 года численность выпускников по профилю ИИ составила 3,8 тыс. человек — всего 0,7% от общего выпуска бакалавриата, специалитета и магистратуры.
🌏 Глобальные данные
• CEO Study — 2024 (IBM Institute for Business Value): аналитики опросили свыше 2,5 тыс. руководителей организаций и выяснили, что 61% из них считают высокие темпы внедрения генеративного ИИ некомфортными для ряда сотрудников.
• Злоупотребления генеративным ИИ (Google): к списку наиболее распространенных тактик злонамеренного использования ИИ эксперты относят манипуляции с человеческим сходством и фальсификацию доказательств. В большинстве случаев не применяются технологически сложные системы или атаки с генеративным ИИ, говорится в документе.
• Magic Quadrant for Data Science and Machine Learning Platforms (Gartner): эксперты собрали карту в формате «Магического квадранта» платформ аналитики данных и машинного обучения. Он разделен на четыре категории: лидеры (Leaders), соперники (Challengers), визионеры (Visionaries) и нишевые игроки (Niche Players).
***
→ Отслеживать свежую аналитику по ИИ можно в канале @ict_moscow_analytics по тегу #искусственный_интеллект
🖍От российских авторов
• Регулирование генеративного ИИ: правовой анализ и риски для РФ («Яков и Партнёры»): авторы определили наиболее благоприятные страны для развития искусственного интеллекта. Среди них США, Израиль, Сингапур, ОАЭ и Россия.
• Роль государства в развитии здравоохранения с применением искусственного интеллекта (Kept): как выяснили аналитики, США, Китай и Россия переходят к комбинированному подходу в регулировании ИИ, совмещая относительную свободу для инноваций с ограничительными мерами для контроля развития и использования ИИ на государственном уровне.
• Развитие технологий искусственного интеллекта в Москве — 2023 (ДИТ Москвы): в документе говорится о том, что жители города стали более осознанно относиться к технологии по сравнению с 2019 годом. Теперь они видят больше преимуществ, чем недостатков в ИИ и сходятся во мнении, что технология может ускорить выполнение рутинных задач.
• Подготовка высококвалифицированных кадров в области искусственного интеллекта (НИУ ВШЭ): по оценкам аналитиков, по состоянию на начало октября 2023 года численность выпускников по профилю ИИ составила 3,8 тыс. человек — всего 0,7% от общего выпуска бакалавриата, специалитета и магистратуры.
🌏 Глобальные данные
• CEO Study — 2024 (IBM Institute for Business Value): аналитики опросили свыше 2,5 тыс. руководителей организаций и выяснили, что 61% из них считают высокие темпы внедрения генеративного ИИ некомфортными для ряда сотрудников.
• Злоупотребления генеративным ИИ (Google): к списку наиболее распространенных тактик злонамеренного использования ИИ эксперты относят манипуляции с человеческим сходством и фальсификацию доказательств. В большинстве случаев не применяются технологически сложные системы или атаки с генеративным ИИ, говорится в документе.
• Magic Quadrant for Data Science and Machine Learning Platforms (Gartner): эксперты собрали карту в формате «Магического квадранта» платформ аналитики данных и машинного обучения. Он разделен на четыре категории: лидеры (Leaders), соперники (Challengers), визионеры (Visionaries) и нишевые игроки (Niche Players).
***
→ Отслеживать свежую аналитику по ИИ можно в канале @ict_moscow_analytics по тегу #искусственный_интеллект