генеративный ии
2.2K subscribers
969 photos
148 videos
24 files
502 links
привет, я Алексей Сидорюк, а это мой канал, посвященный новостям и ярким событиями генеративного ИИ. Делюсь опытом использования решений на базе ИИ, сценариями применения, которые экономят время, полезными инсайтами.

Для связи: @asidoryuk
Сайт: gen-ii.ru
加入频道
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSeek-R1: Как создали ИИ для сложных задач

Новая модель от DeepSeek бьет рекорды в решении логических и математических задач. Вот главное, что нужно знать:

Что особенного?
🌟 Генерирует "токены размышлений" — объясняет ход мыслей, как человек.
🌟 Автоматическая проверка решений через выполнение кода и тесты (никакого ручного труда!).
🌟 Обучение в 3 этапа: базовая модель → тонкая настройка на 600К примеров → RL для улучшения.

Фишки обучения:
🌟 R1-Zero — модель-«первопроходец», учится без готовых ответов, только через RL.
🌟 Промежуточная модель создает данные для обучения, решая проблему нехватки размеченных примеров.
🌟 MoE-архитектура (61 слой) — часть блоков «эксперты» для разных типов задач.

Почему это прорыв?
🌟 Открытые веса — можно использовать в своих проектах.
🌟 Превосходит аналоги в математике.
🌟 Цель — повторить успехи OpenAI, но с прозрачными методами.

Подробнее:
newsletter

@gen_i_i

#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
Почему ошибки ИИ опаснее наших?
Брюс Шнайер и Натан Сандерс — о том, почему старые методы защиты не работают с ИИ

🔺 Человеческие ошибки:
— Предсказуемы: возникают на границе знаний (например, сложная математика).
— Сгруппированы: одна ошибка часто тянет за собой другие.
— Зависят от усталости, стресса, незнания.

🔺 Ошибки ИИ:
— Случайны: нейросеть может ошибиться в простом вопросе и решить сложную задачу.
— Уверенны в своей правоте: ИИ не скажет «не знаю», даже если несёт чушь (например, совет добавить клей на пиццу 🍕).
— Непредсказуемы: ошибки распределены равномерно, а не «скопом».

⚠️ Проблема:
Существующие системы безопасности (двойные проверки, аудиты) не справляются с «странностью» ИИ. Нужны новые подходы!

Что делать?
1⃣ Делать ошибки ИИ более человечными
— Использовать обучение с обратной связью (как в ChatGPT).
— Штрафовать за нелогичные ответы.

2⃣ Создавать новые методы контроля
— Задавать ИИ один вопрос по-разному и сравнивать ответы.
— Ограничивать сферы, где ИИ принимает решения (риски слишком велики).

🔍 Интересное:
— ИИ иногда ведёт себя по-человечески:
Чувствителен к формулировкам (как люди в опросах).
«Забывает» информацию из середины длинных текстов.
— Но некоторые «взломы» ИИ невозможны для людей: ASCII-арт может обмануть нейросеть, но не человека.

Главное:
ИИ-ошибки — не просто баги, а фундаментальная особенность технологии. Без новых систем безопасности их внедрение рискованно.

Подробнее:
Spectrum

@gen_i_i

#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
ИИ создал новый флуоресцентный белок, который не встречается в природе

🧬 Ученые смоделировали 500 млн лет эволюции с помощью нейросети ESM3 и создали уникальный белок — esmGFP. Он светится, как белки медуз и кораллов, но на 58% отличается от ближайшего природного аналога.

В природе на его появление потребовалось бы 96 мутаций и миллионы лет, а ИИ справился за считаные секунды. Пока белок существует только в виде цифрового кода, но его потенциал огромен: от разработки лекарств до новых методов белковой инженерии.

Подробнее:
farmprom

@gen_i_i

#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
Международный отчет по безопасности ИИ 2025

Этот отчет – результат совместной работы ведущих мировых экспертов в области ИИ, и он освещает наиболее актуальные проблемы и перспективы развития этой технологии.

Ключевые выводы, на которые стоит обратить внимание:

🌟 Масштабирование ИИ требует больше ресурсов: Ожидается, что вычислительные мощности, необходимые для обучения ИИ, вырастут в тысячи и миллионы раз к 2030 году по сравнению с GPT-4. Это ставит под вопрос доступность данных, необходимых для обучения, а также может привести к дефициту чипов и увеличению задержек.
🌟 Данные – это новая нефть, но с нюансами: Проблема нехватки качественных данных для обучения ИИ становится все более острой. Авторы отчета указывают на проблемы с авторскими правами на данные, а также на необходимость новых стандартов для сбора и использования данных для обучения ИИ моделей.
🌟 Мультимодальность – ключ к новым возможностям: Обучение ИИ на разнообразных типах данных (текст, изображения, звук и т.д.) может значительно увеличить объем доступных данных и наделить модели новыми способностями.
🌟 Синтетические данные – палка о двух концах: Использование синтетических данных для обучения может помочь решить проблему нехватки данных, но существуют риски ухудшения производительности моделей, если не применять правильные методы обучения.
🌟 Авторские права и "память" ИИ: Большие модели могут запоминать данные, на которых они обучались, и воспроизводить их при запросе, что может приводить к нарушению авторских прав. Исследователи работают над методами "забывания" и удаления такой информации, но это пока что является сложной задачей.
🌟 Риски безопасности: Отчет подчеркивает, что ИИ может быть использован для создания дипфейков, что может нанести ущерб репутации и вызвать недоверие. Кроме того, существуют риски использования ИИ для кибератак и биологических угроз.
🌟 Прозрачность и подотчетность: Авторы отчета призывают к большей прозрачности в разработке и применении ИИ, а также к созданию систем оценки и аудита, которые помогут выявлять и устранять риски.

В целом, отчет подчеркивает важность ответственного подхода к развитию ИИ, а также необходимость международного сотрудничества для обеспечения его безопасности и пользы для всего человечества.

Этот отчет – важный шаг на пути к безопасному и этичному будущему ИИ, и мы надеемся, что его выводы помогут нам всем двигаться в правильном направлении.

🔗 Подробнее:
assets

@gen_i_i

#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
Генеративный ИИ: мифы, реальность и киберриски

Новый выпуск подкаста «Безопасный выход» — всё, что нужно знать о генеративном ИИ и его влиянии на нашу жизнь!

🔍 Разбираем:
🌟 Как ИИ меняет кибербезопасность и какие угрозы несёт
🌟 Реальные возможности и заблуждения вокруг технологии
🌟 Лидеры в гонке ИИ: США, Китай, Европа и уникальный путь России
🌟 Перспективы «общения» с животными через ИИ
🌟 Как злоумышленники используют ИИ и как защититься

🗣 Эксперты выпуска:
🌟 Алексей Сидорюк — советник ассоциации ФинТех по искусственному интеллекту.
🌟 Максим Бузинов — руководитель R&D-лаборатории Центра технологий кибербезопасности ГК «Солар».

🔗 Слушайте подкаст «Безопасный выход» на удобной для вас платформе:
📺 YouTube:
📺 VK Видео:
📺 Rutube:
🎼 Podster:

@gen_i_i

#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
Новые возможности от OpenAI: модели становятся мощнее и доступнее!

💡 Deep research: новая функция ChatGPT для сложных многозадачных исследований.
⭐️ Помогает искать, анализировать и синтезировать информацию из интернета.
⭐️ Для Pro пользователей, в будущем — для Plus и Team.
⭐️ Применяется в науке, финансах, политике и даже для покупок.
⭐️ Готовит отчёты, цитаты и визуализации.
⭐️ Превосходит GPT-4o в глубоком анализе данных.

🧠 OpenAI o3-mini: новая экономичная модель для STEM-задач.
⭐️ Доступна как для платных, так и для бесплатных пользователей.
⭐️ Отличается улучшенными способностями к рассуждению и низкой стоимостью.
⭐️ Превосходит o1-mini по точности и знаниям.

📈 Примеры использования Deep research:
⭐️ Анализ рынка и товаров.
⭐️ Научные исследования, включая клеточное перепрограммирование и полимерные свойства.
⭐️ Рекомендации по интерфейсам и приложениям.

⚠️ Ограничения:
⭐️ Могут возникать галлюцинации и проблемы с достоверностью данных.
⭐️ Высокая вычислительная нагрузка ограничивает количество запросов для Pro пользователей.

🔗 Подробнее:
deep research
o3-mini

@gen_i_i

#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
Конституционные Классификаторы

Исследователи из Anthropic разработали новый метод защиты больших языковых моделей (LLM) от «джейлбрейков» – техник, позволяющих обходить встроенные механизмы безопасности. Эти атаки могут быть использованы для получения доступа к опасной информации, например, о химическом, биологическом или ядерном оружии.

🛡 Конституционные Классификаторы:

⭐️ Используют классификаторы, которые анализируют входные данные и выходные ответы модели, блокируя потенциально опасный контент.
⭐️ Обучены на синтетических данных, сгенерированных с помощью набора правил на естественном языке – «конституции», которая определяет допустимый и запрещенный контент.
⭐️ Это позволяет быстро адаптироваться к новым угрозам путем обновления конституции.
⭐️ Используют потоковую классификацию выходных данных, что позволяет остановить генерацию при обнаружении вредоносного контента.

🔬 Тестирование и результаты:

⭐️ В ходе более чем 3000 часов тестирования не было обнаружено ни одного универсального «джейлбрейка», способного извлечь подробную информацию, сравнимую с незащищенной моделью, в области химического, биологического, радиологического или ядерного оружия.
⭐️ Улучшенные классификаторы показали высокую устойчивость к новым попыткам «джейлбрейка» в автоматизированных тестах, блокируя более 95% таких попыток, по сравнению с 14% без классификаторов.
⭐️ Использование классификаторов увеличивает частоту отказов на 0,38% в реальном трафике и добавляет 23,7% к задержке.
⭐️ Система использует двойную классификацию – на входе и выходе, что повышает ее эффективность.

Преимущества подхода:

⭐️ Гибкость: Возможность быстрого обновления правил для противодействия новым угрозам.
⭐️ Практичность: Подходит для реального применения с минимальными накладными расходами.
⭐️ Надежность: Обеспечивает многоуровневую защиту от универсальных атак.

Дополнительно:

⭐️ Для обучения используются как безопасные, так и опасные примеры, а также методы аугментации для улучшения разнообразия данных.
⭐️ Применяется автоматизированное тестирование, включая имитацию атак, для выявления слабых мест системы.
⭐️ Классификаторы обучаются на основе моделей Claude 3.5, демонстрируя высокую эффективность.

🔒 Вывод:

Конституционные Классификаторы представляют собой эффективный и практичный способ защиты LLM от универсальных «джейлбрейков», позволяя безопасно использовать мощные языковые модели с расширенными научными возможностями.

🔗 Подробнее:
arxiv

@gen_i_i

#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Кто рулит ИТ в регионах?

Запущена платформа «Управление цифровой трансформацией в субъектах РФ» – теперь всё о цифровой экономике и ИКТ-отрасли в регионах в одном месте!

📌 Что внутри?
Руководители цифровой трансформации в субъектах РФ
Ответственные за внедрение ИТ и ИИ в регионах
Отраслевые лидеры цифровизации и подведомственные учреждения

📌 Зачем?
На платформе собираются лучшие практики цифровой трансформации, включая ИИ-решения и управление данными.

Что дальше?
Разработка онлайн-платформы для обмена опытом между регионами, включая практики финалистов «ПРОФ-IT» и «Лидеры ИИ».

Подробнее:
d-economy

@gen_i_i

#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
Главные тренды финтеха 2025: что ждет российский рынок?

Ассоциация ФинТех представила исследование о ключевых трендах в технологиях, бизнесе и финтехе на 2025 год. Давайте рассмотрим основные направления, которые будут определять развитие рынка:

Инновации на платежном рынке:
🌟 Универсальный QR-код: Внедрение технологии, которая упростит оплату различными инструментами, включая цифровой рубль.
🌟 QR-код от клиента: Рассматривается возможность оплаты через QR-код, предъявляемый клиентом для инициации платежа.
🌟 Биометрия: Особое внимание уделят сбору биометрических данных в Единой биометрической системе (ЕБС).
🌟 Биоэквайринг: Внедрение сервиса, позволяющего оплачивать товары и услуги через карты и Систему быстрых платежей (СБП).

Цифровая валюта центрального банка:
🌟 Поэтапное внедрение цифрового рубля: Продолжение тестирования и подключения банков второй волны.
🌟 Расширение функционала: Реализация платежей по инициативе торговых точек, платежей юридических лиц в пользу физических, развитие смарт-контрактов и использование цифровых рублей в операциях с бюджетными средствами.
🌟 Массовое внедрение: Запланирован переход от пилота к массовому внедрению цифрового рубля с 1 июля 2025 года.

Развитие цифровых финансовых активов (ЦФА) и цифровых прав:
🌟 Рост популярности: Увеличение объема выпусков ЦФА, числа пользователей и обладателей ЦФА.
🌟 Использование МСБ: ЦФА становятся инструментом для привлечения средств не только для крупных компаний, но и для малого и среднего бизнеса.
🌟 Упрощение и развитие: Работа над упрощенной идентификацией клиентов, развитие продуктов и сервисов на основе ЦФА, инфраструктуры для обращения цифровых прав и гармонизацией подходов.

Национальная цифровая инфраструктура и цифровой профиль:
🌟 Интеграция с госсистемами: Использование механизмов удаленной идентификации (ЕБС, ЕСЦ), сервиса «Госключ», платформ СПФС, «Мир» и СБП.
🌟 Цифровой профиль: Обмен данными на основе инфраструктуры цифрового профиля.
🌟 Удобство и безопасность: Особое внимание к удобству и безопасности предоставления сервисов, систематизации и автоматизации государственных данных.
🌟 Расширение возможностей: Подключение новых участников и расширение перечня сведений через Цифровой профиль, а также развитие направления для страховой медицины.

Искусственный интеллект и его регулирование:
🌟 Развитие генеративного ИИ: Активное развитие и внедрение мультимодальных моделей.
🌟 Доступность и регулирование: Обеспечение доступности инфраструктуры для внедрения ИИ, регулирование с акцентом на риск-ориентированный и технологически нейтральный подход.
🌟 Доверие и безопасность: Формирование доверия пользователей к ИИ и обеспечение безопасности его применения.

Переход к открытым финансам:
🌟 Открытые финансы: Переход от открытого банкинга к открытым финансам с элементами открытых данных.
🌟 Стандарты API: Внедрение рекомендательных стандартов Открытых API с последующим обязательным применением для крупнейших участников рынка.
🌟 Платформа коммерческих согласий (ПКС): Создание ПКС на базе портала «Госуслуги» для централизованного и безопасного хранения согласий клиентов.

Технологический суверенитет:
🌟 Опора на российские технологии: Укрепление тенденций к разработке решений на базе российских технологий.
🌟 Снижение зависимости: Координация деятельности для снижения технологической зависимости от внешних поставщиков.
🌟 Переход на российское ПО: Переход организаций на преимущественное использование российского программного обеспечения и оборудования.
🌟 Кибербезопасность: Оценка киберрисков и угроз, контроль информационной безопасности и операционной надежности.
🌟 Развитие национальной цифровой инфраструктуры для усиления технологического суверенитета.

В заключении: Российский финтех-рынок в 2025 году будет стремиться к цифровизации, инновациям и технологической независимости, делая упор на безопасность и удобство для пользователей.

Подробнее:
финтех

@gen_i_i

#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Бесплатные ИИ-модели: новая реальность рынка?

Применение новых методов дистилляции привело к резкому снижению стоимости разработки и обучения моделей, что усилило ценовую конкуренцию. Появление моделей, таких как DeepSeek R1 и Gemini 2.0 Flash, а также снижение стоимости Gemini Pro подтверждают эту тенденцию. Бесплатный доступ к o3-mini стал ответом на возрастающее давление со стороны конкурентов.

Ключевые моменты:

🌟 Конкуренция на рынке ИИ-моделей: В 2025 году способность к рассуждению (reasoning) перестала быть уникальным конкурентным преимуществом, что привело к ценовой войне среди разработчиков.
🌟 Бесплатные модели: Модель o3-mini теперь доступна бесплатно в ChatGPT, что стало неожиданностью после выхода DeepSeek R1. Google также предложил бесплатный доступ к Gemini 2.0 Flash Thinking.
🌟 Снижение цен: DeepSeek выпустила конкурирующие с o1 модели, которые оказались в 27 раз дешевле. Это оказывает значительное ценовое давление на -mini модели.
🌟 Улучшение моделей: DeepSeek R1 повысила качество открытых моделей, используя стандартное дообучение без сложных техник, таких как MCTS.
🌟 Дистилляция рассуждений: Этот метод позволяет обучать небольшие модели, такие как 1.5B, которые превосходят Claude 3.5 Sonnet и GPT-4o. Ожидается рост конкуренции в этом направлении.

Технологические и рыночные факторы:

🌟 Снижение барьеров входа: Бесплатные и дешевые модели делают рынок более доступным для новых игроков.
🌟 Ценовая политика Google: Низкие цены могут быть частью стратегии по улучшению репутации Google Cloud среди разработчиков.
🌟 Рост числа конкурентов: Простота и дешевизна дистилляции приведут к появлению новых игроков на рынке, что усилит ценовую конкуренцию.
🌟 Снижение затрат на разработку: DeepSeek потратила на R&D около $300 млн в год, что значительно меньше, чем бюджеты крупных лабораторий.
🌟 Эффективность дистилляции: Этот метод позволил создавать качественные модели при меньших затратах, что снижает стоимость разработки и внедрения.

Таким образом, рынок языковых моделей переживает период интенсивной конкуренции, вызванной снижением стоимости технологий и появлением новых методов обучения. Бесплатный доступ к o3-mini и другим передовым моделям меняет баланс сил, делая передовые ИИ-технологии более доступными.

Подробнее:
latent

@gen_i_i

#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM