Что там в мире ИИ происходит?
Делимся новой подборкой новостей про искусственный интеллект. На карточках коротко о главном, а ссылки помогут узнать все детали:
📌 RL обобщает, SFT запоминает — читать доказательство
📌 Поиск по моделям в Hugging Face — попробовать
📌 Как люди распознают тексты ИИ — узнать больше
📌 302 кейса ИИ в бизнесе от Microsoft — читать отчёт
📌 Alibaba представила Wan 2.1 — попробовать
📌 Mercury Coder — dLLM для кода — протестировать
А если хотите изучить ещё материалы:
🔥 Qwen обновила QwQ и достигла эффективности DeepSeek R1 — узнать больше
📚 Большая лекция по большим языковым моделям (класса ChatGPT) — смотреть
📚 Книга по языковым моделям — читать
📚 Hugging Face выпустила большой документ по эффективным практикам обучения LLM на кластерах GPU — изучить
#aaa_hardposting
Делимся новой подборкой новостей про искусственный интеллект. На карточках коротко о главном, а ссылки помогут узнать все детали:
📌 RL обобщает, SFT запоминает — читать доказательство
📌 Поиск по моделям в Hugging Face — попробовать
📌 Как люди распознают тексты ИИ — узнать больше
📌 302 кейса ИИ в бизнесе от Microsoft — читать отчёт
📌 Alibaba представила Wan 2.1 — попробовать
📌 Mercury Coder — dLLM для кода — протестировать
А если хотите изучить ещё материалы:
🔥 Qwen обновила QwQ и достигла эффективности DeepSeek R1 — узнать больше
📚 Большая лекция по большим языковым моделям (класса ChatGPT) — смотреть
📚 Книга по языковым моделям — читать
📚 Hugging Face выпустила большой документ по эффективным практикам обучения LLM на кластерах GPU — изучить
#aaa_hardposting
⚡8🔥7❤6👍1
Как случайное письмо изменило карьеру 🤔
Однажды в баре Виктор Сизов составил список компаний мечты: Tesla и Альфа-Банк.
А что было дальше и как спустя время Витя оказался в Альфе — рассказываем на карточках.
Хотите глубже разобраться в процессе разметки данных? В статье «База об организации процесса разметки: команда, онбординг, метрики» — о ключевых принципах, автоматизации и качестве разметки для ML.
#aaa_hardposting
Однажды в баре Виктор Сизов составил список компаний мечты: Tesla и Альфа-Банк.
А что было дальше и как спустя время Витя оказался в Альфе — рассказываем на карточках.
Хотите глубже разобраться в процессе разметки данных? В статье «База об организации процесса разметки: команда, онбординг, метрики» — о ключевых принципах, автоматизации и качестве разметки для ML.
#aaa_hardposting
😁18❤🔥14🔥6🤣4👎2🥰2👏2🙈1💘1
Как быстро найти всё и сразу?
Мы подготовили удобный «маршрут» по каналу, чтобы вы не потерялись в потоке контента. Просто кликайте на теги и изучайте посты на интересующие вас темы:
🔍 Экспертные статьи и разборы по Data Science, Data Engineering и MLOps – #aaa_hardposting #aaa_DS #aaa_DE #aaa_MLOps #aaa_habr
👥 Истории и опыт специалистов Альфы – #aaa_experts
🎭 Мемы и лёгкий контент про аналитику – #aaa_fun
📅 Анонсы митапов, конференций и мероприятий – #aaa_events
🚀 Вакансии, карьерные советы и полезные ресурсы – #aaa_career
Вступайте в чат канала — будем обсуждать DS, DE и MLOps, делиться опытом, отвечать на ваши вопросы и устраивать специальные розыгрыши.
Присоединяйтесь — развиваем комьюнити вместе 🚀
Мы подготовили удобный «маршрут» по каналу, чтобы вы не потерялись в потоке контента. Просто кликайте на теги и изучайте посты на интересующие вас темы:
🔍 Экспертные статьи и разборы по Data Science, Data Engineering и MLOps – #aaa_hardposting #aaa_DS #aaa_DE #aaa_MLOps #aaa_habr
👥 Истории и опыт специалистов Альфы – #aaa_experts
🎭 Мемы и лёгкий контент про аналитику – #aaa_fun
📅 Анонсы митапов, конференций и мероприятий – #aaa_events
🚀 Вакансии, карьерные советы и полезные ресурсы – #aaa_career
Вступайте в чат канала — будем обсуждать DS, DE и MLOps, делиться опытом, отвечать на ваши вопросы и устраивать специальные розыгрыши.
Присоединяйтесь — развиваем комьюнити вместе 🚀
❤🔥11👏4🥰3
ИИ не дремлет 👀
Раскроем карты — собирать дайджест нам помогает Вадим Аюев, руководитель дирекции моделей и методов продвинутой аналитики, знаток и энтузиаст в мире ИИ. Вадим ведёт свой канал «Пятничный ИИ», в нём ещё больше новостей, с пылу с жару🔥
На карточках коротко о главном, а чтобы подробнее детальнее изучить, кликайте на ссылку:
🔍 Применение генИИ в маркетинге — исследование
🔍 Топ-100 генИИ приложений — обзор
🔍 ИИ-статья на конференции — узнать больше
🔍 Как ИИ создаёт мемы — статья
🔍 Сложность задач для ИИ растёт — исследование
Больше про ИИ:
📩 Новая мультимодальная модель от Alibaba — статья
📩 Вышла Llama 4 — анонс
📩 Третье поколение открытых моделей Gemma — статья
#aaa_hardposting
Раскроем карты — собирать дайджест нам помогает Вадим Аюев, руководитель дирекции моделей и методов продвинутой аналитики, знаток и энтузиаст в мире ИИ. Вадим ведёт свой канал «Пятничный ИИ», в нём ещё больше новостей, с пылу с жару🔥
На карточках коротко о главном, а чтобы подробнее детальнее изучить, кликайте на ссылку:
🔍 Применение генИИ в маркетинге — исследование
🔍 Топ-100 генИИ приложений — обзор
🔍 ИИ-статья на конференции — узнать больше
🔍 Как ИИ создаёт мемы — статья
🔍 Сложность задач для ИИ растёт — исследование
Больше про ИИ:
📩 Новая мультимодальная модель от Alibaba — статья
📩 Вышла Llama 4 — анонс
📩 Третье поколение открытых моделей Gemma — статья
#aaa_hardposting
❤🔥6🔥5💯3👍2
Разбор лучших решений 😎
Вчера рассказывали, что наши ребята взяли первое и третье место в соревновании Data Fusion Contest в треке Label Craft. Задача была не из лёгких: по названию и описанию товара предсказать его категорию.
На карточках — самое интересное: как решали задачу, какие идеи пробовали, с какими трудностями столкнулись. А если остались вопросы, пишите их в комментариях 👇
P.S. Восхищаемся теми, кто регулярно участвует в хакатонах. Иногда условие звучит как Drtkldksfh;hggddfsjkyyrsffgh — а вы всё равно находите решение. Лучшие 👏
#aaa_hardposting
#aaa_experts
Вчера рассказывали, что наши ребята взяли первое и третье место в соревновании Data Fusion Contest в треке Label Craft. Задача была не из лёгких: по названию и описанию товара предсказать его категорию.
На карточках — самое интересное: как решали задачу, какие идеи пробовали, с какими трудностями столкнулись. А если остались вопросы, пишите их в комментариях 👇
P.S. Восхищаемся теми, кто регулярно участвует в хакатонах. Иногда условие звучит как Drtkldksfh;hggddfsjkyyrsffgh — а вы всё равно находите решение. Лучшие 👏
#aaa_hardposting
#aaa_experts
🔥30❤8🤩7👍4
Как привлечь больше туристов в регион и помочь бизнесу заработать? Ответ — в данных 📊
Недавно мы делились планами по адаптации своих технологий для внешнего рынка. Сегодня — пример того, как развиваем направление B2G: Альфа-Банк и билайн применили данные и ИИ, чтобы помочь регионам привлечь туристов.
Чтобы развивать туризм, нужно понимать, кто приезжает, откуда и зачем. Но традиционные методы сбора информации не справляются — они медленные, неполные и не дают целостной картины.
Альфа-Банк вместе с билайном нашли технологичное решение: объединили обезличенные данные о перемещениях и тратах, подключили ИИ — и получили живую, точную аналитику туристических потоков.
В карточках рассказываем кратко о главном, а в статье — больше деталей и примеров применения 🔥
Читать подробнее в материале на vc.ru
#aaa_hardposting
Недавно мы делились планами по адаптации своих технологий для внешнего рынка. Сегодня — пример того, как развиваем направление B2G: Альфа-Банк и билайн применили данные и ИИ, чтобы помочь регионам привлечь туристов.
Чтобы развивать туризм, нужно понимать, кто приезжает, откуда и зачем. Но традиционные методы сбора информации не справляются — они медленные, неполные и не дают целостной картины.
Альфа-Банк вместе с билайном нашли технологичное решение: объединили обезличенные данные о перемещениях и тратах, подключили ИИ — и получили живую, точную аналитику туристических потоков.
В карточках рассказываем кратко о главном, а в статье — больше деталей и примеров применения 🔥
Читать подробнее в материале на vc.ru
#aaa_hardposting
❤🔥10😎5👍4🥰2⚡1👎1
Что нового у ИИ?
Делимся свежей подборкой новостей из мира искусственного интеллекта. Дайджест помогает нам собирать Вадим Аюев, руководитель дирекции моделей и методов продвинутой аналитики, знаток и энтузиаст ИИ.
На карточках коротко о главном, а чтобы детальнее изучить, кликайте на ссылку:
📌 Как LLM меняют сценарии распространения технологий — читать
📌 Политические предпочтения современных LLM — посмотреть результаты
📌 Отчёт McKinsey о влиянии ИИ на бизнес — читать отчёт
📌 Что не так с рейтингами Chatbot Arena — читать статью
📌 Как ChatGPT влияет на обучение — узнать больше
📌 Генеративный ИИ экономит лишь 3% времени сотрудников — читать исследование
📌 Яндекс выложил один из крупнейших датасетов для рекомендательных систем — перейти к данным
📚 Ещё интересное:
📌 Отчёт Стэнфорда по ключевым трендам ИИ — читать
📌 Учебное видео от Андрея Карпаты по применению LLM — смотреть
📌 Alibaba представила семейство открытых моделей Qwen3 — попробовать
#aaa_hardposting
Делимся свежей подборкой новостей из мира искусственного интеллекта. Дайджест помогает нам собирать Вадим Аюев, руководитель дирекции моделей и методов продвинутой аналитики, знаток и энтузиаст ИИ.
На карточках коротко о главном, а чтобы детальнее изучить, кликайте на ссылку:
📌 Как LLM меняют сценарии распространения технологий — читать
📌 Политические предпочтения современных LLM — посмотреть результаты
📌 Отчёт McKinsey о влиянии ИИ на бизнес — читать отчёт
📌 Что не так с рейтингами Chatbot Arena — читать статью
📌 Как ChatGPT влияет на обучение — узнать больше
📌 Генеративный ИИ экономит лишь 3% времени сотрудников — читать исследование
📌 Яндекс выложил один из крупнейших датасетов для рекомендательных систем — перейти к данным
📚 Ещё интересное:
📌 Отчёт Стэнфорда по ключевым трендам ИИ — читать
📌 Учебное видео от Андрея Карпаты по применению LLM — смотреть
📌 Alibaba представила семейство открытых моделей Qwen3 — попробовать
#aaa_hardposting
❤🔥12👏7🤓5❤1👎1
О чём мы рассказывали со сцены 🎤
Этой весной мы успели больше, чем просто обучить модели и построить пайплайны — наши коллеги по традиции вышли на сцену крупнейших аналитических конференций страны: Data Fest и Data Fusion.
Кто-то делился кейсами, кто-то спорил в дебатах или вёл дискуссии — собрали все выступления в одном месте, чтобы вы ничего не пропустили:
📍 Data Fest
Игорь Дойников, Chief Data Scientist, продвинутая аналитика розничного бизнеса, доклад «Рекомендация и оптимизация в задачах категорийного кэшбэка». Смотреть выступление (тайминг: 4:00:00).
Роман Кузнецов, руководитель проектов разметки данных, доклад «Аналитика, данные, метрики и мотивация: как построить процесс разметки в большом банке». Смотреть выступление (тайминг: 7:23:00).
📍 Data Fusion
Евгений Смирнов, руководитель Лаборатории машинного обучения. Дебаты «Разрушители мИИфов». Смотреть выступление.
Салават Муллабаев, Chief Data Scientist, продвинутая аналитика Общекорпоративных функций, доклад «Формирование оптимальных графиков работы отделений банка». Смотреть выступление.
Алексей Каширин, директор Центра продвинутой аналитики
• Дебаты: «Стена данных: сколько осталось до предела?». Смотреть выступление
• Дискуссионная панель: «Эксперты о трендах: бизнес». Смотреть выступление
• Дискуссионная панель: «Безопасность данных и моделей: как найти общий язык?». Смотреть выступление
#aaa_hardposting
Этой весной мы успели больше, чем просто обучить модели и построить пайплайны — наши коллеги по традиции вышли на сцену крупнейших аналитических конференций страны: Data Fest и Data Fusion.
Кто-то делился кейсами, кто-то спорил в дебатах или вёл дискуссии — собрали все выступления в одном месте, чтобы вы ничего не пропустили:
📍 Data Fest
Игорь Дойников, Chief Data Scientist, продвинутая аналитика розничного бизнеса, доклад «Рекомендация и оптимизация в задачах категорийного кэшбэка». Смотреть выступление (тайминг: 4:00:00).
Роман Кузнецов, руководитель проектов разметки данных, доклад «Аналитика, данные, метрики и мотивация: как построить процесс разметки в большом банке». Смотреть выступление (тайминг: 7:23:00).
📍 Data Fusion
Евгений Смирнов, руководитель Лаборатории машинного обучения. Дебаты «Разрушители мИИфов». Смотреть выступление.
Салават Муллабаев, Chief Data Scientist, продвинутая аналитика Общекорпоративных функций, доклад «Формирование оптимальных графиков работы отделений банка». Смотреть выступление.
Алексей Каширин, директор Центра продвинутой аналитики
• Дебаты: «Стена данных: сколько осталось до предела?». Смотреть выступление
• Дискуссионная панель: «Эксперты о трендах: бизнес». Смотреть выступление
• Дискуссионная панель: «Безопасность данных и моделей: как найти общий язык?». Смотреть выступление
#aaa_hardposting
❤9🔥6🤝5😱4👎1
Наш путь в SOTA 💡
В Лаборатории машинного обучения мы не просто следим за трендами, а проверяем их на практике и внедряем в реальные бизнес-задачи.
Передовые AI-подходы уже работают в наших моделях скоринга, антифрода, оттока и склонностей. Новые архитектуры от графовых сетей до TabM и xLSTM проходят тестирование и масштабируются на другие направления 🔥
На карточках рассказываем, как всё начиналось, какие технологии мы используем, где уже есть результат и какие подводные камни важно учитывать 👆
#aaa_hardposting
В Лаборатории машинного обучения мы не просто следим за трендами, а проверяем их на практике и внедряем в реальные бизнес-задачи.
Передовые AI-подходы уже работают в наших моделях скоринга, антифрода, оттока и склонностей. Новые архитектуры от графовых сетей до TabM и xLSTM проходят тестирование и масштабируются на другие направления 🔥
На карточках рассказываем, как всё начиналось, какие технологии мы используем, где уже есть результат и какие подводные камни важно учитывать 👆
#aaa_hardposting
❤🔥12🏆7👏6🔥1🥰1
Первая LLM, которую мы успешно дообучили в Альфе 🔥
LLM не всегда справляются с задачами «из коробки». В ряде случаев им необходимо предоставить данные из базы знаний с помощью RAG-подхода. Однако для более сложных задач этого может быть недостаточно, тогда требуется дообучение модели.
Мы начали с задачи оценки ответов операторов.
— Александр Сенин, руководитель Центра компетенций Natural Language Processing
На карточках рассказываем, какие методы дообучения выбрали, с какими моделями начали и к каким результатам пришли 👆
Спойлер:удалось добиться стабильной высокой точности без перехода на внешние решения.
#aaa_hardposting
LLM не всегда справляются с задачами «из коробки». В ряде случаев им необходимо предоставить данные из базы знаний с помощью RAG-подхода. Однако для более сложных задач этого может быть недостаточно, тогда требуется дообучение модели.
Мы начали с задачи оценки ответов операторов.
«Дообучение LLM — неизбежный шаг при создании современных, качественных AI-систем. Когда все «низковисящие фрукты» уже собраны, наступает момент, когда модель необходимо дообучать напрямую, чтобы продолжать улучшать её качество. К счастью, существуют легковесные методы, которые позволяют делать это эффективно и без серьёзных затрат на инфраструктуру.
Особенно важно, что даже этих облегчённых подходов оказалось достаточно, чтобы достичь более высокого качества по сравнению с классическими решениями на базе BERT, которые долгое время считались золотым стандартом в задачах классификации.
Это значимый прецедент успешного дообучения LLM в Альфе, который меняет подход: теперь LLM применимы не только для генерации текста, но и для более узких задач, которые раньше решались отдельными моделями, обученными на большом объёме размеченных данных»,
— Александр Сенин, руководитель Центра компетенций Natural Language Processing
На карточках рассказываем, какие методы дообучения выбрали, с какими моделями начали и к каким результатам пришли 👆
Спойлер:
#aaa_hardposting
❤21🔥14⚡6👌1🙈1
Это вы точно не знали
Собрали новую подборку новостей из мира искусственного интеллекта вместе с Вадимом Аюевым, руководитель дирекции моделей и методов продвинутой аналитики, знаток и энтузиаст ИИ.
На карточках коротко о главном, а чтобы подробнее изучить, кликайте на ссылку:
📌 Отчёт Стэнфорда — читать
📌 Открытый набор данных от Essential AI — изучить
📌 Отчёт от Menlo Ventures по потребительскому ИИ — читать
📌 Интервью Джеффри Хинтона — смотреть
📌 Подкаст OpenAI — слушать
📌 Самая большая открытая MoE модель — узнать больше
📌 Открытая модель T-pro 2.0 от Т-Банка — узнать больше
#aaa_hardposting
Собрали новую подборку новостей из мира искусственного интеллекта вместе с Вадимом Аюевым, руководитель дирекции моделей и методов продвинутой аналитики, знаток и энтузиаст ИИ.
На карточках коротко о главном, а чтобы подробнее изучить, кликайте на ссылку:
📌 Отчёт Стэнфорда — читать
📌 Открытый набор данных от Essential AI — изучить
📌 Отчёт от Menlo Ventures по потребительскому ИИ — читать
📌 Интервью Джеффри Хинтона — смотреть
📌 Подкаст OpenAI — слушать
📌 Самая большая открытая MoE модель — узнать больше
📌 Открытая модель T-pro 2.0 от Т-Банка — узнать больше
#aaa_hardposting
❤11🤩8🥰5👍3🔥2
Подход Альфы к управлению данными 🔥
Чтобы они действительно работали на бизнес, а не создавали хаос, нужна системная работа.
Сегодня знакомим с Data Governance. Коллеги рассказывают, зачем подход банку, как он помогает аналитике и какую роль в нём играет сообществои его символ — Бобр Борис 🦫
Скорее читайте карточки🔼
Переходите по ссылкам, чтобы присоединиться к нашей команде:
🔥 — если хотите знать про инструменты Data Governance больше
#aaa_hardposting
Чтобы они действительно работали на бизнес, а не создавали хаос, нужна системная работа.
Сегодня знакомим с Data Governance. Коллеги рассказывают, зачем подход банку, как он помогает аналитике и какую роль в нём играет сообщество
Скорее читайте карточки
Переходите по ссылкам, чтобы присоединиться к нашей команде:
🔗 MLops для направления AI-контроля качества данных — смотреть
🔗 Product Owner «Качество данных» — смотреть
🔗 Руководитель направления по повышению зрелости функции управления данными — смотреть
🔥 — если хотите знать про инструменты Data Governance больше
#aaa_hardposting
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20❤12🤝4🆒1
Будущее DE за автоматизацией 💡
AutoDE — не просто тренд, а следующий шаг зрелости работы с данными. Мы уже тестируем разные подходы: автоматическую репликацию источников, генерацию фич с помощью LLM и другие.
Подробнее про AutoDE рассказывает Юрий Краснов, ведущий эксперт по инжинирингу данных. В карточках вы узнаете, что такое AutoDE, зачем это нужно бизнесу и куда движется эта область📈
А какие практики автоматизации DE вы применяете у себя в компаниях?
Давайте обсудим в комментариях, интересно послушать про ваш опыт 👇
#aaa_hardposting #aaa_DE
AutoDE — не просто тренд, а следующий шаг зрелости работы с данными. Мы уже тестируем разные подходы: автоматическую репликацию источников, генерацию фич с помощью LLM и другие.
Подробнее про AutoDE рассказывает Юрий Краснов, ведущий эксперт по инжинирингу данных. В карточках вы узнаете, что такое AutoDE, зачем это нужно бизнесу и куда движется эта область
А какие практики автоматизации DE вы применяете у себя в компаниях?
Давайте обсудим в комментариях, интересно послушать про ваш опыт 👇
#aaa_hardposting #aaa_DE
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤7💯5😍4👍1😢1