Big Data AI
16.8K subscribers
855 photos
99 videos
19 files
850 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
加入频道
🎙 Ученые из Сбера предложили способ, как даже при небольшом объеме обучающих данных локальными моделями добиться высокой точности обнаружения галлюцинаций LLM — это прорыв в выявлении галлюцинаций искусственного интеллекта

Что важно:
– Точность выявления ошибок выше на ~30% по сравнению с аналогами.
– Для обучения хватает всего 250 примеров.
– Основан на анализе внутренних состояний LLM.
– Работает на классических алгоритмах и трансформере TabPFNv2.
– Снижает затраты на разметку и повышает надёжность ответов ИИ.
👍75😁3🔥1
🔥 Intern-S1-mini — новая лёгкая опенсорсная мультимодальная reasoning-модель

8B LLM + 0.3B vision encoder
Лицензия Apache 2.0
Обучение на 5T мультимодальных данных (50%+ — научные домены)
Dynamic tokenizer для молекул и белковых последовательностей

🔗 https://huggingface.co/internlm/Intern-S1-mini
3👍2
🔥 Thyme: Think Beyond Images

Thyme — это инновационная модель, которая улучшает обработку изображений и сложные задачи рассуждения, используя автономное генерирование и выполнение операций через исполняемый код. Она сочетает в себе методы супервайзинга и обучения с подкреплением, обеспечивая высокую точность выполнения кода.

🚀 Основные моменты:
- Автономная генерация и выполнение операций с изображениями.
- Комбинация супервайзинга и обучения с подкреплением.
- Поддержка высокоразрешающей перцепции и сложного рассуждения.
- Использует алгоритм GRPO-ATS для оптимизации работы.

📌 GitHub: https://github.com/yfzhang114/Thyme

#python

@bigdatai
🚨 OpenAI выпустила HealthBench на Hugging Face!

🧑‍⚕️ Новый датасет создан для строгой оценки возможностей больших языковых моделей в области здравоохранения.
В него вошло 5 000 реалистичных медицинских диалогов, подготовленных при участии сотен врачей со всего мира.

Это важный шаг для применения ИИ в медицине — теперь модели будут проверяться не только на знания, но и на качество помощи человеку.

👉 Датасет доступен здесь: https://huggingface.co/datasets/openai/healthbench
3👍2🔥1
🤖 YandexGPT 5.1 Pro для корпоративных задач

Новая версия генеративной модели от Яндекса теперь доступна через API в Yandex Cloud AI Studio. Главное отличие — ориентация на бизнес-процессы: автоматизация документооборота, работа с внутренними базами знаний и интеграция в CRM.

Модель стала заметно точнее: 71% хороших ответов (против 60% раньше), число ошибок снизилось почти вдвое — до 16%. В бенчмарках она выигрывает у GPT-4.1 в 56% случаев, а также лучше понимает российский контекст и честно сообщает «не знаю», если данных нет.

Стоимость снижена втрое: 40 коп. за 1000 токенов
@bigdatai
Ai экономика 🫥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7😭31
🧩 Streamdown: Markdown для AI-стриминга

Streamdown — это замена react-markdown, оптимизированная для потоковой передачи Markdown-контента от AI. Он обеспечивает плавное форматирование даже при неполных блоках, что делает его идеальным для интеграции с AI-решениями.

🚀 Основные моменты:
- 🔄 Обработка неполных Markdown блоков
- 🎨 Поддержка GitHub Flavored Markdown
- 🔢 Рендеринг математических формул с помощью KaTeX
- 🛡️ Безопасное рендеринг на основе harden-react-markdown
- Оптимизированная производительность с мемоизацией

📌 GitHub: https://github.com/vercel/streamdown
2👍2
🚨 NEWS: xAI подала в суд на своего бывшего инженера Xuechen Li

Компания обвиняет его в краже технологий Grok и передаче их в OpenAI.

📌 Из иска:
> В июле он забрал секретные файлы после того, как продал акции xAI на $7 млн и принял оффер от OpenAI
> 14 августа Li признался в краже во время встречи
> Позже xAI обнаружила на его устройствах ещё больше украденных данных
> Компания требует компенсацию и запрет на переход Li в OpenAI

⚖️ Судебный процесс только начинается, но ставки очень высоки.

news: https://reuters.com/legal/litigation/musks-xai-sues-engineer-allegedly-taking-secrets-openai-2025-08-29/
3🔥2👍1🤡1
🔥 Подборка для LLM Fine-Tuning

На GitHub собрали огромную коллекцию датасетов, тулзов и концептов для тонкой настройки LLM.

📂 Всё аккуратно разложено по категориям:
- 🧮 Math & Logic
- 💻 Code
- 💬 Conversation & Role-Play
- 🤖 Agent & Function Calling

⚖️ Все датасеты доступны под свободными лицензиями (Apache 2.0, MIT, CC-BY-4.0 и др.).

👉 Репозиторий: https://github.com/mlabonne/llm-datasets
3🔥2🥰2
AI-агенты вместо генеративок

Генеративные модели были лишь разминкой. Теперь на повестке системы, которые могут выполнять задачи сами: от покупки билетов до развёртывания облака. По сути — шаг к тому, чтобы ИИ стал полноценным участником рабочих процессов, а не просто генератором кода или контента.

В подкасте «Мы обречены» это обсуждают подробно: что уже умеют агенты, какие инструменты появляются и где ждать первых внедрений.

@bigdatai
4💩1
Отличный курс для тех, кто хочет разобраться в нейронках с нуля от Андрея Карпати (OpenAI/Tesla).

Внутри бесплатная серия лекций на YouTube (и репа на GitHub), где ты с нуля учишься собирать нейронки. Всё максимально hands-on:

Автор не просто рассказывает теорию, а пишет код вместе с тобой — от самых азов до тренировки сетей.

https://github.com/karpathy/nn-zero-to-hero/
4🔥3👍2
Разработка сервиса с передовыми LLM-моделей в одном окне

Интересный кейс на Хабре — red_mad_robot провели технологический эксперимент и сделали AI-сервис Daisy — с большинством ведущих LLM и кастомной нейросетью для генерации изображений под капотом. В материале подробный рассказ, как выстраивать AI-based UX и объединить разные модули в многоуровневую архитектуру, описана маршрутизация и логические слои сервиса.

Для безопасности и точности ответов в Daisy собрали собственный контент-фильтр, который анализирует смысл запроса, а не просто ключевые слова. С учетом ложных срабатываний точность фильтра составила 87%.

📎 Читайте кейс полностью на Хабре: https://habr.com/ru/companies/redmadrobot/articles/941398/
4
FineVision — огромный open-source датасет для обучения современных Vision-Language моделей!

В цифрах это выглядит так:

🖼 17.3M изображений
📦 24.3M сэмплов
💬 88.9M диалоговых шагов
🔡 9.5B токенов ответов

Несколько интересных находок из датасета:

Разнообразие доменов: от повседневных фото до сложных технических изображений.

Многоступенчатые диалоги помогают моделям лучше понимать контекст.

Сильный фокус на качество аннотаций и баланс данных.

👉 FineVision открывает новые возможности для исследований и создания ещё более умных VLM-моделей

http://huggingface.co/spaces/HuggingFaceM4/FineVision
2👍1🔥1