Google выкатили обновления для своих инструментов генерации видео и изображений⚡️ Veo 2 теперь поддерживает создание 3D-видео и анимации, а Imagen 3 улучшает качество и реалистичность сгенерированных изображений. Кроме того, представлен новый инструмент Whisk, предназначенный для упрощения совместной работы над мультимедийными проектами. Эти обновления будут доступны всем в ближайшее время (пишут про начало 2025) в Google Labs и направлены на расширение возможностей пользователей в создании визуального контента✨
Forwarded from Denis Sexy IT 🤖
Что показали
Поговорили про поиск в ChatGPT:
– Теперь он доступен для бесплатных пользователей тоже
– Поиск стал лучше, быстрее и тп.
– Поиск теперь работает во время разговора через Advanced Voice Mode
– Можно сделать поисковик чатгпт дефолтным в браузере (лицо Google представили)
Поговорили про поиск в ChatGPT:
– Теперь он доступен для бесплатных пользователей тоже
– Поиск стал лучше, быстрее и тп.
– Поиск теперь работает во время разговора через Advanced Voice Mode
– Можно сделать поисковик чатгпт дефолтным в браузере (лицо Google представили)
Futuris
Что показали Поговорили про поиск в ChatGPT: – Теперь он доступен для бесплатных пользователей тоже – Поиск стал лучше, быстрее и тп. – Поиск теперь работает во время разговора через Advanced Voice Mode – Можно сделать поисковик чатгпт дефолтным в браузере…
к слову о "лице" Google - это количество источников которые лопатит Gemini если включить DeepSearch (по платной подписке)
This media is not supported in your browser
VIEW IN TELEGRAM
А ещё вот такой плейграунд с картинками от гугл можно попробовать уже сейчас (с впн США) https://labs.google/fx/tools/whisk
Похоже, Google втянулись-таки в гонку AI-релизов 👌
Похоже, Google втянулись-таки в гонку AI-релизов 👌
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и полноценная Gemini 2.0✨
Можно попробовать её в AI Studio (exp 1206) или в самом Gemini Advanced (месяц бесплатно)
Странно они как-то без анонса 🤷♂
Можно попробовать её в AI Studio (exp 1206) или в самом Gemini Advanced (месяц бесплатно)
Странно они как-то без анонса 🤷♂
Команда из Google DeepMind представила новый бенчмарк - FACTS Grounding для оценки точности ответов больших языковых моделей. Этот инструмент проверяет, насколько модели опираются на предоставленные данные и избегают «галлюцинаций». Создана публичная база из 860 примеров, охватывающих такие сферы, как финансы, медицина и право. Результаты оценок ведущих моделей, включая GPT-4o и Claude 3.5, представлены на FACTS-лидерборде. Все ответы проверяются на соответствие запросу и точность. Разработчики надеются, что бенчмарк поможет улучшить точность LLM и стимулирует прогресс в индустрии👌
Media is too big
VIEW IN TELEGRAM
🤯тут реддит взорвал проект Genesis — результат 24-месячного масштабного сотрудничества более 20 исследовательских лабораторий - это генеративный физический движок, создающий 4D-динамические миры для робототехники и физического ИИ. Разработанный на Python, Genesis в 10-80 раз быстрее GPU-решений и обеспечивает симуляции в ~430 000 раз быстрее реального времени. Обучение робота занимает всего 26 секунд на RTX4090.
Genesis — полностью открытая платформа (GitHub), которая интегрирует передовые физические алгоритмы для создания реалистичных виртуальных миров. Она предназначена для автоматической генерации данных: от задач для роботов до интерактивных 3D-сцен.
Github - https://github.com/Genesis-Embodied-AI/Genesis
BIG if true✨
куча крутых примеров тут https://genesis-embodied-ai.github.io/
Короче, Танк - загружай (если что отсылка к Матрице🕶)
Genesis — полностью открытая платформа (GitHub), которая интегрирует передовые физические алгоритмы для создания реалистичных виртуальных миров. Она предназначена для автоматической генерации данных: от задач для роботов до интерактивных 3D-сцен.
Github - https://github.com/Genesis-Embodied-AI/Genesis
BIG if true✨
pip install genesis-world
куча крутых примеров тут https://genesis-embodied-ai.github.io/
Короче, Танк - загружай (если что отсылка к Матрице🕶)
Так, Google продолжает уничтожать 12 дней с OpenAI (что они сегодня релизнут? Возможность написать бумажное письмо ChatGPT без аккаунта и получить ответ через неделю?)
Так вот Google релизнули бесплатного конкурента o1 - модель с размышлениями (Gemini 2.0 flash thinking)
Тестим по традиции в AI studio с впн США
Так вот Google релизнули бесплатного конкурента o1 - модель с размышлениями (Gemini 2.0 flash thinking)
Тестим по традиции в AI studio с впн США
Немного слухов👀
Сегодня посдений из 12 дней OpenAI и тут Сэм начал на что-то намекать (хохнул и охнул 3 раза) и в других местах просочилась (случайно?) инфа про релиз следующей генерации мыслящих моделей gpt4-o3 (сразу 3 потому что 2 якобы занята каким-то трейд марком)
В общем последний шанс у Сэма превратить shitmass в shipmass в этом году 🌚
Сегодня посдений из 12 дней OpenAI и тут Сэм начал на что-то намекать (хохнул и охнул 3 раза) и в других местах просочилась (случайно?) инфа про релиз следующей генерации мыслящих моделей gpt4-o3 (сразу 3 потому что 2 якобы занята каким-то трейд марком)
В общем последний шанс у Сэма превратить shitmass в shipmass в этом году 🌚
o3 и o3-mini пока в закрытом тесте (сказали будет публичный доступ в конце январе), но с ними OpenAI приблизились к созданию AGI. На первом скрине тест ARC-AGI — это тест, созданный для оценки способности искусственного интеллекта решать новые задачи с помощью абстрактного мышления, как это делает человек. Он состоит из визуальных головоломок и проверяет, насколько хорошо ИИ может адаптироваться вне рамок обучающих данных.
На других скринах тоже сильный прирост, в общем не шутки, но уверен будет стоить не меньше 2000$ за месячную подписку
На других скринах тоже сильный прирост, в общем не шутки, но уверен будет стоить не меньше 2000$ за месячную подписку
более подробно о тесте o3 на ARC-AGI
o3 — новая ИИ-система, которая продемонстрировала способность адаптироваться к новым задачам, значительно превышая возможности предыдущих моделей GPT.
Результаты:
На Semi-Private Evaluation (100 задач) o3 набрал:
75.7% при ограниченном бюджете вычислений ($10k).
87.5% с высоким уровнем вычислений (172x больше).
На Public Evaluation (400 задач) результаты составили 82.8% (ограниченный бюджет) и 91.5% (высокий уровень вычислений).
Прорыв:
Это первый случай, когда ИИ достиг такого уровня обобщения, что сравним с человеческим.
Для сравнения, GPT-4o ранее набирал только 5% на аналогичных тестах.
Особенности o3:
Применяет новый подход, основанный на поиске и выполнении программ в текстовой форме для решения задач.
Способен комбинировать знания и адаптироваться к новизне, что ранее было невозможно для моделей GPT.
Вызовы:
Затраты на решение одной задачи (в низкоэффективном режиме) всё ещё выше человеческих (~$17-20 против $5 у человека).
Несмотря на высокую производительность, система всё ещё далека от уровня AGI (общего искусственного интеллекта).
Будущее:
В 2025 году планируется запуск нового теста ARC-AGI-2 для повышения сложности и продолжения исследований.
OpenAI планирует делать эти технологии более доступными и эффективными.
Вывод: OpenAI o3 — это качественный скачок в ИИ, демонстрирующий адаптивность и способность решать принципиально новые задачи. Это пока не AGI, модель всё ещё может совершать ошибки на совершенно простых задачах.
o3 — новая ИИ-система, которая продемонстрировала способность адаптироваться к новым задачам, значительно превышая возможности предыдущих моделей GPT.
Результаты:
На Semi-Private Evaluation (100 задач) o3 набрал:
75.7% при ограниченном бюджете вычислений ($10k).
87.5% с высоким уровнем вычислений (172x больше).
На Public Evaluation (400 задач) результаты составили 82.8% (ограниченный бюджет) и 91.5% (высокий уровень вычислений).
Прорыв:
Это первый случай, когда ИИ достиг такого уровня обобщения, что сравним с человеческим.
Для сравнения, GPT-4o ранее набирал только 5% на аналогичных тестах.
Особенности o3:
Применяет новый подход, основанный на поиске и выполнении программ в текстовой форме для решения задач.
Способен комбинировать знания и адаптироваться к новизне, что ранее было невозможно для моделей GPT.
Вызовы:
Затраты на решение одной задачи (в низкоэффективном режиме) всё ещё выше человеческих (~$17-20 против $5 у человека).
Несмотря на высокую производительность, система всё ещё далека от уровня AGI (общего искусственного интеллекта).
Будущее:
В 2025 году планируется запуск нового теста ARC-AGI-2 для повышения сложности и продолжения исследований.
OpenAI планирует делать эти технологии более доступными и эффективными.
Вывод: OpenAI o3 — это качественный скачок в ИИ, демонстрирующий адаптивность и способность решать принципиально новые задачи. Это пока не AGI, модель всё ещё может совершать ошибки на совершенно простых задачах.
ARC Prize
OpenAI o3 Breakthrough High Score on ARC-AGI-Pub
OpenAI o3 scores 75.7% on ARC-AGI public leaderboard.