Futuris

Google выкатили обновления для своих инструментов генерации видео и изображений⚡️ Veo 2 теперь поддерживает создание 3D-видео и анимации, а Imagen 3 улучшает качество и реалистичность сгенерированных изображений. Кроме того, представлен новый инструмент Whisk, предназначенный для упрощения совместной работы над мультимедийными проектами. Эти обновления будут доступны всем в ближайшее время (пишут про начало 2025) в Google Labs и направлены на расширение возможностей пользователей в создании визуального контента✨

1.2K viewsAnton, 17:43

Futuris

Forwarded from Denis Sexy IT 🤖

Что показали

Поговорили про поиск в ChatGPT:

– Теперь он доступен для бесплатных пользователей тоже
– Поиск стал лучше, быстрее и тп.
– Поиск теперь работает во время разговора через Advanced Voice Mode
– Можно сделать поисковик чатгпт дефолтным в браузере (лицо Google представили)

932 viewsAnton, 18:20

Futuris

Что показали Поговорили про поиск в ChatGPT: – Теперь он доступен для бесплатных пользователей тоже – Поиск стал лучше, быстрее и тп. – Поиск теперь работает во время разговора через Advanced Voice Mode – Можно сделать поисковик чатгпт дефолтным в браузере…

к слову о "лице" Google - это количество источников которые лопатит Gemini если включить DeepSearch (по платной подписке)

1.1K viewsAnton, edited 18:45

Futuris

0:52

This media is not supported in your browser

VIEW IN TELEGRAM

А ещё вот такой плейграунд с картинками от гугл можно попробовать уже сейчас (с впн США) https://labs.google/fx/tools/whisk

Похоже, Google втянулись-таки в гонку AI-релизов 👌

1.2K viewsAnton, edited 22:16

Futuris

This media is not supported in your browser

VIEW IN TELEGRAM

А вот и полноценная Gemini 2.0✨

Можно попробовать её в AI Studio (exp 1206) или в самом Gemini Advanced (месяц бесплатно)

Странно они как-то без анонса 🤷‍♂

1.1K viewsAnton, edited 18:54

Futuris

Команда из Google DeepMind представила новый бенчмарк - FACTS Grounding для оценки точности ответов больших языковых моделей. Этот инструмент проверяет, насколько модели опираются на предоставленные данные и избегают «галлюцинаций». Создана публичная база из 860 примеров, охватывающих такие сферы, как финансы, медицина и право. Результаты оценок ведущих моделей, включая GPT-4o и Claude 3.5, представлены на FACTS-лидерборде. Все ответы проверяются на соответствие запросу и точность. Разработчики надеются, что бенчмарк поможет улучшить точность LLM и стимулирует прогресс в индустрии👌

1.2K viewsAnton, 11:02

🤯тут реддит взорвал проект Genesis — результат 24-месячного масштабного сотрудничества более 20 исследовательских лабораторий - это генеративный физический движок, создающий 4D-динамические миры для робототехники и физического ИИ. Разработанный на Python, Genesis в 10-80 раз быстрее GPU-решений и обеспечивает симуляции в ~430 000 раз быстрее реального времени. Обучение робота занимает всего 26 секунд на RTX4090.

Genesis — полностью открытая платформа (GitHub), которая интегрирует передовые физические алгоритмы для создания реалистичных виртуальных миров. Она предназначена для автоматической генерации данных: от задач для роботов до интерактивных 3D-сцен.

Github - https://github.com/Genesis-Embodied-AI/Genesis

BIG if true✨ pip install genesis-world

куча крутых примеров тут https://genesis-embodied-ai.github.io/

Короче, Танк - загружай (если что отсылка к Матрице🕶)

1.8K viewsAnton, edited 07:32

Futuris

Так, Google продолжает уничтожать 12 дней с OpenAI (что они сегодня релизнут? Возможность написать бумажное письмо ChatGPT без аккаунта и получить ответ через неделю?)
Так вот Google релизнули бесплатного конкурента o1 - модель с размышлениями (Gemini 2.0 flash thinking)

Тестим по традиции в AI studio с впн США

1.3K viewsAnton, 16:48

Futuris

Немного слухов👀
Сегодня посдений из 12 дней OpenAI и тут Сэм начал на что-то намекать (хохнул и охнул 3 раза) и в других местах просочилась (случайно?) инфа про релиз следующей генерации мыслящих моделей gpt4-o3 (сразу 3 потому что 2 якобы занята каким-то трейд марком)

В общем последний шанс у Сэма превратить shitmass в shipmass в этом году 🌚

1.3K viewsAnton, 09:57

Futuris

o3 и o3-mini пока в закрытом тесте (сказали будет публичный доступ в конце январе), но с ними OpenAI приблизились к созданию AGI. На первом скрине тест ARC-AGI — это тест, созданный для оценки способности искусственного интеллекта решать новые задачи с помощью абстрактного мышления, как это делает человек. Он состоит из визуальных головоломок и проверяет, насколько хорошо ИИ может адаптироваться вне рамок обучающих данных.

На других скринах тоже сильный прирост, в общем не шутки, но уверен будет стоить не меньше 2000$ за месячную подписку

1.6K viewsAnton, 18:11

Futuris

более подробно о тесте o3 на ARC-AGI

o3 — новая ИИ-система, которая продемонстрировала способность адаптироваться к новым задачам, значительно превышая возможности предыдущих моделей GPT.

Результаты:
На Semi-Private Evaluation (100 задач) o3 набрал:
75.7% при ограниченном бюджете вычислений ($10k).
87.5% с высоким уровнем вычислений (172x больше).
На Public Evaluation (400 задач) результаты составили 82.8% (ограниченный бюджет) и 91.5% (высокий уровень вычислений).

Прорыв:
Это первый случай, когда ИИ достиг такого уровня обобщения, что сравним с человеческим.
Для сравнения, GPT-4o ранее набирал только 5% на аналогичных тестах.

Особенности o3:
Применяет новый подход, основанный на поиске и выполнении программ в текстовой форме для решения задач.
Способен комбинировать знания и адаптироваться к новизне, что ранее было невозможно для моделей GPT.

Вызовы:
Затраты на решение одной задачи (в низкоэффективном режиме) всё ещё выше человеческих (~$17-20 против $5 у человека).
Несмотря на высокую производительность, система всё ещё далека от уровня AGI (общего искусственного интеллекта).

Будущее:
В 2025 году планируется запуск нового теста ARC-AGI-2 для повышения сложности и продолжения исследований.
OpenAI планирует делать эти технологии более доступными и эффективными.

Вывод: OpenAI o3 — это качественный скачок в ИИ, демонстрирующий адаптивность и способность решать принципиально новые задачи. Это пока не AGI, модель всё ещё может совершать ошибки на совершенно простых задачах.

ARC Prize

OpenAI o3 Breakthrough High Score on ARC-AGI-Pub

OpenAI o3 scores 75.7% on ARC-AGI public leaderboard.

1.7K viewsAnton, edited 18:54

About

Blog

Apps

Platform