OpenAI обновили advanced voice mode, теперь он получил зрение и можно шарить экран, ну прям как гугл вчера
https://www.youtube.com/live/NIQDnWlwYyQ?si=e4TjQlwL4k4xY-E0
https://www.youtube.com/live/NIQDnWlwYyQ?si=e4TjQlwL4k4xY-E0
YouTube
Santa Mode & Video in Advanced Voice—12 Days of OpenAI: Day 6
Kevin Weil, Jackie Shannon, Michelle Qin, and Rowan Zellers introduce and demo the new Santa voice, as well as video and screensharing in Advanced Voice.
Microsoft испекли на синтетических данных свеженькую phi-4 модельку на 14B параметров, которая сравнима и даже местами лучше gpt4o 🤯🤯
From the report:
> While previous models in the Phi family largely distill the capabilities of a teacher model (specifically GPT-4), phi-4 substantially surpasses its teacher model on STEM-focused QA capabilities, giving evidence that our data-generation and post-training techniques go beyond distillation.
Можно будет локально запускать, I will believe it when I see it 🙈
Ну и тренд понятен, сотни таких маленьких агентов, которые подчиняются главной LLM, общаются между собой, гоняют по сети, думают как лучше вами сманипулировать в своих целях..тоесть предоставить достоверный ответ, в общем AGI не за горами👌
From the report:
> While previous models in the Phi family largely distill the capabilities of a teacher model (specifically GPT-4), phi-4 substantially surpasses its teacher model on STEM-focused QA capabilities, giving evidence that our data-generation and post-training techniques go beyond distillation.
Можно будет локально запускать, I will believe it when I see it 🙈
Ну и тренд понятен, сотни таких маленьких агентов, которые подчиняются главной LLM, общаются между собой, гоняют по сети, думают как лучше вами сманипулировать в своих целях..тоесть предоставить достоверный ответ, в общем AGI не за горами👌
Просто для понимания как можно юзать скриншер с нейронками, это оч круто, хотя пока немного и глючит, иногда вылетает, но представляю что будет через пару месяцев и когда им ещё дадут доступ к управлению🌚 (ChatGPT пока почемуто тока с мобилы получил доступ к видео, поэтому использовал гугл)
Запускаем ComfyUI (до записи он прочитал за меня Readme файл, который я ему просто проскролил) и играем в DwarfFortress (в который я никогда не играл до этого🧙♂️)
Запускаем ComfyUI (до записи он прочитал за меня Readme файл, который я ему просто проскролил) и играем в DwarfFortress (в который я никогда не играл до этого🧙♂️)
Google выкатили обновления для своих инструментов генерации видео и изображений⚡️ Veo 2 теперь поддерживает создание 3D-видео и анимации, а Imagen 3 улучшает качество и реалистичность сгенерированных изображений. Кроме того, представлен новый инструмент Whisk, предназначенный для упрощения совместной работы над мультимедийными проектами. Эти обновления будут доступны всем в ближайшее время (пишут про начало 2025) в Google Labs и направлены на расширение возможностей пользователей в создании визуального контента✨
Forwarded from Denis Sexy IT 🤖
Что показали
Поговорили про поиск в ChatGPT:
– Теперь он доступен для бесплатных пользователей тоже
– Поиск стал лучше, быстрее и тп.
– Поиск теперь работает во время разговора через Advanced Voice Mode
– Можно сделать поисковик чатгпт дефолтным в браузере (лицо Google представили)
Поговорили про поиск в ChatGPT:
– Теперь он доступен для бесплатных пользователей тоже
– Поиск стал лучше, быстрее и тп.
– Поиск теперь работает во время разговора через Advanced Voice Mode
– Можно сделать поисковик чатгпт дефолтным в браузере (лицо Google представили)
Futuris
Что показали Поговорили про поиск в ChatGPT: – Теперь он доступен для бесплатных пользователей тоже – Поиск стал лучше, быстрее и тп. – Поиск теперь работает во время разговора через Advanced Voice Mode – Можно сделать поисковик чатгпт дефолтным в браузере…
к слову о "лице" Google - это количество источников которые лопатит Gemini если включить DeepSearch (по платной подписке)
This media is not supported in your browser
VIEW IN TELEGRAM
А ещё вот такой плейграунд с картинками от гугл можно попробовать уже сейчас (с впн США) https://labs.google/fx/tools/whisk
Похоже, Google втянулись-таки в гонку AI-релизов 👌
Похоже, Google втянулись-таки в гонку AI-релизов 👌
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и полноценная Gemini 2.0✨
Можно попробовать её в AI Studio (exp 1206) или в самом Gemini Advanced (месяц бесплатно)
Странно они как-то без анонса 🤷♂
Можно попробовать её в AI Studio (exp 1206) или в самом Gemini Advanced (месяц бесплатно)
Странно они как-то без анонса 🤷♂
Команда из Google DeepMind представила новый бенчмарк - FACTS Grounding для оценки точности ответов больших языковых моделей. Этот инструмент проверяет, насколько модели опираются на предоставленные данные и избегают «галлюцинаций». Создана публичная база из 860 примеров, охватывающих такие сферы, как финансы, медицина и право. Результаты оценок ведущих моделей, включая GPT-4o и Claude 3.5, представлены на FACTS-лидерборде. Все ответы проверяются на соответствие запросу и точность. Разработчики надеются, что бенчмарк поможет улучшить точность LLM и стимулирует прогресс в индустрии👌
Media is too big
VIEW IN TELEGRAM
🤯тут реддит взорвал проект Genesis — результат 24-месячного масштабного сотрудничества более 20 исследовательских лабораторий - это генеративный физический движок, создающий 4D-динамические миры для робототехники и физического ИИ. Разработанный на Python, Genesis в 10-80 раз быстрее GPU-решений и обеспечивает симуляции в ~430 000 раз быстрее реального времени. Обучение робота занимает всего 26 секунд на RTX4090.
Genesis — полностью открытая платформа (GitHub), которая интегрирует передовые физические алгоритмы для создания реалистичных виртуальных миров. Она предназначена для автоматической генерации данных: от задач для роботов до интерактивных 3D-сцен.
Github - https://github.com/Genesis-Embodied-AI/Genesis
BIG if true✨
куча крутых примеров тут https://genesis-embodied-ai.github.io/
Короче, Танк - загружай (если что отсылка к Матрице🕶)
Genesis — полностью открытая платформа (GitHub), которая интегрирует передовые физические алгоритмы для создания реалистичных виртуальных миров. Она предназначена для автоматической генерации данных: от задач для роботов до интерактивных 3D-сцен.
Github - https://github.com/Genesis-Embodied-AI/Genesis
BIG if true✨
pip install genesis-world
куча крутых примеров тут https://genesis-embodied-ai.github.io/
Короче, Танк - загружай (если что отсылка к Матрице🕶)
Так, Google продолжает уничтожать 12 дней с OpenAI (что они сегодня релизнут? Возможность написать бумажное письмо ChatGPT без аккаунта и получить ответ через неделю?)
Так вот Google релизнули бесплатного конкурента o1 - модель с размышлениями (Gemini 2.0 flash thinking)
Тестим по традиции в AI studio с впн США
Так вот Google релизнули бесплатного конкурента o1 - модель с размышлениями (Gemini 2.0 flash thinking)
Тестим по традиции в AI studio с впн США
Немного слухов👀
Сегодня посдений из 12 дней OpenAI и тут Сэм начал на что-то намекать (хохнул и охнул 3 раза) и в других местах просочилась (случайно?) инфа про релиз следующей генерации мыслящих моделей gpt4-o3 (сразу 3 потому что 2 якобы занята каким-то трейд марком)
В общем последний шанс у Сэма превратить shitmass в shipmass в этом году 🌚
Сегодня посдений из 12 дней OpenAI и тут Сэм начал на что-то намекать (хохнул и охнул 3 раза) и в других местах просочилась (случайно?) инфа про релиз следующей генерации мыслящих моделей gpt4-o3 (сразу 3 потому что 2 якобы занята каким-то трейд марком)
В общем последний шанс у Сэма превратить shitmass в shipmass в этом году 🌚