Мир Робототехники
9.98K subscribers
3.87K photos
740 videos
7 files
1.3K links
Официальный Telegram-канал СМИ «Мир Робототехники»

Робототехника, микроэлектроника, искусственный интеллект - новости будущего здесь и сейчас.

roboticsworld.ru
+7 916 830-02-66
加入频道
Media is too big
VIEW IN TELEGRAM
💡Гуманоидные роботы получили офлайн мозги

Google DeepMind представила офлайн-версию своего ИИ-модели нового поколения — Gemini Robotics On-Device. Это программное решение позволяет управлять физическими роботами полностью автономно, без подключения к интернету или облаку.

В отличие от предыдущих моделей, которые опирались на мощные облачные вычисления, новая Gemini работает прямо на самом роботе. Она сочетает мультимодальное восприятие, понимание естественного языка, способность к обобщению задач и тонкую моторную координацию — всё это в локальном исполнении. Роботы, оснащённые этой моделью, могут выполнять сложные задачи и адаптироваться к новым сценариям всего по 50–100 демонстрациям.

На практике это уже показало отличные результаты: Gemini Robotics On-Device успешно используется на различных платформах, включая гуманоидов Apptronik Apollo и двуруких роботов Franka FR3. Роботы умеют застёгивать молнии, складывать одежду и выполнять множество бытовых и производственных операций с высокой точностью и без задержек.

С точки зрения архитектуры, Gemini Robotics On-Device опирается на возможности генеративного ИИ, а не традиционного обучения с подкреплением. Это даёт системам способность обобщать знания, выводить логику из минимального объёма данных и формировать новые паттерны поведения, основываясь на понимании окружающего мира.

🤖 «МИР Робототехники»

#МирРобототехники #Робототехника #Робот #Роботы #Инновации #Технологии #GeminiAI #GoogleDeepMind
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍5
AR против рекламы: бельгийский инженер создал блокировщик уличных объявлений с помощью очков Snap и ИИ Gemini

Бельгийский разработчик Стейн Спанхове собрал прототип AR-приложения, которое с помощью очков дополненной реальности Snap Spectacles и модели искусственного интеллекта Google Gemini «вычищает» окружающий мир от рекламы в реальном времени.

Приложение не просто распознаёт наружную рекламу, логотипы на упаковках и брендинг на газетных полосах — оно заменяет их на яркие красные квадраты, при этом подписывая, какой бренд скрыт.

В основе работы блокировщика лежит интеграция API Snap для кэширования глубины сцены, что позволяет точно фиксировать объекты в пространстве и сохранять стабильность AR-оверлеев при поворотах головы. Google Gemini, в свою очередь, берёт на себя интеллектуальный анализ визуального контента и определяет, где именно реклама, даже если она спрятана на упаковке хлопьев или в журнальной статье.

Система пока далека от совершенства: задержка в распознавании может достигать пары секунд, а из-за прозрачных дисплеев оригинальное изображение частично просвечивает сквозь красный блок. Угол обзора у очков Snap — всего 46 градусов, так что «очистка» охватывает лишь то, что перед глазами. И всё же даже на этой стадии проект вызвал бурную реакцию.

🤖 «МИР Робототехники»

#МирРобототехники #ИИ #Инновации #ИскусственныйИнтеллект #ARтехнологии #GeminiAI #SnapSpectacles
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔95😁3