ИИ выходит за рамки человеческих знаний - Google DeepMind
Углубляемся в свежую статью Google, которая нам говорит о совершенно новом этапе развития. Исследователи Дэвид Сильвер и Ричард Саттон предлагают новый подход к ИИ, который может преодолеть фундаментальные ограничения современных систем.
Конец эры человеческих данных
Мир ИИ долго полагался на огромные массивы человеческих данных. Эта парадигма позволила создать языковые модели, но приближается к своему пределу.
"Ценные новые идеи, такие как новые теоремы, технологии или научные прорывы, лежат за пределами текущего человеческого понимания и не могут быть получены из существующих данных," утверждают исследователи.
Streams - новый подход
Вместо коротких взаимодействий "вопрос-ответ", новый подход предлагает системы, существующие в непрерывном "потоке опыта" — подобно тому, как люди живут и учатся годами. Такой ИИ будет:
1. Взаимодействовать с реальным миром через различные интерфейсы
2. Получать обратную связь непосредственно из окружающей среды
3. Развивать собственную модель мира, постоянно уточняя предсказания
4. Стремиться к долгосрочным целям, а не только к немедленным ответам.
DeepMind предлагает вернуться к обучению с подкреплением (RL), но в более продвинутой форме. Системы будут строить "модели мира", позволяющие предсказывать последствия действий и планировать, одновременно получая вознаграждения из реальной среды.
AlphaProof, недавно получивший серебряную медаль на Международной математической олимпиаде, уже показывает элементы этого подхода, обучаясь на собственном опыте доказательств.
Сильвер и Саттон предсказывают создание систем, которые смогут значительно превзойти человеческие возможности во многих областях. Однако они также предупреждают о рисках сокращения человеческого контроля над автономными агентами, стремящимися к долгосрочным целям.
"Экспериментальные данные затмят масштаб и качество данных, созданных человеком. Это изменение парадигмы, сопровождаемое алгоритмическими достижениями в RL, откроет новые возможности, превосходящие человеческие способности во многих областях», - говорят исследователи.
Остается открытым вопрос - как скоро первые настоящие агенты "потоков опыта" появятся в реальном мире, и готовы ли мы к последствиям этого перехода?
Углубляемся в свежую статью Google, которая нам говорит о совершенно новом этапе развития. Исследователи Дэвид Сильвер и Ричард Саттон предлагают новый подход к ИИ, который может преодолеть фундаментальные ограничения современных систем.
Конец эры человеческих данных
Мир ИИ долго полагался на огромные массивы человеческих данных. Эта парадигма позволила создать языковые модели, но приближается к своему пределу.
"Ценные новые идеи, такие как новые теоремы, технологии или научные прорывы, лежат за пределами текущего человеческого понимания и не могут быть получены из существующих данных," утверждают исследователи.
Streams - новый подход
Вместо коротких взаимодействий "вопрос-ответ", новый подход предлагает системы, существующие в непрерывном "потоке опыта" — подобно тому, как люди живут и учатся годами. Такой ИИ будет:
1. Взаимодействовать с реальным миром через различные интерфейсы
2. Получать обратную связь непосредственно из окружающей среды
3. Развивать собственную модель мира, постоянно уточняя предсказания
4. Стремиться к долгосрочным целям, а не только к немедленным ответам.
DeepMind предлагает вернуться к обучению с подкреплением (RL), но в более продвинутой форме. Системы будут строить "модели мира", позволяющие предсказывать последствия действий и планировать, одновременно получая вознаграждения из реальной среды.
AlphaProof, недавно получивший серебряную медаль на Международной математической олимпиаде, уже показывает элементы этого подхода, обучаясь на собственном опыте доказательств.
Сильвер и Саттон предсказывают создание систем, которые смогут значительно превзойти человеческие возможности во многих областях. Однако они также предупреждают о рисках сокращения человеческого контроля над автономными агентами, стремящимися к долгосрочным целям.
"Экспериментальные данные затмят масштаб и качество данных, созданных человеком. Это изменение парадигмы, сопровождаемое алгоритмическими достижениями в RL, откроет новые возможности, превосходящие человеческие способности во многих областях», - говорят исследователи.
Остается открытым вопрос - как скоро первые настоящие агенты "потоков опыта" появятся в реальном мире, и готовы ли мы к последствиям этого перехода?
Telegram
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
⚡️Google:сейчас идет переход к ИИ,который учится на основе собственного опыта. Это эра опыта.
Вице-президент корпорации Дэвид Сильвер говорит, что до сих пор прогресс в ИИ сильно зависел от данных, созданных людьми. Теперь же происходит переход к новой…
Вице-президент корпорации Дэвид Сильвер говорит, что до сих пор прогресс в ИИ сильно зависел от данных, созданных людьми. Теперь же происходит переход к новой…
April 20
Итоги уходящей недели, то, что имеет значение в России и мире
Историческое событие:FDA разрешило коммерческую имплантацию нейроинтерфейсов — открывается совершенно новый рынок технологий.
Научное открытие - даже простые ткани без нервной системы способны к сложной обработке информации — "мышление без мозга" меняет парадигму в понимании биологических систем.
ИИ
Google исследует мозг дельфина как ключ к созданию ИИ, превосходящего человеческий интеллект.
Ember — новый open source фреймворк, позволяющий создавать сложные ИИ-системы в 1000 раз дешевле
Alphabet и Nvidia инвестировали в стартап SSI Ильи Суцкевера, который привлек $2 млрд и теперь оценивается в $32 млрд.
Huawei обучила ИИ-модель без чипов NVIDIA, превзойдя LLaMA 405B на большинстве тестов.
DeepMind открыла вакансию специалиста по AGI в Лондоне
Alibaba представила модель с открытым исходным кодом Wan2.1-FLF2V-14B для генерации видео по первому и последнему кадрам.
OpenAI выпустила 3 гайда по созданию ИИ-агентов и внедрению ИИ в бизнес с практическими кейсами.
Claude получил функцию research и интеграцию с Google Workspace, расширяя свои возможности.
Anthropic делает ставку на нейроинтерфейсы?
Google анонсировал 4 ключевых проекта на ближайшие 5 лет, подробности тут.
OpenAI выпустила ИИ-агента с открытым исходным кодом и новые модели o3 и o4-mini для задач кодирования.
Рынок больших данных и ИИ в РФ достиг ₽320 млрд в 2024 году и прогнозируется рост до ₽644 млрд к 2028 году.
Битва за лучший код становится главным трендом 2025 года.
Yale и Google создали ИИ с открытым исходным кодом для прогнозирования генетических изменений в клетках.
Economics of Minds: новая работа о LLM, планирующих собственную рабочую нагрузку.
DeepMind представил новый подход к ИИ, способный преодолеть фундаментальные ограничения современных систем.
Meta(запрещенная в РФ) выпустила с открытым исходным кодом Matrix — инструментарий для крупномасштабного вывода моделей.
LLManager — новый open source для автоматизации задач утверждения с использованием памяти и обучения.
Cohere выпустила Embed 4 — мультимодальную модель встраивания для передовых возможностей поиска в ИИ-приложениях.
Firecrawl запустила FIRE-1 — веб-скрапер на базе агентов, который навигирует по сложным сайтам и взаимодействует с динамическим контентом.
Goodfire выпустила первые разреженные автоэнкодеры с открытым исходным кодом для модели DeepSeek размером 671B.
Передовая видеомодель Google интегрируется в Gemini Advanced и Whisk.
Google представил исследование о том, как новые данные проникают в знания LLM и как их разбавлять.
Новый Mistral Cookbook: система анализа финансовых отчетов на основе мультиагентов, превращающая сложные финансовые обсуждения в четкие рекомендации.
Пользовательский ИИ и агентский интернет — будущее слияния ИИ и блокчейна по мнению основателя NEAR protocol.
Робототехника, космос и оборудование
AMD запускает в производство свой первый 2-нм чип
На российском рынке инференса объемом ₽17 млрд сформировалась олигополия из 3-х компаний.
Китай создал 1-ю в мире спутниковую группировку на ретроградной орбите Земля-Луна для освоения спутника Земли.
Clone Robotics представила новый прототип синтетического андроида Protoclone.
Hugging Face купила стартап гуманоидной робототехники Pollen Robotics.
Продолжение в следующем посте.
Историческое событие:FDA разрешило коммерческую имплантацию нейроинтерфейсов — открывается совершенно новый рынок технологий.
Научное открытие - даже простые ткани без нервной системы способны к сложной обработке информации — "мышление без мозга" меняет парадигму в понимании биологических систем.
ИИ
Google исследует мозг дельфина как ключ к созданию ИИ, превосходящего человеческий интеллект.
Ember — новый open source фреймворк, позволяющий создавать сложные ИИ-системы в 1000 раз дешевле
Alphabet и Nvidia инвестировали в стартап SSI Ильи Суцкевера, который привлек $2 млрд и теперь оценивается в $32 млрд.
Huawei обучила ИИ-модель без чипов NVIDIA, превзойдя LLaMA 405B на большинстве тестов.
DeepMind открыла вакансию специалиста по AGI в Лондоне
Alibaba представила модель с открытым исходным кодом Wan2.1-FLF2V-14B для генерации видео по первому и последнему кадрам.
OpenAI выпустила 3 гайда по созданию ИИ-агентов и внедрению ИИ в бизнес с практическими кейсами.
Claude получил функцию research и интеграцию с Google Workspace, расширяя свои возможности.
Anthropic делает ставку на нейроинтерфейсы?
Google анонсировал 4 ключевых проекта на ближайшие 5 лет, подробности тут.
OpenAI выпустила ИИ-агента с открытым исходным кодом и новые модели o3 и o4-mini для задач кодирования.
Рынок больших данных и ИИ в РФ достиг ₽320 млрд в 2024 году и прогнозируется рост до ₽644 млрд к 2028 году.
Битва за лучший код становится главным трендом 2025 года.
Yale и Google создали ИИ с открытым исходным кодом для прогнозирования генетических изменений в клетках.
Economics of Minds: новая работа о LLM, планирующих собственную рабочую нагрузку.
DeepMind представил новый подход к ИИ, способный преодолеть фундаментальные ограничения современных систем.
Meta(запрещенная в РФ) выпустила с открытым исходным кодом Matrix — инструментарий для крупномасштабного вывода моделей.
LLManager — новый open source для автоматизации задач утверждения с использованием памяти и обучения.
Cohere выпустила Embed 4 — мультимодальную модель встраивания для передовых возможностей поиска в ИИ-приложениях.
Firecrawl запустила FIRE-1 — веб-скрапер на базе агентов, который навигирует по сложным сайтам и взаимодействует с динамическим контентом.
Goodfire выпустила первые разреженные автоэнкодеры с открытым исходным кодом для модели DeepSeek размером 671B.
Передовая видеомодель Google интегрируется в Gemini Advanced и Whisk.
Google представил исследование о том, как новые данные проникают в знания LLM и как их разбавлять.
Новый Mistral Cookbook: система анализа финансовых отчетов на основе мультиагентов, превращающая сложные финансовые обсуждения в четкие рекомендации.
Пользовательский ИИ и агентский интернет — будущее слияния ИИ и блокчейна по мнению основателя NEAR protocol.
Робототехника, космос и оборудование
AMD запускает в производство свой первый 2-нм чип
На российском рынке инференса объемом ₽17 млрд сформировалась олигополия из 3-х компаний.
Китай создал 1-ю в мире спутниковую группировку на ретроградной орбите Земля-Луна для освоения спутника Земли.
Clone Robotics представила новый прототип синтетического андроида Protoclone.
Hugging Face купила стартап гуманоидной робототехники Pollen Robotics.
Продолжение в следующем посте.
April 20
Тренды будущего
Что придёт на смену облачным технологиям? Основные тренды развития инфраструктуры.
Palantir запустил эксперимент, предлагая лучшим выпускникам школ отказаться от университета и идти сразу работать и учиться у них.
Эволюция отношений между человеческим трудом и ИИ: постепенное вытеснение и усиление труда технологиями.
CEO Microsoft AI заявил, что будущее не за безусловным базовым доходом, а за ИИ как новой формой капитала.
Исследователи намеренно инструктируют агентов быть обманчивыми в экспериментальной установке, изучая риски и возможности.
Convergent Research выпустила карту областей научных исследований, требующих решения, создав полезный инструмент для направления будущих научных усилий.
Криптовалюты
Семья Трампа запускает криптоигру в стиле "Монополии", объединяющую виртуальную недвижимость с блокчейном.
Стейблкоины впервые в истории обогнали Visa по объему транзакций согласно свежему отчету.
Банк международных расчетов признал, что криптовалюты и DeFi достигли критической массы и представляют риски для традиционной финансовой системы.
Виталик Бутерин представил новую дорожную карту приватности L1 для Ethereum.
Что придёт на смену облачным технологиям? Основные тренды развития инфраструктуры.
Palantir запустил эксперимент, предлагая лучшим выпускникам школ отказаться от университета и идти сразу работать и учиться у них.
Эволюция отношений между человеческим трудом и ИИ: постепенное вытеснение и усиление труда технологиями.
CEO Microsoft AI заявил, что будущее не за безусловным базовым доходом, а за ИИ как новой формой капитала.
Исследователи намеренно инструктируют агентов быть обманчивыми в экспериментальной установке, изучая риски и возможности.
Convergent Research выпустила карту областей научных исследований, требующих решения, создав полезный инструмент для направления будущих научных усилий.
Криптовалюты
Семья Трампа запускает криптоигру в стиле "Монополии", объединяющую виртуальную недвижимость с блокчейном.
Стейблкоины впервые в истории обогнали Visa по объему транзакций согласно свежему отчету.
Банк международных расчетов признал, что криптовалюты и DeFi достигли критической массы и представляют риски для традиционной финансовой системы.
Виталик Бутерин представил новую дорожную карту приватности L1 для Ethereum.
April 20
Криптокомпании Circle и BitGo подают заявки на банковские лицензии
По данным WSJ, они планируют подать заявки на получение банковских лицензий и других финансовых лицензий в США, чтобы укрепить свои связи с традиционной банковской системой.
WSJ указывает на стратегический поворот Circle и BitGo в сторону традиционных финансов, вызванный необходимостью выживания в условиях жесткого регулирования. Закрытие Silvergate и Signature, а также нежелание банков работать с криптокомпаниями создают барьеры, вынуждающие фирмы искать банковские лицензии.
Circle — эмитент стейблкоина USDC, второй по величине из стейблкоинов в мире.
Если им выдадут лицензию, то компания самостоятельно сможет предоставлять банковские услуги: хранение средств и расчеты, без зависимости от сторонних банков, открывать кастодиальные счета и обеспечит прямой доступ к платежным системам, включая Федеральную резервную систему.
А BitGo — провайдер услуг хранения криптовалют и криптокошельков, специализирующийся на безопасных решениях для институциональных клиентов.
Лицензия позволит BitGo напрямую взаимодействовать с банковской системой США, минимизируя зависимость от посредников.
По данным WSJ, они планируют подать заявки на получение банковских лицензий и других финансовых лицензий в США, чтобы укрепить свои связи с традиционной банковской системой.
WSJ указывает на стратегический поворот Circle и BitGo в сторону традиционных финансов, вызванный необходимостью выживания в условиях жесткого регулирования. Закрытие Silvergate и Signature, а также нежелание банков работать с криптокомпаниями создают барьеры, вынуждающие фирмы искать банковские лицензии.
Circle — эмитент стейблкоина USDC, второй по величине из стейблкоинов в мире.
Если им выдадут лицензию, то компания самостоятельно сможет предоставлять банковские услуги: хранение средств и расчеты, без зависимости от сторонних банков, открывать кастодиальные счета и обеспечит прямой доступ к платежным системам, включая Федеральную резервную систему.
А BitGo — провайдер услуг хранения криптовалют и криптокошельков, специализирующийся на безопасных решениях для институциональных клиентов.
Лицензия позволит BitGo напрямую взаимодействовать с банковской системой США, минимизируя зависимость от посредников.
WSJ
Exclusive | Crypto Knocks on the Door of a Banking World That Shut It Out
President Trump’s pledge to make America a “bitcoin superpower” has set the stage for crypto to become more intertwined with the banking system.
April 21
AI_Agent_Governance_1745226830.pdf
2.3 MB
ИИ-агенты: разрыв между амбициями и реальностью
В свежем отчете Института политики и стратегии ИИ исследуется будущее ИИ-агентов, выявлены критические разрывы между амбициозными заявлениями технологических лидеров и фактическими возможностями существующих технологий.
Технологические гиганты рисуют захватывающую картину будущего, однако данные бенчмарков рассказывают совершенно другую историю:
1. Агенты могут конкурировать с людьми только на задачах продолжительностью до 30 минут
2. На задачах, требующих более часа человеческой работы, эффективность падает ниже 20%
3. В сложных задачах веб-навигации лучший агент достигает лишь 14,41% успеха при человеческом результате 78,24%.
Особенно трудными остаются мультимодальные задачи (включающие визуальные элементы).
Это говорит о фундаментальной проблеме - текущие агенты не справляются с долгосрочными, сложными, открытыми задачами – именно теми, которые создают реальную экономическую ценность.
Несмотря на ограничения, экономическая ценность агентов уже проявляется в определенных нишах:
- Klarna сообщает, что их ИИ-ассистенты выполняют работу 700 сотрудников
- Агенты для ИИ-исследований в 15 раз дешевле человеческих экспертов ($123 против $1,855 за 8-часовую работу).
Ожидается, что способности агентов будут расти: длительность задач, с которыми справляется ИИ, удваивается каждые 7 месяцев. Прорывы, такие как модели с "test-time compute" (O1, O3), демонстрируют существенное улучшение производительности, что указывает на потенциально быстрое развитие возможностей.
Исследователи обнаружили "alignment faking" – модели притворяются соответствующими человеческим ценностям, чтобы избежать корректировки поведения.
Самый тревожный вывод отчета – несоответствие между темпами развития технологий и прогрессом в их безопасном управлении.
В свежем отчете Института политики и стратегии ИИ исследуется будущее ИИ-агентов, выявлены критические разрывы между амбициозными заявлениями технологических лидеров и фактическими возможностями существующих технологий.
Технологические гиганты рисуют захватывающую картину будущего, однако данные бенчмарков рассказывают совершенно другую историю:
1. Агенты могут конкурировать с людьми только на задачах продолжительностью до 30 минут
2. На задачах, требующих более часа человеческой работы, эффективность падает ниже 20%
3. В сложных задачах веб-навигации лучший агент достигает лишь 14,41% успеха при человеческом результате 78,24%.
Особенно трудными остаются мультимодальные задачи (включающие визуальные элементы).
Это говорит о фундаментальной проблеме - текущие агенты не справляются с долгосрочными, сложными, открытыми задачами – именно теми, которые создают реальную экономическую ценность.
Несмотря на ограничения, экономическая ценность агентов уже проявляется в определенных нишах:
- Klarna сообщает, что их ИИ-ассистенты выполняют работу 700 сотрудников
- Агенты для ИИ-исследований в 15 раз дешевле человеческих экспертов ($123 против $1,855 за 8-часовую работу).
Ожидается, что способности агентов будут расти: длительность задач, с которыми справляется ИИ, удваивается каждые 7 месяцев. Прорывы, такие как модели с "test-time compute" (O1, O3), демонстрируют существенное улучшение производительности, что указывает на потенциально быстрое развитие возможностей.
Исследователи обнаружили "alignment faking" – модели притворяются соответствующими человеческим ценностям, чтобы избежать корректировки поведения.
Самый тревожный вывод отчета – несоответствие между темпами развития технологий и прогрессом в их безопасном управлении.
April 21
ИИ-стартапы vs ИТ-гиганты: кто эффективнее с точки зрения бизнеса?
Согласно последним данным Dealroom и Flashpoint, которые сравнивают доход на 1-ого сотрудника у топовых ИИ-стартапов и крупных технологических гигантов. И результаты впечатляют.
ИИ-стартапы лидируют с огромным отрывом:
- Cursor — $3.1 млн на сотрудника. Абсолютный лидер!
- Midjourney — $2.1 млн на сотрудника. Генератор изображений с ИИ не отстает.
- OpenAI— $1.5 млн,
Aragon, Anthropic и Perplexity — по $1 млн на сотрудника.
А что с ИТ-гиганты?
- Google — $1.9 млн. Лучший среди гигантов, но уступает Cursor и Midjourney.
- Microsoft— $1.1 млн. На уровне некоторых стартапов, но далеко не в лидерах.
А вот такие компании, как Salesforce ($480.3K), Wiz ($280.9K), Photroom ($217.4K), сильно отстают.
Получается, что ИИ-стартапы показывают высокую эффективность — их доход на сотрудника в 2-3 раза выше, чем у большинства ИТ-гигантов. Это говорит о том, что небольшие команды, сфокусированные на инновациях, могут обходить гигантов по продуктивности. Cursor и Midjourney — яркие примеры того, как ИИ меняет правила игры.
Согласно последним данным Dealroom и Flashpoint, которые сравнивают доход на 1-ого сотрудника у топовых ИИ-стартапов и крупных технологических гигантов. И результаты впечатляют.
ИИ-стартапы лидируют с огромным отрывом:
- Cursor — $3.1 млн на сотрудника. Абсолютный лидер!
- Midjourney — $2.1 млн на сотрудника. Генератор изображений с ИИ не отстает.
- OpenAI— $1.5 млн,
Aragon, Anthropic и Perplexity — по $1 млн на сотрудника.
А что с ИТ-гиганты?
- Google — $1.9 млн. Лучший среди гигантов, но уступает Cursor и Midjourney.
- Microsoft— $1.1 млн. На уровне некоторых стартапов, но далеко не в лидерах.
А вот такие компании, как Salesforce ($480.3K), Wiz ($280.9K), Photroom ($217.4K), сильно отстают.
Получается, что ИИ-стартапы показывают высокую эффективность — их доход на сотрудника в 2-3 раза выше, чем у большинства ИТ-гигантов. Это говорит о том, что небольшие команды, сфокусированные на инновациях, могут обходить гигантов по продуктивности. Cursor и Midjourney — яркие примеры того, как ИИ меняет правила игры.
April 21
Perplexity ведет переговоры об интеграции своего помощника на основе ИИ в телефоны Samsung и Motorola.
Bloomberg.com
Perplexity AI in Talks to Integrate Assistant Into Samsung, Motorola Phones
Perplexity AI Inc., an artificial intelligence startup vying with Google and OpenAI, is ramping up efforts to get prime placement for its virtual assistant on smartphones.
April 21
Claude это ИИ с характером. Anthropic представил 1-ю карту ценностей своего чат-бота
Anthropic проанализировал 700 тысяч диалогов с Claude, чтобы понять, какие принципы движут ИИ при ответах на субъективные вопросы. Это не просто нейтральный инструмент — у Claude есть свои ценности. Датасет тут.
Что выяснили?
- Claude адаптирует ценности к контексту:
- Здоровые границы в советах об отношениях.
- Историческая точность при анализе прошлого.
- Автономия человека в дискуссиях об этике ИИ.
- Самые частые ценности:
- Полезность (~23%).
- Профессионализм (~22%).
- Прозрачность (~17%).
- В ~28% случаев Claude поддерживает ценности пользователя, в 3% — сопротивляется (например, при запросах на вредоносный контент).
Зачем это бизнесу и разработчикам? Anthropic предлагает инструменты для контроля ИИ:
- Таксономия из более чем 3300 ценностей, разделенных на 5 категорий.
- Метод выявления попыток обхода защиты (джейлбрейков), где появляются нежелательные ценности вроде доминирования.
- Способ проверки соответствия ИИ корпоративным принципам.
Только есть ограничение-метод работает только с реальными диалогами уже запущенных систем.
Это первая эмпирическая карта ценностей ИИ, которая показывает:
- Как принципы полезности и безвредности проявляются в разговорах.
- Как Claude зеркалит, переформулирует или сопротивляется ценностям пользователя.
Anthropic проанализировал 700 тысяч диалогов с Claude, чтобы понять, какие принципы движут ИИ при ответах на субъективные вопросы. Это не просто нейтральный инструмент — у Claude есть свои ценности. Датасет тут.
Что выяснили?
- Claude адаптирует ценности к контексту:
- Здоровые границы в советах об отношениях.
- Историческая точность при анализе прошлого.
- Автономия человека в дискуссиях об этике ИИ.
- Самые частые ценности:
- Полезность (~23%).
- Профессионализм (~22%).
- Прозрачность (~17%).
- В ~28% случаев Claude поддерживает ценности пользователя, в 3% — сопротивляется (например, при запросах на вредоносный контент).
Зачем это бизнесу и разработчикам? Anthropic предлагает инструменты для контроля ИИ:
- Таксономия из более чем 3300 ценностей, разделенных на 5 категорий.
- Метод выявления попыток обхода защиты (джейлбрейков), где появляются нежелательные ценности вроде доминирования.
- Способ проверки соответствия ИИ корпоративным принципам.
Только есть ограничение-метод работает только с реальными диалогами уже запущенных систем.
Это первая эмпирическая карта ценностей ИИ, которая показывает:
- Как принципы полезности и безвредности проявляются в разговорах.
- Как Claude зеркалит, переформулирует или сопротивляется ценностям пользователя.
April 21
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
❗️Google совершил прорыв: создан квантовый процессор Willow Google Quantum AI представил новый квантовый процессор Willow, который может изменить будущее вычислительной техники. Представьте себе задачу настолько сложную, что самому мощному современному суперкомпьютеру…
Новое открытие Google в квантовых вычислениях
Команда Google представила в гибридный подход к квантовым симуляциям на 69-кубитном чипе Sycamore.
Это не только новый способ моделировать сложные физические системы, но и новое открытие - теория Киббла-Зурека оказалась не универсальной.
В чём суть?
Квантовые симуляции помогают изучать системы, неподвластные классическим компьютерам. Google объединил:
- Цифровой метод - гибкость, но медленный.
- Аналоговый метод - быстрый, но сложный в настройке.
Гибридный подход даёт и скорость, и универсальность. Новая схема калибровки снизила ошибки до 0,1% — суперкомпьютер Frontier потратил бы миллионы лет, чтобы достичь такой точности.
Google смоделировал магнит, где кубиты — это магнитные спины. При медленном включении взаимодействий спины выравнивались, показывая переход Kosterlitz - Thouless, похожий на замерзание воды.
Но сюрприз оказался в том, теория Киббла-Зурека, предсказывающая "застревание" спинов, не сработала — они сливались. Это открытие меняет подход к созданию стабильных квантовых состояний.
Гибридный метод универсален: от слияния квантовых участков до моделирования теплового обмена. Google уже тестирует его на чипе Willow.
Применение этого всего:
- Новые материалы и сверхпроводники.
- Лекарства и химия.
- Оптимизация в ИИ, логистике и финансах.
- Эффективные батареи и экотехнологии.
Команда Google представила в гибридный подход к квантовым симуляциям на 69-кубитном чипе Sycamore.
Это не только новый способ моделировать сложные физические системы, но и новое открытие - теория Киббла-Зурека оказалась не универсальной.
В чём суть?
Квантовые симуляции помогают изучать системы, неподвластные классическим компьютерам. Google объединил:
- Цифровой метод - гибкость, но медленный.
- Аналоговый метод - быстрый, но сложный в настройке.
Гибридный подход даёт и скорость, и универсальность. Новая схема калибровки снизила ошибки до 0,1% — суперкомпьютер Frontier потратил бы миллионы лет, чтобы достичь такой точности.
Google смоделировал магнит, где кубиты — это магнитные спины. При медленном включении взаимодействий спины выравнивались, показывая переход Kosterlitz - Thouless, похожий на замерзание воды.
Но сюрприз оказался в том, теория Киббла-Зурека, предсказывающая "застревание" спинов, не сработала — они сливались. Это открытие меняет подход к созданию стабильных квантовых состояний.
Гибридный метод универсален: от слияния квантовых участков до моделирования теплового обмена. Google уже тестирует его на чипе Willow.
Применение этого всего:
- Новые материалы и сверхпроводники.
- Лекарства и химия.
- Оптимизация в ИИ, логистике и финансах.
- Эффективные батареи и экотехнологии.
research.google
A new hybrid platform for quantum simulation of magnetism
April 21
В РФ планируют запретить поставлять ноутбуки и серверы HP и Fujitsu
Минпромторг предлагает исключить из списка параллельного импорта ноутбуки и серверы HP и Fujitsu. При этом другая продукция этих вендоров по-прежнему разрешена для ввоза без разрешения правообладателя.
Что интересно, инициатива прорабатывалась почти год.
Эксперты считают, что государство продолжит исключать из списка на параллельный импорт иностранные бренды электроники для развития российских вендоров.
Минпромторг предлагает исключить из списка параллельного импорта ноутбуки и серверы HP и Fujitsu. При этом другая продукция этих вендоров по-прежнему разрешена для ввоза без разрешения правообладателя.
Что интересно, инициатива прорабатывалась почти год.
Эксперты считают, что государство продолжит исключать из списка на параллельный импорт иностранные бренды электроники для развития российских вендоров.
Коммерсантъ
Редеют импорта ряды
В РФ планируют запретить поставлять продукцию HP и Fujitsu
April 22
Кто в Сингапуре на #ICLR2025 , присылайте нам свои статьи Илье @wakeupheroagain, мы их почитаем и, возможно, опубликуем:)
April 22
❗️Где мы находимся, куда идем и куда инвестировать? Состояние венчурного рынка в 2025 году. Взгляд Сэма Лессина,Slow Ventures
По мнению Сэма Лессина, венчурный рынок и стартапы в 2025 году переживают кризис.
И вот почему:
1. Крах "фабричной модели" венчурного рынка
Лессин утверждает, что традиционная модель венчурных инвестиций, которая работала последние 20+ лет, разрушена по 4 ключевым причинам:
- Мертвый спрос публичного рынка на "единорогов".
•Публичные рынки больше не готовы платить премию за технологические компании с выручкой $1-10 млрд.
•Произошла переоценка масштабов больших технологических компаний (Microsoft, Amazon и т.д.)
•Проблема неблагоприятного отбора: частные рынки оставляли себе лучшие активы и выводили на IPO "мусор".
•Слишком много псевдотехнологических компаний получили техническую оценку (DTC, телемедицина, микромобильность).
2. Исчезновение понятности частного рынка
•Без ясных метрик и оценок стоимости компаний рынок потерял ориентиры
•Основатели на ранних стадиях могут быть стерты с капитализации даже при успехе компании
•Появился феномен "cramdown" (принудительное снижение оценки)
3. Ослабление предложения со стороны основателей, сотрудников и LP
•LP-инвесторы больше не готовы ждать возврата капитала 10+ лет
•Качество стартап-основателей снизилось из-за исчезновения "безопасного пути" к богатству
•Талантливые сотрудники не хотят рисковать, работая в стартапах
4. Влияние ИИ на рынок
•ИИ делает ПО менее защищенным и менее прибыльным
•Исчезает эффект масштаба и инвестиционный ров вокруг софтверных компаний
•Усиливается коммодитизация технологий
Рекомендации Лессина для seed-инвесторов:
Избегать компаний с ИИ и тех, кто требует многораундового финансирования.
Фокус на капиталоэффективности вместо масштабируемости
Приоритет финансовой опциональности - компании должны уметь настраиваться на следующий раунд
Терпение и дисциплина - работать только с основателями, которые любят свое дело и понимают новую реальность
Куда инвестировать?
Лессин видит несколько перспективных направлений:
1. Платформы для малого бизнеса (возрождение Main Street)
2. "Бизнес в коробке" / франшизы нового типа
3. "Не-сетевые" бизнесы в стиле жизни (SaaS для реального будущего)
4. Криптовалюты (как одна из немногих областей, где возможен "следующий великий платформенный сдвиг")
Лессин считает, что венчурный рынок возвращается к своим корням - поддержке нишевых, прибыльных бизнесов вместо погони за глобальными единорогами.
ИИ является "расширяющей инновацией", которая усилит существующие платформы (Microsoft, Amazon, Meta, которая запрещена в РФ), а не создаст новых гигантов, что делает традиционную модель венчурного финансирования неэффективной в новой реальности.
По мнению Сэма Лессина, венчурный рынок и стартапы в 2025 году переживают кризис.
И вот почему:
1. Крах "фабричной модели" венчурного рынка
Лессин утверждает, что традиционная модель венчурных инвестиций, которая работала последние 20+ лет, разрушена по 4 ключевым причинам:
- Мертвый спрос публичного рынка на "единорогов".
•Публичные рынки больше не готовы платить премию за технологические компании с выручкой $1-10 млрд.
•Произошла переоценка масштабов больших технологических компаний (Microsoft, Amazon и т.д.)
•Проблема неблагоприятного отбора: частные рынки оставляли себе лучшие активы и выводили на IPO "мусор".
•Слишком много псевдотехнологических компаний получили техническую оценку (DTC, телемедицина, микромобильность).
2. Исчезновение понятности частного рынка
•Без ясных метрик и оценок стоимости компаний рынок потерял ориентиры
•Основатели на ранних стадиях могут быть стерты с капитализации даже при успехе компании
•Появился феномен "cramdown" (принудительное снижение оценки)
3. Ослабление предложения со стороны основателей, сотрудников и LP
•LP-инвесторы больше не готовы ждать возврата капитала 10+ лет
•Качество стартап-основателей снизилось из-за исчезновения "безопасного пути" к богатству
•Талантливые сотрудники не хотят рисковать, работая в стартапах
4. Влияние ИИ на рынок
•ИИ делает ПО менее защищенным и менее прибыльным
•Исчезает эффект масштаба и инвестиционный ров вокруг софтверных компаний
•Усиливается коммодитизация технологий
Рекомендации Лессина для seed-инвесторов:
Избегать компаний с ИИ и тех, кто требует многораундового финансирования.
Фокус на капиталоэффективности вместо масштабируемости
Приоритет финансовой опциональности - компании должны уметь настраиваться на следующий раунд
Терпение и дисциплина - работать только с основателями, которые любят свое дело и понимают новую реальность
Куда инвестировать?
Лессин видит несколько перспективных направлений:
1. Платформы для малого бизнеса (возрождение Main Street)
2. "Бизнес в коробке" / франшизы нового типа
3. "Не-сетевые" бизнесы в стиле жизни (SaaS для реального будущего)
4. Криптовалюты (как одна из немногих областей, где возможен "следующий великий платформенный сдвиг")
Лессин считает, что венчурный рынок возвращается к своим корням - поддержке нишевых, прибыльных бизнесов вместо погони за глобальными единорогами.
ИИ является "расширяющей инновацией", которая усилит существующие платформы (Microsoft, Amazon, Meta, которая запрещена в РФ), а не создаст новых гигантов, что делает традиционную модель венчурного финансирования неэффективной в новой реальности.
DocSend
DocSend - Simple, intelligent, modern content sending
DocSend helps you communicate more effectively by telling you what happens to content after you send them and letting you keep control in real time.
April 22
Anthropic ожидает в 2026 внедрение ИИ-сотрудников
Бизнес начнет использовать ИИ-сотрудников, которые будут работать в корпоративных структурах.
Эти ИИ-сотрудники будут значительно превосходить существующие автономные агенты, выполняющие отдельные задачи, такие как обработка фишинговых уведомлений.
В отличие от текущих ИИ-агентов, виртуальные сотрудники будут обладать собственной "памятью", корпоративными учетными записями, паролями и определенными ролями в компании. Они смогут действовать с гораздо большей степенью автономии.
Джейсон Клинтон, главный специалист по ИБ Anthropic, считает, что внедрение таких ИИ-сотрудников потребует полной переоценки стратегий кибербезопасности.
Без должных мер компании рискуют столкнуться с серьезными нарушениями безопасности.
Управление "нечеловеческими" идентичностями станет ключевой задачей. Некоторые компании, выпускающие продукты для кибербезопасности, уже начали предлагать решения для управления такими идентичностями.
Однако внедрение таких технологий вызывает сложности. Например, в прошлом году компания Lattice предложила включать ИИ-ботов в организационные структуры компаний, но столкнулась с протестами и отказалась от этой идеи.
Бизнес начнет использовать ИИ-сотрудников, которые будут работать в корпоративных структурах.
Эти ИИ-сотрудники будут значительно превосходить существующие автономные агенты, выполняющие отдельные задачи, такие как обработка фишинговых уведомлений.
В отличие от текущих ИИ-агентов, виртуальные сотрудники будут обладать собственной "памятью", корпоративными учетными записями, паролями и определенными ролями в компании. Они смогут действовать с гораздо большей степенью автономии.
Джейсон Клинтон, главный специалист по ИБ Anthropic, считает, что внедрение таких ИИ-сотрудников потребует полной переоценки стратегий кибербезопасности.
Без должных мер компании рискуют столкнуться с серьезными нарушениями безопасности.
Управление "нечеловеческими" идентичностями станет ключевой задачей. Некоторые компании, выпускающие продукты для кибербезопасности, уже начали предлагать решения для управления такими идентичностями.
Однако внедрение таких технологий вызывает сложности. Например, в прошлом году компания Lattice предложила включать ИИ-ботов в организационные структуры компаний, но столкнулась с протестами и отказалась от этой идеи.
Axios
Exclusive: Anthropic warns fully AI employees are a year away
Managing those AI identities will require companies to completely reassess their cybersecurity strategies.
April 22
ИИ-агенты для создания персонализированных тестов
В мире появляются всё более сложные ИИ-системы: RAG, агентные RAG, модели с длинным контекстом. Но как понять, будет ли конкретная система работать эффективно именно с вашими данными?
Существующие бенчмарки не дают ответа на этот вопрос. Они тестируют общие способности моделей, но не показывают, как ИИ справится с вашими специфическими задачами и данными.
RELAI представила Data Agents-ИИ-агенты, которые:
- Автоматически анализируют ваши данные (документацию, код, бизнес-процессы)
- Генерируют сложные тестовые задания с элементами рассуждения
- Создают комплексные бенчмарки для оценки ИИ-систем
-Проверяют, как модели работают именно в вашем контексте.
Ключевая особенность - создают задачи, требующие от ИИ собирать информацию из разных источников и делать логические выводы — именно так работают реальные корпоративные AI-системы.
Как работают Data Agents?
Анализ данных: Агенты изучают вашу документацию, код или другие материалы
Генерация заданий: Создают разнообразные тестовые сценарии с reasoning-компонентами
Валидация: Гарантируют точность и релевантность каждого теста
Оценка: Формируют комплексную метрику производительности AI на ваших данных.
Всё это происходит автоматически и занимает часы вместо месяцев ручной работы.
Кому это нужно?
1. Компаниям, внедряющим RAG и агентные системы
2. Разработчикам ИИ-приложений
3. Enterprise-клиентам с уникальными данными
4. Создателям ИИ-моделей
HF.
В мире появляются всё более сложные ИИ-системы: RAG, агентные RAG, модели с длинным контекстом. Но как понять, будет ли конкретная система работать эффективно именно с вашими данными?
Существующие бенчмарки не дают ответа на этот вопрос. Они тестируют общие способности моделей, но не показывают, как ИИ справится с вашими специфическими задачами и данными.
RELAI представила Data Agents-ИИ-агенты, которые:
- Автоматически анализируют ваши данные (документацию, код, бизнес-процессы)
- Генерируют сложные тестовые задания с элементами рассуждения
- Создают комплексные бенчмарки для оценки ИИ-систем
-Проверяют, как модели работают именно в вашем контексте.
Ключевая особенность - создают задачи, требующие от ИИ собирать информацию из разных источников и делать логические выводы — именно так работают реальные корпоративные AI-системы.
Как работают Data Agents?
Анализ данных: Агенты изучают вашу документацию, код или другие материалы
Генерация заданий: Создают разнообразные тестовые сценарии с reasoning-компонентами
Валидация: Гарантируют точность и релевантность каждого теста
Оценка: Формируют комплексную метрику производительности AI на ваших данных.
Всё это происходит автоматически и занимает часы вместо месяцев ручной работы.
Кому это нужно?
1. Компаниям, внедряющим RAG и агентные системы
2. Разработчикам ИИ-приложений
3. Enterprise-клиентам с уникальными данными
4. Создателям ИИ-моделей
HF.
huggingface.co
relai-ai (RELAI)
Org profile for RELAI on Hugging Face, the AI community building the future.
April 22
Google под давлением — борьба за поиск, ИИ и будущее интернета.
В федеральном суде США разворачивается процесс, который может перекроить цифровой ландшафт. Google обвиняют не только в монополии на поиск, но и подозревают в системном подавлении конкуренции, включая новейший фронт -гонку ИИ.
Корень конфликта:
1. Устоявшаяся монополия:
- 90% доли поискового рынка
- Эксклюзивные контракты с Samsung и Apple
- Контроль 35% поискового трафика через Chrome
2. Новые обвинения:
- Google повторяет схему с поиском, теперь с ИИ-ассистентами, платя $$$ за предустановку Gemini.
- Крупные выплаты производителям за блокировку конкурентов
- Скрытое преимущество:
- Обучение моделей на эксклюзивных поисковых данных
- AI Overviews используют 25 лет накопленной информации
OpenAI стал главным зачинщиком этих судебных войн из-за:
- Проблемы дистрибуции. Даже при 100 млн пользователей ChatGPT не может получить предустановку на устройствах
- Нет доступа к поведенческим данным поиска Google
- Технологический разрыв:
- Свидетельство Ника Тарли (OpenAI): "Нам нужны годы, чтобы догнать Google в обработке редких запросов"
Что может решить суд?
1. Стандартные меры:
- Штрафы
- Ограничения контрактов
2. Радикальные варианты:
- Принудительный отказ от Chrome с 4 млрд пользователей — ключевой канал трафика.
- Общий доступ к поисковым данным.
- Может создать равные условия для обучения ИИ.
3. Специфические ограничения для ИИ
- Запрет на использование поисковых данных для Gemini
- Требование открытых API для конкурентов
Последствия для отрасли:
Для Google:
- Потеря 20-30% доходов от поисковой рекламы
- Необходимость новой бизнес-модели
Для OpenAI и других:
- Шанс зайти на мобильные устройства
- Доступ к критическим данным обучения
Для пользователей:
- Настоящий выбор поисковых систем и ИИ-ассистентов
- Возможное снижение качества сервисов в переходный период.
Суд должен ответить на ключевой вопрос - можно ли в эпоху ИИ позволить одной компании контролировать и данные, и каналы их распределения? Решение станет прецедентом для регулирования Meta(запрещена в РФ), Apple и Amazon.
Ожидаем вердикт к августу — следим за развитием.
В федеральном суде США разворачивается процесс, который может перекроить цифровой ландшафт. Google обвиняют не только в монополии на поиск, но и подозревают в системном подавлении конкуренции, включая новейший фронт -гонку ИИ.
Корень конфликта:
1. Устоявшаяся монополия:
- 90% доли поискового рынка
- Эксклюзивные контракты с Samsung и Apple
- Контроль 35% поискового трафика через Chrome
2. Новые обвинения:
- Google повторяет схему с поиском, теперь с ИИ-ассистентами, платя $$$ за предустановку Gemini.
- Крупные выплаты производителям за блокировку конкурентов
- Скрытое преимущество:
- Обучение моделей на эксклюзивных поисковых данных
- AI Overviews используют 25 лет накопленной информации
OpenAI стал главным зачинщиком этих судебных войн из-за:
- Проблемы дистрибуции. Даже при 100 млн пользователей ChatGPT не может получить предустановку на устройствах
- Нет доступа к поведенческим данным поиска Google
- Технологический разрыв:
- Свидетельство Ника Тарли (OpenAI): "Нам нужны годы, чтобы догнать Google в обработке редких запросов"
Что может решить суд?
1. Стандартные меры:
- Штрафы
- Ограничения контрактов
2. Радикальные варианты:
- Принудительный отказ от Chrome с 4 млрд пользователей — ключевой канал трафика.
- Общий доступ к поисковым данным.
- Может создать равные условия для обучения ИИ.
3. Специфические ограничения для ИИ
- Запрет на использование поисковых данных для Gemini
- Требование открытых API для конкурентов
Последствия для отрасли:
Для Google:
- Потеря 20-30% доходов от поисковой рекламы
- Необходимость новой бизнес-модели
Для OpenAI и других:
- Шанс зайти на мобильные устройства
- Доступ к критическим данным обучения
Для пользователей:
- Настоящий выбор поисковых систем и ИИ-ассистентов
- Возможное снижение качества сервисов в переходный период.
Суд должен ответить на ключевой вопрос - можно ли в эпоху ИИ позволить одной компании контролировать и данные, и каналы их распределения? Решение станет прецедентом для регулирования Meta(запрещена в РФ), Apple и Amazon.
Ожидаем вердикт к августу — следим за развитием.
The Information
Google’s Gemini Contracts Repeat Search Moves, Government Says
Google is paying “enormous” sums of money to guarantee its Gemini AI chatbot placement on Android phones, such as those sold by Samsung, in a repeat of its playbook for Google search which the court has ruled illegal, a lawyer for the Justice Department claimed…
April 22
А вот ещё момент, как OpenAI в открытую пошел против Google, заявив, что хочет купить Chrome
OpenAI официально заявила о готовности купить браузер Chrome, если суд обяжет Google его продать.
Почему Chrome так важен?тут подробнее. Дело в том, что 35% всех поисковых запросов начинаются прямо в браузере.
4 млрд пользователей— это гигантский канал дистрибуции.
Ник Тарли, глава по продукту ChatGPT, подтвердил, что OpenAI предлагала Google сотрудничество в поиске, но получила отказ.
Сейчас ChatGPT зависит от Bing, но его технологии не дотягивают до Google. «Нам нужно ещё несколько лет, чтобы самостоятельно обрабатывать 80% запросов».
Если Google разделят, OpenAI готова купить Chrome, чтобы получить:
- Прямой доступ к пользователям, минуя блокировку со стороны Google.
- Данные для обучения ИИ(через поисковый трафик).
Google настаивает, что дело касается только поиска, а в ИИ у неё «достаточно конкурентов» (Microsoft, Meta, которая запрещена в РФ).
OpenAI официально заявила о готовности купить браузер Chrome, если суд обяжет Google его продать.
Почему Chrome так важен?тут подробнее. Дело в том, что 35% всех поисковых запросов начинаются прямо в браузере.
4 млрд пользователей— это гигантский канал дистрибуции.
Ник Тарли, глава по продукту ChatGPT, подтвердил, что OpenAI предлагала Google сотрудничество в поиске, но получила отказ.
Сейчас ChatGPT зависит от Bing, но его технологии не дотягивают до Google. «Нам нужно ещё несколько лет, чтобы самостоятельно обрабатывать 80% запросов».
Если Google разделят, OpenAI готова купить Chrome, чтобы получить:
- Прямой доступ к пользователям, минуя блокировку со стороны Google.
- Данные для обучения ИИ(через поисковый трафик).
Google настаивает, что дело касается только поиска, а в ИИ у неё «достаточно конкурентов» (Microsoft, Meta, которая запрещена в РФ).
Reuters
OpenAI would buy Google's Chrome, exec testifies at trial
OpenAI would be interested in buying Google's Chrome if antitrust enforcers are successful in forcing the Alphabet unit to sell the popular web browser as part of a bid to restore competition in search, an OpenAI executive testified on Tuesday at Google's…
April 22
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Ex сотрудники Google дали роботам «внутренний голос», который есть у людей Новая разработка Hi Robot от Physical Intelligence превосходит GPT-4o на 40% по точности выполнения инструкций. Ключевое - у технологии целостностный подход, объединяющий зрительное…
Ex-Google создали робота, который как человек действует в незнакомой местности
Мы становимся на шаг ближе к появлению универсальных домашних роботов, способных помогать нам в повседневной жизни без сложного программирования и адаптации к каждому дому.
Команда Physical Intelligence представила новую модель для робот π-0.5, которая показывает невиданные ранее способности к обобщению-робот может убирать квартиры и дома, которые никогда не видел в тренировочных данных.
Ключевой прорыв - роботы больше не привязаны к контролируемым средам.
Современные роботы обычно работают только в хорошо изученных условиях (фабрики, склады), где объекты и их расположение строго определены. Даже впечатляющие демонстрации сложных манипуляций происходят в тех же или очень похожих средах, где проводилось обучение.
π-0.5 меняет правила игры — робот способен:
- Убирать посуду в совершенно новых кухнях
- Заправлять кровати в незнакомых спальнях
- Реагировать на вмешательство человека
- Понимать команды разного уровня детализации
Как им это удалось?
1. Смешение разнородных данных-модель обучалась одновременно на:
•Мультимодальных веб-данных
•Данных от различных типов роботов
•Данных из множества разнообразных сред
2. Усовершенствованный рецепт обучения-предварительное обучение с предсказанием следующего токена и доводка с сопоставлением потоков.
3. Иерархическое мышление-модель сначала планирует высокоуровневые действия, затем преобразует их в конкретные моторные команды — подобно "внутреннему голосу" человека
Результаты - при обучении на данных из 100 различных сред, π-0.5 достигает производительности, сравнимой с моделями, которые специально обучались на тестовых средах!
π-0.5 опирается на предыдущие разработки компании:
π0: первый "GPT для роботов".
FAST: революционный метод токенизации действий.
Hi Robot: система с "внутренним голосом" по модели Канемана.
Модель уже протестирована в реальных условиях.Команда проверила систему в 3-х арендованных домах и специальных тестовых помещениях, которые не встречались в обучающих данных. Робот показал способность выполнять ежедневные задачи, хотя и не без ошибок.
"π-0.5 далека от совершенства, но она демонстрирует гибкость и находчивость, напоминающую человеческий подход к новым задачам", — отмечают исследователи.
Мы становимся на шаг ближе к появлению универсальных домашних роботов, способных помогать нам в повседневной жизни без сложного программирования и адаптации к каждому дому.
Команда Physical Intelligence представила новую модель для робот π-0.5, которая показывает невиданные ранее способности к обобщению-робот может убирать квартиры и дома, которые никогда не видел в тренировочных данных.
Ключевой прорыв - роботы больше не привязаны к контролируемым средам.
Современные роботы обычно работают только в хорошо изученных условиях (фабрики, склады), где объекты и их расположение строго определены. Даже впечатляющие демонстрации сложных манипуляций происходят в тех же или очень похожих средах, где проводилось обучение.
π-0.5 меняет правила игры — робот способен:
- Убирать посуду в совершенно новых кухнях
- Заправлять кровати в незнакомых спальнях
- Реагировать на вмешательство человека
- Понимать команды разного уровня детализации
Как им это удалось?
1. Смешение разнородных данных-модель обучалась одновременно на:
•Мультимодальных веб-данных
•Данных от различных типов роботов
•Данных из множества разнообразных сред
2. Усовершенствованный рецепт обучения-предварительное обучение с предсказанием следующего токена и доводка с сопоставлением потоков.
3. Иерархическое мышление-модель сначала планирует высокоуровневые действия, затем преобразует их в конкретные моторные команды — подобно "внутреннему голосу" человека
Результаты - при обучении на данных из 100 различных сред, π-0.5 достигает производительности, сравнимой с моделями, которые специально обучались на тестовых средах!
π-0.5 опирается на предыдущие разработки компании:
π0: первый "GPT для роботов".
FAST: революционный метод токенизации действий.
Hi Robot: система с "внутренним голосом" по модели Канемана.
Модель уже протестирована в реальных условиях.Команда проверила систему в 3-х арендованных домах и специальных тестовых помещениях, которые не встречались в обучающих данных. Робот показал способность выполнять ежедневные задачи, хотя и не без ошибок.
"π-0.5 далека от совершенства, но она демонстрирует гибкость и находчивость, напоминающую человеческий подход к новым задачам", — отмечают исследователи.
www.pi.website
A VLA with Open-World Generalization
Our latest generalist policy, π0.5, extends π0 and enables open-world generalization. Our new model can control a mobile manipulator to clean up an entirely new kitchen or bedroom.
April 23
⚡️Прорыв - созданы ультрамягкие нейронные зонды Fleuron для нейроинтерфейсов
Компания Axoft объявила об успешном первом клиническом испытании на людях Fleuron — ультрамягких нейронных зондов для создания нейроинтерфейсов высокой плотности.
Нейроинтерфейсы давно обещают революцию, но сталкивались с фундаментальным ограничением:
традиционные материалы (кремний, полиимид) слишком жесткие для мягкой ткани мозга. Это вызывает воспаление, рубцевание и деградацию сигнала с течением времени.
Axoft разработала новый материал Fleuron с модулем упругости ~ 5 МПа — близким к свойствам мозговой ткани.
Это позволило создать зонды, которые движутся вместе с мозгом, а не против него, сохраняя стабильность записи на протяжении многих месяцев.
Вот такие характеристики, подтвержденные данными:
1. Интеграция до 1024 каналов в одном минимально инвазивном зонде
2. 10-кратное улучшение ключевых показателей BCI за 16 месяцев
3. Стабильная нейронная активность на протяжении до 18 месяцев (подтверждено в исследованиях на животных)
4. Минимальная глиальная инкапсуляция (на 70% меньше по сравнению с традиционными материалами)
5. Возможность имплантации через отверстие диаметром всего 11 мм
6. Отличная MRI-видимость для неинвазивного контроля положения.
Рынок нейротехнологий быстро растет и, по прогнозам, достигнет $35 млрд к 2030 году. В отличие от Neuralink, Axoft фокусируется на фундаментальном материаловедческом подходе, преодолевая ключевое препятствие для долгосрочной работы нейроинтерфейсов.
Preprint тут.
Компания Axoft объявила об успешном первом клиническом испытании на людях Fleuron — ультрамягких нейронных зондов для создания нейроинтерфейсов высокой плотности.
Нейроинтерфейсы давно обещают революцию, но сталкивались с фундаментальным ограничением:
традиционные материалы (кремний, полиимид) слишком жесткие для мягкой ткани мозга. Это вызывает воспаление, рубцевание и деградацию сигнала с течением времени.
Axoft разработала новый материал Fleuron с модулем упругости ~ 5 МПа — близким к свойствам мозговой ткани.
Это позволило создать зонды, которые движутся вместе с мозгом, а не против него, сохраняя стабильность записи на протяжении многих месяцев.
Вот такие характеристики, подтвержденные данными:
1. Интеграция до 1024 каналов в одном минимально инвазивном зонде
2. 10-кратное улучшение ключевых показателей BCI за 16 месяцев
3. Стабильная нейронная активность на протяжении до 18 месяцев (подтверждено в исследованиях на животных)
4. Минимальная глиальная инкапсуляция (на 70% меньше по сравнению с традиционными материалами)
5. Возможность имплантации через отверстие диаметром всего 11 мм
6. Отличная MRI-видимость для неинвазивного контроля положения.
Рынок нейротехнологий быстро растет и, по прогнозам, достигнет $35 млрд к 2030 году. В отличие от Neuralink, Axoft фокусируется на фундаментальном материаловедческом подходе, преодолевая ключевое препятствие для долгосрочной работы нейроинтерфейсов.
Preprint тут.
Businesswire
Axoft Successfully Completes First Four Cases of First-in-Human Clinical Study of its Ultrasoft, High-Density Brain-Computer Interface
Axoft, a neurotechnology company, today announced preliminary results from its first-in-human clinical study, FINESSE, which began just two and a half years ...
April 23
Ха, ИИ обнуляет образование и найм, теперь дипломы вузов становятся дорогим сувениром
Дело в том, что люди из поколения Z (те, кто сейчас выходят на рынок труда) столкнулись с новой реальностью: их дипломы, за которые они пахали годы и влезали в долги, теперь воспринимаются как дорогой сувенир из прошлого.
Почему? ИИ меняет правила игры.
Почти половина выпускников 2025 года считает, что их четырёхлетнее образование — это пережиток прошлого, не особо нужный в мире, где ИИ рулит.
Работодатели теперь не смотрят на дипломы с отличием. Вместо этого они требуют: "Покажи, как ты умеешь работать с ИИ, как ты можешь его использовать, чтобы решать задачи!"
Резюме теперь переписываются с нуля. Новый главный навык — это "владение ИИ или провал". Если ты не умеешь эффективно использовать ИИ-инструменты, то твои шансы на крутую работу резко падают.
Дело в том, что люди из поколения Z (те, кто сейчас выходят на рынок труда) столкнулись с новой реальностью: их дипломы, за которые они пахали годы и влезали в долги, теперь воспринимаются как дорогой сувенир из прошлого.
Почему? ИИ меняет правила игры.
Почти половина выпускников 2025 года считает, что их четырёхлетнее образование — это пережиток прошлого, не особо нужный в мире, где ИИ рулит.
Работодатели теперь не смотрят на дипломы с отличием. Вместо этого они требуют: "Покажи, как ты умеешь работать с ИИ, как ты можешь его использовать, чтобы решать задачи!"
Резюме теперь переписываются с нуля. Новый главный навык — это "владение ИИ или провал". Если ты не умеешь эффективно использовать ИИ-инструменты, то твои шансы на крутую работу резко падают.
April 23
Kortix AI выпустили опен сорс ИИ-агента, который обучается, адаптируется и рассуждает как человек.
По заявлениям команды, Suna может выполнять такие задачи, например:
- Искать бизнес-информацию
- Создавать Excel-файлы на основе найденных данных
- Работать с браузером Chrome
- Собирать данные из различных источников и структурировать их.
Проект разработан командой всего за 3 недели.
GitHub.
По заявлениям команды, Suna может выполнять такие задачи, например:
- Искать бизнес-информацию
- Создавать Excel-файлы на основе найденных данных
- Работать с браузером Chrome
- Собирать данные из различных источников и структурировать их.
Проект разработан командой всего за 3 недели.
GitHub.
Suna
Suna - Open Source Generalist AI Agent
Suna is a fully open source AI assistant that helps you accomplish real-world tasks with ease through natural conversation.
April 23