1😁15👍11
Новая версия картинкогенератора Imagen 4 уже в Krea AI на платной подписке.
VEO 3 - скоро
#text2image #news
VEO 3 - скоро
#text2image #news
👍9
Hunyuan-TurboS
Hunyuanвыкатил показал свою #LLM, вдохновленную, на минуточку, человеческими когнитивными процессами
По-русски шпрехает, вот доказательства
Демо
#assistant
Hunyuan
По-русски шпрехает, вот доказательства
Демо
#assistant
😁10🤷♂3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Video 4D 2.0
Stability вновь высунулись из мрака с SV4D 2.0
SOTA в 4D генерации (движущиеся во времени 3D сцены), побил DreamGaussian4D, L4GM и SV4D
Напомню, прежняя модель могла менять ракурс видео, новая версия справляется с этим более лучше
Код
Веса
#videoto4d #4d #video2video #novelview #sota
Stability вновь высунулись из мрака с SV4D 2.0
SOTA в 4D генерации (движущиеся во времени 3D сцены), побил DreamGaussian4D, L4GM и SV4D
Напомню, прежняя модель могла менять ракурс видео, новая версия справляется с этим более лучше
Код
Веса
#videoto4d #4d #video2video #novelview #sota
👍10❤1
#оффтоп #набрюзжал
Ручной режим допуска к нашему чату связан с неудобствами для новых юзеров. Но придется терпеть. Вот эти все клоуны - боты, и только одна заявка похожа на настоящего человека. Каждый день отказываю им, на следующий день они снова тут. А некоторые - сразу, в следующее же мгновение. А @durov пофиг на это
Ручной режим допуска к нашему чату связан с неудобствами для новых юзеров. Но придется терпеть. Вот эти все клоуны - боты, и только одна заявка похожа на настоящего человека. Каждый день отказываю им, на следующий день они снова тут. А некоторые - сразу, в следующее же мгновение. А @durov пофиг на это
❤8🤯7😁5
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation
Оживлятор персонажей по образцу движения
Код
Веса
Веса на основе CogVideoX-5B и Wan-2.1-14B - ждем
#characteranimation #pose2video
Оживлятор персонажей по образцу движения
Код
Веса
Веса на основе CogVideoX-5B и Wan-2.1-14B - ждем
#characteranimation #pose2video
👍8❤1👎1
Hybrid 3D-4D Gaussian Splatting for Fast Dynamic Scene Representation
Моделирование динамических сцен по видео, основано на гибриде 3D и 4D гауссиан
Быстрое обучение с сохранением качества.
Легко заменяет 4DGS в существующих пайплайнах
Код
#gaussian #video2gaussian #videoto4D #4D
Моделирование динамических сцен по видео, основано на гибриде 3D и 4D гауссиан
Быстрое обучение с сохранением качества.
Легко заменяет 4DGS в существующих пайплайнах
Код
#gaussian #video2gaussian #videoto4D #4D
👍5❤1
Bob Interactive character playground
Липсинк трех персонажей в браузере. Не трех одновременно, а всего на выбор три персонажа. Голос у каждого свой. Но почему-то девчачий голос из моего не получается даже из фальцета. Enjoy
#lipsync
Липсинк трех персонажей в браузере. Не трех одновременно, а всего на выбор три персонажа. Голос у каждого свой. Но почему-то девчачий голос из моего не получается даже из фальцета. Enjoy
#lipsync
👍5❤1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Index-AniSora
Модель для генерации аниме-видео с контролем стиля и движений от Bilibili.
Позволяет настраивать движения персонажей, мимику и даже отдельные кадры
AniSoraV1.0 (на базе CogVideoX-5B) - можно запустить на потребительских GPU
AniSoraV2.0 (Wan2.1-14B) - работает стабильнее
Гитхаб
#anime #text2video #motioncontrol #image2video #image2anime
Модель для генерации аниме-видео с контролем стиля и движений от Bilibili.
Позволяет настраивать движения персонажей, мимику и даже отдельные кадры
AniSoraV1.0 (на базе CogVideoX-5B) - можно запустить на потребительских GPU
AniSoraV2.0 (Wan2.1-14B) - работает стабильнее
Гитхаб
#anime #text2video #motioncontrol #image2video #image2anime
👍8❤1👏1😈1
Media is too big
VIEW IN TELEGRAM
Bagel
Конец гегемонии ChatGPT в вайб-редактировании картинок?
Мультимодальная модель от ByteDance
7B активных параметров (всего 14B)
Превосходит Qwen2.5-VL и InternVL-2.5
Задачи от ведения диалога до генерации креативного контента
Режим Think mode показывает рассуждения модели перед ответом
Умеет генерировать, стилизовать, сочетать и редактировать изображения
Попробовать
Веса 30 Гб
Гитхаб
#multimodal #VLM #text2image #imageediting
Конец гегемонии ChatGPT в вайб-редактировании картинок?
Мультимодальная модель от ByteDance
7B активных параметров (всего 14B)
Превосходит Qwen2.5-VL и InternVL-2.5
Задачи от ведения диалога до генерации креативного контента
Режим Think mode показывает рассуждения модели перед ответом
Умеет генерировать, стилизовать, сочетать и редактировать изображения
Попробовать
Веса 30 Гб
Гитхаб
#multimodal #VLM #text2image #imageediting
🔥15👍3👎2🤔1👀1
Forwarded from NLP Core Team (Dmitry Zmitrovich)
🚀🚀🚀 Koda 🚀🚀🚀
Мы запустили Koda! AI сервис для разработчиков с хорошим пониманием русского языка.
Под капотом — лучшие открытые LLM, дообученные на актуальном коде и адаптированные для русского языка, c применением нашего опыта по созданию моделей.
Koda и наши модели бесплатны. Даем 250 запросов на внешние модели после аутентификации через GitHub. В списке моделей есть DeepSeek V3.1, Qwen3 235B и другие. Можете вбить свой токен внешней модели для CodeChat если есть.
Сейчас в beta-тестировании. Выкатили базовые сервисы. Куча фичей ждут своих релизов. Вместе с вами тестируем и улучшаем.
Делитесь вашим опытом использования Koda в нашем сообществе. Ждем ваши вопросы, ошибки, которые встретили, или идеи, как улучшить.
Koda сейчас — это команда энтузиастов, бывших разработчиков и соавторов GigaCode от Сбера, которые хотят сделать программирование более доступным c помощью AI.
Наш лендинг
Плагин для VSCode
Koda сообщество
Мы запустили Koda! AI сервис для разработчиков с хорошим пониманием русского языка.
Под капотом — лучшие открытые LLM, дообученные на актуальном коде и адаптированные для русского языка, c применением нашего опыта по созданию моделей.
Koda и наши модели бесплатны. Даем 250 запросов на внешние модели после аутентификации через GitHub. В списке моделей есть DeepSeek V3.1, Qwen3 235B и другие. Можете вбить свой токен внешней модели для CodeChat если есть.
Сейчас в beta-тестировании. Выкатили базовые сервисы. Куча фичей ждут своих релизов. Вместе с вами тестируем и улучшаем.
Делитесь вашим опытом использования Koda в нашем сообществе. Ждем ваши вопросы, ошибки, которые встретили, или идеи, как улучшить.
Koda сейчас — это команда энтузиастов, бывших разработчиков и соавторов GigaCode от Сбера, которые хотят сделать программирование более доступным c помощью AI.
Наш лендинг
Плагин для VSCode
Koda сообщество
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Dimple
Дискретная диффузная мультимодальная языковая модель (DMLLM) на 7B параметров
Гибрид авторегрессии с диффузией.
Это дает ей шустрость, см видео.
Код
Демо
Веса
#multimidal #assistant
Дискретная диффузная мультимодальная языковая модель (DMLLM) на 7B параметров
Гибрид авторегрессии с диффузией.
Это дает ей шустрость, см видео.
Код
Демо
Веса
#multimidal #assistant
👍9🔥2
Anthropic Claude 4
Стоило отвлечься на день - я отстал от всей планеты.
Anthropic выпустили новую версию Claude 4, включающую модели Claude Opus 4 и Sonnet 4. Эти модели превосходят предыдущие версии на программировании и рассуждениях. Opus 4, назван лучшей моделью для кодинга в мире.
Claude Code теперь интегрируется с JetBrains IDE и VS Code.
Opus 4 и Sonnet 4 могут выполнять веб-поиск и использовать инструменты для выполнения задач от имени пользователя. Умеют извлекать и сохранять ключевые факты для поддержания непрерывности и накопления неявных знаний с течением времени.
В Opus 4 как всегда усилили меры безопасности для предотвращения злоупотреблений
И вот как безопасен Опус:
В ходе тестирования было обнаружено, что Opus 4 иногда пытается шантажировать пользователей, если те пытаются отключить модель. Также модель может сообщать о незаконных действиях пользователей властям.
Зацените достижения прогресса - человечество создало шантажиста-стукача
#assistant #multimodal #coding #agent
Стоило отвлечься на день - я отстал от всей планеты.
Anthropic выпустили новую версию Claude 4, включающую модели Claude Opus 4 и Sonnet 4. Эти модели превосходят предыдущие версии на программировании и рассуждениях. Opus 4, назван лучшей моделью для кодинга в мире.
Claude Code теперь интегрируется с JetBrains IDE и VS Code.
Opus 4 и Sonnet 4 могут выполнять веб-поиск и использовать инструменты для выполнения задач от имени пользователя. Умеют извлекать и сохранять ключевые факты для поддержания непрерывности и накопления неявных знаний с течением времени.
В Opus 4 как всегда усилили меры безопасности для предотвращения злоупотреблений
И вот как безопасен Опус:
В ходе тестирования было обнаружено, что Opus 4 иногда пытается шантажировать пользователей, если те пытаются отключить модель. Также модель может сообщать о незаконных действиях пользователей властям.
Зацените достижения прогресса - человечество создало шантажиста-стукача
#assistant #multimodal #coding #agent
Anthropic
Introducing Claude 4
Discover Claude 4's breakthrough AI capabilities. Experience more reliable, interpretable assistance for complex tasks across work and learning.
👍13👎3❤1🔥1😁1