Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot
Реконструкция 3D моделей нескольких людей по одному ракурсу.
Восстанавливает без одежды. Нет, не поэтому
Код
Демо
#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction
Реконструкция 3D моделей нескольких людей по одному ракурсу.
Восстанавливает без одежды. Нет, не поэтому
Код
Демо
#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction
🔥5🤯1
SwiftEdit: Lightning Fast Text-guided Image Editing via One-step Diffusion
Редактирование изображений с помощью текстовых команд.
Обучен на SwiftBrush v2 (SBv2) и SD-Turbo
Сохраняет детали и текстуры исходного изображения
Работать быстро, всего за 0,23 секунды на одной видеокарте A100
Код ждем
#imageediting #image2image
Редактирование изображений с помощью текстовых команд.
Обучен на SwiftBrush v2 (SBv2) и SD-Turbo
Сохраняет детали и текстуры исходного изображения
Работать быстро, всего за 0,23 секунды на одной видеокарте A100
Код ждем
#imageediting #image2image
👍5
Есть код и демо OneDiffusion - генератора/пониматора картинок
Код
Демо сейчас 404 - ждем
Веса на HF
#text2image #image2image #conditioning #personalization #multiview
Код
Демо сейчас 404 - ждем
Веса на HF
#text2image #image2image #conditioning #personalization #multiview
Telegram
Нейронавт | Нейросети в творчестве
OneDiffusion
Единая модель для разных задач, связанных с генерацией и пониманием изображений
- генерация по тексту
- персонализация
- многоракурсная генерация - сразу несколько ракурсов объекта, заданного текстом или референсным изображением
- генерация…
Единая модель для разных задач, связанных с генерацией и пониманием изображений
- генерация по тексту
- персонализация
- многоракурсная генерация - сразу несколько ракурсов объекта, заданного текстом или референсным изображением
- генерация…
👍4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGTP Canvas обновили.
Это инструмент для совместного редактирования вместе с ChatGPT
Теперь он доступен "всем" ну и плюс еще какие-то фишки
- Код на Python можно запускать в браузере;
- ChatGPT -может комментировать и редактировать текст и код
- Поддержка кастомных GPT’s
#coding
Это инструмент для совместного редактирования вместе с ChatGPT
Теперь он доступен "всем" ну и плюс еще какие-то фишки
- Код на Python можно запускать в браузере;
- ChatGPT -может комментировать и редактировать текст и код
- Поддержка кастомных GPT’s
#coding
👍1🤯1
Youtube auto dubbing
Youtube прикрутил автоматический дубляж видео. Привет @yabrowser
Чтобы видео было продублировано на другой язык, автор должен включить эту опцию
Пример дулбяж с французского на английский
#news #dubbing #speech2speech
Youtube прикрутил автоматический дубляж видео. Привет @yabrowser
Чтобы видео было продублировано на другой язык, автор должен включить эту опцию
Пример дулбяж с французского на английский
#news #dubbing #speech2speech
👍10🔥4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini 2.0
Гугл объявил эру агентов.
Мультимодальный ассистент
- в риалтайме понимает одновременно и аудио и видео
- можно стримить ему свой экран
- может общаться голосом
- выполняет сложные задачи
- ищет в интернете
И все это бесплатно. Россиян традиционно не любят. Добро пожаловать с неевропейского IP
Попробовать
#news #agent
Гугл объявил эру агентов.
Мультимодальный ассистент
- в риалтайме понимает одновременно и аудио и видео
- можно стримить ему свой экран
- может общаться голосом
- выполняет сложные задачи
- ищет в интернете
И все это бесплатно. Россиян традиционно не любят. Добро пожаловать с неевропейского IP
Попробовать
#news #agent
👍6💯3
DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation
Генератор манги (японских комиксов) на основе текстового описания и изображений персонажей.
Под капотом дообученный SDXL
- Создает мангу с несколькими персонажами, которые адаптируются к текстовому описанию
- Есть контроль расположения персонажей и диалогов на странице
- Сохраняет стиль и консистентность персонажей
Код
#text2image #comics
Генератор манги (японских комиксов) на основе текстового описания и изображений персонажей.
Под капотом дообученный SDXL
- Создает мангу с несколькими персонажами, которые адаптируются к текстовому описанию
- Есть контроль расположения персонажей и диалогов на странице
- Сохраняет стиль и консистентность персонажей
Код
#text2image #comics
❤13
Media is too big
VIEW IN TELEGRAM
MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis
Генератор звука по видео или текстовому описанию
Код
Демо
Колаб
#video2audio #video2sound #text2audio
Генератор звука по видео или текстовому описанию
Код
Демо
Колаб
#video2audio #video2sound #text2audio
👍10❤1🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Трумультимодальность.
До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.
OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.
Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.
А вот пример с газовой горелкой - просто отличный: "нарисуй то, что случится, когда горелка повернется".
Визуальная цепочка мыслей.
"Включи телевизор" - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.
И поднимите веки Midjourney кто-нибудь. Неприлично уже.
@cgevent
До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.
OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.
Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.
А вот пример с газовой горелкой - просто отличный: "нарисуй то, что случится, когда горелка повернется".
Визуальная цепочка мыслей.
"Включи телевизор" - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.
И поднимите веки Midjourney кто-нибудь. Неприлично уже.
@cgevent
🔥14👍6❤1
StableAnimator: High-Quality Identity-Preserving Human Image Animation
Очередной аниматор персонажа по фото и образцу движения, сохраняющий идентичность персонажа. Под капотом SVD
Код
#humananimation #characteranimation #image2video #pose2video
Очередной аниматор персонажа по фото и образцу движения, сохраняющий идентичность персонажа. Под капотом SVD
Код
#humananimation #characteranimation #image2video #pose2video
👍6🔥5❤1
This media is not supported in your browser
VIEW IN TELEGRAM
В трекере точек на видео TAPTR реализовали потоковый режим, позволяющий обрабатывать видео любой длины на RTX 3090
Демо TAPTRv3
#tracking
Демо TAPTRv3
#tracking
🔥9👍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints
Метод заставить видеогенераторы делать одно и то же видео с двух и более ракурсов.
Ждем во всех видеогенрилках планеты
Код
#text2image #multiview
Метод заставить видеогенераторы делать одно и то же видео с двух и более ракурсов.
Ждем во всех видеогенрилках планеты
Код
#text2image #multiview
🔥15🤔2❤1