This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
DRA-Ctrl: Dimension-Reduction Attack! Video Generative Models are Experts on Controllable Image Synthesis
создание и редактирование изображений силами видеогенераторов, в том числе по управляющим изображениям, как контролнет
Прочие возможности: инпейнтинг, персонализация, апскейл, деблюр, предсказание глубины? колоризация
Код
Демо
Веса небольшие кстати
#text2image #image2image #referencing #controlnet #deblur #imagerestoration #personalization #upscale #colorize
создание и редактирование изображений силами видеогенераторов, в том числе по управляющим изображениям, как контролнет
Прочие возможности: инпейнтинг, персонализация, апскейл, деблюр, предсказание глубины? колоризация
Код
Демо
Веса небольшие кстати
#text2image #image2image #referencing #controlnet #deblur #imagerestoration #personalization #upscale #colorize
❤8🔥4
Warp 2.0
Агент/кодер
- Agents: запуск и управление несколькими агентами для выполнения различных задач.
- Terminal: современный терминал с улучшенным пользовательским опытом.
- Drive: общее хранилище знаний для команды и агентов.
устанавливается локально
Есть бесплатный тариф
#Windows / #Mac / #Linux
скачать
#desktop #agent #coding
Агент/кодер
- Agents: запуск и управление несколькими агентами для выполнения различных задач.
- Terminal: современный терминал с улучшенным пользовательским опытом.
- Drive: общее хранилище знаний для команды и агентов.
устанавливается локально
Есть бесплатный тариф
#Windows / #Mac / #Linux
скачать
#desktop #agent #coding
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
FLUX.1 Kontext [dev] выложили в открытый доступ
Напоминаю, это облегченная версия редактора изображений
Веса
Нативная поддержка в ComfyUI
воркфлоу
Спасибо @iNevestenko
#imageediting #text2image #vibeediting
Напоминаю, это облегченная версия редактора изображений
Веса
Нативная поддержка в ComfyUI
воркфлоу
Спасибо @iNevestenko
#imageediting #text2image #vibeediting
❤16🤯7⚡3
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Suno - красавцы!
Взяли и пожрали WavTools/DAW.
WavTool это браузерный DAW-софт(Digital Audio Workstation), который объединил профессиональные функции создания музыки (поддержка плагинов VST, редактирование с точностью до сэмпла, запись в реальном времени и многое другое) с собственными возможностями ИИ, такими как разделение стемов, MIDI-файлы, сгенерированные ИИ, и встроенный чат-бот для редактирования музыки в реальном времени.
Представляете какой интерфейс и мощща будут у Suno 5?
https://www.prnewswire.com/news-releases/suno-acquires-wavtool-to-level-up-capabilities-for-professional-songwriters--producers-302491932.html
@cgevent
Взяли и пожрали WavTools/DAW.
WavTool это браузерный DAW-софт(Digital Audio Workstation), который объединил профессиональные функции создания музыки (поддержка плагинов VST, редактирование с точностью до сэмпла, запись в реальном времени и многое другое) с собственными возможностями ИИ, такими как разделение стемов, MIDI-файлы, сгенерированные ИИ, и встроенный чат-бот для редактирования музыки в реальном времени.
Представляете какой интерфейс и мощща будут у Suno 5?
https://www.prnewswire.com/news-releases/suno-acquires-wavtool-to-level-up-capabilities-for-professional-songwriters--producers-302491932.html
@cgevent
👍5👎2🤯1
Hyperswap 256
В репозитории Facefusion появилась модель для замены лиц разрешением 256 пикселей, что следует из имен файлов.
В теории она могла бы прийти на смену inswapper128, который до сих пор используется во всех быстрых заменяторах лиц, но похоже что она сырая
Комментарий с реддита:
#faceswap
В репозитории Facefusion появилась модель для замены лиц разрешением 256 пикселей, что следует из имен файлов.
В теории она могла бы прийти на смену inswapper128, который до сих пор используется во всех быстрых заменяторах лиц, но похоже что она сырая
Комментарий с реддита:
Я протестировал его (не очень тщательно, всего пару раз поменял местами), и, похоже, он не может должным образом работать с направлением взгляда. С помощью inswapper измененное лицо, кажется, смотрит в правильном направлении, но с помощью hyperswap что-то выглядит не так, как будто человек все время смотрит вверх и куда-то вдаль.
#faceswap
huggingface.co
facefusion/models-3.3.0 at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍5😁1
This media is not supported in your browser
VIEW IN TELEGRAM
SimpleGVR: A Simple Baseline for Latent-Cascaded Video Super-Resolution
Улучшайзер видео от анонимных авторов без кода
Модель работает в два этапа: сначала создаёт базовое видео низкого разрешения, а затем повышает его качество до высокого разрешения
Полное видео
#videorestoration #enhancevideo #enhance #superresolution
Улучшайзер видео от анонимных авторов без кода
Модель работает в два этапа: сначала создаёт базовое видео низкого разрешения, а затем повышает его качество до высокого разрешения
Полное видео
#videorestoration #enhancevideo #enhance #superresolution
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
4Real-Video-V2: Fused View-Time Attention and Feedforward Reconstruction for 4D Scene Generation
SOTA в генерации и реконструкция видео в 4D от Snap и KAUST, в списке авторов русские фамилии.
Может как воссоздать сцену по мультиракурсному видео, так и сгенерировать по тексту
Показывает изменения сцены во времени и пространстве, как если бы это было живое 4D изображение.
Под капотом гауссианы и еще что-то
Кода нет, ждем в снэпчате?
#4D #textto4d #videoto4D #gaussian #novelview #rendering #research
SOTA в генерации и реконструкция видео в 4D от Snap и KAUST, в списке авторов русские фамилии.
Может как воссоздать сцену по мультиракурсному видео, так и сгенерировать по тексту
Показывает изменения сцены во времени и пространстве, как если бы это было живое 4D изображение.
Под капотом гауссианы и еще что-то
Кода нет, ждем в снэпчате?
#4D #textto4d #videoto4D #gaussian #novelview #rendering #research
👍2🤯2
Media is too big
VIEW IN TELEGRAM
4D-LRM: Large Space-Time Reconstruction Model From and To Any View at Any Time
И тут же подобная работа от Adobe С КОДОМ‼️
Модель способна принимать на вход ограниченное количество изображений объекта с разных ракурсов и моментов времени и создавать из них новые комбинации ракурсов и моментов времени.
Объединяет пространство и время, представляя объект как облако 4D гауссиан
Обрабатывает 24 кадра за менее чем 1,5 секунды на одном GPU A100
Но разрешение, похоже, всего 256 x 256 (а, вот почему с кодом)
Код должен быть, проверить не могу
#4D #videoto4D #gaussian #novelview #rendering #imageto4d
И тут же подобная работа от Adobe С КОДОМ‼️
Модель способна принимать на вход ограниченное количество изображений объекта с разных ракурсов и моментов времени и создавать из них новые комбинации ракурсов и моментов времени.
Объединяет пространство и время, представляя объект как облако 4D гауссиан
Обрабатывает 24 кадра за менее чем 1,5 секунды на одном GPU A100
Но разрешение, похоже, всего 256 x 256 (а, вот почему с кодом)
Код должен быть, проверить не могу
#4D #videoto4D #gaussian #novelview #rendering #imageto4d
👍3🤯2
🔥7❤2