Нейронавт | Нейросети в творчестве

DRA-Ctrl: Dimension-Reduction Attack! Video Generative Models are Experts on Controllable Image Synthesis

создание и редактирование изображений силами видеогенераторов, в том числе по управляющим изображениям, как контролнет

Прочие возможности: инпейнтинг, персонализация, апскейл, деблюр, предсказание глубины? колоризация

Код
Демо
Веса небольшие кстати

#text2image #image2image #referencing #controlnet #deblur #imagerestoration #personalization #upscale #colorize

❤8🔥4

1.72K views14:31

Нейронавт | Нейросети в творчестве

1:03

This media is not supported in your browser

VIEW IN TELEGRAM

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

Warp 2.0

Агент/кодер

- Agents: запуск и управление несколькими агентами для выполнения различных задач.

- Terminal: современный терминал с улучшенным пользовательским опытом.

- Drive: общее хранилище знаний для команды и агентов.

устанавливается локально
Есть бесплатный тариф

#Windows / #Mac / #Linux

скачать

#desktop #agent #coding

❤3

1.7K views15:14

Нейронавт | Нейросети в творчестве

0:50

This media is not supported in your browser

VIEW IN TELEGRAM

FLUX.1 Kontext [dev] выложили в открытый доступ

Напоминаю, это облегченная версия редактора изображений

Веса
Нативная поддержка в ComfyUI
воркфлоу

Спасибо @iNevestenko

#imageediting #text2image #vibeediting

❤16🤯7⚡3

2.54K views20:34

Нейронавт | Нейросети в творчестве

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

Suno - красавцы!

Взяли и пожрали WavTools/DAW.

WavTool это браузерный DAW-софт(Digital Audio Workstation), который объединил профессиональные функции создания музыки (поддержка плагинов VST, редактирование с точностью до сэмпла, запись в реальном времени и многое другое) с собственными возможностями ИИ, такими как разделение стемов, MIDI-файлы, сгенерированные ИИ, и встроенный чат-бот для редактирования музыки в реальном времени.

Представляете какой интерфейс и мощща будут у Suno 5?
https://www.prnewswire.com/news-releases/suno-acquires-wavtool-to-level-up-capabilities-for-professional-songwriters--producers-302491932.html

@cgevent

👍5👎2🤯1

1.14K views05:28

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

FLUX.1 Kontext [dev] уже на Krea.ai

#imageediting #text2image #vibeediting

🔥9❤3

1.6K views06:07

Нейронавт | Нейросети в творчестве

Hyperswap 256

В репозитории Facefusion появилась модель для замены лиц разрешением 256 пикселей, что следует из имен файлов.

В теории она могла бы прийти на смену inswapper128, который до сих пор используется во всех быстрых заменяторах лиц, но похоже что она сырая

Комментарий с реддита:

Я протестировал его (не очень тщательно, всего пару раз поменял местами), и, похоже, он не может должным образом работать с направлением взгляда. С помощью inswapper измененное лицо, кажется, смотрит в правильном направлении, но с помощью hyperswap что-то выглядит не так, как будто человек все время смотрит вверх и куда-то вдаль.

#faceswap

huggingface.co

facefusion/models-3.3.0 at main

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

👍5😁1

1.42K viewsedited 06:35

Нейронавт | Нейросети в творчестве

Гитхаб прилег, открывается через впн

🔥3

1.36K views06:45

Нейронавт | Нейросети в творчестве

0:58

This media is not supported in your browser

VIEW IN TELEGRAM

SimpleGVR: A Simple Baseline for Latent-Cascaded Video Super-Resolution

Улучшайзер видео от анонимных авторов без кода

Модель работает в два этапа: сначала создаёт базовое видео низкого разрешения, а затем повышает его качество до высокого разрешения

Полное видео

#videorestoration #enhancevideo #enhance #superresolution

👍6

1.44K views07:02

Нейронавт | Нейросети в творчестве

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

3D arena

Быстрый способ сравнить 3D генераторы бок о бок

#leaderboard #arena #3D

🔥8👍1

1.68K viewsedited 07:11

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

4Real-Video-V2: Fused View-Time Attention and Feedforward Reconstruction for 4D Scene Generation

SOTA в генерации и реконструкция видео в 4D от Snap и KAUST, в списке авторов русские фамилии.

Может как воссоздать сцену по мультиракурсному видео, так и сгенерировать по тексту

Показывает изменения сцены во времени и пространстве, как если бы это было живое 4D изображение.

Под капотом гауссианы и еще что-то

Кода нет, ждем в снэпчате?

#4D #textto4d #videoto4D #gaussian #novelview #rendering #research

👍2🤯2

1.41K views07:41

Нейронавт | Нейросети в творчестве

2:30

Media is too big

VIEW IN TELEGRAM

4D-LRM: Large Space-Time Reconstruction Model From and To Any View at Any Time

И тут же подобная работа от Adobe С КОДОМ‼️

Модель способна принимать на вход ограниченное количество изображений объекта с разных ракурсов и моментов времени и создавать из них новые комбинации ракурсов и моментов времени.

Объединяет пространство и время, представляя объект как облако 4D гауссиан

Обрабатывает 24 кадра за менее чем 1,5 секунды на одном GPU A100

Но разрешение, похоже, всего 256 x 256 (а, вот почему с кодом)

Код должен быть, проверить не могу

#4D #videoto4D #gaussian #novelview #rendering #imageto4d

👍3🤯2

1.44K viewsedited 08:11

Нейронавт | Нейросети в творчестве

Forge жив! (наверно)

В репозитории появляются новые коммиты.
Теперь есть поддержка Chroma - свободного от цензуры Flux Schnell с PONYманием анатомии
Поддержка fp8 здесь
Как поженить с лорами - здесь и здесь

#text2image #forge

🔥7❤2

1.92K views08:41

About

Blog

Apps

Platform