Нейронавт | Нейросети в творчестве
9.5K subscribers
3.68K photos
3.17K videos
40 files
4.13K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
SwiftEdit: Lightning Fast Text-guided Image Editing via One-step Diffusion

Редактирование изображений с помощью текстовых команд.
Обучен на SwiftBrush v2 (SBv2) и SD-Turbo

Сохраняет детали и текстуры исходного изображения
Работать быстро, всего за 0,23 секунды на одной видеокарте A100

Код ждем

#imageediting #image2image
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGTP Canvas обновили.
Это инструмент для совместного редактирования вместе с ChatGPT

Теперь он доступен "всем" ну и плюс еще какие-то фишки
- Код на Python можно запускать в браузере;
- ChatGPT -может комментировать и редактировать текст и код
- Поддержка кастомных GPT’s

#coding
👍1🤯1
Youtube auto dubbing

Youtube прикрутил автоматический дубляж видео. Привет @yabrowser

Чтобы видео было продублировано на другой язык, автор должен включить эту опцию

Пример дулбяж с французского на английский

#news #dubbing #speech2speech
👍10🔥41
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini 2.0

Гугл объявил эру агентов.
Мультимодальный ассистент

- в риалтайме понимает одновременно и аудио и видео
- можно стримить ему свой экран
- может общаться голосом
- выполняет сложные задачи
- ищет в интернете

И все это бесплатно. Россиян традиционно не любят. Добро пожаловать с неевропейского IP

Попробовать

#news #agent
👍6💯3
DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation

Генератор манги (японских комиксов) на основе текстового описания и изображений персонажей.

Под капотом дообученный SDXL

- Создает мангу с несколькими персонажами, которые адаптируются к текстовому описанию
- Есть контроль расположения персонажей и диалогов на странице
- Сохраняет стиль и консистентность персонажей

Код

#text2image #comics
13
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Трумультимодальность.

До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.

OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.

Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.

А вот пример с газовой горелкой - просто отличный: "нарисуй то, что случится, когда горелка повернется".
Визуальная цепочка мыслей.
"Включи телевизор" - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.

И поднимите веки Midjourney кто-нибудь. Неприлично уже.

@cgevent
🔥14👍61
StableAnimator: High-Quality Identity-Preserving Human Image Animation

Очередной аниматор персонажа по фото и образцу движения, сохраняющий идентичность персонажа. Под капотом SVD

Код

#humananimation #characteranimation #image2video #pose2video
👍6🔥51
This media is not supported in your browser
VIEW IN TELEGRAM
В трекере точек на видео TAPTR реализовали потоковый режим, позволяющий обрабатывать видео любой длины на RTX 3090

Демо TAPTRv3

#tracking
🔥9👍21
This media is not supported in your browser
VIEW IN TELEGRAM
SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

Метод заставить видеогенераторы делать одно и то же видео с двух и более ракурсов.
Ждем во всех видеогенрилках планеты

Код

#text2image #multiview
🔥15🤔21