Нейронавт | Нейросети в творчестве
9.51K subscribers
3.69K photos
3.17K videos
40 files
4.13K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Media is too big
VIEW IN TELEGRAM
UniReal: Universal Image Generation and Editing via Learning Real-world Dynamics

Мультимодальный генератор/редактор картинок от Adobe и Гонконгского университета. Вероятно поэтому будет опенсорс.

Умеет практически все: персонализация, кастомизация, светотеневые эффекты, замена объектов и т д

Что-то написано про использование видео для универсального супервайза, понимание динамики из больших видео

Код ждем
Reddit

#text2image #imageediting
11👍2
FLUX Style Shaping

Берет с одной картинки форму, с другой текстуру.
Под капотом Flux[dev] Redux + Flux[dev] Depth ComfyUI

#styletransfer #image2image
👍15
diffusion-pipe

Экспериментальный тренер диффузных моделей.
Поддерживает #Flux (лоры, полный файнтюн), LTX-Video, HunyuanVideo (лоры)

Реализовано распараллеливание для моделей которые не влезают в GPU

На Винде завелось только у одного юзера, но это неточно

Лору HunyuanVideo можно тренить на картинках на 24GB VRAM

LTX-Video с таким богатым VRAM можно тренить и на видео

#lora #finetuning
🔥12
This media is not supported in your browser
VIEW IN TELEGRAM
А Grok-2 модель 1212 уже завезли в Anychat

Ну там все время что-то добавляют, заходите посмотреть

#assistant
👍31
This media is not supported in your browser
VIEW IN TELEGRAM
GenEx: Generating an Explorable World

Создает объёмный открытый мир из одной картинки

Очень похоже на практически одноименный проект, но нет, это другое

Код ждем

#image2scene #imageto3d #image2world
👍8🔥5
Stable Diffusion GUI

Кроссплатформенный GUI для #SD и #Flux.
Написан на C++, нет зависимостей Python

Встроена поддержка контролнет, апскейл

Бэкенд: CPU, CUDA, ROCm

Гитхаб

#GUI #text2image #tools
👍10🔥6😐21
Veo 2

Не успели мы сломя голову отказаться от удовольствия оплатить триалку первой версии видеогенератора от гугла, как уже, видимо, придется забить и на вторую. Но это неточно, я в поезде и проверить не могу

- обещают генерцию видео в 4К, 8 секунд хронометража
- контроль камеры текстовым описанием
- жизненно, физично, по вашему ТЗ
- традиционная нелюбовь к россиянам

Вход по вейтлисту

#text2video
🔥3👀21
InvSR

Апскейлер на инверсии диффузии.
Короче еще один способ качественно увеличить картинку

Код
Демо HF
Демо Replicate
Колаб

#upscale
8👍7🤯1
Уже наверно знаете, поиск ChatGPT открыли для бесплатных пользователей. Работает в том числе и во время разговора через Advanced Voice Mode. И его можно сделать поисковиком по умолчанию в браузере

Ну а в мобильное приложение прикрутили карты

#search #news
👍51
Media is too big
VIEW IN TELEGRAM
Mocha 2025 - Object Brush

В новую версию Mocha завезли нейроротоскоп.
Если это в реальности работает хорошо как на видео (сомневаюсь), то глядишь, всякие громоздкие костыли станут не нужны

#roto #video2mask
👍81
Mind the Time: Temporally-Controlled Multi-Event Video Generation

Новый видеогенератор с фишечкой от Snap Research и компании.
Фишечка в том что он умеет делать последовательно несколько событий, объединенные общей сценой. Благодаря контролю времени MinT последовательно сосредоточивается в каждый момент времени на одном событии из всех событий описанных в промпте

Подсмотрел у Сергея Цыпцына

#text2video #timecontrol
👍4🔥31