Нейронавт | Нейросети в творчестве
9.41K subscribers
3.63K photos
3.14K videos
40 files
4.1K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA RTX Remix в опенсорсе

NVIDIA выпустили в опенсорс инструмент для ремастеринга игр RTX Remix - Open Source Creator Toolkit.

Приятно, что есть интеграция с Comfy UI.

Скачать бету
Туториалы

#tools #upscale #remaster
👍9🔥3
Media is too big
VIEW IN TELEGRAM
ChronoDepth: Learning Temporally Consistent Video Depth from Video Diffusion Priors

Генератор консистентной карты глубины для видео.
Как я посмотрю, консистентность у них скачкообразная, но вроде есть какие-то рульки которые можно крутить. И таких проектов мало, так что ждем код и не ноем

Код ждем

#depth #depth2video #video2depth
🔥7
Stable Audio Open

Stability AI опубликовали в опенсорсе свою модель генерации звуковых эффектов по текстовому описанию. Музыку тоже может, но зачем оно вам надо с таким качеством. Впрочем, дополнить кусочек вашего трека новым кусочком сможет.

Модель обучена на данных с Freesound и Free Music Archive, поэтому проблем с правами быть не должно.

В демоспейсе мультиплеер - в нем можете не только генерировать свои звуки, но и послушать генерации коммьюнити.

Код/веса
Демо

#text2audio #music2music #text2music
7👍4
Dimba: Transformer-Mamba Diffusion Models

Новая модель генерации картинок на гибридной архитектуре. Большинство из генераторов, которыми вы пользуетесь, работают на трансформерах, в том числе и SD. Не спрашивайте что это такое. На смену им придумали более продвинутую Mamba, которую я недавно упоминал.

Так вот, тут мы имеем некий Transformer-Mamba гибрид, прочащий диффузной генерации картинок светлое будущее.

Из плюсов: тюнинг качества, адаптация разрешения, семантический контроль. Картинки с сайта мне нравятся

Код
Веса
Демо (вход через WeChat🤬)

#text2image
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2
AnyText: Multilingual Visual Text Generation And Editing

Штука которая должна уметь хорошо генерить на изображении текст

Код
Демо

#text2image #text2font
👍3
Пересаживаемся с Forge обратно на A1111

Кто пользовался, конечно.
Большинство оптимизаций все равно переедут в A1111 в грядущем апдейте.
А Forge превратится в экспериментальный репозиторий, несовместимый с существующими расширениями.
Да, расширения перестанут работать.

Последний рабочий коммит здесь

Земля тебе цифровым пухом, форжик

#news #text2image
😭9👍2😁21💩1
Media is too big
VIEW IN TELEGRAM
NeRF-Insert: Local 3D editing with multimodal control signals

Редактор #nerf, работает по картинке или текстовому описанию. Область редактирования можно задать маской или референсным мешем

Код ждем

#3dto3d #3dinpainting #nerf2nerf
🔥6
Если бы chatgpt установили на робота Boston Dynamics

#humor
😁322💯2
This media is not supported in your browser
VIEW IN TELEGRAM
HGM: Generalizable Human Gaussians from Single-View Image

Реконструкция человеков в объеме гауссианами по одной картинке.
На сайте можно покрутить меши

Код ждем

#gaussian #imageto3D #humanavatar
👍7
Кто на Т-дворе сейчас?
Можем встретиться

#оффтоп
👍7🤡7🤮4🥴1
Найдено идеальное кресло для художников, программистов и всех остальных кого заменят нейросети

Объявляю воскресную проверку мемов. Скидывайте в комментарии что принесли ваши сети

#humor
😁16👍6👏2👎1
Forwarded from Сергей Соколов
https://www.reddit.com/r/comfyui/comments/1dbls5n/psa_if_youve_used_the_comfyui_llmvision_node_from

Если вы использовали узел ComfyUI_LLMVISION от u/AppleBotzz, ваш браузер был взломан. Ваша информация о паролях от браузера, данные кредитных карт и история просмотров были отправлены в сервер Discord через веб-хук. Если вы установили и использовали этот пакет, вам следует принять меры для устранения последствий.
🤯15😱3👍1😭1
Flash Diffusion: Accelerating Any Conditional Diffusion Model for Few Steps Image Generation

Ускорение любой диффузионной модели генерации изображений в несколько шагов.

Уже есть в Pinokio

Код
Демо

#text2image #optimization
👍6