Нейронавт | Нейросети в творчестве – Telegram

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

9.43K subscribers

3.65K photos

3.15K videos

40 files

4.11K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

9.43K subscribers

Нейронавт | Нейросети в творчестве

mirage-ghibli

Гиблификация быстрее и дешевле чем в ChatGPT
Лора Flux.dev
Должно работать прямо на HF но не работает

У авторов есть офсайт с анонсом ИИ-фоторамки с гиблификацией. Регаетесь в вейтлист, постите реферральную ссылку в свой канал и становитесь участником розыгрыша фоторамки стоимостью $160

#stylize #image2image #lora

👍6

1.89K views07:17

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

DeepSite

Кодинг в браузере на базе DeepSeek-V3-0324

Сразу можно и хостить созданное приложение

#vibecoding #coding

👍11🔥2

1.94K views07:50

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning

Пониматор видео, мультимодальный агентный фреймворк, который улучшает понимание видеое за счет имитации человекоподобных процессов, таких как разбиение задач, локализация и проверка моментов, а также синтез ответов. Этот подход решает уникальные проблемы, связанные с рассуждениями, основанными на времени

Код
Демо
HF

#vlm #reasoning

👍8

1.81K viewsedited 08:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

TripoSG / TripoSF

Новые модели Tripo

TripoSG 1.5B преобразует картинку в меш

TripoSF работает с более сложными топологиями/сценами, может моделировать внутренние детали объектов

Гитхаб
Веса
Демо

#imageto3d

👍8❤3

1.83K views08:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

CFG-Zero★: Improved Classifier-Free Guidance for Flow Matching Models

улучшенный метод генерации картинок и видео вместо обычного CFG, который направляет генерацию по неправильному пути.

Поддерживает wan2.1-14B генерацию видео по картинке, а также Flux, SD, Lumina

Уже есть в #ComfyUI нодах Kijai

Код
Демо

#text2image #image2image #image2video #text2video

👍11❤1

2.08K views09:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization

унифицированная модель, которая позволяет персонажам, основанным на физике, выполнять разнообразные задачи взаимодействия человека со сценой. Для 3D персонажей и роботов

Код ждем

#HSI #humananimation

👍9

1.8K views10:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Не прошло и года с июля 2024

Опубликован код и веса (~8Гб) GenXD - генератора 3D и 4D (с движением) сцен по одному или нескольким ракурсам

Код
Веса

#videoto3d #videoto4d

❤3👍1

1.8K views10:44

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency

Создает 4D-сцены на гауссианах из одного изображения, управляемый рендер в реальном времени.

Код

#image2gaussian #image2video #imageto4d #gaussian #nivelview #realtime #4d

🔥7

1.79K viewsedited 11:14

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

GIMM-VFI: Generalizable Implicit Motion Modeling for Video Frame Interpolation

Интерполяция кадров, создает кадры между существующими

Код

#frameinterpolation #slowmotion

👍6🔥1

1.77K views14:41

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

MiniMax Speech-02

Возможности MiniMax Audio обновились

Создает аудиокниги и подкасты из файлов или URL-ссылок, обрабатывает до 200 тысяч символов за раз

Умеет клонировать голос

Генератор речи поддерживает 30+ языков
При выборе голоса в Speech Synthesis русский есть, но везде ли и как он работает - не проверял

Хвастаются качеством звука

#text2speech #tts #voicecloning

👍6🔥5

1.94K views15:16

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Runway Gen-4

Обновка видеогенератора

Создает картинки и видео по референсным изображениям и текстовым описаниям.

Обещает консистентность стилей, сюжетов, местоположений и прочего

Пробовать тут, доступ раскатывают постепенно

#text2video #image2video

👍7🔥1

1.8K views15:39

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Turtle: Learning Truncated Causal History Model for Video Restoration

Реставрация видео: удаление снега, дождя, шума, блюра (размытия).
Модель накапливает причинно-следственную историю и обрабатывает каждый текущий кадр с учетом предыдущих

Код

#videorestoration #deblur #denoise #viedo2video #restoration

👍10🔥4😱3👎1

2.03K views16:14