Нейронавт | Нейросети в творчестве
9.43K subscribers
3.64K photos
3.15K videos
40 files
4.1K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Есть, в общем, такая продакшен-студия - Bad Decisions. Они чем-то напоминают или даже копируют Corridor Digital, но суть не в этом. Они сильно захайпились последнее время за счет переноса известных сцен из кино в 3D через использование Gaussian Splatting. Тут они перенесли фильм Shining, так же в полном видео есть Матрица, Бесславные ублюдки, Асасин и Гарри Поттер.

Я честно не могу сказать, что это прям очень частая потребность в 3D или кино-продакшене (я именно про перевод из кино-материала в 3D), но эффект производит интересный. Ладно, может быть есть польза данных траектории камеры и может быть для Deep композа удобно имплементировать материал.

Можно еще попробовать повытаскивать из игр данные, но тоже не понятно для чего, т.к. есть инструменты более удобные для того, чтобы вытащить оригинальную геометрию и текстуры сразу. (Поправьте, если еще видите какую-то киллер-фичу, которую я не углядел)
MiniGPT-v2:Large Language Model as a Unified Interface for Vision-Language Multi-task Learning

Визуально-языковая модель, наверно теперь такие LLM надо называть VLM
И как раз есть сравнение, см картинки (твиттер) с GPT-4V

Код
Демоспейс
Колаб

#chatbot #LLM #VLM #assistant
👍4
VideoReTalking: Audio-based Lip Synchronization for Talking Head Video Editing In the Wild

Генератор говорящей головы с липсинком, лучше недавнего wav2lip.
И даже продолжительное молчание отрабатывает +/- хорошо

Код
Колаб

#wav2lip #lipsync #talkinghead #audio2video
👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Riffusion

Генератор песен, звучит офигительно, работает быстро.
Из минусов - продолжительность трека всего 12 секунд.

Запилил для вас пару цитат Бендера.
Кидайте творчество в коменты.

В коментах есть лайфхак

#text2music #text2song #text2audio
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Должен сказать, это офигительный инструмент для накидывания музыкальных идей. Нужно чтобы оно умело продолжать заданный отрывок
Media is too big
VIEW IN TELEGRAM
LAMP: Learn A Motion Pattern for Few-Shot-Based Video Generation

генератор видео по тексту. Генерит в два этапа: сначала генерит первый кадр, потом предсказывает движение. (А разве не все генераторы так делают?)

Редактировать видео тоже умеет, но при замене фона искажает и передний план, примеры на сайте

Код, пока без весов. Но особо буйные смогут обучить свой претрейн

#text2video
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
YandexART и Video-Kandiskiy

Яндекс и Сбер выкатили по генератору видео.
YandexART работает в приложении Шедеврум и Яндекс.Бизнес, Кандинский - в телеге
Не буду рассусоливать, пробуйте сами по ссылкам выше. Котики из Шедеврума

#text2video
👎6🔥1🤔1
ScaleCrafter: Tuning-free Higher-Resolution Visual Generationwith Diffusion Models

А вот этот генератор видео и картинок на основе #StableDiffusion поинтереснее. Акцент на высоком разрешении и произвольном соотношении сторон без дообучения и оптимизаций. Результаты крутые

Код

#text2image #text2video
🔥5👍3
DA-CLIP: Controlling Vision-Language Models for Universal Image Restoration

Восстановление изображений. DA-CLIP с высокой точностью предсказывает эмбеддинги повреждений и выдает высококачественные детали для восстановления.

Код
Демо

#image2image #imagerestoration #deblur #denoise #restoration
🤔3