Нейронавт | Нейросети в творчестве – Telegram

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

9.44K subscribers

3.65K photos

3.15K videos

40 files

4.1K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

9.44K subscribers

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

Mustango: Toward Controllable Text-to-Music Generation

Управляемый генератор музыки по тексту. На фоне Lyria звучит хреновато.
Но он опенсорсный, и у него есть своя фишка — он хорошо понимает специфический музыкальный язык. Аккорды, ритм, тональность, лады и т. д. Что дает пользователю больше контроля.

Демо1
Демо2
Код

#text2music

👍2

963 views16:05

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Suno.ai

Генератор песен. Он уже хорошо известен, и теперь еще улучшил качество генерации. От этой же команды мы уже видели генератор звуков Bark

Теперь пользоваться сервисом можно не только в дискорде, но и на сайте. Правда, на сайте и музыка и текст задается одним промтом, а в дискорде - отдельно.

Длина промта слишком короткая, не хватает чтобы подробно описать желаемый стиль.

#text2music #text2song #text2lyrics

👍3

918 views10:53

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Splash Pro

Генератор песен.
Здесь можно подробнее расписать стиль музыки, темп, тональность и лад. После генерации музыки добавить текст.
Бесплатно дают только один голос вокалиста-рэпера и длина трека максимум 60 секунд. Есть реферралка

#text2music #text2song #text2lyrics

🔥1

972 viewsedited 11:07

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Video-LLaVA: Learning United Visual Representation by Alignment Before Projection

Визуально-языковая модель, понимает и картинки, и видео.

Код
Демо1
Демо2

#VLM #LLM #multimodal

👍1

914 views06:49

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

PartyRock

Сервис от Amazon для создания AI-приложений без кода!
Делитесь своими приложениями в чате.

#coding #tools #assistant

🔥2

873 views06:58

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

RunwayML таки обновился.
MotionBrush и пересеты стилей

#mask2motion #image2video

🔥7❤2

1.06K views07:05

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

Make Pixels Dance: High-Dynamic Video Generation

Новый крутой генератор видео. Может делать видео из изображения. Есть Magic Mode - видео из двух изображений, смешивая их по текстовому промту.

Кода и демо нет. Но можно попросить авторов выполнить ваш запрос здесь

#text2video #image2video

👍3🔥2

1.02K views07:45

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Кейс ИИ-VFX

Использованные инструменты:

AnimateDiff-Evolved Nodes
IPAdapter Plus
Advanced ControlNet
KJNodes

Описание процесса с результатами на каждом шаге
Реддит

#inpainting #video2video

🔥6

990 views06:17

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Пока ChatGPT прилег, Anthropic презентовали Claude 2.1

- Окно контекста теперь 200 тыс токенов. Это примерно 500 страниц текста, или 150 тыс английских слов.
- Уменьшена частота галлюцинаций в два раза
- На длинных контекстах уменьшена ошибка: на ~30% при максимальной длине контекста
- Возможность использовать внешние инстурменты по API
- Цена на новую модель такая же, как и на Claude 2

#chatbot #assistant #LLM

👍1

895 viewsedited 06:23

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Stable Video Diffusion

Stability.AI представили генератор видео по изображению. Работает на базе SD v2.1.

Есть две версии
- SDV генерит 14 кадров 576x1024
- SDV-XT дообученный вариант SDV, 25 кадров

Модель может быть легко адаптирована к различным задачам, включая синтез новых ракурсов из одного изображения (см на сайте)

Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG

#image2video

👍3

1.26K viewsedited 06:36

Нейронавт | Нейросети в творчестве

Forwarded from Соне нравится (или нет)

Наша команда трудилась-трудилась и выкатила две крупные (во всех смыслах) модели в релиз! 😧

➡️

➡️

➡️

Kandinsky 3.0 для генерации изображений и Kandinsky Video для генерации видео

Познакомиться и найти все ссылки можно в статьях на Хабре. Здесь про Kandinsky 3.0, а здесь про Kandinsky Video.

Ставим лайки, делаем репосты, а админ этого канала запасается ящиком энергетиков без сахара на следующий релиз. Как говорится, stay tuned. 🦔

Please open Telegram to view this post

VIEW IN TELEGRAM

Kandinsky 3.0 — новая модель генерации изображений по тексту

«Без чувства современности художник останется непризнанным» , Михаил Пришвин, русский и советский писатель, прозаик и публицист В прошлом году на АI Journey мы представили модель Kandinsky 2.0 —...

🔥6

812 views11:01

Нейронавт | Нейросети в творчестве

начеррипиканные примеры - ну такое

774 views11:15

Нейронавт | Нейросети в творчестве

Forwarded from GigaChat

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

🟢Готовы примерить на себя роль режиссёра, сценариста и монтажёра? Камера, ~~мотор~~ промпт, начали! Представляем первую в России нейросеть для генерации полноценного видео!

Kandinsky Video прокачался на датасете из 300 000 пар «текст — видео» для воплощения ваших идей:

🤖 плавный видеоряд с частотой 30 кадров в секунду и возможностью делать видео с хронометражем до 8 секунд

🤖 два ключевых блока, которые работают вместе. Один отвечает за создание ключевых кадров структуры сюжета, а второй — за плавность движений

🤖 формат видео представляет собой непрерывную сцену с движением как объекта, так и фона

🤖 в основе нейросети — новая модель синтеза изображений по текстовым описаниям.

Оценить Kandinsky Video можно на платформе fusionbrain.ai и в Telegram-боте — оставляйте заявку на доступ!

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

😁6🔥4❤1👍1👎1

733 views11:15

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

OWSM v3: An Open Whisper-style Speech Model from CMU WAVLab

Говорят, превосходит Whisper

- Распознавание речи для 151 языка
- Перевод речи с любого на любой язык
- Предсказание временных меток
- Транскрипция в длинной форме
- Идентификация языка

Демо
Колаб

#speech2text #translation #speech2speech #voice2text

🔥4👍1

1.01K viewsedited 11:29

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models

А вот движок генерации речи по тексту с заявленным человекоподобием. Масса возможностей.

Код
Примеры
Демо (надеюсь, починят)
Колаб

#text2speech

985 views11:43