Нейронавт | Нейросети в творчестве
9.44K subscribers
3.65K photos
3.15K videos
40 files
4.1K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Media is too big
VIEW IN TELEGRAM
Mustango: Toward Controllable Text-to-Music Generation

Управляемый генератор музыки по тексту. На фоне Lyria звучит хреновато.
Но он опенсорсный, и у него есть своя фишка — он хорошо понимает специфический музыкальный язык. Аккорды, ритм, тональность, лады и т. д. Что дает пользователю больше контроля.

Демо1
Демо2
Код

#text2music
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Suno.ai

Генератор песен. Он уже хорошо известен, и теперь еще улучшил качество генерации. От этой же команды мы уже видели генератор звуков Bark

Теперь пользоваться сервисом можно не только в дискорде, но и на сайте. Правда, на сайте и музыка и текст задается одним промтом, а в дискорде - отдельно.

Длина промта слишком короткая, не хватает чтобы подробно описать желаемый стиль.

#text2music #text2song #text2lyrics
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Splash Pro

Генератор песен.
Здесь можно подробнее расписать стиль музыки, темп, тональность и лад. После генерации музыки добавить текст.
Бесплатно дают только один голос вокалиста-рэпера и длина трека максимум 60 секунд. Есть реферралка

#text2music #text2song #text2lyrics
🔥1
PartyRock

Сервис от Amazon для создания AI-приложений без кода!
Делитесь своими приложениями в чате.

#coding #tools #assistant
🔥2
Media is too big
VIEW IN TELEGRAM
Make Pixels Dance: High-Dynamic Video Generation

Новый крутой генератор видео. Может делать видео из изображения. Есть Magic Mode - видео из двух изображений, смешивая их по текстовому промту.

Кода и демо нет. Но можно попросить авторов выполнить ваш запрос здесь

#text2video #image2video
👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Пока ChatGPT прилег, Anthropic презентовали Claude 2.1

- Окно контекста теперь 200 тыс токенов. Это примерно 500 страниц текста, или 150 тыс английских слов.
- Уменьшена частота галлюцинаций в два раза
- На длинных контекстах уменьшена ошибка: на ~30% при максимальной длине контекста
- Возможность использовать внешние инстурменты по API
- Цена на новую модель такая же, как и на Claude 2

#chatbot #assistant #LLM
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Video Diffusion

Stability.AI представили генератор видео по изображению. Работает на базе SD v2.1.

Есть две версии
- SDV генерит 14 кадров 576x1024
- SDV-XT дообученный вариант SDV, 25 кадров

Модель может быть легко адаптирована к различным задачам, включая синтез новых ракурсов из одного изображения (см на сайте)

Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG

#image2video
👍3
Наша команда трудилась-трудилась и выкатила две крупные (во всех смыслах) модели в релиз! 😧

➡️➡️➡️ Kandinsky 3.0 для генерации изображений и Kandinsky Video для генерации видео

Познакомиться и найти все ссылки можно в статьях на Хабре. Здесь про Kandinsky 3.0, а здесь про Kandinsky Video.

Ставим лайки, делаем репосты, а админ этого канала запасается ящиком энергетиков без сахара на следующий релиз. Как говорится, stay tuned. 🦔
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
начеррипиканные примеры - ну такое
Forwarded from GigaChat
🟢Готовы примерить на себя роль режиссёра, сценариста и монтажёра? Камера, мотор промпт, начали! Представляем первую в России нейросеть для генерации полноценного видео!

Kandinsky Video прокачался на датасете из 300 000 пар «текст — видео» для воплощения ваших идей:

🤖 плавный видеоряд с частотой 30 кадров в секунду и возможностью делать видео с хронометражем до 8 секунд

🤖 два ключевых блока, которые работают вместе. Один отвечает за создание ключевых кадров структуры сюжета, а второй — за плавность движений

🤖 формат видео представляет собой непрерывную сцену с движением как объекта, так и фона

🤖 в основе нейросети — новая модель синтеза изображений по текстовым описаниям.

Оценить Kandinsky Video можно на платформе fusionbrain.ai и в Telegram-боте — оставляйте заявку на доступ!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6🔥41👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
OWSM v3: An Open Whisper-style Speech Model from CMU WAVLab

Говорят, превосходит Whisper

- Распознавание речи для 151 языка
- Перевод речи с любого на любой язык
- Предсказание временных меток
- Транскрипция в длинной форме
- Идентификация языка

Демо
Колаб

#speech2text #translation #speech2speech #voice2text
🔥4👍1
Media is too big
VIEW IN TELEGRAM
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models

А вот движок генерации речи по тексту с заявленным человекоподобием. Масса возможностей.

Код
Примеры
Демо (надеюсь, починят)
Колаб

#text2speech