Media is too big
VIEW IN TELEGRAM
Mustango: Toward Controllable Text-to-Music Generation
Управляемый генератор музыки по тексту. На фоне Lyria звучит хреновато.
Но он опенсорсный, и у него есть своя фишка — он хорошо понимает специфический музыкальный язык. Аккорды, ритм, тональность, лады и т. д. Что дает пользователю больше контроля.
Демо1
Демо2
Код
#text2music
Управляемый генератор музыки по тексту. На фоне Lyria звучит хреновато.
Но он опенсорсный, и у него есть своя фишка — он хорошо понимает специфический музыкальный язык. Аккорды, ритм, тональность, лады и т. д. Что дает пользователю больше контроля.
Демо1
Демо2
Код
#text2music
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Suno.ai
Генератор песен. Он уже хорошо известен, и теперь еще улучшил качество генерации. От этой же команды мы уже видели генератор звуков Bark
Теперь пользоваться сервисом можно не только в дискорде, но и на сайте. Правда, на сайте и музыка и текст задается одним промтом, а в дискорде - отдельно.
Длина промта слишком короткая, не хватает чтобы подробно описать желаемый стиль.
#text2music #text2song #text2lyrics
Генератор песен. Он уже хорошо известен, и теперь еще улучшил качество генерации. От этой же команды мы уже видели генератор звуков Bark
Теперь пользоваться сервисом можно не только в дискорде, но и на сайте. Правда, на сайте и музыка и текст задается одним промтом, а в дискорде - отдельно.
Длина промта слишком короткая, не хватает чтобы подробно описать желаемый стиль.
#text2music #text2song #text2lyrics
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Splash Pro
Генератор песен.
Здесь можно подробнее расписать стиль музыки, темп, тональность и лад. После генерации музыки добавить текст.
Бесплатно дают только один голос вокалиста-рэпера и длина трека максимум 60 секунд. Есть реферралка
#text2music #text2song #text2lyrics
Генератор песен.
Здесь можно подробнее расписать стиль музыки, темп, тональность и лад. После генерации музыки добавить текст.
Бесплатно дают только один голос вокалиста-рэпера и длина трека максимум 60 секунд. Есть реферралка
#text2music #text2song #text2lyrics
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Video-LLaVA: Learning United Visual Representation by Alignment Before Projection
Визуально-языковая модель, понимает и картинки, и видео.
Код
Демо1
Демо2
#VLM #LLM #multimodal
Визуально-языковая модель, понимает и картинки, и видео.
Код
Демо1
Демо2
#VLM #LLM #multimodal
👍1
PartyRock
Сервис от Amazon для создания AI-приложений без кода!
Делитесь своими приложениями в чате.
#coding #tools #assistant
Сервис от Amazon для создания AI-приложений без кода!
Делитесь своими приложениями в чате.
#coding #tools #assistant
🔥2
Media is too big
VIEW IN TELEGRAM
Make Pixels Dance: High-Dynamic Video Generation
Новый крутой генератор видео. Может делать видео из изображения. Есть Magic Mode - видео из двух изображений, смешивая их по текстовому промту.
Кода и демо нет. Но можно попросить авторов выполнить ваш запрос здесь
#text2video #image2video
Новый крутой генератор видео. Может делать видео из изображения. Есть Magic Mode - видео из двух изображений, смешивая их по текстовому промту.
Кода и демо нет. Но можно попросить авторов выполнить ваш запрос здесь
#text2video #image2video
👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Пока ChatGPT прилег, Anthropic презентовали Claude 2.1
- Окно контекста теперь 200 тыс токенов. Это примерно 500 страниц текста, или 150 тыс английских слов.
- Уменьшена частота галлюцинаций в два раза
- На длинных контекстах уменьшена ошибка: на ~30% при максимальной длине контекста
- Возможность использовать внешние инстурменты по API
- Цена на новую модель такая же, как и на Claude 2
#chatbot #assistant #LLM
- Окно контекста теперь 200 тыс токенов. Это примерно 500 страниц текста, или 150 тыс английских слов.
- Уменьшена частота галлюцинаций в два раза
- На длинных контекстах уменьшена ошибка: на ~30% при максимальной длине контекста
- Возможность использовать внешние инстурменты по API
- Цена на новую модель такая же, как и на Claude 2
#chatbot #assistant #LLM
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Video Diffusion
Stability.AI представили генератор видео по изображению. Работает на базе SD v2.1.
Есть две версии
- SDV генерит 14 кадров 576x1024
- SDV-XT дообученный вариант SDV, 25 кадров
Модель может быть легко адаптирована к различным задачам, включая синтез новых ракурсов из одного изображения (см на сайте)
Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG
#image2video
Stability.AI представили генератор видео по изображению. Работает на базе SD v2.1.
Есть две версии
- SDV генерит 14 кадров 576x1024
- SDV-XT дообученный вариант SDV, 25 кадров
Модель может быть легко адаптирована к различным задачам, включая синтез новых ракурсов из одного изображения (см на сайте)
Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG
#image2video
👍3
Forwarded from Соне нравится (или нет)
Наша команда трудилась-трудилась и выкатила две крупные (во всех смыслах) модели в релиз! 😧
➡️ ➡️ ➡️ Kandinsky 3.0 для генерации изображений и Kandinsky Video для генерации видео
Познакомиться и найти все ссылки можно в статьях на Хабре. Здесь про Kandinsky 3.0, а здесь про Kandinsky Video.
Ставим лайки, делаем репосты, а админ этого канала запасается ящиком энергетиков без сахара на следующий релиз. Как говорится, stay tuned.🦔
Познакомиться и найти все ссылки можно в статьях на Хабре. Здесь про Kandinsky 3.0, а здесь про Kandinsky Video.
Ставим лайки, делаем репосты, а админ этого канала запасается ящиком энергетиков без сахара на следующий релиз. Как говорится, stay tuned.
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Kandinsky 3.0 — новая модель генерации изображений по тексту
«Без чувства современности художник останется непризнанным» , Михаил Пришвин, русский и советский писатель, прозаик и публицист В прошлом году на АI Journey мы представили модель Kandinsky 2.0 —...
🔥6
Forwarded from GigaChat
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Kandinsky Video прокачался на датасете из 300 000 пар «текст — видео» для воплощения ваших идей:
Оценить Kandinsky Video можно на платформе fusionbrain.ai и в Telegram-боте — оставляйте заявку на доступ!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6🔥4❤1👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
OWSM v3: An Open Whisper-style Speech Model from CMU WAVLab
Говорят, превосходит Whisper
- Распознавание речи для 151 языка
- Перевод речи с любого на любой язык
- Предсказание временных меток
- Транскрипция в длинной форме
- Идентификация языка
Демо
Колаб
#speech2text #translation #speech2speech #voice2text
Говорят, превосходит Whisper
- Распознавание речи для 151 языка
- Перевод речи с любого на любой язык
- Предсказание временных меток
- Транскрипция в длинной форме
- Идентификация языка
Демо
Колаб
#speech2text #translation #speech2speech #voice2text
🔥4👍1
Media is too big
VIEW IN TELEGRAM
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models
А вот движок генерации речи по тексту с заявленным человекоподобием. Масса возможностей.
Код
Примеры
Демо (надеюсь, починят)
Колаб
#text2speech
А вот движок генерации речи по тексту с заявленным человекоподобием. Масса возможностей.
Код
Примеры
Демо (надеюсь, починят)
Колаб
#text2speech