Нейронавт | Нейросети в творчестве

RWKV: Parallelizable RNN with Transformer-level LLM Performance

Пока все засовывают эти ваши 30b int4 лламы на cpu, EleutherAI x BlinkDL выкладывают RNN, которая перформит на уровне GPT-level (14b). При этом она (14b int8) влезает в 3gb VRAM, и имеет, в принципе, бесконечную длину контекста, как и все RNN.

Paper
Code
Models

Discord
Twitter

Чат-версия: https://github.com/BlinkDL/ChatRWKV

@derplearning

👍4

457 views05:09

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

MaskFreeVIS: Mask-Free Video Instance Segmentation

Новый эффективный метод сегментации видео.

Код

#segmentation #video2mask

531 views06:52

Нейронавт | Нейросети в творчестве

0:41

Media is too big

VIEW IN TELEGRAM

Наконец руки дошли поковыряться в этих ваших нейросетках.
В ответ на мэшапы голосом Винни Пуха Гомер Симпсон исполнил песню Винни Пуха.

Сделано вот в этом колабе

Инструкция

Youtube

#Neuronaut_art

❤2

608 views07:27

Нейронавт | Нейросети в творчестве

Forwarded from CGIT_Vines (Marvin Heemeyer)

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

Casablanca.ai – сервис, который пошёл дальше, чем сервисы Nvidia, сдвигающие ваши глаза в камеру, он позволяет повернуть всю вашу голову.

Считаю, что хватит уже ходить вокруг да около, замените всё тело, и пусть оно само делает заинтересованный вид на дейли синках.

😁6

373 views08:16

Нейронавт | Нейросети в творчестве

0:44

This media is not supported in your browser

VIEW IN TELEGRAM

1:30

This media is not supported in your browser

VIEW IN TELEGRAM

MMS: Scaling Speech Technology to 1000+ languages

Специалисты из Meta AI выпустили модель, которая переводит 1100 языков из текста в аудио и из аудио в текст. Целью было, как я понял, создание единой модели, понимающей много языков. Судя по демо, получилось.

Кроме всего прочего, для обучения собрали и использовали аудио записи, где люди читают Библию на разных языках. Потому что, кажется, нет другой книги, которая была бы переведена на столько разных языков. Очень хитро́!

Код

#TTS #STT

550 views08:43

Нейронавт | Нейросети в творчестве

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

ControlVideo

Пытаются обучать #text2video при помощи Controlnet.
Ну, такое. Посмотрим что будет дальше

494 views08:51

Нейронавт | Нейросети в творчестве

Forwarded from Dreams and Robots

Inpaint-модели отличаются от остальных тем, что позволяют использовать форму черно-белой маски при генерации. Модель встроит новое изображение точно в ее границы.

До недавнего времени инпейнт-модели нужно было отдельно получать хитрыми операциями из существующих. Но теперь у нас есть инпейнтинг прямо в ControlNet 1.1.

Переключитесь в Image2image, добавьте исходное изображение и маску, сделайте все необходимые настройки, как в обычном инпейнте.

Теперь включайте контролнет, выбирайте в нем Inpaint-препроцессор и Inpaint-модель. Важно, что при этом картинка в самом контролнете должна отсутствовать -- в этом случае он возьмет её из маски image2image. Если вы работаете в Stable Houdini, переключитесь в Image type - File и сотрите имя файла.

Вот и вся хитрость, теперь абсолютно любой чекпойнт будет работать как Inpaint. На приложенных примерах я сгенерировал локацию старинного храма и добавил дверь в инпейнте.

#stablediffusion #A1111 #совет #controlnet #stablehoudini

🔥5

470 views09:09

Нейронавт | Нейросети в творчестве

Forwarded from Psy Eyes (Andrey Bezryadin)

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

Runway поделились как получать четкие и близкие к источнику результаты с GEN-1:

1) Если нужно изменить стиль по референсу, то лучше вытащить кадр из видео —> стилизовать его через img2img под нужный стиль любым софтом (SD, MJ, Runway, итд) —> использовать итоговую картинку как референс.

2) Идём в расширенные настройки (Advanced) и ставим:

Structural consistency: 0
Style weight: между 3 и 7
Frame consistency: 1.2

👍2

499 views09:17

Нейронавт | Нейросети в творчестве

1:01

Media is too big

VIEW IN TELEGRAM

Adobe добавляет свою нейросеть Firefly в Photoshop — пока доступна в бете, а полноценная версия заработает во второй половине 2023 года

👍5🔥2

619 views12:31

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Неофициальная имплементация DragGAN

Код

Колаб

🔥5

593 viewsedited 14:15

Нейронавт | Нейросети в творчестве

1:07

This media is not supported in your browser

VIEW IN TELEGRAM

Причина переехать на Windows 11.

В Windows 11 будет встроен ИИ-помощник Windows Copilot на базе Bing Chat. Он сможет управлять настройками Windows, анализировать содержимое приложений, обрабатывать сложные запросы и многое другое.

На следующей неделе обещают начать рассылку бета-версии для всех пользователей Windows 11.

Ну и если это недостаточно убедительная причина, то у меня еще есть запасная: в Windows 11 будет полная поддержка формата .rar на уровне ОС

🔥5

484 views06:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

ExplainDev
Список ИИ-помощников программиста пополнился плагином для VSCode и расширением для Chrome. ExplainDev объясняет код и функции простым языком, отвечает на технические вопросы и составляет гайды. Поддерживает десяток языков программирования.

При регистрации отвечаете на несколько вопросов и получаете код доступа. По этому коду пользуетесь триальным тарифом. Как долго - пока не знаю.

#coding #tools

👍2

482 viewsedited 06:34

Нейронавт | Нейросети в творчестве

SDXL теперь обучен на ~ 50%, разработчики просят помощи юзеров.

Мы запустили бота в нашем Discord, который собирает некоторые столь необходимые данные о том, какие изображения являются лучшими.

Он изменяет множество параметров под капотом (например, шкалу CFG), чтобы действительно определить, какие настройки являются наилучшими. Итак, время от времени вы будете получать странные изображения (например, в масштабе CFG 3.0 или что-то еще странное)

Действительно подвергаем проверке многие общепринятые представления — и у нас уже были некоторые неожиданности в отношении определенных параметров ... определенных токенов, которые люди часто используют...

Мы поделимся всем этим, как только у нас будет достаточно данных, чтобы доказать это.

Поэтому, пожалуйста, помогите нам, перейдя на каналы Discord для ботов SDXL, где вы можете бесплатно создавать с помощью SDXL, и особенно там, где вы можете проголосовать за лучшие полученные изображения, пожалуйста...

Приглашение в дискорд

Инструкция

👍2❤1

1.86K viewsedited 07:00

Нейронавт | Нейросети в творчестве

Неофициальная имплементация DragGAN Код Колаб

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

В общем, поковырял я эту кустарную демку DragGAN

Результаты неутешительные.

- Начнем с того, что нельзя просто взять и ~~отнести кольцо~~ загрузить туда любую картинку. При загрузке GAN вынужден будет уложить вашу картинку в прокрустово ложе своего векторного пространства. Дон Корлеоне предлагает вам посмотреть что они сделали с бедным Эйнштейном.

- Использовать DragGAN можно только на классах, на которых он обучен. В колабе кроме лиц есть котики, лошади, церкви. Но на всем кроме лиц он практически не работает. Да и на лицах кое-как. Вы можете поискать в инете готовые модельки других классов или обучить свою. Но это не то же самое что ткнуть пару точек и получить результат как мы видели в демо.

- Максимум чего удалось добиться - приоткрыть на лице рот
чтоб получилась улыбка. Или наоборот - призакрыть. Ни о каких поворотах вокруг оси речь не идет

Короче, расходимся, это не те дроиды которые нам нужны

507 views07:34

About

Blog

Apps

Platform