Нейронавт | Нейросети в творчестве
9.43K subscribers
3.65K photos
3.15K videos
40 files
4.11K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Forwarded from Derp Learning
RWKV: Parallelizable RNN with Transformer-level LLM Performance

Пока все засовывают эти ваши 30b int4 лламы на cpu, EleutherAI x BlinkDL выкладывают RNN, которая перформит на уровне GPT-level (14b). При этом она (14b int8) влезает в 3gb VRAM, и имеет, в принципе, бесконечную длину контекста, как и все RNN.

Paper
Code
Models

Discord
Twitter

Чат-версия: https://github.com/BlinkDL/ChatRWKV

@derplearning
👍4
Media is too big
VIEW IN TELEGRAM
Наконец руки дошли поковыряться в этих ваших нейросетках.
В ответ на мэшапы голосом Винни Пуха Гомер Симпсон исполнил песню Винни Пуха.

Сделано вот в этом колабе

Инструкция

Youtube

#Neuronaut_art
2
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Casablanca.ai – сервис, который пошёл дальше, чем сервисы Nvidia, сдвигающие ваши глаза в камеру, он позволяет повернуть всю вашу голову.

Считаю, что хватит уже ходить вокруг да около, замените всё тело, и пусть оно само делает заинтересованный вид на дейли синках.
😁6
MMS: Scaling Speech Technology to 1000+ languages

Специалисты из Meta AI выпустили модель, которая переводит 1100 языков из текста в аудио и из аудио в текст. Целью было, как я понял, создание единой модели, понимающей много языков. Судя по демо, получилось.

Кроме всего прочего, для обучения собрали и использовали аудио записи, где люди читают Библию на разных языках. Потому что, кажется, нет другой книги, которая была бы переведена на столько разных языков. Очень хитро́!

Код

#TTS #STT
This media is not supported in your browser
VIEW IN TELEGRAM
ControlVideo

Пытаются обучать #text2video при помощи Controlnet.
Ну, такое. Посмотрим что будет дальше
Forwarded from Dreams and Robots
Inpaint-модели отличаются от остальных тем, что позволяют использовать форму черно-белой маски при генерации. Модель встроит новое изображение точно в ее границы.

До недавнего времени инпейнт-модели нужно было отдельно получать хитрыми операциями из существующих. Но теперь у нас есть инпейнтинг прямо в ControlNet 1.1.

Переключитесь в Image2image, добавьте исходное изображение и маску, сделайте все необходимые настройки, как в обычном инпейнте.

Теперь включайте контролнет, выбирайте в нем Inpaint-препроцессор и Inpaint-модель. Важно, что при этом картинка в самом контролнете должна отсутствовать -- в этом случае он возьмет её из маски image2image. Если вы работаете в Stable Houdini, переключитесь в Image type - File и сотрите имя файла.

Вот и вся хитрость, теперь абсолютно любой чекпойнт будет работать как Inpaint. На приложенных примерах я сгенерировал локацию старинного храма и добавил дверь в инпейнте.

#stablediffusion #A1111 #совет #controlnet #stablehoudini
🔥5
Forwarded from Psy Eyes (Andrey Bezryadin)
This media is not supported in your browser
VIEW IN TELEGRAM
Runway поделились как получать четкие и близкие к источнику результаты с GEN-1:

1) Если нужно изменить стиль по референсу, то лучше вытащить кадр из видео —> стилизовать его через img2img под нужный стиль любым софтом (SD, MJ, Runway, итд) —> использовать итоговую картинку как референс.

2) Идём в расширенные настройки (Advanced) и ставим:

Structural consistency: 0
Style weight: между 3 и 7
Frame consistency: 1.2
👍2
Media is too big
VIEW IN TELEGRAM
Adobe добавляет свою нейросеть Firefly в Photoshop — пока доступна в бете, а полноценная версия заработает во второй половине 2023 года
👍5🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Причина переехать на Windows 11.

В Windows 11 будет встроен ИИ-помощник Windows Copilot на базе Bing Chat. Он сможет управлять настройками Windows, анализировать содержимое приложений, обрабатывать сложные запросы и многое другое.

На следующей неделе обещают начать рассылку бета-версии для всех пользователей Windows 11.

Ну и если это недостаточно убедительная причина, то у меня еще есть запасная: в Windows 11 будет полная поддержка формата .rar на уровне ОС
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
ExplainDev
Список ИИ-помощников программиста пополнился плагином для VSCode и расширением для Chrome. ExplainDev объясняет код и функции простым языком, отвечает на технические вопросы и составляет гайды. Поддерживает десяток языков программирования.

При регистрации отвечаете на несколько вопросов и получаете код доступа. По этому коду пользуетесь триальным тарифом. Как долго - пока не знаю.

#coding #tools
👍2
SDXL теперь обучен на ~ 50%, разработчики просят помощи юзеров.

Мы запустили бота в нашем Discord, который собирает некоторые столь необходимые данные о том, какие изображения являются лучшими.

Он изменяет множество параметров под капотом (например, шкалу CFG), чтобы действительно определить, какие настройки являются наилучшими. Итак, время от времени вы будете получать странные изображения (например, в масштабе CFG 3.0 или что-то еще странное)

Действительно подвергаем проверке многие общепринятые представления — и у нас уже были некоторые неожиданности в отношении определенных параметров ... определенных токенов, которые люди часто используют...

Мы поделимся всем этим, как только у нас будет достаточно данных, чтобы доказать это.

Поэтому, пожалуйста, помогите нам, перейдя на каналы Discord для ботов SDXL, где вы можете бесплатно создавать с помощью SDXL, и особенно там, где вы можете проголосовать за лучшие полученные изображения, пожалуйста...

Приглашение в дискорд

Инструкция
👍21
Нейронавт | Нейросети в творчестве
Неофициальная имплементация DragGAN Код Колаб
В общем, поковырял я эту кустарную демку DragGAN

Результаты неутешительные.

- Начнем с того, что нельзя просто взять и отнести кольцо загрузить туда любую картинку. При загрузке GAN вынужден будет уложить вашу картинку в прокрустово ложе своего векторного пространства. Дон Корлеоне предлагает вам посмотреть что они сделали с бедным Эйнштейном.

- Использовать DragGAN можно только на классах, на которых он обучен. В колабе кроме лиц есть котики, лошади, церкви. Но на всем кроме лиц он практически не работает. Да и на лицах кое-как. Вы можете поискать в инете готовые модельки других классов или обучить свою. Но это не то же самое что ткнуть пару точек и получить результат как мы видели в демо.

- Максимум чего удалось добиться - приоткрыть на лице рот
чтоб получилась улыбка. Или наоборот - призакрыть. Ни о каких поворотах вокруг оси речь не идет

Короче, расходимся, это не те дроиды которые нам нужны