Бегло потестил Sad Talker, скрипт для оживления портретов, который недавно появился в виде расширения для Автоматика. По большому счёту это тот же Thin Plate, выдающий видео размером 256x192, но с дополнительным апскейлом и восстановлением лиц.
Авторы утверждают, что результат настолько реалистичный, что им пришлось добавить вотермарк. Правда у меня случился какой-то глюк и файл sadtalker_logo.png в папке extensions/SadTalker/docs почему-то заменился на пустую прозрачную пнгшку, и вотермарк пропал (знаю, знаю, странное дело с этими багами).
Ну а по впечатлениям:
- Голос нужно отдельно обрабатывать, нормализовывать и компрессировать, иначе рот может открываться не до конца.
- В целом как будто нормально выглядит, но разрешение всё портит.
- Лучше работает с реалистичными изображениями.
- Параметров в Автоматике кот наплакал, при том, что сам скрипт позволяет настраивать многое.
- Установка забагованная, мне пришлось вручную скачивать модели и копировать их в папку.
- Пофиксили.В правильную папку результат не записывает, надо смотреть в папке Results.
- Нужен установленный ffmpeg.
- Пофиксили.Для запуска требует ключ --disable-safe-unpickle, к тому же (надеюсь ложно) некоторые антивирусы находили трояна в файлах с весами. Если вы не такой рисковый, чтобы доверять китайцам, лучше дождитесь пропатченной версии.
https://github.com/Winfredy/SadTalker
#sadtalker #анимация
Авторы утверждают, что результат настолько реалистичный, что им пришлось добавить вотермарк. Правда у меня случился какой-то глюк и файл sadtalker_logo.png в папке extensions/SadTalker/docs почему-то заменился на пустую прозрачную пнгшку, и вотермарк пропал (знаю, знаю, странное дело с этими багами).
Ну а по впечатлениям:
- Голос нужно отдельно обрабатывать, нормализовывать и компрессировать, иначе рот может открываться не до конца.
- В целом как будто нормально выглядит, но разрешение всё портит.
- Лучше работает с реалистичными изображениями.
- Параметров в Автоматике кот наплакал, при том, что сам скрипт позволяет настраивать многое.
- Установка забагованная, мне пришлось вручную скачивать модели и копировать их в папку.
- Пофиксили.
- Пофиксили.
#sadtalker #анимация
😁22👍8❤4🤩1
В принципе, я понимаю, зачем нужна услуга определения картинок, созданных нейросетями. Как минимум это было бы полезно банкам, сайтам знакомств и прочим сервисам, где требуется предоставлять свои фотографии, как дополнительный слой антифрода. Но, боюсь, это просто невозможная задача.
Потестил очередной такой сервис, https://aiornot.optic.xyz/
Что могу сказать? В целом он работает. Но.
Во-первых, он определяет все мои генерации, как созданные Midjourney, хотя я загружал прямо с тегами Автоматика. Уже это многое говорит об уровне старания разработчиков.
Во-вторых, определялка ломается банальным добавлением двух процентов нойза в фотошопе. Можно будет плагин для Автоматика под это дело написать, чтобы меньше времени тратить.
Было бы ещё интересно проверить на ложное срабатывание. Но даже так уже понятно, что этот сервис нужен скорее для облегчения кошельков инвесторов. Если защита такого рода обходится за одну минуту, то какой в ней толк?
Потестил очередной такой сервис, https://aiornot.optic.xyz/
Что могу сказать? В целом он работает. Но.
Во-первых, он определяет все мои генерации, как созданные Midjourney, хотя я загружал прямо с тегами Автоматика. Уже это многое говорит об уровне старания разработчиков.
Во-вторых, определялка ломается банальным добавлением двух процентов нойза в фотошопе. Можно будет плагин для Автоматика под это дело написать, чтобы меньше времени тратить.
Было бы ещё интересно проверить на ложное срабатывание. Но даже так уже понятно, что этот сервис нужен скорее для облегчения кошельков инвесторов. Если защита такого рода обходится за одну минуту, то какой в ней толк?
🔥16❤2
Вы наверняка слышали о новой модели Stable Diffusion XL от Stability AI. Её многие называют убийцей Midjourney. Мол, фоторильность зашкаливает, супер-криспи-шарп-мега-кволити-мастерпис генерации из коробки.
Может, я чего-то не понимаю, но результаты у меня получаются плохенькие. Даже хуже стоковой 1.5, не говоря уже о файнтюненых моделях.
Единственное, чем SDXL хороша, это способностью писать тексты. Это да, это круто.
Попробуйте сами и отпишитесь, что я не так делаю? Сама модель пока в бете, потестить можно тут:
https://clipdrop.co/stable-diffusion
#stablediffusion
Может, я чего-то не понимаю, но результаты у меня получаются плохенькие. Даже хуже стоковой 1.5, не говоря уже о файнтюненых моделях.
Единственное, чем SDXL хороша, это способностью писать тексты. Это да, это круто.
Попробуйте сами и отпишитесь, что я не так делаю? Сама модель пока в бете, потестить можно тут:
https://clipdrop.co/stable-diffusion
#stablediffusion
😁9❤2
Минутка бесполезной информации.
А вы знали, что Stable Diffusion умеет воспринимать эмодзи в качестве промпта, причем у них свои собственные токены в словаре?
Вот вам, например, картинка по запросу 👱🏼♀️ 🩱 🏖
#stablediffusion
А вы знали, что Stable Diffusion умеет воспринимать эмодзи в качестве промпта, причем у них свои собственные токены в словаре?
Вот вам, например, картинка по запросу 👱🏼♀️ 🩱 🏖
#stablediffusion
🤔28🔥12😁11❤3👍2
Pez Dispenser - это скрипт, который работает примерно как текстуальная инверсия, только вместо эмбеддинга он выдаёт промпт. И это довольно любопытный инструмент.
Итак, на вход скрипта подаётся картинка, или готовый промпт, который нужно перфразировать/сократить.
https://huggingface.co/spaces/tomg-group-umd/pez-dispenser
Поставьте внизу Prompt length подлиннее и попробуйте поиграться. Генерация может занимать несколько минут.
Pez Dispenser работает с OpenCLIP-ViT/H, так что его результаты будут более адекватными с моделями Stable Diffusion 2 или Midjourney. Но даже если вы такой же старовер, как я, и больше любите модели 1.5, все равно вы получите очень интересный результат, пусть и далёкий от исходного.
Диспенсер выдаёт очень сложные промпты, иногда похожие на набор случайных слов. Там могут быть и эмодзи, и неожиданные знаки препинания, и какие-то странные сочетания букв. И это хорошая стартовая точка для экспериментов.
Вот промпты для приложенных к посту картинок, которые я нашел с помощью Диспенсера:
#промпты
Итак, на вход скрипта подаётся картинка, или готовый промпт, который нужно перфразировать/сократить.
https://huggingface.co/spaces/tomg-group-umd/pez-dispenser
Поставьте внизу Prompt length подлиннее и попробуйте поиграться. Генерация может занимать несколько минут.
Pez Dispenser работает с OpenCLIP-ViT/H, так что его результаты будут более адекватными с моделями Stable Diffusion 2 или Midjourney. Но даже если вы такой же старовер, как я, и больше любите модели 1.5, все равно вы получите очень интересный результат, пусть и далёкий от исходного.
Диспенсер выдаёт очень сложные промпты, иногда похожие на набор случайных слов. Там могут быть и эмодзи, и неожиданные знаки препинания, и какие-то странные сочетания букв. И это хорошая стартовая точка для экспериментов.
Вот промпты для приложенных к посту картинок, которые я нашел с помощью Диспенсера:
fineart cgi realistic influencer awarded tamannayoon seo best lsd psychedelic lollajellyfish reviewed nominated, vivid colors
spective biotic futuristic cyberpunk refurbished alien illustration bohemian watercolour artwork gerry aik strange forest gloomy trees
digital art painting of jongin manainactive percy ferns gill priory castle yeezy pagan foggy dark submergreenery lores austerity by greg rutkowski
painting of orchestrbryce landscape korubberplaceabstract arch free solid abstract autodesk bryce knuckles leaked olly, vivid colors, high contrast
alain edelsnowy solstice yellow 💤folklorethursday audubon goddess allergies illustration niallaest festivities wawx holidays
#промпты
🔥20👏2
Итак, свершилось. Я только что выложил мой набор инструментов для работы со Stable Diffusion из Гудини в открытый доступ. Для всех, даром, и пусть никто не уйдёт обиженным. Все, что нужно знать, в видео.
Нагенерируйте мне красоты!
https://www.youtube.com/watch?v=Un_b8cvzxcw
Нагенерируйте мне красоты!
https://www.youtube.com/watch?v=Un_b8cvzxcw
YouTube
Stable Houdini - бесплатные ассеты для работы со Stable Diffusion
Ассеты:
https://github.com/stassius/StableHoudini
Генеративные и нейронные проекты:
https://evr.systems/
https://yangx.top/evrdev
Сказать спасибо:
https://www.donationalerts.com/r/houdinirus
English version of the tutorial:
https://youtu.be/jCE1Dx_Q924
Телеграм…
https://github.com/stassius/StableHoudini
Генеративные и нейронные проекты:
https://evr.systems/
https://yangx.top/evrdev
Сказать спасибо:
https://www.donationalerts.com/r/houdinirus
English version of the tutorial:
https://youtu.be/jCE1Dx_Q924
Телеграм…
🔥164❤27👍9❤🔥6🫡6😎1
Я сделал англоязычную версию видео про Stable Houdini. Нейросетью, конечно. Если не сложно - поставьте апвоут на Реддите и лайк на Ютубе, буду благодарен.
https://www.reddit.com/r/StableDiffusion/comments/12zsjn0/i_released_my_set_of_houdini_digital_assets_for/?sort=new
https://www.reddit.com/r/StableDiffusion/comments/12zsjn0/i_released_my_set_of_houdini_digital_assets_for/?sort=new
Reddit
From the StableDiffusion community on Reddit: I released my set of Houdini digital assets for Stable Diffusion for free. Links…
Explore this post and more from the StableDiffusion community
🔥78👍17❤3
Немного новостей про Stable Houdini.
Я добавил две новые ноды:
- SD Preprocessor, которая позволяет получать результат работы препроцессора из Контролнета и генерировать карты глубины, нормалей и так далее.
- SD Png Info, которая читает параметры генерации из картинки и сохраняет их в атрибутах для переиспользования.
На ноде SD Prompt добавился выбор эмбеддингов и гипернетворков. Лор пока нет. Они работают, но их нужно копировать из промпта в Автоматике.
Так что рекомендую обновиться.
Все значимые обновления я описываю в разделе Announcements на Гитхабе:
https://github.com/stassius/StableHoudini/discussions/categories/announcements
Кстати, поставьте звездочку на Гитхабе, что ли? Вам не сложно, а мне приятно.
#stablehoudini
Я добавил две новые ноды:
- SD Preprocessor, которая позволяет получать результат работы препроцессора из Контролнета и генерировать карты глубины, нормалей и так далее.
- SD Png Info, которая читает параметры генерации из картинки и сохраняет их в атрибутах для переиспользования.
На ноде SD Prompt добавился выбор эмбеддингов и гипернетворков. Лор пока нет. Они работают, но их нужно копировать из промпта в Автоматике.
Так что рекомендую обновиться.
Все значимые обновления я описываю в разделе Announcements на Гитхабе:
https://github.com/stassius/StableHoudini/discussions/categories/announcements
Кстати, поставьте звездочку на Гитхабе, что ли? Вам не сложно, а мне приятно.
#stablehoudini
GitHub
stassius/StableHoudini Announcements · Discussions
Explore the GitHub Discussions forum for stassius StableHoudini in the Announcements category.
❤67🔥22👍18
Ищу онлайн-сервис со Stable Diffusion, хочу жену подсадить на это дело.
Midjourney неплохой вариант, но Discord в качестве фронт-енда это совсем извращение на любителя.
Пока что я остановился на leonardo.ai (не реклама). Под капотом обычный Stable Diffusion, невысокая цена.
Плюсы:
- Есть сторонние модели! Это киллер-фича, поскольку здесь я также могу использовать DreamShaper или Delibirate, как и на локальном SD.
- Есть инпейнт и аутпейнт. Unzoom, удаление бэкграунда, апскейл и тайлинг
- Возможность обучать на собственных датасетах.
- Есть бесплатные генерации, 150 токенов в день.
- КонтролНет. Есть три модели - простой OpenPose, Depth и Canny.
- Image2Image
- Генерация текстур для Obj-моделей, но я не разбирался, если честно. Скорее всего шляпа.
- Community Feed. Можно смотреть чужие работы и сразу же пробовать понравившиеся настройки и промпты в своих генерациях.
Минусы:
- Закрытость и минимум информации. Почему-то все подобные сервисы делают вид, что внутри у них суперсекретная неонка, и скрывают от пользователя подробности работы. Например, в том же обучении непонятно, что именно тренируется - Lora, Hypernetwork или сразу DreamBooth.
- Скрытые параметры. Параметров чуть больше, чем в других подобных сервисах, но все равно мало. Например тут очень нелогичные и непонятные опции апскейла. При этом в Coming Soon обещают дать возможность их редактировать - но только пользователям продвинутого плана. Бред.
- Нет привычных лор, эмбеддингов и гипернетворков. Очень жду сервис, который позволит их использовать.
В общем, первые впечатления неплохие. По крайней мере это лучше какого-нибудь DreamStudio, Scenario.gg и Lexica.art.
Если у вас есть на примете подобные недорогие сервисы со стейблом -- напишите в комментариях.
https://leonardo.ai
Чтобы зарегистрироваться надо оставить почту, через какое-то время (несколько дней) вам придёт инвайт. Закрытый клуб, понимаете.
#сервисы
Midjourney неплохой вариант, но Discord в качестве фронт-енда это совсем извращение на любителя.
Пока что я остановился на leonardo.ai (не реклама). Под капотом обычный Stable Diffusion, невысокая цена.
Плюсы:
- Есть сторонние модели! Это киллер-фича, поскольку здесь я также могу использовать DreamShaper или Delibirate, как и на локальном SD.
- Есть инпейнт и аутпейнт. Unzoom, удаление бэкграунда, апскейл и тайлинг
- Возможность обучать на собственных датасетах.
- Есть бесплатные генерации, 150 токенов в день.
- КонтролНет. Есть три модели - простой OpenPose, Depth и Canny.
- Image2Image
- Генерация текстур для Obj-моделей, но я не разбирался, если честно. Скорее всего шляпа.
- Community Feed. Можно смотреть чужие работы и сразу же пробовать понравившиеся настройки и промпты в своих генерациях.
Минусы:
- Закрытость и минимум информации. Почему-то все подобные сервисы делают вид, что внутри у них суперсекретная неонка, и скрывают от пользователя подробности работы. Например, в том же обучении непонятно, что именно тренируется - Lora, Hypernetwork или сразу DreamBooth.
- Скрытые параметры. Параметров чуть больше, чем в других подобных сервисах, но все равно мало. Например тут очень нелогичные и непонятные опции апскейла. При этом в Coming Soon обещают дать возможность их редактировать - но только пользователям продвинутого плана. Бред.
- Нет привычных лор, эмбеддингов и гипернетворков. Очень жду сервис, который позволит их использовать.
В общем, первые впечатления неплохие. По крайней мере это лучше какого-нибудь DreamStudio, Scenario.gg и Lexica.art.
Если у вас есть на примете подобные недорогие сервисы со стейблом -- напишите в комментариях.
https://leonardo.ai
Чтобы зарегистрироваться надо оставить почту, через какое-то время (несколько дней) вам придёт инвайт. Закрытый клуб, понимаете.
#сервисы
Leonardo AI
AI Image Generator - Create Art, Images & Video | Leonardo AI
Transform your projects with our AI image generator. Generate high-quality, AI generated images with unparalleled speed and style to elevate your creative vision
👍15🥱3😁1🤔1
Я записал второй урок про работу со Stable Houdini, рассказал про новые ноды и подробно описал процесс работы над конкретной задачей.
https://www.youtube.com/watch?v=1-kPfLz-Uy4
#stablehoudini #stablediffusion
https://www.youtube.com/watch?v=1-kPfLz-Uy4
#stablehoudini #stablediffusion
YouTube
Stable Houdini для дизайнеров
Скачать ассеты:
https://github.com/stassius/StableHoudini
Сказать "Спасибо":
https://www.donationalerts.com/r/houdinirus
Урок про установку Stable Houdini:
https://www.youtube.com/watch?v=Un_b8cvzxcw
Наш телеграм-канал про нейросети:
https://yangx.top/dreamsrobots…
https://github.com/stassius/StableHoudini
Сказать "Спасибо":
https://www.donationalerts.com/r/houdinirus
Урок про установку Stable Houdini:
https://www.youtube.com/watch?v=Un_b8cvzxcw
Наш телеграм-канал про нейросети:
https://yangx.top/dreamsrobots…
👍61🔥27❤12❤🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Играл с генерацией ландшафтов и проиграл.
Нагенерировал 20 хайрезных спутниковых карт с помощью Лоры MapSatimageEU и вот такого промпта:
Препроцессором Depth Leres превратил их в карты глубины, создал террейн, просимулировал эрозию, сохранил в кэш.
Вроде бы получились неплохие заготовки для дальнейшей обработки.
Поскольку работаю в Гудини, весь процесс от генерации картинок до рендера финальных секвенций запускается одной кнопкой.
#stablehoudini #stablediffusion
Нагенерировал 20 хайрезных спутниковых карт с помощью Лоры MapSatimageEU и вот такого промпта:
mapsatimageeu, Satellite map of a rocky mountain range, highly detailed, 8k, sharp, desert valleys, mountain tops, <lora:MapSatimageEU_V1.0_ST_LoRa:1>
Препроцессором Depth Leres превратил их в карты глубины, создал террейн, просимулировал эрозию, сохранил в кэш.
Вроде бы получились неплохие заготовки для дальнейшей обработки.
Поскольку работаю в Гудини, весь процесс от генерации картинок до рендера финальных секвенций запускается одной кнопкой.
#stablehoudini #stablediffusion
👍49🔥30❤5😁1
Вы только посмотрите, какую красоту сделал наш подписчик Рустам со Stable Houdini!
Лайк и ретвит, пожалуйста!
https://twitter.com/KRu3ty/status/1655980595703316480
#stablehoudini
Лайк и ретвит, пожалуйста!
https://twitter.com/KRu3ty/status/1655980595703316480
#stablehoudini
🔥59👍7❤🔥5💩2