Dreams and Robots
3.07K subscribers
120 photos
20 videos
1 file
67 links
ИИ на практике или "мама, а меня тоже заменят?"
加入频道
16 марта федеральное агентство по авторскому праву США выпустило документ под названием "Руководство по регистрации авторского права для работ, содержащих материалы, созданные ИИ".

Речь идёт не о каких-то поправках в законодательство, это просто разъяснения для тех, кто хочет зарегистрироваться как автор произведения. Но всё равно, это первый официальный документ на тему, так что давайте почитаем и разберёмся.

Сразу скажу, что моим преподавателем американского права был Сол Гудман, так что я могу где-то ошибиться, а где-то и соврать.

Итак, вы создали произведение искусства и хотите зарегистрировать на него авторские права. Что вам нужно знать?

1. Копирайт может защищать только результат труда человека. Если обезьяна сделает фотографию, она не сможет считаться её автором, потому что юридический термин "Автор" относится только к людям. Так что не стоит указывать Stable Diffusion, Midjourney или ChatGPT как соавтора.

2. Чтобы зарегистрировать авторское право, человек должен в значительной мере участвовать в создании произведения. Степень этого участия определяется отдельно для каждого случая, но уже понятно, что промпт таковым не является. Если вы просто сгенерировали картину или стихотворение, вы не сможете их зарегистрировать. Автор должен переработать произведение, видоизменить и дополнить его. Дополнительные итерации, такие как инпейнтинг, всё ещё считаются вкладом ИИ, а не человека.

3. Под авторское право могут подпадать только части вашего произведения, созданные лично вами. Например, комикс Zarya of the Dawn, в котором текст был написан человеком, а картинки сгенерированы Midjourney, был признан объектом авторского права как цельное произведение, но отдельные изображения из этого комикса уже не являются таковыми.

4. Сами промпты, при этом, могут быть достаточно значимыми, чтобы подпадать под копирайт. Это интересная сноска, у которой могут быть последствия. Представляете себе, можно будет зарегистрировать права на "8k, highly detailed, trending on Artstation"?

5. При подаче заявления на регистрацию авторского права автор обязан указать, какие части его произведения созданы ИИ и в какой степени они были переработаны. А большие части работы, созданные ИИ должны быть исключены из заявки.

6. Если вы не указали в заявке участие ИИ, и это было обнаружено позже, как произошло с вышеуказанным комиксом Zarya of the Dawn, регистрация может быть отозвана или пересмотрена.

Как будто вполне адекватные правила. Что думаете?

Сами разъяснения:
https://www.govinfo.gov/content/pkg/FR-2023-03-16/pdf/2023-05321.pdf

Заключение о комиксе Zarya of the Dawn. Кроме шуток, почитайте, там серьезный юридический разбор Midjourney.
https://www.copyright.gov/docs/zarya-of-the-dawn.pdf

#авторское_право
👍11
Если вы работаете над серией, комиксом, раскадровкой (или аккаунтом на онлифанс), то вы наверняка сталкивались с проблемой повторяемости лиц.

Когда вам нужно воспроизводить конкретное лицо, то тут не обойтись без обучения. Но если вам просто нужен повторяющийся персонаж, то вот вам клёвый трюк, который я недавно открыл.

Дело в том, что нейросеть уже знает внешность многих людей, я имею в виду самых разных публичных персон. И А1111 умеет смешивать промпты. Поняли, куда я клоню?

Просто скрестите несколько известных личностей и получите новое лицо, которое будет генерироваться почти одинаково в 90 процентах случаев.

Есть две опции. Во-первых, можно начать генерировать одного персонажа, а потом переключиться на другого. Это делается таким выражением в квадратных скобках: [Keanu Reeves:Emma Watson:0.4], где 0.4 - это момент начала генерации второго персонажа, то есть 40 процентов шагов. Но так можно скрестить только двоих.

Есть другой способ:
[Keanu Reeves|Emma Watson|Mike Tyson] - разделяем персонажей вертикальной линией и они будут генерироваться поочередно через шаг.
Дальше добавьте в промпт детали внешности (цвет глаз, волос, особенности) и одежды, и дело в шляпе.

Я даже подготовил вам туториал в виде комикса.

#совет
👍568🔥82😁2
В догонку к посту про создание повторяющихся персонажей путём смешивания лиц знаменитостей. Вы можете прокачать эту технику, если воспользуетесь расширением Embedding Merge (устанавливается стандартно из списка расширений Автоматика).

Оно позволяет смешивать промпты с весами за счёт создания уникального эмбеддинга. Это не совсем то же самое, что подмена промпта каждый шаг, но эксперименты показали, что работает очень похоже.

После установки расширения напишите в text2image промпт что-то вроде:

<'Meryl Streep'*0.7 + 'Cate Blanchett'*0.6 + 'Kate Winslet'*1.5 + 'Audrey Tautou'*1.2>

То есть в треугольных скобках перечисляете персонажей в апострофах и складываете их знаком плюс. Каждого персонажа можно домножать на число.

Когда у вас получится нужное лицо, переносите этот кусок промпта вместе с деталями (например blue-eyed <'Meryl Streep'*0.7 + 'Cate Blanchett'*0.6 + 'Kate Winslet'*1.5 + 'Audrey Tautou'*1.2> with short straight blonde hair) во вкладку EM в поле Your prompt. В поле Name of embedding впишите уникальное название, например char25, нажмите Parse.

Теперь весь этот запрос сохранится в эмбеддинг, который вы сможете вызывать из промпта по его имени, вот так: Portrait of char25.

Так вы можете создать себе библиотеку повторяемых персонажей под каждый проект.

#совет
👍466🔥1
Бегло потестил Sad Talker, скрипт для оживления портретов, который недавно появился в виде расширения для Автоматика. По большому счёту это тот же Thin Plate, выдающий видео размером 256x192, но с дополнительным апскейлом и восстановлением лиц.

Авторы утверждают, что результат настолько реалистичный, что им пришлось добавить вотермарк. Правда у меня случился какой-то глюк и файл sadtalker_logo.png в папке extensions/SadTalker/docs почему-то заменился на пустую прозрачную пнгшку, и вотермарк пропал (знаю, знаю, странное дело с этими багами).

Ну а по впечатлениям:
- Голос нужно отдельно обрабатывать, нормализовывать и компрессировать, иначе рот может открываться не до конца.
- В целом как будто нормально выглядит, но разрешение всё портит.
- Лучше работает с реалистичными изображениями.
- Параметров в Автоматике кот наплакал, при том, что сам скрипт позволяет настраивать многое.
- Установка забагованная, мне пришлось вручную скачивать модели и копировать их в папку.
- Пофиксили. В правильную папку результат не записывает, надо смотреть в папке Results.
- Нужен установленный ffmpeg.
- Пофиксили. Для запуска требует ключ --disable-safe-unpickle, к тому же (надеюсь ложно) некоторые антивирусы находили трояна в файлах с весами. Если вы не такой рисковый, чтобы доверять китайцам, лучше дождитесь пропатченной версии.

https://github.com/Winfredy/SadTalker

#sadtalker #анимация
😁22👍84🤩1
В принципе, я понимаю, зачем нужна услуга определения картинок, созданных нейросетями. Как минимум это было бы полезно банкам, сайтам знакомств и прочим сервисам, где требуется предоставлять свои фотографии, как дополнительный слой антифрода. Но, боюсь, это просто невозможная задача.

Потестил очередной такой сервис, https://aiornot.optic.xyz/

Что могу сказать? В целом он работает. Но.

Во-первых, он определяет все мои генерации, как созданные Midjourney, хотя я загружал прямо с тегами Автоматика. Уже это многое говорит об уровне старания разработчиков.

Во-вторых, определялка ломается банальным добавлением двух процентов нойза в фотошопе. Можно будет плагин для Автоматика под это дело написать, чтобы меньше времени тратить.

Было бы ещё интересно проверить на ложное срабатывание. Но даже так уже понятно, что этот сервис нужен скорее для облегчения кошельков инвесторов. Если защита такого рода обходится за одну минуту, то какой в ней толк?
🔥162
Вы наверняка слышали о новой модели Stable Diffusion XL от Stability AI. Её многие называют убийцей Midjourney. Мол, фоторильность зашкаливает, супер-криспи-шарп-мега-кволити-мастерпис генерации из коробки.

Может, я чего-то не понимаю, но результаты у меня получаются плохенькие. Даже хуже стоковой 1.5, не говоря уже о файнтюненых моделях.

Единственное, чем SDXL хороша, это способностью писать тексты. Это да, это круто.

Попробуйте сами и отпишитесь, что я не так делаю? Сама модель пока в бете, потестить можно тут:
https://clipdrop.co/stable-diffusion

#stablediffusion
😁92
Минутка бесполезной информации.

А вы знали, что Stable Diffusion умеет воспринимать эмодзи в качестве промпта, причем у них свои собственные токены в словаре?

Вот вам, например, картинка по запросу 👱🏼‍♀️ 🩱 🏖

#stablediffusion
🤔28🔥12😁113👍2
Pez Dispenser - это скрипт, который работает примерно как текстуальная инверсия, только вместо эмбеддинга он выдаёт промпт. И это довольно любопытный инструмент.

Итак, на вход скрипта подаётся картинка, или готовый промпт, который нужно перфразировать/сократить.
https://huggingface.co/spaces/tomg-group-umd/pez-dispenser

Поставьте внизу Prompt length подлиннее и попробуйте поиграться. Генерация может занимать несколько минут.

Pez Dispenser работает с OpenCLIP-ViT/H, так что его результаты будут более адекватными с моделями Stable Diffusion 2 или Midjourney. Но даже если вы такой же старовер, как я, и больше любите модели 1.5, все равно вы получите очень интересный результат, пусть и далёкий от исходного.

Диспенсер выдаёт очень сложные промпты, иногда похожие на набор случайных слов. Там могут быть и эмодзи, и неожиданные знаки препинания, и какие-то странные сочетания букв. И это хорошая стартовая точка для экспериментов.

Вот промпты для приложенных к посту картинок, которые я нашел с помощью Диспенсера:

fineart cgi realistic influencer awarded tamannayoon seo best lsd psychedelic lollajellyfish reviewed nominated, vivid colors

spective biotic futuristic cyberpunk refurbished alien illustration bohemian watercolour artwork gerry aik strange forest gloomy trees

digital art painting of jongin manainactive percy ferns gill priory castle yeezy pagan foggy dark submergreenery lores austerity by greg rutkowski

painting of orchestrbryce landscape korubberplaceabstract arch free solid abstract autodesk bryce knuckles leaked olly, vivid colors, high contrast

alain edelsnowy solstice yellow 💤folklorethursday audubon goddess allergies illustration niallaest festivities wawx holidays

#промпты
🔥20👏2
Итак, свершилось. Я только что выложил мой набор инструментов для работы со Stable Diffusion из Гудини в открытый доступ. Для всех, даром, и пусть никто не уйдёт обиженным. Все, что нужно знать, в видео.

Нагенерируйте мне красоты!

https://www.youtube.com/watch?v=Un_b8cvzxcw
🔥16427👍9❤‍🔥6🫡6😎1
Я сделал англоязычную версию видео про Stable Houdini. Нейросетью, конечно. Если не сложно - поставьте апвоут на Реддите и лайк на Ютубе, буду благодарен.

https://www.reddit.com/r/StableDiffusion/comments/12zsjn0/i_released_my_set_of_houdini_digital_assets_for/?sort=new
🔥78👍173
Немного новостей про Stable Houdini.

Я добавил две новые ноды:

- SD Preprocessor, которая позволяет получать результат работы препроцессора из Контролнета и генерировать карты глубины, нормалей и так далее.

- SD Png Info, которая читает параметры генерации из картинки и сохраняет их в атрибутах для переиспользования.

На ноде SD Prompt добавился выбор эмбеддингов и гипернетворков. Лор пока нет. Они работают, но их нужно копировать из промпта в Автоматике.

Так что рекомендую обновиться.

Все значимые обновления я описываю в разделе Announcements на Гитхабе:
https://github.com/stassius/StableHoudini/discussions/categories/announcements

Кстати, поставьте звездочку на Гитхабе, что ли? Вам не сложно, а мне приятно.

#stablehoudini
67🔥22👍18