Denis Sexy IT 🤖
А тем временем модельку которой я генерировал Ивана Айвазовского и других активно допиливуют в сообществе — посмотрите какая красота поулчается, с телефона некоторые картинки не отличить от фотографий уже (Модель теперь может выдавать 1024x768 на A100) | Автор…
Дарвин! Каким говнокодом сделана красота из предыдущего поста Дениса!.
Действительно, ресерч код не обязан бы идеальным. Но это же откровенная и намеренная ресерч-копрофилия.
Действительно, ресерч код не обязан бы идеальным. Но это же откровенная и намеренная ресерч-копрофилия.
🔥3
🎄 МЛ коллеги, друзья по нейронным сетям! С наступающим!
- Готовлю для вас большую обзорную статью: ИИ Итоги 2021 года
- В качестве новогоднего поздравления предлагаю самое доброе и теплое обращение от нейрофизиолога Дубынина Вячеслава Альбертовича
Всех с праздником! Интересного ресерча, крутых нейронок, классных коллабораций, и большого компьюта в 2022 году!
🎁 И, главное, здоровья, любви и крутейших мультимодальных трансформеров!
- Готовлю для вас большую обзорную статью: ИИ Итоги 2021 года
- В качестве новогоднего поздравления предлагаю самое доброе и теплое обращение от нейрофизиолога Дубынина Вячеслава Альбертовича
Всех с праздником! Интересного ресерча, крутых нейронок, классных коллабораций, и большого компьюта в 2022 году!
🎁 И, главное, здоровья, любви и крутейших мультимодальных трансформеров!
👍32🔥21
Forwarded from DL in NLP (nlpcontroller_bot)
The Illustrated Retrieval Transformer
jalammar.github.io/illustrated-retrieval-transformer/
Мы уже обозревали RETRO в этом коротком посте, но на днях Jay Alammar опубликовал новый блогпост, где идея RETRO описывается визуально.
RETRO — это модель, которая работает на уровне GPT-3 175B имея всего 7B параметров. Это делается с помощью того, что модель может обращаться к дополнительной "базе данных" текстов и их продолжений во время генерации текста.
jalammar.github.io/illustrated-retrieval-transformer/
Мы уже обозревали RETRO в этом коротком посте, но на днях Jay Alammar опубликовал новый блогпост, где идея RETRO описывается визуально.
RETRO — это модель, которая работает на уровне GPT-3 175B имея всего 7B параметров. Это делается с помощью того, что модель может обращаться к дополнительной "базе данных" текстов и их продолжений во время генерации текста.
👍16🔥1
Forwarded from AbstractDL
This media is not supported in your browser
VIEW IN TELEGRAM
GPT для чайников: от токенизации до файнтюнинга
Сделал для вас небольшой colab туториал про GPT. Там подробно и с примерами разобраны такие темы как:
1. Устройство GPT-1,2,3
2. Токенизация
3. Методы генерации текста
4. Файнтюнинг (прям в колабе)
Если вы давно хотели поиграться с GPT, но всё не доходили руки, то новогодние праздники — самое время 😉
Colab
Сделал для вас небольшой colab туториал про GPT. Там подробно и с примерами разобраны такие темы как:
1. Устройство GPT-1,2,3
2. Токенизация
3. Методы генерации текста
4. Файнтюнинг (прям в колабе)
Если вы давно хотели поиграться с GPT, но всё не доходили руки, то новогодние праздники — самое время 😉
Colab
🔥40👍6
Forwarded from Нейроэстетика
🌲🏝 Хвойные леса лазурного тропического острова
спойлер: сгенерировано неизвестной нейронной сетью
спойлер: сгенерировано неизвестной нейронной сетью
🔥22👍5
🎆 V Objective Diffusion: Код, Модель, Веса + Colab
Королева генеративного искусства Rivers Have Wings Катерина выложила аккуратно обученную диффузионную модель, кондишн на текстовых эмбедингах собственно обученного 602M CLIP. Скажем спасибо stability.ai за компьют и помощь в ресерче! По факту подход classifier-free guidance похож на недавний GLIDE от OpenAI.
Генерации просто на высшем уровне. И понимание текста, и целостность (консистентность) изображений, и стилистика. Доступны 481M и 968M модели, обученные на 33M парах изображение-текст, сабсет Yahoo Flickr Creative Commons 100 Million.
💻 Code 🔮 Unofficial Colab
Королева генеративного искусства Rivers Have Wings Катерина выложила аккуратно обученную диффузионную модель, кондишн на текстовых эмбедингах собственно обученного 602M CLIP. Скажем спасибо stability.ai за компьют и помощь в ресерче! По факту подход classifier-free guidance похож на недавний GLIDE от OpenAI.
Генерации просто на высшем уровне. И понимание текста, и целостность (консистентность) изображений, и стилистика. Доступны 481M и 968M модели, обученные на 33M парах изображение-текст, сабсет Yahoo Flickr Creative Commons 100 Million.
💻 Code 🔮 Unofficial Colab
🔥16👍4
Коллеги, друзья. Помогите выбрать победителя для будущей статьи «ИИ Итоги 2021 года» | Мультивыбор
Anonymous Poll
46%
CLIP
50%
DALL-E
14%
VQ-GAN
9%
Perceiver / IO
2%
mDETR
21%
AlphaFold 2
12%
RETRO
3%
LiT
18%
Diffusion Models Beat GAN
11%
CODEX
🔥20👍1
Победителями года стали DALL-E и CLIP! Внимание вопрос: Может ли один трансформер генерировать как DALL-E, и сам оценивать свои результаты, как CLIP (при этом обладая zero-shot и linear probe способностями CLIP)? Одним словом можно ли их объединить?
Final Results
86%
Да. Реально обьединить DALL-E и CLIP в одной сети. Я за гипер-модальные трансформеры будущего!
14%
Невозможно. DALL-E это DALL-E, CLIP это CLIP. Одна модель не может и генерировать классифицировать.
👍9🔥7
🦌🎄☃️ One Hyper-Modal Transformer can be
Creative as DALL-E and Smart as CLIP
Встречайте, RuDOLPH! Текстово-визуальный гипермодальный GPT-3 (350M), сочетающий в себе генеративные возможности текстового GPT-3 и текст-картиночного DALL-E с Reranking & Zero-Shot способностями CLIP.
👀 см картинки к посту
Гипермодальный RuDolph может:
▪️ Генерировать текст
▪️ Генерировать изображения по тексту
▪️ «Проявлять» диффузией в высоком качестве и разрешении сгенерированные изображения
▪️ Изменять (inpainting) изображения по описанию
▪️ Генерировать текстовые описания для изображений
▪️ Быть Feature Extractor’ом для few-shot и linear probe классификации
▪️ Ранжировать изображения по текстовому описанию
▪️ Классифицировать изображения в режиме Zero-Shot
💻 Git Код + Веса
📰 Paper [soon]
🦌 HF demo (только 4 картинки)
🤗 Model Card
🔮 Colab со всеми возможностями
Creative as DALL-E and Smart as CLIP
Встречайте, RuDOLPH! Текстово-визуальный гипермодальный GPT-3 (350M), сочетающий в себе генеративные возможности текстового GPT-3 и текст-картиночного DALL-E с Reranking & Zero-Shot способностями CLIP.
👀 см картинки к посту
Гипермодальный RuDolph может:
▪️ Генерировать текст
▪️ Генерировать изображения по тексту
▪️ «Проявлять» диффузией в высоком качестве и разрешении сгенерированные изображения
▪️ Изменять (inpainting) изображения по описанию
▪️ Генерировать текстовые описания для изображений
▪️ Быть Feature Extractor’ом для few-shot и linear probe классификации
▪️ Ранжировать изображения по текстовому описанию
▪️ Классифицировать изображения в режиме Zero-Shot
💻 Git Код + Веса
📰 Paper [soon]
🦌 HF demo (только 4 картинки)
🤗 Model Card
🔮 Colab со всеми возможностями
🔥23👍16