OpenAI добавили в DALL-E 2 новую фичу - #outpainting
То есть генерация снаружи инит-картинки.
То же самое что #inpainting только редактор стал удобнее.
Я счел это поводом потратить свои кредиты
1. Богатыри Васнецова ждут 14й трамвай, а идут только 5 и 42
2. Музыканты Караваджо выступают на рок-арене
3. Крик ужаса от приближающегося с каждым днем Шуфутинского
То есть генерация снаружи инит-картинки.
То же самое что #inpainting только редактор стал удобнее.
Я счел это поводом потратить свои кредиты
1. Богатыри Васнецова ждут 14й трамвай, а идут только 5 и 42
2. Музыканты Караваджо выступают на рок-арене
3. Крик ужаса от приближающегося с каждым днем Шуфутинского
😁8🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Нейрогенератор лиц с отдельным от личностных деталей внешнего вида контролем мимики. С морфингом лиц, само собой
Controllable 3D Generative Adversarial Face Model via Disentangling Shape and Appearance
Есть код
Controllable 3D Generative Adversarial Face Model via Disentangling Shape and Appearance
Есть код
This media is not supported in your browser
VIEW IN TELEGRAM
Про расшифровку зрительных образов уже было. Теперь подвезли расшифровку мысленной речи.
В запрещенной Meta разработали модель ИИ, которая может декодировать речь на основе неинвазивных записей активности мозга.
На основе трех секунд мозговой активности модель может декодировать соответствующие сегменты речи с точностью до 73% от верхнего предела из словарного запаса в 793 слова, т.е. большую часть слов, которые люди обычно используют в повседневной жизни.
В качестве данных использовали более 150 часов записей 169 здоровых добровольцев, слушавших аудиокниги и изолированные предложения на английском и голландском языках. Короче, у них все получилось, оно работает.
В запрещенной Meta разработали модель ИИ, которая может декодировать речь на основе неинвазивных записей активности мозга.
На основе трех секунд мозговой активности модель может декодировать соответствующие сегменты речи с точностью до 73% от верхнего предела из словарного запаса в 793 слова, т.е. большую часть слов, которые люди обычно используют в повседневной жизни.
В качестве данных использовали более 150 часов записей 169 здоровых добровольцев, слушавших аудиокниги и изолированные предложения на английском и голландском языках. Короче, у них все получилось, оно работает.
👍2
В недрах Adobe есть сервис Shasta для улучшения качества звука, в частности речи. Пятиминутная демонстрация (второе видео) очень впечатлила меня.
А на первом видео эксперимент с нецелевым использованием - речь стилизовали под пианино.
Доступ к полному функционалу дают по запросу. Видимо, бета.
Без запроса можно залить аудитрек на улучшение, но без какого-либо контроля. Просто залил - скачал.
А на первом видео эксперимент с нецелевым использованием - речь стилизовали под пианино.
Доступ к полному функционалу дают по запросу. Видимо, бета.
Без запроса можно залить аудитрек на улучшение, но без какого-либо контроля. Просто залил - скачал.
Нейронавт | Нейросети в творчестве
В недрах Adobe есть сервис Shasta для улучшения качества звука, в частности речи. Пятиминутная демонстрация (второе видео) очень впечатлила меня. А на первом видео эксперимент с нецелевым использованием - речь стилизовали под пианино. Доступ к полному функционалу…
Поиздеваться над музыкой речевым фильтром можно здесь
Нейронавт | Нейросети в творчестве
В недрах Adobe есть сервис Shasta для улучшения качества звука, в частности речи. Пятиминутная демонстрация (второе видео) очень впечатлила меня. А на первом видео эксперимент с нецелевым использованием - речь стилизовали под пианино. Доступ к полному функционалу…
Audio
Нейронавт | Нейросети в творчестве
В недрах Adobe есть сервис Shasta для улучшения качества звука, в частности речи. Пятиминутная демонстрация (второе видео) очень впечатлила меня. А на первом видео эксперимент с нецелевым использованием - речь стилизовали под пианино. Доступ к полному функционалу…
enhanced.wav
3.4 MB
👍2😁2
Мой любимый блогер музыкант пытается заставить нейросеть сочинить песню.
https://youtu.be/Pa1CIz1CbWw
https://youtu.be/Pa1CIz1CbWw
YouTube
Нейросеть дописывает песни [яндекс Балабоба]
Учусь извлекать из нейросети "Балабоба" пользу и пытаюсь понять, есть ли с неё толк для меня, как для сонграйтера.
Большой разбор текста, о котором я упоминаю в начале видео https://youtu.be/iNODxMkInDo
►Поддержать меня и создание видео:
BOOSTY - http…
Большой разбор текста, о котором я упоминаю в начале видео https://youtu.be/iNODxMkInDo
►Поддержать меня и создание видео:
BOOSTY - http…
👍4
Архитектура GPT-3 - на сегодняшний день величайшее достижение в генерации текста, но ей уже полтора года, в мире машинного обучения это старость. Похоже, GPT-4 будет уметь не только в текст, но во все остальное
👍2
Forwarded from Мишин Лернинг 🇺🇦🇮🇱
❗️OpenAI начало обучать GPT-4. Обучение будет закончено через пару месяцев
Сказать больше не могу, чтобы не подставлять.. Но что стоит знать:
— Огромное количество параметров
— Спарс парадигма
— Стоимость обучения ~ $.e6
— Text, audio-vqvae, image-vqvae (возможно и видео) токены в одном потоке
— SOTA в огромном количестве задач! Особенно значимые результаты в мультимодальном домене.
— Релизное окно: Декабрь-Февраль
p.s.: откуда инфа? ..оттуда. доверяю ли я ей сам? ну в чём-то да, в чём-то нет. мое дело рассказать, ваше — отказаться
@мишин лернинг
Сказать больше не могу, чтобы не подставлять.. Но что стоит знать:
— Огромное количество параметров
— Спарс парадигма
— Стоимость обучения ~ $.e6
— Text, audio-vqvae, image-vqvae (возможно и видео) токены в одном потоке
— SOTA в огромном количестве задач! Особенно значимые результаты в мультимодальном домене.
— Релизное окно: Декабрь-Февраль
p.s.: откуда инфа? ..оттуда. доверяю ли я ей сам? ну в чём-то да, в чём-то нет. мое дело рассказать, ваше — отказаться
@мишин лернинг
👍1🔥1
Оптимизированный #stablediffusion
Разрешение картинок 576x1280 на 6 GB VRAM
https://github.com/neonsecret/stable-diffusion
Колаб
Разрешение картинок 576x1280 на 6 GB VRAM
https://github.com/neonsecret/stable-diffusion
Колаб
GitHub
GitHub - neonsecret/stable-diffusion
Contribute to neonsecret/stable-diffusion development by creating an account on GitHub.
❤1👍1🔥1