Нейронавт | Нейросети в творчестве
9.4K subscribers
3.62K photos
3.14K videos
40 files
4.1K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Meta AI разродилась (-лись?) рядом релизов
Во-первых, ИИ-чатботом

the Verge
Media is too big
VIEW IN TELEGRAM
Вернее, это ИИ-ассистент которого они внедряют во все приложения девайсы. Он будет уметь генерировать и редактировать картинки, создавать кастомные стикеры. Умеет ходить в интернет и искать в партнерстве с Bing. Под капотом Llama 2.

В боте уже есть разные персонажи, но интереснее что дадут доступ в AI Studio для разработки пользовательских ИИ

Блог
👍2
Ну и конечно очки Ray-Ban Meta Smart Glasses

На которых будет что? Правильно, ИИ Meta AI.
Стриминг, видеозапись, звонки, вот это все.
А знаете что самое главное? Для меня как очкарика главное что есть возможность использовать линзы с диоптриями
NeuRBF: A Neural Fields Representation with Adaptive Radial Basis Functions

Новый тип #nerf
Если обычно в них для описания сцены используется сетка, то тут радиальные базы, что бы это ни значило. Так достигается лучшее качество и компактность модели. Умеет описывать 2D картинки и SDF (поля расстояний со знаком). По представленным примерам превосходит конкурентов, в том числе нвидиевский instant NGP

Код есть, можно поковырять

#novelview #rendering
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Я просто охреневаю, какие грани обретает идея, если посмотреть на неё под немного другим углом.

Что это - ретро-реконструкция, historical splatting, prehistoric metaverse? Хаха.

Так или иначе, Polycam научился Gaussian splatting, и на мобильных устройствах его тоже можно попробовать.

Кидайте идеи, что можно перевести в 3D? Прибытие поезда и высадка на луну уже заняты!
🔥8
Media is too big
VIEW IN TELEGRAM
AnimeInbet: Deep Geometrized Cartoon Line Inbetweening

Интерполяция промежуточных кадров лайнарта в анимации с учетом геометрии. Есть тут аниматоры чтобы оценить?

Код
Видео полной презентации, 7 минут

#frameinterpolation #animation
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Show-1: Marrying Pixel and Latent Diffusion Models for Text-to-Video

Генератор видео по тексту. Демонстрирует лучшее следование пропмту в сравнении с конкурентами.

Код

#text2video
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
RealFillReference-Driven Generation for Authentic Image Completion

Прикольная штука. Дополняет изображение по референсам. Например, из нескольких фото одно было бы самым удачным если б не неудачное кадрирование. RealFill посмотрит остальные фотки и дорисует то что за кадром. Ну или наоборот, заменит что-то внутри кадра.

На входных референсах дообучается, поэтому работает медленно.
Не справится если ракурс на референсе сильно отличается от ракурса целевой картинки

Сходите на сайт, там много примеров

Кода нет

#image2image #inpainting #outpainting
🔥6👍1
Доступ к DALL-E 3 открыли для всех. Но это неточно. Если что, заходите через VPN. Сгенерировать Бендера еще никогда не было так просто!

Окрываем в чате портал для ваших генераций

Попробовать DALL-E 3

#text2image
6🔥2
Media is too big
VIEW IN TELEGRAM
Decaf: Monocular Deformation Capture for Face and Hand Interactions

Восстановление 3D головы и рук и их взаимодействия с деформациями по одному видео.

Код обещают выложить

Полное видео, 4 минуты

#videoto3D #talkinghead #humanavatar #head #hands #mocap
👏8
This media is not supported in your browser
VIEW IN TELEGRAM
Nova2 от Deepgram

Транскрибатор речи из аудио в текст.
Deepgram поддерживает много языков, в том числе русский и английский.
Про Nova2 на сайте висит инфа что пока только английский и планируют расширять список языков.

Заявлено лучшее качество и скорость среди конкурентов.
На вход принимает файлы и потоковое аудио в реальном времени.
Умеет в суммаризацию и еще какие-то ИИ-постобработки.
Есть API. Короче, плюшек много.

На старте дают бесплатного сервиса на 200$, обработка минуты аудио примерно от 0.005$. Немало? Ну а когда эти стартовые иссякнут вы знаете что делать.

#speech2text
👍1🔥1