Нейронавт | Нейросети в творчестве

Сравнение 10 ИИ-ассистентов кодера

Наверняка предвзятое в какой-то мере, потому что составлено командой CodiumAI, и они поставили себя на 2 место, сразу после Copilot.

* GitHub Copilot
* Codium
* Tabnine
* MutableAI
* Amazon CodeWhisperer
* AskCodi
* Codiga
* Replit
* CodeT5
* OpenAI Codex
* SinCode

#shootout #comparison #coding

👍3

1.09K views06:49

Нейронавт | Нейросети в творчестве

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

0:42

This media is not supported in your browser

VIEW IN TELEGRAM

Cuebric

Набор инструментов онлайн на базе SD со своими кинематографичными моделями, позиционируют себя для филммейкеров и создателей контента. Пример на видео.

- генерация изображений по тексту (естественно)
- сегментация изображений - семантическая и по глубине
- апскейл
- инпейнтинг

Из интересного поддержка .exr и планы на работу с HDR, с глубиной цвета больше 8 бит.

Запросить доступ

#tools #upscale #inpainting #segmentation #image2depth #text2image

👎1🔥1

1.15K views08:21

Нейронавт | Нейросети в творчестве

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

AG3D: Learning to Generate 3D Avatars from 2D Image Collections

Создание 3D аватара человека по набору изображений.
В сравнении с EVA3d дает хорошую геометрию даже по бокам и текстуры без артефактов (см полное видео). Результат пригоден для анимации

Код
Полное видео, 4 минуты

#imageto3D #image2avatar #humanavatar #3Davatar #humananimation

1.24K views11:28

Нейронавт | Нейросети в творчестве

Zero2Story

Занятный комплексный демоспейс для создания историй.
По шагам проводит вас через настройку персонажей, жанр, сеттинг и т. д. На выходе рассказ с картинками и каким-то звуком.

#text2story #tools #assistant

🔥8

17.5K views11:31

Нейронавт | Нейросети в творчестве

Zero123++: a Single Image to Consistent Multi-view Diffusion Base Model

Диффузионный генератор новых ракурсов по одному изображению

Код
Демо (официальный)
Демо2
Колаб

#novelview #image2image

🔥6

1.2K viewsedited 07:32

Нейронавт | Нейросети в творчестве

2:32

This media is not supported in your browser

VIEW IN TELEGRAM

DreamCraft3D: Hierarchical 3D Generation with Bootstrapped Diffusion Prior

Генератор 3D моделей по одному изображению. Хвастаются хитростями, к которым пришлось прибегнуть чтобы результат выглядел хорошо. Но пусть покажут сетку)

Код обещают выложить

#imageto3D

🔥3👍1

1.13K views06:36

Нейронавт | Нейросети в творчестве

0:47

This media is not supported in your browser

VIEW IN TELEGRAM

GPT Engineer

ИИ-программист, пишет всю кодовую базу по текстовому заданию. Умеет переписывать ваш имеющийся код. Можно установить локально. Для работы требуется API ключ OpenAI или локальная языковая модель.

Код

#coding #text2code #code2code

👍6

1.36K views07:06

Нейронавт | Нейросети в творчестве

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

HyperFields:Towards Zero-Shot Generation of NeRFs from Text

Генератор #nerf по тексту
Но зачем когда у нас уже есть DreamGaussian
Впрочем, посмотрим разовьется ли это направление или это мертвая ветка.

Код, для запуска потребуется GPU с минимум 48 GB VRAM

#text2nerf

1.04K views07:42

Нейронавт | Нейросети в творчестве

SALMONN: Speech Audio Language Music Open Neural Network

Распозначание речи, музыки и прочих звуков на основе LLM, с последующим чатом.

Код
Демо
Веса

#chatbot #audio2text

👍2

1.14K views11:32

Нейронавт | Нейросети в творчестве

0:45

This media is not supported in your browser

VIEW IN TELEGRAM

Pegasus-1

Какое название подойдет чтобы конкурировать с Eleven Labs? Правильно, Twelve Labs. И вот они объявляют (твиттер) о релизе своей базовой модели преобразования видео в текст. Уверяют что их модель анализирует именно видеоданные. Аудио и речь, конечно, тоже.

Записаться в вейтлист

#video2text

🔥3

1.18K viewsedited 11:57

Нейронавт | Нейросети в творчестве

Forwarded from e/acc

ChatGPT теперь поддерживает работу с файлами (загружай PDF и задавай вопросы) и совмещение разных модальностей в одном чате (может рисовать картинки, гуглить, писать и исполнять код в одном чате).

Для большинства это шок, потому что их стартап идея была разбита о быструю доставку качественного продукта команды OpenAI с инженерами за $600к в год.

Дабы предупредить будущий шок, давайте сразу обсудим, что ChatGPT выкатит в следующих версиях:

- подключение своих данных: Gmail, slack, WhatsApp
- общение в едином чате, который помнит все о вас. по сути - разговор с ассистентом.
- возможность соединять цепочки действий и плагинов (агенты)
- маркетплейс плагинов с монетизацией и курацией (curation, если на человеческом)
- полная мультимодальность: на вход видео, на выход голос; на вход музыку, на выход видео; на вход excel на выход диаграммы
- проактивный ИИ: сам поймёт когда и что у вас спросить или вам рассказать
- у каждого пользователя персональная модель, обученная на последних годах диалога (каждому — свою LoRA)

625 views05:28

Нейронавт | Нейросети в творчестве

0:57

This media is not supported in your browser

VIEW IN TELEGRAM

Coqui + Bark Voice Cloning

Демоспейс для клонирования голоса по 20-секундному образцу снова работает. Можно сохранять голоса. Даже умеет несколько коряво говорить по-русски. Возможно, если ему скормить русскоязычный образец, будет получше.

Демо

#voicecloning #text2speech

🔥3

1.27K viewsedited 07:06

Нейронавт | Нейросети в творчестве

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Real-Time Latent Consistency Model

👞туц-👞туц-👞туц-👞туц
дальше музыка должна сама запуститься в голове
Стилизация видео в браузере «в реальном времени». У меня вышло чуть быстрее 1 fps.
А все дело в Latent Consistency Model

#video2video #realtime

🔥4

1.06K views08:50

Нейронавт | Нейросети в творчестве

FastSD CPU

И еще про Latent Consistency Model, полезная штука, оказывается.
StableDuffusion на процессоре, без GPU

Скачать бета-релиз здесь
Гитхаб - здесь в том числе и инструкция по установке

#text2image

995 views11:20

Нейронавт | Нейросети в творчестве

1:15

Media is too big

VIEW IN TELEGRAM

Unity + StableDiffusion = варьирование текстур.
Текстурирование обратной стороны в разработке.

реддит

#text2texture

1.01K views11:28

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Wonder3D: Single Image to 3D using Cross-Domain Diffusion

Генератор 3D моделей по одному изображению.
Применен известный уже трюк с заходом на 3D через карту нормалей. Делают это многократно для получения пачки ракурсов, из которых уже восстанавливают текстурированный меш.

Тест Бендера на ракурсах проходит очень неплохо! (кину в комментарии). А меш демка не делает, к сожалению

Код
Колаб
Демо

#imageto3D

👍1

1.1K views11:42

Нейронавт | Нейросети в творчестве

Forwarded from QWERTY

1:08

Media is too big

VIEW IN TELEGRAM

Робопёс-экскурсовод. Boston Dynamics Spot + ChatGPT

Оснастив робопса чат-ботом, компания Boston Dynamics создала гида по своей лаборатории, который может проводить экскурсии от имени разных персонажей. Для этого Spot оснастили динамками, микрофоном и API ChatGPT. Чтобы ещё больше оживить образ машины, разработчики добавили к ней вместо рта роботизированный манипулятор, на котором закрепили небольшой головной убор и пару пластиковых глаз. Наконец, ему предложили проводить экскурсии от имени разных персонажей: гида-британца времён Шекспира, девочки-подростка и саркастичного Джоша (Josh).

Spot говорил людям комплименты, на ходу сочинял стихи и успешно отвечал на вопросы, которых не было в сценарии: когда его попросили показать родителей, они привёл посетителя к выставленным роботам Spot предыдущего поколения. Но как и обычный ChatGPT, иногда он мог рассказать не соответствующие действительности вещи.

👍2🔥1🤔1

953 views13:06

About

Blog

Apps

Platform