Нейронавт | Нейросети в творчестве
9.43K subscribers
3.65K photos
3.15K videos
40 files
4.11K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
UniRelight: Learning Joint Decomposition and Synthesis for Video Relighting

Релайтинг от Nvidia.
Помимо прочего умеет учитывать прозрачность объектов.

Код ждем

#relighting #research
🔥1411👍1
Trae Agent

Агент-программист от ByteDance на Claude и Gemini на стадии альфы

Показал высокие результаты на тесте SWE-bench Verified

Обещают добавить поддержку других LLM и MCP

#agent #coding
3👍1
Media is too big
VIEW IN TELEGRAM
Fellou: The World's First Agentic Browser

"Первый в мире" агентный браузер.

Ну да, можно писать "первый в мире", пока опера дуплится, но тут тоже вход по вейтлисту.

#agent #browser #tools
👍5💩31🤔1🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
Orchids

Сервис для создания приложений и веб-сайтов с помощью чата с ИИ. Обещают что результаты не выглядит «сгенерированными ИИ», превосходство над аналогами втрое, блаблабла. И этот тоже "первый в мире"

На бесплатном тарифе 5 запросов в месяц, деплой одного сайта.

#online #text2site #text2app
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
LangScene-X

Создает из набора изображений (от двух, но лучше больше) согласованное видео с учетом 3D, а также трёхмерную сцену, карту сегментации и нормали поверхности

В основе - CogVideoX, а также SAM2 и гауссианы

Код

#image2scene #imageto3d #image2normal #image2mask #image2video #gaussian
7🔥2😐2
VLM Image Captioning Tool

Инструмент для автоматизации описания большого количества изображений. Главная фича - позволяет настроить серию промптов (а не один промпт) для пошагового процесса.

Поддерживает большинство VLM провайдеров, в том числе локальные VLM

Видео

#captioning #image2text #vlm
👍53
В четверг в 6 утра по Москве релиз Grok 4

Твит

#news
👍11🔥2
Media is too big
VIEW IN TELEGRAM
Moonvalley Marey

Новый видеогенератор

1. Натренирован не на ворованных видео (важно бизнесам, юзер больше пофик)
2. Много контроля: поза, перенос движения, траектории движения, образцы объектов, контроль камеры в 3D
3. Качество t2v на данный момент объективно похуже конкурентов
4. Нативная поддержка в CumfyUI

Бесплатного тарифа нет, приветственных кредитов не насыпают

Marey Realism v1.5 in ComfyUI

Спасибо @p0lygon

#text2video #comfyUI
👍8🤯42
This media is not supported in your browser
VIEW IN TELEGRAM
Sara - AI Interviewer for hiring

Трепещите, кожаные. Теперь вас будет отвергать железяка.

ИИ-собеседователь.
Я попытался получить у нее позицию коммерческого директора. Мои знания о том как быть коммерческим директором равны нулю. Но она высоко оценила мою уверенность.

Дают 10-дневную триалку.

А поболтать можно бесплатно

#assistant #hr #interviewer
😁7👀3👎2😱2🍌1
Flux Kontext Character Turnaround Sheet LoRA

Лора #kontext на рабочий лист персонажа

HF
Civitai

#lora #image2image
👍171
HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context

Ресерч.
Если встретите название HumanOmniV2, не путайте его с OmniHuman

Проект HumanOmniV2 от Alibaba направлен на улучшение способности больших языковых моделей (LLM) понимать и интерпретировать человеческие намерения и эмоции через мультимодальные данные.

Если кому нужен код, вот

Код

#llm #research
👍6