This media is not supported in your browser
VIEW IN TELEGRAM
UniRelight: Learning Joint Decomposition and Synthesis for Video Relighting
Релайтинг от Nvidia.
Помимо прочего умеет учитывать прозрачность объектов.
Код ждем
#relighting #research
Релайтинг от Nvidia.
Помимо прочего умеет учитывать прозрачность объектов.
Код ждем
#relighting #research
🔥14⚡1❤1👍1
Trae Agent
Агент-программист от ByteDance на Claude и Gemini на стадии альфы
Показал высокие результаты на тесте SWE-bench Verified
Обещают добавить поддержку других LLM и MCP
#agent #coding
Агент-программист от ByteDance на Claude и Gemini на стадии альфы
Показал высокие результаты на тесте SWE-bench Verified
Обещают добавить поддержку других LLM и MCP
#agent #coding
GitHub
GitHub - bytedance/trae-agent: Trae Agent is an LLM-based agent for general purpose software engineering tasks.
Trae Agent is an LLM-based agent for general purpose software engineering tasks. - bytedance/trae-agent
❤3👍1
Media is too big
VIEW IN TELEGRAM
Fellou: The World's First Agentic Browser
"Первый в мире" агентный браузер.
Ну да, можно писать "первый в мире", пока опера дуплится, но тут тоже вход по вейтлисту.
#agent #browser #tools
"Первый в мире" агентный браузер.
Ну да, можно писать "первый в мире", пока опера дуплится, но тут тоже вход по вейтлисту.
#agent #browser #tools
👍5💩3❤1🤔1🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
Orchids
Сервис для создания приложений и веб-сайтов с помощью чата с ИИ. Обещают что результаты не выглядит «сгенерированными ИИ», превосходство над аналогами втрое, блаблабла. И этот тоже "первый в мире"
На бесплатном тарифе 5 запросов в месяц, деплой одного сайта.
#online #text2site #text2app
Сервис для создания приложений и веб-сайтов с помощью чата с ИИ. Обещают что результаты не выглядит «сгенерированными ИИ», превосходство над аналогами втрое, блаблабла. И этот тоже "первый в мире"
На бесплатном тарифе 5 запросов в месяц, деплой одного сайта.
#online #text2site #text2app
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
LangScene-X
Создает из набора изображений (от двух, но лучше больше) согласованное видео с учетом 3D, а также трёхмерную сцену, карту сегментации и нормали поверхности
В основе - CogVideoX, а также SAM2 и гауссианы
Код
#image2scene #imageto3d #image2normal #image2mask #image2video #gaussian
Создает из набора изображений (от двух, но лучше больше) согласованное видео с учетом 3D, а также трёхмерную сцену, карту сегментации и нормали поверхности
В основе - CogVideoX, а также SAM2 и гауссианы
Код
#image2scene #imageto3d #image2normal #image2mask #image2video #gaussian
❤7🔥2😐2
VLM Image Captioning Tool
Инструмент для автоматизации описания большого количества изображений. Главная фича - позволяет настроить серию промптов (а не один промпт) для пошагового процесса.
Поддерживает большинство VLM провайдеров, в том числе локальные VLM
Видео
#captioning #image2text #vlm
Инструмент для автоматизации описания большого количества изображений. Главная фича - позволяет настроить серию промптов (а не один промпт) для пошагового процесса.
Поддерживает большинство VLM провайдеров, в том числе локальные VLM
Видео
#captioning #image2text #vlm
GitHub
GitHub - victorchall/vlm-caption: Multiturn VLM Bulk captioning using your api service
Multiturn VLM Bulk captioning using your api service - victorchall/vlm-caption
👍5❤3
Media is too big
VIEW IN TELEGRAM
Moonvalley Marey
Новый видеогенератор
1. Натренирован не на ворованных видео (важно бизнесам, юзер больше пофик)
2. Много контроля: поза, перенос движения, траектории движения, образцы объектов, контроль камеры в 3D
3. Качество t2v на данный момент объективно похуже конкурентов
4. Нативная поддержка в CumfyUI
Бесплатного тарифа нет, приветственных кредитов не насыпают
Marey Realism v1.5 in ComfyUI
Спасибо @p0lygon
#text2video #comfyUI
Новый видеогенератор
1. Натренирован не на ворованных видео (важно бизнесам, юзер больше пофик)
2. Много контроля: поза, перенос движения, траектории движения, образцы объектов, контроль камеры в 3D
3. Качество t2v на данный момент объективно похуже конкурентов
4. Нативная поддержка в CumfyUI
Бесплатного тарифа нет, приветственных кредитов не насыпают
Marey Realism v1.5 in ComfyUI
Спасибо @p0lygon
#text2video #comfyUI
👍8🤯4❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Sara - AI Interviewer for hiring
Трепещите, кожаные. Теперь вас будет отвергать железяка.
ИИ-собеседователь.
Я попытался получить у нее позицию коммерческого директора. Мои знания о том как быть коммерческим директором равны нулю. Но она высоко оценила мою уверенность.
Дают 10-дневную триалку.
А поболтать можно бесплатно
#assistant #hr #interviewer
Трепещите, кожаные. Теперь вас будет отвергать железяка.
ИИ-собеседователь.
Я попытался получить у нее позицию коммерческого директора. Мои знания о том как быть коммерческим директором равны нулю. Но она высоко оценила мою уверенность.
Дают 10-дневную триалку.
А поболтать можно бесплатно
#assistant #hr #interviewer
😁7👀3👎2😱2🍌1
Flux Kontext Character Turnaround Sheet LoRA
Лора #kontext на рабочий лист персонажа
HF
Civitai
#lora #image2image
Лора #kontext на рабочий лист персонажа
HF
Civitai
#lora #image2image
👍17❤1
Media is too big
VIEW IN TELEGRAM
DLoRAL: One-Step Diffusion for Detail-Rich and Temporally Consistent Video Super-Resolution
Новый апскейлер с фокусом на точность, а не креатив. По капотом SD2.1
Код
Бонус: список диффузных видео апскейлеров
#upscale #Upscalevideo #superresolution
Новый апскейлер с фокусом на точность, а не креатив. По капотом SD2.1
Код
Бонус: список диффузных видео апскейлеров
#upscale #Upscalevideo #superresolution
👍8🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
StreamDiT: Real-Time Streaming Text-to-Video Generation
Генерация видео из текста в режиме реального времени, ресерч от Meta и ко.
Разрешение 512p, 16 fps на H100
Первая тройка видео - на модели 4B параметров
Вторая тройка видео - на модели 30B, не рилтайм
Кода нет
#realtime #text2video #research
Генерация видео из текста в режиме реального времени, ресерч от Meta и ко.
Разрешение 512p, 16 fps на H100
Первая тройка видео - на модели 4B параметров
Вторая тройка видео - на модели 30B, не рилтайм
Кода нет
#realtime #text2video #research
👍11
HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context
Ресерч.
Если встретите название HumanOmniV2, не путайте его с OmniHuman
Проект HumanOmniV2 от Alibaba направлен на улучшение способности больших языковых моделей (LLM) понимать и интерпретировать человеческие намерения и эмоции через мультимодальные данные.
Если кому нужен код, вот
Код
#llm #research
Ресерч.
Если встретите название HumanOmniV2, не путайте его с OmniHuman
Проект HumanOmniV2 от Alibaba направлен на улучшение способности больших языковых моделей (LLM) понимать и интерпретировать человеческие намерения и эмоции через мультимодальные данные.
Если кому нужен код, вот
Код
#llm #research
huggingface.co
Paper page - HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context
Join the discussion on this paper page
👍6