#unrealneural
MV-RAG: Retrieval Augmented Multiview Diffusion
TextTo3D генерация продвинулась вперед. MV-RAG – новый конвейер преобразования текста в 3D, который сначала извлекает релевантные двумерные изображения из большой базы данных 2D-данных, а затем обуславливает на этих изображениях многоракурсную модель диффузии для синтеза согласованных и точных многоракурсных результатов.
MV-RAG совершенствует генерацию многоракурсных изображений, объединяя внутренние знания предобученной многоракурсной модели с внешними визуальными сигналами, полученными из большой базы данных изображений. На этапе вывода полученные двумерные изображения кодируются в токены с помощью кодировщика изображений, а затем обучаемого ресемплера. В многоракурсной модели диффузии трёхмерные слои собственного внимания обеспечивают согласованность между сгенерированными представлениями. Каждый слой перекрёстного внимания затем работает в двух параллельных ветвях: одна обусловлена текстовыми токенами, а другая — полученными токенами изображений. Их выходные данные объединяются с использованием коэффициента слияния, прогнозируемого модулем Prior-Guided Attention.
https://yosefdayani.github.io/MV-RAG/
MV-RAG: Retrieval Augmented Multiview Diffusion
TextTo3D генерация продвинулась вперед. MV-RAG – новый конвейер преобразования текста в 3D, который сначала извлекает релевантные двумерные изображения из большой базы данных 2D-данных, а затем обуславливает на этих изображениях многоракурсную модель диффузии для синтеза согласованных и точных многоракурсных результатов.
MV-RAG совершенствует генерацию многоракурсных изображений, объединяя внутренние знания предобученной многоракурсной модели с внешними визуальными сигналами, полученными из большой базы данных изображений. На этапе вывода полученные двумерные изображения кодируются в токены с помощью кодировщика изображений, а затем обучаемого ресемплера. В многоракурсной модели диффузии трёхмерные слои собственного внимания обеспечивают согласованность между сгенерированными представлениями. Каждый слой перекрёстного внимания затем работает в двух параллельных ветвях: одна обусловлена текстовыми токенами, а другая — полученными токенами изображений. Их выходные данные объединяются с использованием коэффициента слияния, прогнозируемого модулем Prior-Guided Attention.
https://yosefdayani.github.io/MV-RAG/
❤4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Brainchop
Инструмент с открытым исходным кодом для 3D-сегментации МРТ в вашем браузере с использованием облегченной модели глубокого обучения. Загрузите свой МРТ в формате NIfTI для анализа.
https://brainchop.org/
https://github.com/neuroneural/brainchop
Brainchop
Инструмент с открытым исходным кодом для 3D-сегментации МРТ в вашем браузере с использованием облегченной модели глубокого обучения. Загрузите свой МРТ в формате NIfTI для анализа.
https://brainchop.org/
https://github.com/neuroneural/brainchop
👍3❤🔥1❤1⚡1
#unrealneural
Вышла моя статья-размышления:
"Архитектура в эпоху ИИ: как технологии меняют понимание пространства"
https://hi-tech.mail.ru/review/132528-arhitektura-v-epohu-ii-kak-tehnologii-menyayut-ponimanie-prostranstva/
Пишите обратную связь в комментариях
Вышла моя статья-размышления:
"Архитектура в эпоху ИИ: как технологии меняют понимание пространства"
https://hi-tech.mail.ru/review/132528-arhitektura-v-epohu-ii-kak-tehnologii-menyayut-ponimanie-prostranstva/
Пишите обратную связь в комментариях
❤11👍7⚡5
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
VoxHammer от Tencent и Бэйханского университета
Не требующий обучения метод точного и последовательного 3D-редактирования, работающий непосредственно в исходном скрытом 3D-пространстве.
Он гарантирует, что неотредактированные области останутся идеальными, а новые изменения будут легко интегрированы.
https://huggingface.co/papers/2508.19247
VoxHammer от Tencent и Бэйханского университета
Не требующий обучения метод точного и последовательного 3D-редактирования, работающий непосредственно в исходном скрытом 3D-пространстве.
Он гарантирует, что неотредактированные области останутся идеальными, а новые изменения будут легко интегрированы.
https://huggingface.co/papers/2508.19247
👍3⚡1❤1
#unrealneural
Drawing2CAD
Transformer, преобразующая векторные чертежи (SVG) в последовательность DeepCAD. Использование векторных данных вместо растровых (изображений) повышает точность примерно на 7%.
https://github.com/lllssc/Drawing2CAD
Drawing2CAD
Transformer, преобразующая векторные чертежи (SVG) в последовательность DeepCAD. Использование векторных данных вместо растровых (изображений) повышает точность примерно на 7%.
https://github.com/lllssc/Drawing2CAD
👍3⚡1❤🔥1🔥1
#unrealneural
SAT-SKYLINES
Создание 3D mesh зданий по спутниковым снимкам + грубая геометрия. Cities: Skylines в качестве набора данных.
https://arxiv.org/abs/2508.18531
SAT-SKYLINES
Создание 3D mesh зданий по спутниковым снимкам + грубая геометрия. Cities: Skylines в качестве набора данных.
https://arxiv.org/abs/2508.18531
👍8⚡2❤1
Media is too big
VIEW IN TELEGRAM
#unrealneural
MatchAnything — это мощный фреймворк, который позволяет сопоставлять ключевые точки между сильно различающимися и даже искаженными изображениями, такими как вид карты iPhone и аэрофотоснимки Google или тепловизионные и дневные изображения.
MatchAnything — это мощный фреймворк, который позволяет сопоставлять ключевые точки между сильно различающимися и даже искаженными изображениями, такими как вид карты iPhone и аэрофотоснимки Google или тепловизионные и дневные изображения.
👍3⚡1🔥1
#unrealneural
Как новый эволюционный алгоритм Sakana AI создает мощные модели ИИ без дорогостоящего переобучения
Статья посвящена новому эволюционному алгоритму Model Merging of Natural Niches (M2N2), разработанному японской лабораторией Sakana AI. Этот метод позволяет улучшать возможности ИИ-моделей без дорогостоящего переобучения или тонкой настройки. M2N2 объединяет параметры нескольких специализированных моделей в одну, более мощную, сохраняя их сильные стороны. Алгоритм подходит для разных типов моделей, включая большие языковые модели (LLM) и генераторы изображений.
https://venturebeat.com/ai/how-sakana-ais-new-evolutionary-algorithm-builds-powerful-ai-models-without-expensive-retraining/
Как новый эволюционный алгоритм Sakana AI создает мощные модели ИИ без дорогостоящего переобучения
Статья посвящена новому эволюционному алгоритму Model Merging of Natural Niches (M2N2), разработанному японской лабораторией Sakana AI. Этот метод позволяет улучшать возможности ИИ-моделей без дорогостоящего переобучения или тонкой настройки. M2N2 объединяет параметры нескольких специализированных моделей в одну, более мощную, сохраняя их сильные стороны. Алгоритм подходит для разных типов моделей, включая большие языковые модели (LLM) и генераторы изображений.
https://venturebeat.com/ai/how-sakana-ais-new-evolutionary-algorithm-builds-powerful-ai-models-without-expensive-retraining/
👍3🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #ЛабораторияИИ #AILAB
Туториал 2. Генерация с помощью Nano Banana + KLING 2.1
1. Загружаем исходное изображение
2. Создаем различные ракурсы с помощью Nano Banana
3. Комбинируем ракурсы с помощью KLING 2.1 keyframes
4. Монтируем все вместе
Туториал 2. Генерация с помощью Nano Banana + KLING 2.1
1. Загружаем исходное изображение
2. Создаем различные ракурсы с помощью Nano Banana
3. Комбинируем ракурсы с помощью KLING 2.1 keyframes
4. Монтируем все вместе
👍5❤4⚡1🥱1
#unrealneural
CAD-Llama
В последнее время большие языковые модели (LLM) достигли значительного успеха, что вызвало повышенный интерес к расширению их генеративных возможностей за пределы общего текста. В данном исследовании изучается генерация параметрических последовательностей для моделей систем автоматизированного проектирования (САПР) с использованием LLM.
https://arxiv.org/pdf/2505.04481
CAD-Llama
В последнее время большие языковые модели (LLM) достигли значительного успеха, что вызвало повышенный интерес к расширению их генеративных возможностей за пределы общего текста. В данном исследовании изучается генерация параметрических последовательностей для моделей систем автоматизированного проектирования (САПР) с использованием LLM.
https://arxiv.org/pdf/2505.04481
👍2🔥2⚡1
#unrealneural
CAD-GPT
CAD-GPT — метод синтеза САПР с использованием MLLM, улучшенного на основе пространственного мышления, который в качестве входных данных использует либо одно изображение, либо текстовое описание.
https://www.semanticscholar.org/reader/51a8d15cb89f7a754cca514ffc32825ab5e5fa74
CAD-GPT
CAD-GPT — метод синтеза САПР с использованием MLLM, улучшенного на основе пространственного мышления, который в качестве входных данных использует либо одно изображение, либо текстовое описание.
https://www.semanticscholar.org/reader/51a8d15cb89f7a754cca514ffc32825ab5e5fa74
⚡2❤1👍1