This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
STream3R
Масштабируемая последовательная 3D-реконструкция с помощью Causal Transformer
https://huggingface.co/papers/2508.10893
STream3R
Масштабируемая последовательная 3D-реконструкция с помощью Causal Transformer
https://huggingface.co/papers/2508.10893
👍2⚡1❤1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
LongSplat от NVIDIA
Неструктурированный 3D-гауссовский сплэттинг для простых длинных видео
https://huggingface.co/papers/2508.14041
LongSplat от NVIDIA
Неструктурированный 3D-гауссовский сплэттинг для простых длинных видео
https://huggingface.co/papers/2508.14041
👍4⚡2
Media is too big
VIEW IN TELEGRAM
#unrealneural #туториалы #AILAB
Туториал 1. Редактирование изображения в Krea.ai и создание анимации в Midjourney
Тестирую новый формат. Новая модель редактирования изображений Qwen Image Edit вполне хорошо добавляет локальные точечные изменения и не так сильно меняет форму архитектуры. Вот какой результат получился.
В видео использовались сервисы
Krea.ai
midjourney.com
Youtube
https://youtu.be/L-QcsTgq6XQ
Туториал 1. Редактирование изображения в Krea.ai и создание анимации в Midjourney
Тестирую новый формат. Новая модель редактирования изображений Qwen Image Edit вполне хорошо добавляет локальные точечные изменения и не так сильно меняет форму архитектуры. Вот какой результат получился.
В видео использовались сервисы
Krea.ai
midjourney.com
Youtube
https://youtu.be/L-QcsTgq6XQ
🔥14👍2👏2
#unrealneural
VGGT — это новый подход к 3D, и он получил премию CVPR 2025 за лучшую работу.
Но из-за глобального внимания (global attention) его сложность растет квадратично с количеством изображений, поэтому вы не сможете скормить ему много изображений.
https://vgg-t.github.io/
VGGT — это новый подход к 3D, и он получил премию CVPR 2025 за лучшую работу.
Но из-за глобального внимания (global attention) его сложность растет квадратично с количеством изображений, поэтому вы не сможете скормить ему много изображений.
https://vgg-t.github.io/
👍5🔥1
#unrealneural #вкопилкуэрудита
Одна из идей глубокого обучения заключается в том, что слои нейронной сети - это ряд геометрических преобразований ⚡️
https://phillipi.github.io/6.7960/materials/notes/02_neural_nets_as_distribution_transformers.pdf
Одна из идей глубокого обучения заключается в том, что слои нейронной сети - это ряд геометрических преобразований ⚡️
https://phillipi.github.io/6.7960/materials/notes/02_neural_nets_as_distribution_transformers.pdf
🔥4⚡1👍1
#unrealneural
От простых набросков до 3D-интерьеров с помощью Qwen-Image-Edit
Выглядит очень хорошо 👍
https://chat.qwen.ai/?inputFeature=image_edit
От простых набросков до 3D-интерьеров с помощью Qwen-Image-Edit
Выглядит очень хорошо 👍
https://chat.qwen.ai/?inputFeature=image_edit
🔥8👍4🤮1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Еще немного шикарных результатов с использованием Kling 2.1 Start & End Frame
P.S. видео не мое
Еще немного шикарных результатов с использованием Kling 2.1 Start & End Frame
P.S. видео не мое
⚡6👍3❤2👎1
#unrealneural #вкопилкуэрудита
"Эффект МакКордак"("Эффект AI")
Как только ИИ осваивает новую задачу, её часто начинают считать простой вычислительной операцией, а не примером интеллектуального процесса. Это приводит к постоянному пересмотру границ того, что считается ИИ, а что — интеллектуальной деятельностью.
Эффект назван в честь Памелы МакКордак, писательницы и исследовательницы ИИ, которая описала этот феномен в своей книге «Machines Who Think» (1979).
Яркий пример - когда шахматный компьютер Deep Blue обыграл чемпиона мира, многие были разочарованы: это была не та форма суперинтеллекта, о которой мечтали. Задача просто перестала быть показателем интеллекта, как только решилась машиной.
"Эффект МакКордак"("Эффект AI")
Как только ИИ осваивает новую задачу, её часто начинают считать простой вычислительной операцией, а не примером интеллектуального процесса. Это приводит к постоянному пересмотру границ того, что считается ИИ, а что — интеллектуальной деятельностью.
Эффект назван в честь Памелы МакКордак, писательницы и исследовательницы ИИ, которая описала этот феномен в своей книге «Machines Who Think» (1979).
Яркий пример - когда шахматный компьютер Deep Blue обыграл чемпиона мира, многие были разочарованы: это была не та форма суперинтеллекта, о которой мечтали. Задача просто перестала быть показателем интеллекта, как только решилась машиной.
👍9❤2
#unrealneural #вкопилкуэрудита
Semantic Structure in LLM Embeddings
Семантические пространства эмбеддингов LLM незаметно сжимают множество значений в небольшое общее пространство, отражающее человеческие суждения.
Трехмерное подпространство охватывает около 50% семантической дисперсии.
Психология показывает, что люди оценивают слова по нескольким осям, например, насколько они позитивны, насколько они сильны и насколько активны.
Авторы воссоздают это, формируя 28 направлений из пар антонимов и проецируя на них 301 слово.
Эти прогнозы хорошо соответствуют рейтингам опроса, показывая, что геометрия встраивания отражает человеческие ассоциации.
Анализ главных компонентов — инструмент, который находит основные направления вариации, сворачивает проекции в три компонента, такие как оценка, эффективность и активность.
https://arxiv.org/abs/2508.10003
Semantic Structure in LLM Embeddings
Семантические пространства эмбеддингов LLM незаметно сжимают множество значений в небольшое общее пространство, отражающее человеческие суждения.
Трехмерное подпространство охватывает около 50% семантической дисперсии.
Психология показывает, что люди оценивают слова по нескольким осям, например, насколько они позитивны, насколько они сильны и насколько активны.
Авторы воссоздают это, формируя 28 направлений из пар антонимов и проецируя на них 301 слово.
Эти прогнозы хорошо соответствуют рейтингам опроса, показывая, что геометрия встраивания отражает человеческие ассоциации.
Анализ главных компонентов — инструмент, который находит основные направления вариации, сворачивает проекции в три компонента, такие как оценка, эффективность и активность.
https://arxiv.org/abs/2508.10003
⚡3👍1
#unrealneural
Jet-Nemotron: эффективная языковая модель с постнейронной архитектурой поиска
Jet-Nemotron, новое семейство языковых моделей с гибридной архитектурой, точность которых сопоставима или превосходит точность ведущих моделей полного внимания, при этом значительно повышая производительность генерации. Jet-Nemotron разработан с использованием PostNeural Architecture Search (PostNAS), нового конвейера исследований нейронной архитектуры, обеспечивающего эффективное проектирование моделей.
https://arxiv.org/abs/2508.15884
Jet-Nemotron: эффективная языковая модель с постнейронной архитектурой поиска
Jet-Nemotron, новое семейство языковых моделей с гибридной архитектурой, точность которых сопоставима или превосходит точность ведущих моделей полного внимания, при этом значительно повышая производительность генерации. Jet-Nemotron разработан с использованием PostNeural Architecture Search (PostNAS), нового конвейера исследований нейронной архитектуры, обеспечивающего эффективное проектирование моделей.
https://arxiv.org/abs/2508.15884
👍2❤🔥1⚡1
#unrealneural
MV-RAG: Retrieval Augmented Multiview Diffusion
TextTo3D генерация продвинулась вперед. MV-RAG – новый конвейер преобразования текста в 3D, который сначала извлекает релевантные двумерные изображения из большой базы данных 2D-данных, а затем обуславливает на этих изображениях многоракурсную модель диффузии для синтеза согласованных и точных многоракурсных результатов.
MV-RAG совершенствует генерацию многоракурсных изображений, объединяя внутренние знания предобученной многоракурсной модели с внешними визуальными сигналами, полученными из большой базы данных изображений. На этапе вывода полученные двумерные изображения кодируются в токены с помощью кодировщика изображений, а затем обучаемого ресемплера. В многоракурсной модели диффузии трёхмерные слои собственного внимания обеспечивают согласованность между сгенерированными представлениями. Каждый слой перекрёстного внимания затем работает в двух параллельных ветвях: одна обусловлена текстовыми токенами, а другая — полученными токенами изображений. Их выходные данные объединяются с использованием коэффициента слияния, прогнозируемого модулем Prior-Guided Attention.
https://yosefdayani.github.io/MV-RAG/
MV-RAG: Retrieval Augmented Multiview Diffusion
TextTo3D генерация продвинулась вперед. MV-RAG – новый конвейер преобразования текста в 3D, который сначала извлекает релевантные двумерные изображения из большой базы данных 2D-данных, а затем обуславливает на этих изображениях многоракурсную модель диффузии для синтеза согласованных и точных многоракурсных результатов.
MV-RAG совершенствует генерацию многоракурсных изображений, объединяя внутренние знания предобученной многоракурсной модели с внешними визуальными сигналами, полученными из большой базы данных изображений. На этапе вывода полученные двумерные изображения кодируются в токены с помощью кодировщика изображений, а затем обучаемого ресемплера. В многоракурсной модели диффузии трёхмерные слои собственного внимания обеспечивают согласованность между сгенерированными представлениями. Каждый слой перекрёстного внимания затем работает в двух параллельных ветвях: одна обусловлена текстовыми токенами, а другая — полученными токенами изображений. Их выходные данные объединяются с использованием коэффициента слияния, прогнозируемого модулем Prior-Guided Attention.
https://yosefdayani.github.io/MV-RAG/
❤4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Brainchop
Инструмент с открытым исходным кодом для 3D-сегментации МРТ в вашем браузере с использованием облегченной модели глубокого обучения. Загрузите свой МРТ в формате NIfTI для анализа.
https://brainchop.org/
https://github.com/neuroneural/brainchop
Brainchop
Инструмент с открытым исходным кодом для 3D-сегментации МРТ в вашем браузере с использованием облегченной модели глубокого обучения. Загрузите свой МРТ в формате NIfTI для анализа.
https://brainchop.org/
https://github.com/neuroneural/brainchop
👍3❤🔥1❤1⚡1
#unrealneural
Вышла моя статья-размышления:
"Архитектура в эпоху ИИ: как технологии меняют понимание пространства"
https://hi-tech.mail.ru/review/132528-arhitektura-v-epohu-ii-kak-tehnologii-menyayut-ponimanie-prostranstva/
Пишите обратную связь в комментариях
Вышла моя статья-размышления:
"Архитектура в эпоху ИИ: как технологии меняют понимание пространства"
https://hi-tech.mail.ru/review/132528-arhitektura-v-epohu-ii-kak-tehnologii-menyayut-ponimanie-prostranstva/
Пишите обратную связь в комментариях
❤11👍7⚡5
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
VoxHammer от Tencent и Бэйханского университета
Не требующий обучения метод точного и последовательного 3D-редактирования, работающий непосредственно в исходном скрытом 3D-пространстве.
Он гарантирует, что неотредактированные области останутся идеальными, а новые изменения будут легко интегрированы.
https://huggingface.co/papers/2508.19247
VoxHammer от Tencent и Бэйханского университета
Не требующий обучения метод точного и последовательного 3D-редактирования, работающий непосредственно в исходном скрытом 3D-пространстве.
Он гарантирует, что неотредактированные области останутся идеальными, а новые изменения будут легко интегрированы.
https://huggingface.co/papers/2508.19247
👍3⚡1❤1
#unrealneural
Drawing2CAD
Transformer, преобразующая векторные чертежи (SVG) в последовательность DeepCAD. Использование векторных данных вместо растровых (изображений) повышает точность примерно на 7%.
https://github.com/lllssc/Drawing2CAD
Drawing2CAD
Transformer, преобразующая векторные чертежи (SVG) в последовательность DeepCAD. Использование векторных данных вместо растровых (изображений) повышает точность примерно на 7%.
https://github.com/lllssc/Drawing2CAD
👍3⚡1❤🔥1🔥1
#unrealneural
SAT-SKYLINES
Создание 3D mesh зданий по спутниковым снимкам + грубая геометрия. Cities: Skylines в качестве набора данных.
https://arxiv.org/abs/2508.18531
SAT-SKYLINES
Создание 3D mesh зданий по спутниковым снимкам + грубая геометрия. Cities: Skylines в качестве набора данных.
https://arxiv.org/abs/2508.18531
👍7⚡2❤1