AI LAB | Лаборатория ИИ
1.72K subscribers
613 photos
430 videos
23 files
888 links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca

Вопросы сотрудничества и соучастия
@j_fede
加入频道
CAD-MLLM: нейронная сеть для генерации CAD-моделей через мультимодальные данные

CAD-MLLM — это первая в своем роде система, способная генерировать параметрические CAD-модели, основываясь на мультимодальных данных: текстовых описаниях, изображениях, облаках точек или их комбинации.

Ключевая идея системы — использование последовательностей команд CAD-моделей. Вместо прямой реконструкции объекта система генерирует точные команды для его построения, такие как выдавливание, вращение или создание геометрии. Это делает модели параметрически корректными.
👏6👍1
Forwarded from AI для Всех (Artemii)
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT теперь умеет создавать приложения.
Как я сделал приложение для изучения языка за пару минут

🔥 Важное обновление от OpenAI: Canvas теперь умеет делать артефакты, как у Claude! Это значит, что вы можете не просто писать код, но и сразу получать работающие проекты.

Я протестировал эту фичу и хочу рассказать, как с её помощью сделал приложение для изучения языка.

💡 Как это работает?

1️⃣ Генерируем идею и задачу
Сначала я попросил GPT-4o придумать детальный промпт для создания приложения. Хотел что-то простое: карточки с иностранными словами, переводом и кнопкой "выучено". GPT-4o справился на отлично!

2️⃣ Создаём артефакт с Canvas
Скопировал промпт, открыл Canvas и выбрал модель o1. Через минуту у меня было готовое приложение! А главное, Canvas сразу рендерит результат. Я тут же посмотрел, как всё выглядит — всё очень удобно и работает.

3️⃣ Результат: мини-приложение
Теперь у меня есть простое и полезное приложение для изучения языка. Я могу добавлять новые слова, повторять их и отслеживать прогресс. Всё это буквально за пару минут работы.

Попробуйте сами и убедитесь, как это круто! 🚀

Анонс
👍61
Hunyuan3D
генератор 3д геометрии с открытым исходным кодом
На вход можно подавать текст и изображение
https://github.com/YanWenKun/Hunyuan3D-2-WinPortable?tab=readme-ov-file
🔥71👍1
Transformer²: Самоадаптирующиеся трансформеры

Статья демонстрирует силу LLM, которая может самостоятельно адаптировать свои веса к своей среде. Вероятно в будущем граница между «предварительным обучением» и «после обучения» исчезнет, ​​и наши модели и агенты будут постоянно адаптироваться и самосовершенствоваться. Такие системы проложат путь для нового поколения адаптивного ИИ, способного изменять свои собственные веса и архитектуру, чтобы адаптироваться к изменяющейся природе задач, с которыми они сталкиваются в среде.

https://arxiv.org/abs/2501.06252

https://sakana.ai/transformer-squared/
5
😁11
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну вот, пошли интеграции с Блендором для 3Д генераторов

На гитхабе у Хуньяня 3Д 2.0 появился блендор-аддон.

Правда рядом с Блендором вам придется поднять апи-сервер хунька.

Инструкции тут:
https://github.com/Tencent/Hunyuan3D-2?tab=readme-ov-file#blender-addon

@cgevent
6
This media is not supported in your browser
VIEW IN TELEGRAM
«TinySwallow-1.5B» - отличный пример того что эффективная языковая модель это не всегда облачный сервис. Это может быть локальным продуктом даже на смартфоне без необходимости доступа в интернет.

Новый метод извлечения знаний под названием «Временно адаптивная интерполированная извлечение (TAID)» эффективно переносит знания из крупномасштабных языковых моделей (LLM) в более мелкие модели. Этот метод обеспечивает эффективную передачу знаний путем переноса знаний из крупномасштабной модели в соответствии с процессом обучения маломасштабной модели. Данное исследование было принято на ICLR 2025 — международной конференции в области машинного обучения.
Используя TAID, были перенесены знания из 32B параметров LLM в мелкомасштабную языковую модель с 1,5B параметрами, что составляет около 1/20 размера LLM. Затем превратилось в японскую модель TinySwallow. Компактный «TinySwallow-1.5B» позволяет вам общаться прямо на вашем смартфоне или ПК, не прибегая к внешнему API.
Демо: https://pub.sakana.ai/tinyswallow/
Бумага: https://arxiv.org/abs/2501.16937
ГитХаб: https://github.com/SakanaAI/TAID
👍3❤‍🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Сверточная нейронная сеть (CNN) предсказывающая рукописные цифры. Все полностью на glsl и шейдерах. Модель состоит из 2023 параметров и слои активации отображаются по мере рисования
https://www.shadertoy.com/view/msVXWD
2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Интерактивная визуализация сверточной нейронной сети
можно смотреть что именно происходит на каждом шаге прямо в браузере
https://poloclub.github.io/cnn-explainer/
🤯4👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
PolyDiff: Создание 3D-полигональных сеток с использованием моделей диффузии»

Модель работает непосредственно с полигонами трехмерных сеток и генерирует новые формы в качестве выходных данных посредством итеративного процесса диффузии.
arxiv.org/abs/2312.11417
https://youtu.be/Dzdu4cQlS2k
👍5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Исследуйте модели трансформеров в вашем браузере

Интерактивная система визуализации, призванная помочь исследователям и практикам NLP анализировать и сравнивать весовые коэффициенты внимания в моделях на основе трансформаторов с лингвистическими знаниями.
https://poloclub.github.io/dodrio/
2👍1
Media is too big
VIEW IN TELEGRAM
🤯🤯🤯
🤯9👍2😱2
This media is not supported in your browser
VIEW IN TELEGRAM
Представляем UrbanGPT

ChatGPT от OpenAI с Grasshopper для создания трехмерных городских проектов в реальном времени на основе текста.

Просто введя любой текстовый запрос, дизайнеры могут генерировать динамические городские планы, отслеживать важные показатели (например, площадь программы и этажей) и создавать реалистичное распределение объемов для любого городского проекта. Эта объемная модель затем визуализируется в реальном времени на основе введенного текста с использованием алгоритмов диффузии искусственного интеллекта.

Текущая версия прототипа работает на базе GPT-4o, но легко адаптируется под любые языковые модели.

Это значительный шаг вперед в области текстового планирования городов!

https://clck.ru/3GAGGU
👍3🔥2😱2
Геометрия концепций
В статье «Геометрия концепций: разреженная структура функций автокодировщика» авторы исследуют многослойную структуру концепций, представленных большими языковыми моделями, с помощью разреженных автокодировщиков. Они выявляют три уровня структуры:
1) «Атомная» мелкомасштабная структура
2) «Мозговая» промежуточная масштабная структура - например математические и кодовые признаки
3) Крупномасштабная структура "галактического" масштаба облака точек признаков
https://arxiv.org/abs/2410.19750
🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Модель трансформера с интерактивной визуализацией
https://poloclub.github.io/transformer-explainer/
🔥3👍1
Крутой ресурс с инструментами для понимания работы многих моделей ИИ
https://poloclub.github.io/
👍4🔥2