Нейронавт | Нейросети в творчестве

Forwarded from Santry's Singularity blog

Пока что технология image-to-3d находится в зачаточном состоянии и напоминает результаты, которые выдавали первые версии stable diffusion. Реконструкции поддаются только сравнительно простые изображения монолитных предметов.

Да, сравнивать 3d.csm, tripo3d с демо на huggingface нечестно, так как это демонстрационные версии коммерческих сервисов, которые используют более сложные пайплайны и генерируют в несколько этапов. Однако сейчас именно они юзабельнее. Более детальные текстуры - заметное преимущество, так как их можно преобразовать в карту высот и перенести часть деталей в меш.

Вряд ли результаты их работы подойдут для нужд 3D-художников, однако уже сейчас они могут быть основой для скульптинга и годятся для распечатки на FDM-принтере.

P.S. Бюст штурмовика создан при помощи Dall-E и tripo3d.

🔥2

1.3K views11:46

Нейронавт | Нейросети в творчестве

Адаптер PuLID теперь поддерживается в sd-webui-controlnet

#personalization #text2image #image2image #conditioning

🔥8

1.41K views07:37

Нейронавт | Нейросети в творчестве

1:47

This media is not supported in your browser

VIEW IN TELEGRAM

Streamlining Image Editing with Layered Diffusion Brushes

Послойное создание и редактирование изображений в реальном времени

Код ждем
Демо

#imageediting #image2image #text2image #realtime

👍19❤2

1.47K viewsedited 07:45

Нейронавт | Нейросети в творчестве

Forwarded from Кононюковщина

huggingface.co

aeonium/Aeonium-v0-Base-1B · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

👀 Aeonium-v1-BaseWeb-1B

Завершено обучение первой языковой модели для русского языка с 1.6 млрд. параметров.
- 32B токенов в датасете
- 4096 контекстное окно
- Llama в качестве основной архитектуры
- 128k vocab

HuggingFace
@hikonon

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👀2

1.32K views09:11

Нейронавт | Нейросети в творчестве

Кулстори про мой мастеркласс.

Пока готовился, решил освежить в памяти как я давал подобные мастерклассы в офлайне. Да, было такое.

Достаю архивные аудио/видео и понимаю что нет времени/желания переслушивать все это целиком. Вот бы получить в систематизированном видео ключевые моменты, а лучше с полным конспектом на всякий случай. Вообще нетрудно найти нужное, полистав у меня на канале теги #summary #video2text #audio2text #speech2text

Но мне как раз недавно попался свежий сервис mymeet.ai на базе ChayGPT-4. От русскоязычных разработчиков, значит проблем с русским языком должно быть минимум. Заявлена расшифровка любых аудио и видео, интеграция в Google Meet и Zoom.

Закинул в него аудио. Ограничение на объем файла - 1Гб на бесплатном тарифе, поэтому видео не пролезло. Через пару минут получаю готовую полную расшифровку и выжимку. Можно скопировать форматированный текст и дальше делать с ним что угодно. Сервис различает спикеров, что позволило мне сосредоточиться только на своих репликах и быстро составить план нового мастеркласса.

Запись у меня была с говномикрофона, все как мы любим для стресс-теста. В расшифровке некоторые фразы неточно определились. Думаю: мы же живем в эпоху магии, почему все так неидеально? Написал разработчикам, так, мол и так, у вас ошибки, хочу расшифровку точнее. Ответили в течение дня с просьбой прислать примеры плохой расшифровки и обещанием доработать. По их словам, сейчас точность определения 96%, чего вполне хватает для стандартных звонков.

По поводу триалки - дают обработать 180 минут. Много это или мало - решайте сами, мне хватило обработать 3 больших выступления. Ну и если вам постоянно или периодически нужен такой инструмент, платные тарифы весьма приемлемые.

mymeet.ai - го тестить

👍9🤡1

1.44K views10:04

Нейронавт | Нейросети в творчестве

ConsistentID:Portrait Generation with Multimodal Fine-Grained Identity Preserving

Персонализация портретов по одному образцу

Код
Демо(медленно загружается)
Демо2(похоже, еще недоделан)

#personalization #text2image #image2image #conditioning

👍5🔥3

1.65K views13:33

Нейронавт | Нейросети в творчестве

ConsistentID:Portrait Generation with Multimodal Fine-Grained Identity Preserving Персонализация портретов по одному образцу Код Демо(медленно загружается) Демо2(похоже, еще недоделан) #personalization #text2image #image2image #conditioning

а он неплох!

😁7👍1

1.43K views14:12

Нейронавт | Нейросети в творчестве

Появилась демка адаптера материалов ZeST
Го тестить

Демо

#material #image2image

😁7🥴2🤯1

2.84K views06:51

Нейронавт | Нейросети в творчестве

ImageInWords: Unlocking Hyper-Detailed Image Descriptions

Инструмент для гипердетального описания изображений от Google/Deepmind. Есть демоспейс для просмотра датасетов и гитхаб, но нет кода и свое изображение на пробу загрузить некуда.

Потенциальная польза - датасеты применят для обучения генераторов и кэпшонеров. Ну а вдруг и кодом поделятся

Гитхаб
Просмотр датасета
Скачать датасет

#image2text

👍5

1.54K views08:53

Нейронавт | Нейросети в творчестве

DeepSeek-V2

Давно не было новостей для кодеров. Держите.

Обновился Deepseek coder

- Занимает 3-е место в рейтинге AlignBench, превосходя GPT-4 и приближаясь к GPT-4 Turbo.
- Занимает первое место в рейтинге MT-Bench, конкурируя с LLaMA3-70B и превосходя Mixtral 8x22B.
- Специализируется на математике, коде и логических выводах.
- контекстное окно: 128 К (модель с открытым исходным кодом) / 32 К (онлайн-сервис)

Обещают после подтверждения номера телефона дать 5млн бесплатных токенов на платформе

Попробовать в режиме чата
Модель (для владельцев 100500 GB VRAM)

#coding #llm #chatbot #assistant

Deepseek

DeepSeek Platform

Join DeepSeek API platform to access our AI models, developer resources and API documentation.

❤5

1.59K viewsedited 10:38

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

OpenDevin

Попытка сделать опенсорсный аналог Devin
Запускается в Docker'е

Гитхаб

#coding #assistant

👍9

1.56K views12:45

Нейронавт | Нейросети в творчестве

Salient Object-Aware Background Generation using Text-Guided Diffusion Models

Инпейнтинг с сохранением границ объекта от Yahoo. Суть проблемы видна на картинке. Обычный SD инпейнтинг что-то дорисовывает к объекту который должен остаться неизменным

Код

#inpainting #image2image

❤5🔥1😁1

1.63K views07:43

Нейронавт | Нейросети в творчестве

#chatbot #llm #assistant

1.34K views07:59

Нейронавт | Нейросети в творчестве

Forwarded from Нейросети и Блендер

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

im-a-good-gpt2-chatbot появился в сравнительной части chat.lmsys.org

chat.lmsys.org — сейчас арена для теста лучших LLM, и арт вроде должен быть далеко от этого. Но я недавно узнал у Сиолошной про im-a-good-gpt2-chatbot, говорят это проделки OpenAI.

В общем я решил использовать старые промпты для P5JS (Помните был такой Генарт? Когда с помощью кода создают красоту)
И im-a-good-gpt2-chatbot показал невероятное понимание как создать, анимировать и даже визуализировать объекты. В моем случае я попросил создать симуляцию столкновения двух нейтронных звезд и примерно рассчитать масштаб черной дыры и визуально показать ее. Очень хорошо видеть в сравнение со второй рандомной(Qwen и gemini-1.5-pro-api-0409-preview) моделью, как im-a-good-gpt2-chatbot превосходит другие модели и выдает рабочий, сложный код.

Пока я прошу перевести код в Blender API(что он тоже прекрасно делает) поглядите на симуляцию столкновения двух нейтронных звезд одинакового размера.

А Денис успел раньше игру запилить.

P.S. Модель хорошо сгенерировала svg вариант текстового сторис для инсты и даже запилила полноценный код с использования controlnet и кастомных моделей в diffusers. Это очень мощно.

👍8

1.01K views07:59

About

Blog

Apps

Platform