Нейронавт | Нейросети в творчестве
9.23K subscribers
3.53K photos
3.05K videos
40 files
4.02K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Browser-Use WebUI

Надстройка к оригинальному Browser-Use для удобного пользования.
Проект дает доступ LLM-агентам к браузеру.
Что-то вроде Computer Use, но агент имеет доступ только к браузеру

Поддерживает Gemini, OpenAI, Azure OpenAI, Anthropic, DeepSeek, Ollama и др.

[UPDATE]
Этот код теперь в официальном Browser-Use

#assistant #agent #tools
👍61
Browser-Use + Deepseek v3

Инструкция по настройке на китайском

А вообще Browser-Use уже включили в ai-gradio

агента можно запустить в несколько строчек кода:

import gradio as gr
import ai_gradio

demo = gr.load(
name='browser:gpt-4-turbo',
src=ai_gradio.registry,
title='Browser Agent',
description='AI agent that can interact with web browsers'
).launch()


#assistant #agent #tools #tutorial
👍42🤯1
LightDiffusion-Next

Новая оболочка для диффузных генераторов картинок, хвастается тем что на 30% быстрее ComfyUI

Функционал пока скупой
Ладно, запомним на будущее

Гитхаб
Демо
Обсуждение на реддит

#text2image #tools #gui
👍91
Немножко #news

Давно заходили на Civitai.com?

Куда-то исчезли все срамные картинки с главной страницы. По поиску срамные модели еще можно найти, но они исчезают одна за другой, фурри-фетишисты обеспокоены. Да и с онлайн тренировкой моделей стало сложнее.

Согласно мнению реддитора, CivitAI не виноват.
Проблема связана с Visa и ограничениями, которые она накладывает на компании, принимающие её карты. Visa требует от компаний, работающих с искусственным интеллектом, применять цензуру, иначе они не смогут обрабатывать платежи.

Есть ряд альтернатив, которые еще не настолько популярны чтобы ощутить давление Visa

Сохраняем, пользуемся:

Tensor.art - прямой конкурент

Huggingface.com - репозиторий ИИ-разработчиков, "магазин ИИ-приложений"

Prompthero.com - этот у меня работает только с вэпээн

Pixai.art - хвалят за скорость и удобство по сравнению с Civitai

Seaart.ai - еще один неплохой конкурент

thinkdiffusion.com - генерация ИИ-арта в браузере с контролнетами


#text2image #gallery #online #tools #nsfw
👍3🔥32😭2
AI Runner

Локальная среда запуска нейросеток - языковых моделей, генератов текста, видео, речи.

Обещают легкую установку (Docker), свободу от зависимостей (со сладкого не слезу 🤩), систему плагинов и прочие плюшки вплоть до импорта в ваш питон-проект в виде библиотеки

#tools
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍21🤷‍♂1😈1
Triton V3.3.0 Windows Native Build

Ошибкам из-за неработающего triton на Windows конец?

Предыдущее решение у меня сработало без каких-либо проблем, но мне повезло, не у всех так.

Это решение вез какой-либо виртуализации, родная Windows библиотека. Но только для Nvidia

Пользуйтесь на свой страх и риск

#tools #python #fix
🔥6👍1
Stable Scripts UI (SSUI)

Автор испугался огромных комфи воркфлоу и сделал свой комфи с блэкджеком. Короче среда сборки и запуска воркфлоу с нейросетками, но чтоб не было десятков и сотен непонятных блоков.

Главная идея - простота и воспроизводимость. У всех все должно запускаться одинаково. Что-то вроде Pinokio если бы он был конструктором для непрограммистов. И что-то вроде комфи где не надо разбираться что куда втыкать

- Простота использования

- Воспроизводимость: Скрипты, необходимые для них модули и сам SSUI являются версионными. Скрипты могут запускаться точно в той же среде, что и автор сценария.

- Управляемость моделями и конфигурациями

- Строгая типизированность: Все ресурсы (включая модели) являются строго типизированными, и их невозможно использовать неправильно.

- Настраиваемость: Вы можете настроить скрипты, типы, модели, панели, загрузчики, фреймворк пользовательского интерфейса и многое другое.

Проект на стадии MVP (минимальный функционал), сейчас поддерживает только SD1, SDXL, Flux

#text2image #tools #GUI
👍12🤷‍♂2
This media is not supported in your browser
VIEW IN TELEGRAM
Comfyui-FlowChain

Позволяет заворачивать группы нод и целые форкфлоу в одну ноду

#ComfyUI #tools
🔥101🤯1
AI Runner 4.8

AI Runner теперь официально поддерживает OpenVoice.

Что нового:
• Поддержка OpenVoice для клонирования голоса и генерации речи на нескольких языках
• Возможность настройки стиля голоса, включая эмоции, акценты, ритм, паузы и интонацию
• Улучшенное качество аудио и нативная поддержка нескольких языков

#voicecloning #tools
🔥51
DanceGRPO

Метод создания изображений и видео по тексту, видео по картинке от ByteDance

Совместим с Stable Diffusion, HunyuanVideo, FLUX, SkyReel-I2V.

Код ждем

#text2image #text2video #image2video #tools
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
GenGaze

Создание изображений в ComfyUI с использованием направления взгляда пользователя.

Код ждем

#imageediting #tools
👀6👍1
Google AI Edge Gallery

Экспериментальное приложение Гугла для локального запуска ИИ-моделей на смартфоне

Основные возможности:

- Генерация изображений
- ИИ-чат без интернета
- Написание и редактирование кода
- Анализ изображений ("Ask Image")
- Prompt Lab с готовыми шаблонами для различных задач
- Поддержка моделей Google Gemma 3n и других
- AI Chat: участвуйте в многопользовательских беседах.
- Анализ производительности: тесты в реальном времени (TTFT, скорость декодирования, задержка).
- Загрузите свою собственную модель: протестируйте местные .taskмодели LiteRT.
- Ресурсы для разработчиков: быстрые ссылки на карточки моделей и исходный код.

Android
iOS ждем

#mobile #android #assistant #tools
8
WanGP

Инструмент для запуска видеогенераторов на GPU от 6 ГБ VRAM

Позволяет генерировать видео длительностью более 10 секунд с разрешением 720p на RTX 4090 и 480p с менее чем 12 ГБ VRAM.

Поддерживает Wan, Hunyuan Video и LTV Video/ Добавили поддержку Phantom 14Bб Wan CausVidб VACE

- Поддержка старых графических процессоров (RTX 10XX, 20xx, ...)

-Интегрированные инструменты для облегчения создания видео: редактор масок, усилитель подсказок, временная и пространственная генерация

- Поддержка лор

- Очередь заданий

#tools #text2video #image2video #video2video #optimization
2
SimpleTuner v2.0

В свежем релизе инструмента - полная поддержка дообучения Flux Kontext

и еще миллион ничтяков

#finetuning #tools
👍6
Framepack Studio 0.5

Не Контекстом единым.
Обновился Framepack Studio

- Добавлен MagCache, теперь используется в качестве механизма кэширования по умолчанию

- Улучшайзинг промпта через Granite LLM

- Описание картинок через Florence2 LLM


- Улучшена генерация T2V при старте с нойза (по умолчанию)

- Выведены параметры CFG

Плюс ко всему, организовали документацию

#text2video #tools
🔥9👍2
inference.sh

Самый простой способ запускать опенсорсные нейросети локально или на удаленной машине


Еще одна попытка сделать простой доступ пользователям к ИИ-инструментам, подобная Pinokio, Stability Matrix и иже с ними.

Есть презентационное видео
и пост на Реддите

#tools #gui
🔥11👍4
Media is too big
VIEW IN TELEGRAM
Fellou: The World's First Agentic Browser

"Первый в мире" агентный браузер.

Ну да, можно писать "первый в мире", пока опера дуплится, но тут тоже вход по вейтлисту.

#agent #browser #tools
👍5💩31🤔1🤡1
ArtOfficial Studio: The 1-Stop Solution for Your AI Needs

Надстройка над #ComfyUI для упрощения жизни.

Автоматически устанавливает

ComfyUI

- SageAttention and Torch Compile

- Auto Model Downloader

- Около 20 самых популярных кастом нод

- 80+ встроенных ворклоу, работающих с автозагружаемыми моделями

- Civit-ai Model Downloader

- HugginFace Model Downloader

- Безопасность, ноды не доберутся до ваших личных данных

Diffusion Pipe (Wan, Hunyuan, HiDream, etc. lora training)

Flux Gym (Flux Lora Trainer, Resolving some issues in it right now)

Kohya (Untested, but technically installed)

#Windows / #Linux

Видео по установке / запуску

#gui #tools
22👍3😱3
ComfyUI Subgraph / Partial Execution

Ликуйте, комфийщки, в комфи наконец завезли подграфы.
Группу нод можно упаковать в подграф как в нормальном нодовом редакторе и вывести все необходимые настройки

Имейте ввиду, что операция необратима, кнопки распаковать обратно нет

Partial Execution - возможность тестировать отдельные ветки форкфлоу, не запуская его целиком.

Кнопка Partial Execution появляется при выделении любой ноды Output

Ну что, обновляемся?

#tools #gui #news #ComfyUI
👍8🔥3🤷‍♂22
This media is not supported in your browser
VIEW IN TELEGRAM
WAN 2.2 BRKN AI Prompt Generator

Генератор промптов с фокусом на #WAN22

Под капотом Gemini или другие LLM

#prompting #tools
👍101