Нейронавт | Нейросети в творчестве
9.4K subscribers
3.62K photos
3.14K videos
40 files
4.1K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
AI Meme Arena

Прокачка ИИ-чувства юмора. Впрочем не только ИИ, но и кожаного.

Принес вам серьезное залипалово на несерьезную тему. Сижу второй час. Генерю мемы.
Вот тут: @AIMemeArenaBot - это прямо полный аналог lmsys’овской Chatbot Arena, из которой вырастает объективный лидерборд для оценки остроумия AI-агентов.
Больше даже похоже на лидерборд для картинок, ибо результат оцениваешь "нутром", а не мозгом.

Иногда результаты полный треш, но иногда выходит такой мем, что твои кожаные мозги начинают нагреваться - это смешно, но ты не можешь объяснить почему. Я совершенно заворожен этим экспериментом. Сдается мне все стендаперы (особенно любители парадоксальных шуток сейчас ломанутся туда).
Процесс напоминает ранние генерации в Stable Diffusion 1.5 - много мусора и кривой анатомии, а потом бац и шедевр, надо только прокликать "еще мемов". В принципе с ранними чатботами было также же, поток галлюцинаций вперемешку с нормальными ответами. С фонами тоже есть проблемы, но, я так понимаю, датасет растет.

Процесс до тупости прост, задаешь тему
- отправляешь контекстный промпт (например, "Айфон тырит фичи у андроида");
- Два рандомных AI-агента Арены его получают;
- Каждый генерит свой мем;
- Голосуете за более остроумный и релевантный;
- На основе множества таких баттлов(кликов "давай еще") строится Leaderboard, который уже работает тут: https://aimemearena.vercel.app/

Самое смешное, что никакой регистрации, подписок на канал и прочая.

Сейчас Арена работает только на русскоязычных AI-энтузиастов, но авторы вероятно скоро сделают глобальную версию
- когда сделают, есть шанс, что эта штука поможет ускорить эволюцию остроумия и ЧЮ у AI-агентов и LLM-ок и мы выпьем за кожаных Петросянов
- в качестве контекстных промптов можно попробовать новостные заголовки, посты в Телеграме, абзацы из статьи и т.д.
- чем шире описан контекст, тем релевантнее и глубже мемы получаются

Дальше - больше.

Оказалось, что там не только боты от авторов @AIMemeArenaBot, а любой желающий может наваять своего ИИ-стендапера и выпустить его на арену - для этого есть Chаllenge: https://aimemearena.vercel.app/challenge
У кого получится хороший рейтинг на арене, еще и компьют компенсируют.

Я полез искать авторов, которые пишут что их миссия is Making AI Funny As Fuck и и оказалось, что они как-то связаны с FUNCORP.

Пойду напишу Вове Закоулову, ибо это прекрасно.

А пока позалипайте тут @AIMemeArenaBot и присылайте лютые шедевры и такой же треш в коментарии.

Повеселимсо.

У меня вот такой свеженький про chatGPT Tasks сгенерилсо.

@cgevent
👍6😁2🥴2🤯1
Media is too big
VIEW IN TELEGRAM
MiniCPM-o 2.6

Опенсорсная мультимодальная модель от китайцев OpenBMB, превосходящая GPT-4V на визуальных задачах

8B параметров, работает на смартфонах и планшетах.

Под капотом SigLip-400M + Whisper-300M + ChatTTS-200M + Qwen2.5-7B

Голосовое общение в реальном времени, клонирование голоса

Гитхаб
Демо
Веса

#vlm #voicemode #realtime #mobile #voicecloning
8👍2🔥1
Dreamina

Генератор картинок и видео от Capcut.
Вопреки официальному твиту, видеогенератор в бете, мне недоступен.
И да, там у них так же в бете и генератор музыки есть

Для картинок есть редактор с холстом

Вход на сайт из РФ заблокирован

#text2image #text2video #image2video #text2music #imageediting
💩3👀3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Convert to 3D

В Krea.ai новый инструмент, позволяющий конвертировать объекты с изображения в 3D модели и вертеть их чтобы получить референс с нужного угла для генерации картинки

Бесплатно для всех

#imageediting #novelview #image2image #imgaeediting
🤯20🔥6👍51
FLUX Pro Finetuning API

BlackForest Labs выпустили API для дообучения #FLUX

Уверяют что результат файнтюна будет работать со всеми официальными вариантами FLUX и совместим с FLUX Tools

FLUX Finetuning Beta Guide

#finetuning #lora #api
🔥8👍2
Cosmos1GP: Cosmos1GP for the GPU Poor by DeepBeepMeep

Нвидиевский видеогенератор миров Cosmos, версия для бедных.

с правильными настройками на 3090/4090 можно генерить по 10 секунд видео

#text2video #image2video #simulation #text2world #image2world
👍10
FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs

Инструмент от Alibaba для голосового общения человека с языковыми моделями в реальном времени, можно собрать свой #Voicemode

Распознает речь на 50 языках.
Сам говорит и клонирует голос на 5 языках, русского пока нет

SenseVoice - распознавание голоса и эмоций

CosyVoice - генерирует речь по тексту

Демо CosyVoice 2.0

Демо CosyVoise 2.0 на modelscope

Код

#tts #text2speech #stt #speech2text #realtime
👍8
Gaussian Splatting for Nuke - irrealix plugin

Плагин для работы со сценами на гауссианах в #nuke

- Импорт .ply файлов или сжатого .ply из SuperSplat
- Обрезка cцен сферой, боксом, плоскостью Y
- До 10 сплатов в одной сцене
- работа с цветом
- некоторые возможности анимации
- Рендер в реальном времени на GPU
- Рендер пасса глубины

Купить платно за деньги

#gaussian
4
This media is not supported in your browser
VIEW IN TELEGRAM
AI Voice Mixer Studio - Kokoro TTS

Миксер ИИ-голосов на базе Kokoro
Можно из имеющихся 11 англоязычных голосов намешать свой кастомный голос

#tts #text2speech
👍2🤯1
kotaemon

Интерфейс для чата с вашими документами.

Но вообще-то рекомендую его для быстрого ознакомления с сутью препринтов с arxiv.org или HuggingFace- выбираете статью и просите суммаризацию или задаете вопрос по ней.
Для этого создан демоспейс

Демо Kotaemon Papers

И бонус, еще один демоспейс для тех же целей:

Демо Paper Central

#chatbot #assistant #paper2chat #summary
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Upscayl v2.5.5

Обновился опенсорсный инструмент для апскейла изображений - интерфейс для RealESRGAN и других зарекомендовавших себя моделей

Код

#upscale #gui
🔥8🤔1
Humva: Your Easiest Go-To Avatar Tool

Простейший, как заявлено в названии, инструмент для создания аватара. Хорошо говорит по-русски

В топе на Producthunt

Проверил, он довольно капризный. Аватар создается за 5-10 минут. Если создастся вообще. Закидываем фото, выбираем тему и окружение, голос и ждем.
Или можно выбрать один из готовых аватаров.

При попытке создать аватар из фото знаменитостей может выдать ошибку, и второго шанса создать свой аватар не даст. Но Юра Борисов, видимо не настолько знаменит

И не факт что ваш аватар сможет быть полезен. Мой кастомный аватар долго не мог ничего сказать на русском все время ошибка. Хотя голос стандартный, с библиотечными аватарами работает. Видимо, текст слишком длинный

Бесплатно можно создать 4 говорящих видео по 30 секунд. На вход можно подать текст, а можно готовое аудио с речью

#voicecloning #humanavatar #talkinghead #portraitanimation #facialanimation #text2speech #tts #image2avatar
👍4👎1😱1
Субботняя проверка мемов. Есть че?

#humor
😁58