📓 Записки программера
1.02K subscribers
304 photos
1 video
6 files
599 links
Канал с регулярными постами о разных интересных материалах (статьи, видео, фреймворки и полезные инструменты).

https://dotnet.social/@denisio
加入频道
Локально развертываемая LLM Ollama для извлечения текста из документов (включая PDF). На примере выглядит отлично, как оно будет на практике - надо проверять. #llm
👍1
Ещё одна штука, которая позволяет делать примерно то, что было в посте выше. Требуется рассмотрение и тесты. Жаль конечно, что примеры в основном на питоне. #llm #ai
👍3
Дожили, LLM модель засунули в TTF шрифт для отрисовки лигатур и других специальных штук #llm
🤯3
LLM всё страньше и страньше. Оффлайновая LLM которая работает в браузере.

Которая конечно квантизованная по самое небалуйся чтобы уложица в ~1 ГБ. И она достаточно быстра и визуально почти не отличить от ChatGPT :) #llm
🔥4👍2
Коротенькая статья по хранению векторов для #LLM (в статье для Ollama)
🔥2
Тут nVidia релизнула несколько моделей на гитхабе Text to visual world generation (картинка / video). Должно быть это прекрасные модели, но... ресурсы...

Ну и initialization time на Single H100 CPU 14B модели 590 секунд... Вобщем копите бабки :) #llm
👍2
Тут на арену выходит новая нейронка DeepSeek, которая вроде как даже лучше Claude, и в половине тестов - лучше GPT-4o.

Русский понимает неплохо (несмотря на то что сама модель китайская) и весьма быстрая, а также что немаловажно - API (насколько я посмотрел) совместимо с OpenAI.

Ценники: $0.27 per million input tokens and $1.10 per million output tokens. #llm
👍3
Недавно обнаружил, что один из моих любимых научно-фантастических авторов выпустил очередную книгу, которая доступна только в виде аудиокниги в виде монолога. А я не очень привык к аудиокнигам, поэтому мы делаем что? Правильно, покупаем аудиокнигу, качаем mp3 и зовём на помощь нейронки чтобы а) транскрибировать б) перевести.

И если с первым проблем особо не возникло, какая-то из моделей вполне справилась локально за некоторое время, то вот со вторым - возникла трудность, потому что перевести en / ru эта модель не очень предназначена, а другие модели вроде Aya-23-8B не подходят под llama.cpp, а конвертить - ну там прямо таки linux way - это собери, тут напиши скрипты на питоне, разберись почему это говно не работает, запусти стопицот раз. И вобщем я начал искать какой-то движок, который бы мне перевёл 600 КБ текста с минимальными телодвижениями оффлайново. Потому что онлайново - это стоило бы денег :)

И нашёл кажется интересный движок msty, который можно self-hosted под Windows/Mac/Linux, умеет RAG и разные NVIDIA/AMD GPU и содержит даже какую-то коллекцию промптов. И что самое клёвое - очень удобный поиск и загрузка моделей, прямо из UI.

Качаю, пробую :) #llm
👍8🔥4🤯1
В продолжение поста про msty - оказывается есть что-то похожее у Microsoft в Microsoft Store - можно загрузить разные модели для оффлайна и заюзать их. Но возможностей сильно меньше - чисто юзерская конструкция и Windows only конечно #ai #llm
👍1
По описанию интересно выглядящий инструмент, который умеет

* Summarize videos in seconds.
* Generate full movies with voiceovers from a script.
* Search and index your media library.
* Organize and clip your content effortlessly.
* Dub and edit your audio and video with ease.
* Translate and add subtitle in any language.

и т.д. Тут как раз намечается проект, где надо делать summarize видео в виде текста, надо будет попробовать. #ai #llm
3👍3
Как запилить свой Model Context Protocol адаптер для того, чтобы интегрировать их в LLM. Ещё одна статья на Microsoft и примеры на C# #dotnet #llm
👍12🥱2