Daniilak — Канал
646 subscribers
630 photos
117 videos
12 files
473 links
Пишу о технологиях и датасетах, немного ML

Рекламирую Чебоксары
加入频道
Иван Бегтин сегодня анонсировал новую платформу для поиска данных — Dateno.

Это сайт, на котором можно найти открытые данные и статистику со всего мира по поисковому запросу. На нём уже проиндексировано 10 миллионов датасетов (из них — 219 тысяч по России), а к концу года это количество планируют расширить до 30 миллионов. Можно указать тематику, язык источника, формат данных. А работает это уже лучше, чем тот же Google Dataset Search.

Портал пока находится в стадии беты, но уже работает:
https://dateno.io/
🔥6👍1👎1
С помощью технологии GPT от OpenAI удалось успешно решить проблему незаконно установленного киоска "Славица", который нарушал закон с 17 февраля 2023 года (с этого дня территория, на которой расположен киоск, сменилась на муниципальную). Обращения, перед подачей через приложение "Решаем вместе", были трансформированы из обычного человеческого текста в более структурированный и грамотный формат при помощи GPT4.
🔥51👍1👎1👏1
Упорно работаю над своим проектом, при помощи которого можно будет запрашивать информацию по базе Розыска в МВД.
https://github.com/daniilak/ru_mvd_search_wanted

Собираюсь выпустить его на pypi.org и нахожусь на заключительном этапе, по которому осталось выполнить следующие задачи:

1. Написать тесты для проверки функционала.
2. Экспериментально проверить его работоспособность.
3. Доработать раздел "Readme" для более полного описания проекта.
4. Заменить возвращение ошибок на исключения.
5. Качественно оптимизировать код.

Несмотря на текущий прогресс, на данный момент этот проект является только частичным парсером. Для его полноценной работы требуется:

1. Добавить код и модель, которые смогут автоматически решать капчу.
2. Реализовать функцию, позволяющую получить дополнительные данные о найденном человеке через проверку ответов на почте.

Думаю, что будет создан отдельный репозиторий в формате FastAPI приложения, который будет включать в себя отдельные модули для решения капчи и работы с почтой.
❤‍🔥2👍2🔥1
Думаю на kaggle.com выпустить полные кадастровые данные по Чебоксарам (полигоны и метаданные), и посмотреть как территорию города будут анализировать)
🔥2👍1
Наконец доехал из перевода Veles2.5 - переведенный на русский Hermes2.5 через gpt3.5

Вероятно доедет за несколько недель вихрь-велес

Датасет для русского
1🔥1
Daniilak — Канал
Думаю на kaggle.com выпустить полные кадастровые данные по Чебоксарам (полигоны и метаданные), и посмотреть как территорию города будут анализировать)
Я провёл анализ данных, извлечённых из ЕГРН и публичной кадастровой карты по Чебоксарам (Кадастровый Округ "21:01"). В результате было обработано 94072 земельных участка.

По параметру "Категория земель" было выявлено следующее распределение:

- Земли населённых пунктов: 60301 участок
- Категория не установлена: 342 участка
- Земли лесного фонда: 222 участка
- Земли сельскохозяйственного назначения: 17 участков
- Земли промышленности, энергетики, транспорта, связи, радиовещания, телевидения, информатики, земли для обеспечения космической деятельности, земли обороны, безопасности и земли иного специального назначения: 13 участков
- Земли особо охраняемых территорий и объектов: 7 участков

При анализе поля "Разрешенное использование" было выявлено больше категорий — их оказалось 122.

Однако наибольшее удивление вызвал параметр "Разрешенное использование по документу" — здесь было обнаружено аж 5796 различных наименований.

Отсортированные категории в комментариях. Исходники опубликую позже)
👍1🔥1
Наконец-то!
😁9
This media is not supported in your browser
VIEW IN TELEGRAM
На Github выложили платформу OpenCat. С её помощью можно сделать себе четвероногого робота-питомца 🌯

Как раз без дела лежат и Raspberry Pi и Arduino
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21
Chatbot Arena: Claude 3 Opus обогнал GPT-4-turbo, Bard, Sonnet и Haiku догнали обычный GPT-4.
👍1
Заренерировал новые треки через suno.ai и залил на youtube (тык и тык)

еще минус несколько профессий?
🔥4👍1👌1
Представьте троллинг:
— Ты что, не помнишь эту песню?
И ставить генерацию..
😁8😨1
Сгенерил рекламу на радио для продающегося земельного участка

app.suno.ai/song/0e4c0c6d-b317-4482-8fd2-3ed3336084ff
app.suno.ai/song/74896336-1793-4293-8432-1104d02f8676
🔥3😁3👍1🤔1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Посвящается всем авторам ТГ каналов про Эй Ай


Я слежу что пишет сама
Знаю все про Гэ Пэ Тэ
Ворлд модели строит Сора
подпишись на мой тэ гэ

Здесь посты и много мемов
Можно слушать и читать
Будешь лучшем в мире сеток
Клоуна не ставьте блять

Когда ты станешь самым смелым
Будешь шарить, больше знать
Будет офер, много денег
Незабудь донат прислать


https://app.suno.ai/song/71d79d32-73f1-42e4-8b55-16809ebfad33
21👍1🔥1😁1
Можно разные техники, лоссы, архитектуры DL наглядно изучить. Фреймворк DL Pytorch.

https://nn.labml.ai
OpenAI показывают свою систему копирования голоса.