Daniilak — Канал
642 subscribers
630 photos
117 videos
12 files
471 links
Пишу о технологиях и датасетах, немного ML

Рекламирую Чебоксары
加入频道
Сделал для Чебоксар канал, который мониторит публичные обращения и ответы в приложении «Решаем вместе» от Госуслуг
https://yangx.top/cheb_problems


В целом, можно расширить на всю страну, учитывая что я уже публиковал небольшой датасет t.me/opendatarussiachat1/35032

Может можно сделать какой-нибудь микросервис по этой теме?
🔥6
Уже вчера у RU зоны сломался DNSSEC
Однако, можно глянуть на список предыдущих поломок, разделенных по зонам и датам
https://ianix.com/pub/dnssec-outages.html
Например, ранее у рунета ломалось в августе 19 года
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Гении из MSCHF нашли способ легально показывать фильмы в интернете без нарушения авторских прав. Встречайте — ASCII кинотеатр, в котором можно посмотреть свежие новинки фильмов.

Чтобы обойти все юридические запреты, фильмы генерируются в ASCII. Это такой формат, где каждый кадр представляет собой динамическое полотно цветных текстовых символов.

Сами MSCHF заявляют, что кинотеатр будет работать, пока его не закроют.
😁2👍1
Минцифры РФ планирует в 2024 году начать внедрение на портале "Госуслуги" технологии ChatGPT для консультации граждан.


Об этом сообщил министр цифрового развития РФ Максут Шадаев.

Как раз и вакансию выложили hh.ru/vacancy/92428757
💩2🤔1
Почалось
На фрилансах появилась куча проектов про написанию автоматических отзывов и ответов на вопросы Wildberries через ChatGPT
😱3💯1
Forwarded from Инфокультура
Присоединяйтесь ко Дню открытых данных 2024

6 марта приглашаем к участию в нашем ежегодном мероприятии для сообщества — «День открытых данных 2024».

Мероприятие пройдет в онлайн формате. Центральный фокус программы мероприятия этого года — открытые данные для сообщества. Мы планируем включить программу ваши доклады, презентации проектов и мастер-классы.

Оставьте заявку до 15 февраля, если хотите стать спикером и выступить на мероприятии, и мы с вами свяжемся: https://forms.gle/HMxjCkKi9cR3NYS77

Приглашаем разработчиков, ИТ-специалистов, дата-журналистов, гражданских активистов и других участников российского движения открытости.

Организатором Дня открытых данных в России выступает АНО «Информационная культура».

Подробности и регистрация: opendataday.ru/msk.
🔥2👍1
Daniilak — Канал
RussianCadastralParcels.zip
Часть интерфейса по мониторингу земельных участков
👍71😍1
Чат-бот склоняется как одушевлённое существительное:
🔵чат-бот — чат-боты
🔵чат-бота — чат-ботов
🔵чат-боту — чат-ботам
🔵чат-бота — чат-боты
🔵чат-ботом — чат-ботами
🔵о чат-боте — о чат-ботах

Напишите в чат-бота

Напишите в чат-бот
Please open Telegram to view this post
VIEW IN TELEGRAM
💯1
Изучаю сервис Росреестра, который предлагает возможность отслеживать изменения по объектам недвижимости на различных территориях. Однако, столкнулся с рядом ограничений, о которых хотел бы сообщить.

Во-первых, отслеживание изменений ограничено до 300 элементов. Этими элементами могут быть как кадастровые участки, так и территории площадью до 500 000 квадратных метров. В сумме не больше 300.

В случае, если в сервисе отслеживается конкретный кадастровый участок, то в данных мониторинга отображаются все изменения, касающиеся этого участка. Это может быть, например, изменение цены или типа участка, а также даты последнего изменения.

Однако, если отслеживаются изменения по территориям (например, я разделил Чебоксары на квадраты и добавил эти данные в систему с помощью скрипта), то система только указывает наличие пересечения с земельными участками. К сожалению, полезной информации об изменениях этих земельных участков не предоставляется.

В целом, данный микросервис оставляет впечатление несколько ограниченного инструмента. Однако, если API будет всегда открытым, это может компенсировать некоторые из его недостатков
👍3🔥1👏1
Я всегда стремлюсь обозревать новые сервисы и веб-сайты стартапов, чтобы открывать для себя свежие идеи и определять основные тенденции в разработке. Например, часто обитаю в каталоге betalist.com. Однако, мне успешно удалось пропустить веб-сайт с каталогом стартапов от акселератора Сбербанка.

Многие из этих сервисов мне уже знакомы, и я имел возможность их протестировать, но некоторые из них, к моему сожалению, остались незамеченными. Я не собираюсь составлять какой-либо рейтинг или список сервисов, ведь у каждого человека свои предпочтения, а кроме того, мне просто не хочется тратить на это время. Поэтому предлагаю вам ссылки на списки сайтов каждой волны акселератора:

1. Первая волна
2. Вторая волна
3. Третья волна
4. Четвертая волна
🔥2👎1
2030 год

@

90% части информации поступает от бездушных сгенерированных нейросетей
🙈1
Весьма интересный факт: бюрократические органы не признают наличие леса на определённых территориях, например, после пожара, несмотря на то что новый лес уже давно пророс там. Но через несколько лет, эти же территории подвергаются очистке с помощью бульдозеров, в результате чего уничтожается молодой лес и нарушается состояние почвы. После этого проводятся мероприятия по посадке нового леса
Вот ссылка на видео, которое иллюстрирует данную проблему: https://youtu.be/7Axo91WNQik
🤬2😢2👍1
Forwarded from The After Times
Появление React ребята из Facebook часто объясняют примерно вот так:

В далеком 2013 году в Facebook Chat часто появлялись фантомные сообщения: уведомление приходило, иконка загоралась, а самого сообщения не было.

Это было вызвано ужасным императивным кодом, а чтобы это починить и был придуман React.


У меня всегда были вопросы к этому объяснению. А вчера Adam Wolff причастный к разработке добавил деталей:

Да, React, был действительно создан для решения проблемы фантомных уведомлений, но эту проблему он в результате не решил, потому что проблема на самом деле была в кривых настройках DNS где-то в Индии, и когда DNS починили проблема ушла.

https://twitter.com/dmwlff/status/1762885255030259854?s=20
😁2
Можно утверждать, что MongoDB не всегда является оптимальным выбором базы данных. Да, она может быть эффективной для кеширования JSON-объектов и в некоторых специфических ситуациях, например, как хранилище для вывода потоковых данных или когда важна оптимизация под вставку неструктурированных данных, и скорость чтения не является приоритетом - что может быть актуально для парсеров.

Однако, стоит учесть три важных момента:
1. Даже в вышеупомянутых случаях существуют другие решения, которые могут быть более эффективными.
2. MongoDB часто используется не по назначению, а в качестве полноценной базы данных, что может привести к ряду проблем.
3. MongoDB часто используют аутсорсеры, которые не заинтересованы в удобном использовании написанного кода в будущем

Проблема не только в отсутствии у MongoDB конкретных преимуществ перед другими базами данных, такими как PostgreSQL, но и в том, что использование MongoDB может негативно сказаться на качестве кода и архитектуры в целом.

Отсутствие схем в MongoDB, миграций, транзакций (хотя они были добавлены позже) делают эту базу данных менее надежной. Вследствие этого возникает необходимость обрабатывать большое количество возможных ошибок прямо в коде, что усложняет бизнес-логику. Если в базе данных нет схемы, значит, она определена в коде, что затрудняет ее чтение и понимание.

В итоге, хотя ответ на вопрос об использовании MongoDB, конечно, "зависит от задачи", общее правило может заключаться в том, чтобы избегать использования MongoDB, если это возможно.
🔥2
Геочеки от ФНС — https://geochecki-vpd.nalog.gov.ru/geochecks

Открытые данные Федеральной налоговой службы о потреблении товаров и услуг в различных локациях, агрегированные по гексагональной сетке.

Может пригодиться для исследований городских центров и решения геомаркетинговых задач, например, уровень обеспеченности города
1
Почему вообще используются восьмиугольники на картах?

Агрегация случайных точечных данных в регулярные сетки используется по многим причинам, в частности для нормирования географии для нанесения на карту или для уменьшения неоднородности при использовании полигонов неправильной формы, созданных произвольно (например, границы избирательных округов или блоков, созданных в результате политических процессов). Регулярные сетки могут состоять только из равносторонних треугольников, квадратов или шестиугольников, т.к. только такая геометрия полигонов позволяет создавать мозаичное замощение (совокупность одинаковых фигур, охватывающую всю область без пробелов и перекрытий), чтобы получить равномерную сетку.


Хотя сетка квадратов является основным типом геометрии в ГИС-анализе и тематической картографии, бывают ситуации, когда шестиугольники лучше подходят для анализа, в зависимости от сути вопроса.


— Агрегация по гексагональной сетке может применять по следующим причинам:

— Шестиугольники позволяют уменьшить смещение выборки из-за краевых эффектов, вызванных геометрией сетки, что связано с низким значением соотношения периметра к площади шестиугольника. Наименьшее соотношение имеет окружность, но окружности не могут создать замощение в виде непрерывной сетки. Шестиугольники обладают наиболее близкой к окружности геометрией и могут складываться в мозаику, формируя равномерную сетку.

— Такая приближенность гексагональной сетки к окружности позволяет более естественно представлять кривые в распределении данных, чем квадратная сетка.

— При сравнении полигонов с равными площадями, чем ближе форма полигона к окружности, тем ближе к центроиду оказываются точки у границ (особенно рядом с вершинами). Это означает, что любая точка внутри шестиугольника находится ближе к его центроиду, чем любая точка в квадрате или треугольнике равной площади (из-за более острых углов квадрата и треугольника по сравнению с шестиугольником).

— Шестиугольники более предпочтительны, когда в анализ включаются аспекты связности или пути перемещения.

— Из-за линейной природы прямоугольников, регулярные сетки формируют прямые параллельные линии, что может скрывать от наблюдателя закономерности, имеющиеся в данных. Шестиугольники позволяют разбить эти линии и позволяют легче наблюдать закономерности в данных, имеющие криволинейную форму. Это позволяет прервать искусственные прямолинейные закономерности и снизить смещение по расположению, которое может проявляться в регулярных сетках.

— Если вы работаете с большой областью, гексагональная сетка вносит меньше искажений, вызванных кривизной земной поверхности, чем регулярная сетка.

— Поиск соседств с помощью гексагональной сетки является более эффективным. Поскольку ребро или длина контакта каждой стороны одинаковы, центроид каждого соседства является равноудаленным. Однако с регулярной сеткой центроиды соседства Queen’s Case (над/под/справа/слева) находятся на удалении N единиц, а центроиды диагонального (Rook) соседства – несколько дальше (точнее, на расстоянии квадратного корня из 2N единиц).

— Поскольку в гексагональной сетке расстояние между центроидами во всех шести направлениях одинаково, если вы используете для поиска соседей полосу расстояний или инструменты Оптимизированный анализ горячих точек, Оптимизированный анализ выбросов или Создать куб Пространство-Время по агрегации точек, в гексагональной сетке для каждого объекта в вычисления войдет большее число соседей, чем при использовании регулярной сетки.
Хм, а ведь можно пропатчить эту скрепку и запихнуть в неё API от OpenAI
😁7
Иван Бегтин сегодня анонсировал новую платформу для поиска данных — Dateno.

Это сайт, на котором можно найти открытые данные и статистику со всего мира по поисковому запросу. На нём уже проиндексировано 10 миллионов датасетов (из них — 219 тысяч по России), а к концу года это количество планируют расширить до 30 миллионов. Можно указать тематику, язык источника, формат данных. А работает это уже лучше, чем тот же Google Dataset Search.

Портал пока находится в стадии беты, но уже работает:
https://dateno.io/
🔥6👍1👎1