Почему вообще используются восьмиугольники на картах?
Агрегация случайных точечных данных в регулярные сетки используется по многим причинам, в частности для нормирования географии для нанесения на карту или для уменьшения неоднородности при использовании полигонов неправильной формы, созданных произвольно (например, границы избирательных округов или блоков, созданных в результате политических процессов). Регулярные сетки могут состоять только из равносторонних треугольников, квадратов или шестиугольников, т.к. только такая геометрия полигонов позволяет создавать мозаичное замощение (совокупность одинаковых фигур, охватывающую всю область без пробелов и перекрытий), чтобы получить равномерную сетку.
— Агрегация по гексагональной сетке может применять по следующим причинам:
— Шестиугольники позволяют уменьшить смещение выборки из-за краевых эффектов, вызванных геометрией сетки, что связано с низким значением соотношения периметра к площади шестиугольника. Наименьшее соотношение имеет окружность, но окружности не могут создать замощение в виде непрерывной сетки. Шестиугольники обладают наиболее близкой к окружности геометрией и могут складываться в мозаику, формируя равномерную сетку.
— Такая приближенность гексагональной сетки к окружности позволяет более естественно представлять кривые в распределении данных, чем квадратная сетка.
— При сравнении полигонов с равными площадями, чем ближе форма полигона к окружности, тем ближе к центроиду оказываются точки у границ (особенно рядом с вершинами). Это означает, что любая точка внутри шестиугольника находится ближе к его центроиду, чем любая точка в квадрате или треугольнике равной площади (из-за более острых углов квадрата и треугольника по сравнению с шестиугольником).
— Шестиугольники более предпочтительны, когда в анализ включаются аспекты связности или пути перемещения.
— Из-за линейной природы прямоугольников, регулярные сетки формируют прямые параллельные линии, что может скрывать от наблюдателя закономерности, имеющиеся в данных. Шестиугольники позволяют разбить эти линии и позволяют легче наблюдать закономерности в данных, имеющие криволинейную форму. Это позволяет прервать искусственные прямолинейные закономерности и снизить смещение по расположению, которое может проявляться в регулярных сетках.
— Если вы работаете с большой областью, гексагональная сетка вносит меньше искажений, вызванных кривизной земной поверхности, чем регулярная сетка.
— Поиск соседств с помощью гексагональной сетки является более эффективным. Поскольку ребро или длина контакта каждой стороны одинаковы, центроид каждого соседства является равноудаленным. Однако с регулярной сеткой центроиды соседства Queen’s Case (над/под/справа/слева) находятся на удалении N единиц, а центроиды диагонального (Rook) соседства – несколько дальше (точнее, на расстоянии квадратного корня из 2N единиц).
— Поскольку в гексагональной сетке расстояние между центроидами во всех шести направлениях одинаково, если вы используете для поиска соседей полосу расстояний или инструменты Оптимизированный анализ горячих точек, Оптимизированный анализ выбросов или Создать куб Пространство-Время по агрегации точек, в гексагональной сетке для каждого объекта в вычисления войдет большее число соседей, чем при использовании регулярной сетки.
Агрегация случайных точечных данных в регулярные сетки используется по многим причинам, в частности для нормирования географии для нанесения на карту или для уменьшения неоднородности при использовании полигонов неправильной формы, созданных произвольно (например, границы избирательных округов или блоков, созданных в результате политических процессов). Регулярные сетки могут состоять только из равносторонних треугольников, квадратов или шестиугольников, т.к. только такая геометрия полигонов позволяет создавать мозаичное замощение (совокупность одинаковых фигур, охватывающую всю область без пробелов и перекрытий), чтобы получить равномерную сетку.
Хотя сетка квадратов является основным типом геометрии в ГИС-анализе и тематической картографии, бывают ситуации, когда шестиугольники лучше подходят для анализа, в зависимости от сути вопроса.
— Агрегация по гексагональной сетке может применять по следующим причинам:
— Шестиугольники позволяют уменьшить смещение выборки из-за краевых эффектов, вызванных геометрией сетки, что связано с низким значением соотношения периметра к площади шестиугольника. Наименьшее соотношение имеет окружность, но окружности не могут создать замощение в виде непрерывной сетки. Шестиугольники обладают наиболее близкой к окружности геометрией и могут складываться в мозаику, формируя равномерную сетку.
— Такая приближенность гексагональной сетки к окружности позволяет более естественно представлять кривые в распределении данных, чем квадратная сетка.
— При сравнении полигонов с равными площадями, чем ближе форма полигона к окружности, тем ближе к центроиду оказываются точки у границ (особенно рядом с вершинами). Это означает, что любая точка внутри шестиугольника находится ближе к его центроиду, чем любая точка в квадрате или треугольнике равной площади (из-за более острых углов квадрата и треугольника по сравнению с шестиугольником).
— Шестиугольники более предпочтительны, когда в анализ включаются аспекты связности или пути перемещения.
— Из-за линейной природы прямоугольников, регулярные сетки формируют прямые параллельные линии, что может скрывать от наблюдателя закономерности, имеющиеся в данных. Шестиугольники позволяют разбить эти линии и позволяют легче наблюдать закономерности в данных, имеющие криволинейную форму. Это позволяет прервать искусственные прямолинейные закономерности и снизить смещение по расположению, которое может проявляться в регулярных сетках.
— Если вы работаете с большой областью, гексагональная сетка вносит меньше искажений, вызванных кривизной земной поверхности, чем регулярная сетка.
— Поиск соседств с помощью гексагональной сетки является более эффективным. Поскольку ребро или длина контакта каждой стороны одинаковы, центроид каждого соседства является равноудаленным. Однако с регулярной сеткой центроиды соседства Queen’s Case (над/под/справа/слева) находятся на удалении N единиц, а центроиды диагонального (Rook) соседства – несколько дальше (точнее, на расстоянии квадратного корня из 2N единиц).
— Поскольку в гексагональной сетке расстояние между центроидами во всех шести направлениях одинаково, если вы используете для поиска соседей полосу расстояний или инструменты Оптимизированный анализ горячих точек, Оптимизированный анализ выбросов или Создать куб Пространство-Время по агрегации точек, в гексагональной сетке для каждого объекта в вычисления войдет большее число соседей, чем при использовании регулярной сетки.
Иван Бегтин сегодня анонсировал новую платформу для поиска данных — Dateno.
Это сайт, на котором можно найти открытые данные и статистику со всего мира по поисковому запросу. На нём уже проиндексировано 10 миллионов датасетов (из них — 219 тысяч по России), а к концу года это количество планируют расширить до 30 миллионов. Можно указать тематику, язык источника, формат данных. А работает это уже лучше, чем тот же Google Dataset Search.
Портал пока находится в стадии беты, но уже работает:
https://dateno.io/
Это сайт, на котором можно найти открытые данные и статистику со всего мира по поисковому запросу. На нём уже проиндексировано 10 миллионов датасетов (из них — 219 тысяч по России), а к концу года это количество планируют расширить до 30 миллионов. Можно указать тематику, язык источника, формат данных. А работает это уже лучше, чем тот же Google Dataset Search.
Портал пока находится в стадии беты, но уже работает:
https://dateno.io/
🔥6👍1👎1
С помощью технологии GPT от OpenAI удалось успешно решить проблему незаконно установленного киоска "Славица", который нарушал закон с 17 февраля 2023 года (с этого дня территория, на которой расположен киоск, сменилась на муниципальную). Обращения, перед подачей через приложение "Решаем вместе", были трансформированы из обычного человеческого текста в более структурированный и грамотный формат при помощи GPT4.
🔥5⚡1👍1👎1👏1
Упорно работаю над своим проектом, при помощи которого можно будет запрашивать информацию по базе Розыска в МВД.
https://github.com/daniilak/ru_mvd_search_wanted
Собираюсь выпустить его на pypi.org и нахожусь на заключительном этапе, по которому осталось выполнить следующие задачи:
1. Написать тесты для проверки функционала.
2. Экспериментально проверить его работоспособность.
3. Доработать раздел "Readme" для более полного описания проекта.
4. Заменить возвращение ошибок на исключения.
5. Качественно оптимизировать код.
Несмотря на текущий прогресс, на данный момент этот проект является только частичным парсером. Для его полноценной работы требуется:
1. Добавить код и модель, которые смогут автоматически решать капчу.
2. Реализовать функцию, позволяющую получить дополнительные данные о найденном человеке через проверку ответов на почте.
Думаю, что будет создан отдельный репозиторий в формате FastAPI приложения, который будет включать в себя отдельные модули для решения капчи и работы с почтой.
https://github.com/daniilak/ru_mvd_search_wanted
Собираюсь выпустить его на pypi.org и нахожусь на заключительном этапе, по которому осталось выполнить следующие задачи:
1. Написать тесты для проверки функционала.
2. Экспериментально проверить его работоспособность.
3. Доработать раздел "Readme" для более полного описания проекта.
4. Заменить возвращение ошибок на исключения.
5. Качественно оптимизировать код.
Несмотря на текущий прогресс, на данный момент этот проект является только частичным парсером. Для его полноценной работы требуется:
1. Добавить код и модель, которые смогут автоматически решать капчу.
2. Реализовать функцию, позволяющую получить дополнительные данные о найденном человеке через проверку ответов на почте.
Думаю, что будет создан отдельный репозиторий в формате FastAPI приложения, который будет включать в себя отдельные модули для решения капчи и работы с почтой.
GitHub
GitHub - daniilak/ru_mvd_search_wanted: Поиск в базе данных Розыска МВД
Поиск в базе данных Розыска МВД. Contribute to daniilak/ru_mvd_search_wanted development by creating an account on GitHub.
❤🔥2👍2🔥1
Думаю на kaggle.com выпустить полные кадастровые данные по Чебоксарам (полигоны и метаданные), и посмотреть как территорию города будут анализировать)
🔥2👍1
Forwarded from Love. Death. Transformers.
Наконец доехал из перевода Veles2.5 - переведенный на русский Hermes2.5 через gpt3.5
Вероятно доедет за несколько недель вихрь-велес
Датасет для русского
Вероятно доедет за несколько недель вихрь-велес
Датасет для русского
❤1🔥1
Daniilak — Канал
Думаю на kaggle.com выпустить полные кадастровые данные по Чебоксарам (полигоны и метаданные), и посмотреть как территорию города будут анализировать)
Я провёл анализ данных, извлечённых из ЕГРН и публичной кадастровой карты по Чебоксарам (Кадастровый Округ "21:01"). В результате было обработано 94072 земельных участка.
По параметру "Категория земель" было выявлено следующее распределение:
- Земли населённых пунктов: 60301 участок
- Категория не установлена: 342 участка
- Земли лесного фонда: 222 участка
- Земли сельскохозяйственного назначения: 17 участков
- Земли промышленности, энергетики, транспорта, связи, радиовещания, телевидения, информатики, земли для обеспечения космической деятельности, земли обороны, безопасности и земли иного специального назначения: 13 участков
- Земли особо охраняемых территорий и объектов: 7 участков
При анализе поля "Разрешенное использование" было выявлено больше категорий — их оказалось 122.
Однако наибольшее удивление вызвал параметр "Разрешенное использование по документу" — здесь было обнаружено аж 5796 различных наименований.
Отсортированные категории в комментариях. Исходники опубликую позже)
По параметру "Категория земель" было выявлено следующее распределение:
- Земли населённых пунктов: 60301 участок
- Категория не установлена: 342 участка
- Земли лесного фонда: 222 участка
- Земли сельскохозяйственного назначения: 17 участков
- Земли промышленности, энергетики, транспорта, связи, радиовещания, телевидения, информатики, земли для обеспечения космической деятельности, земли обороны, безопасности и земли иного специального назначения: 13 участков
- Земли особо охраняемых территорий и объектов: 7 участков
При анализе поля "Разрешенное использование" было выявлено больше категорий — их оказалось 122.
Однако наибольшее удивление вызвал параметр "Разрешенное использование по документу" — здесь было обнаружено аж 5796 различных наименований.
Отсортированные категории в комментариях. Исходники опубликую позже)
👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
На Github выложили платформу OpenCat. С её помощью можно сделать себе четвероногого робота-питомца 🌯
Как раз без дела лежат и Raspberry Pi и Arduino
Как раз без дела лежат и Raspberry Pi и Arduino
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2⚡1
🔥4👍1👌1
Представьте троллинг:
— Ты что, не помнишь эту песню?
И ставить генерацию..
— Ты что, не помнишь эту песню?
И ставить генерацию..
😁8😨1
Сгенерил рекламу на радио для продающегося земельного участка
app.suno.ai/song/0e4c0c6d-b317-4482-8fd2-3ed3336084ff
app.suno.ai/song/74896336-1793-4293-8432-1104d02f8676
app.suno.ai/song/0e4c0c6d-b317-4482-8fd2-3ed3336084ff
app.suno.ai/song/74896336-1793-4293-8432-1104d02f8676
🔥3😁3👍1🤔1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Посвящается всем авторам ТГ каналов про Эй Ай
https://app.suno.ai/song/71d79d32-73f1-42e4-8b55-16809ebfad33
Я слежу что пишет сама
Знаю все про Гэ Пэ Тэ
Ворлд модели строит Сора
подпишись на мой тэ гэ
Здесь посты и много мемов
Можно слушать и читать
Будешь лучшем в мире сеток
Клоуна не ставьте блять
Когда ты станешь самым смелым
Будешь шарить, больше знать
Будет офер, много денег
Незабудь донат прислать
https://app.suno.ai/song/71d79d32-73f1-42e4-8b55-16809ebfad33
Можно разные техники, лоссы, архитектуры DL наглядно изучить. Фреймворк DL Pytorch.
https://nn.labml.ai
https://nn.labml.ai