Ivan Begtin
8.1K subscribers
2.02K photos
3 videos
102 files
4.75K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
加入频道
Ранее я писал про бот который создает поток сообщений из RSS и новостей на сайтах и транслирует их в каналах. Бот наконец-то проверен в полубоевых условиях и готов для публичного тестирования.

Бот доступен тут @FeedRetranslatorBot справка по нему получается командой "/help".

Как с ним работать:
1. Если у Вас нет канала, то создаете его через клиента Telegrama. Он должен быть публичен. Например, мой канал имеет имя "begtin" и ссылку "https://yangx.top/begtin". Вам понадобится его имя.
2. Добавляете бота @FeedRetranslatorBot администратором в канал. Из прав ему нужны только права на публикацию постов.
3. Заходите в настройки бота и добавляете подключаете канал. Это команда "/channel [название канала]". Пример: /channel begtin
4. Далее добавляете подписки. Добавить можно через команду: "/add"
Добавление выглядит вот так: "/add begtin https://medium.com/feed/@ibegtin"
если Вы не знаете есть ли RSS лента на странице, то можно предварительно это проверить командой "/test https://medium.com/feed/@ibegtin"
5. Далее каждые полчаса робот собирает новости и раскидывает их по каналам.

Важные особенности:
- сейчас стоит ограничение на 3 канала и по 5 подписок на канал на одного пользователя. Если понадобится больше, пишите.
- боту _не обязательно_ чтобы на странице была RSS лента. Он умеет собирать новости с любой страницы где есть ссылки с датами. Пример, у ФРИИ нет RSS ленты на сайте, но со страницы http://www.iidf.ru/media/articles/ бот соберет информацию. Поддерживает 8 языков и примерно 300 видов написания дат. Не поддерживает восточные языки, иероглифы и тд. Даже не проверялся.
- сейчас бот может иногда выдавать отладочную информацию при взаимодействии, это нужно для его проверки. Но в сами каналы он ничего такого не пишет, туда идут только новости.

Это мой личный проект-хобби, я на нем поддерживаю свои навыки программирования, чтобы совсем уж не отойти от технической работы. При этом я сам его активно использую, перенеся в него все подписки из RSS ридера.

Все пожелания можно направлять мне в @begtinchat или напрямую в @ibegtin

#news #rss #feeds #bots
Обратите внимание на то как проводит найм сотрудников Canadian Digital Services.
1. Работа в start-up environment. С самого начала работа предполагает неформальную обстановку
2. Найм людей исключительно по квалификации и талантам. Нет требований к образованию, годам госслужбы, допуску и так далее. Требуется только опыт и квалификации для задач команды [1]
3. Открытый исходный код [2] включая полный код их сайта digital.canada.ca [3]

Ссылки:
[1] https://digital.canada.ca/work-with-us/
[2] https://github.com/cds-snc
[3] https://github.com/cds-snc/digital-canada-ca
Forwarded from Open Government Digest
Hiring at CDS – How we make it work in a start-up environment
http://digital.canada.ca/2018/01/09/hiring-at-cds/

There’s a lot of interest on how we are recruiting and staffing up a digital
services team that can hit the ground running and help solve service
challenges across the Government. This is why I am super excited to be writing
a blog post about our hiring practices at CDS.

We are recruiting talent from inside and outside the public service at the
grandest scale: globally, nationally and locally. We want to bring together
the best: highly skilled people who are motivated to do mission driven work
Примеры того как данные о преступлениях приводят к предсказании преступности. Алгоритм с 90% вероятностью предсказывает типы и число преступлений на определенных территориях, только на основе исторических данных полиции Сан-Франциско. Особенность в том что предсказания привязаны к почтовому индексу, времени суток и дню недели. А также доступен исходный код [1]

Ссылки:
[1] https://github.com/orlandott/Predictive_Policing

#opendata #openpolice
Forwarded from Data is good
The Perils of Predictive Policing
https://towardsdatascience.com/the-perils-of-predictive-policing-11928a9f1d60?source=rss----7f60cf5620c9---4

### Data Science gone wrong: Predictive Policing is a WMD

See the **interactive map** with the prediction results
[here.](https://orlandott.github.io/Predictive_Policing/)

![](https://cdn-images-1.medium.com/max/1024/1*VCh6gjUWHkFLnliQDQOR9w.png)
Click the link above to see the interactive map.

For the **code** , visit the repo for this project
[here](https://github.com/orlandott/Predictive_Policing).

When new technologies emerge, our ethics and our laws normally take some time
to adjust. As
Правительство Великобритании использует алгоритмы для выбора приоритета проверки школ [1]. Так в Великобритании тоже идут изменения в надзоре и контроле государства, хотя это и не называется реформой. Разработкой алгоритмов занимается команда Behavioural Insights Team [2] применяющая алгоритмы прогнозирования не только к инспекциям, но и к другой деятельности государства.

Чему уже сопротивляется союз учителей, призывающей к прозрачности работы алгоритмов и наличию четких критериев для проверяемых в том какая именно школа выбрана для проверки.

Не стоит рассчитывать что эта тенденция обойдет Россию стороной. Все что нужно для внедрения алгоритмического планирования проверок или прогнозирования - это смена поколений руководителей.

Ссылки:
[1] http://www.bbc.com/news/technology-42425959
[2] http://www.behaviouralinsights.co.uk/publications/using-data-science-in-policy/

#opendata #algorithms #bigdata
В открытый проект Open Ownership объединяющий базы владельцев бизнеса по всему миру добавили базу из 240 тысяч украинских компаний [1]. В самом реестре сейчас примерно 4.2 миллиона организаций [2] Великобритании, Словакии, Украины и раскрываемых по стандарту EITI. А все данные доступны как открытые данные.

4,2 миллиона организаций - это очень мало, в сравнении, например, с OpenCorporates и их базой в 138 миллионов юридических лиц [3], но важная особенность в том что Open Ownership дает информацию именно о конечных владельцах организации для тех реестров которые позволяют это сделать.

Ссылки:
[1] https://openownership.org/news/ukrainian-beneficial-ownership-data-now-available/
[2] https://register.openownership.org/
[3] https://opencorporates.com/

#opendata #opengov #transparency #ownership
Пока отдельные страны придумывают собственные механизмы идентификации граждан, в Гунджоу (Китай) используют WeChat для официальной цифровой идентификации и доступа к государственным услугам онлайн и оффлайн.
Forwarded from Open Government Digest
Guangzhou now uses WeChat for digital identity
http://govinsider.asia/security/guangzhou-wechat-digital-identity/

The app provides official identification for using both online and offline
government services.
Можно ли предсказать голосование по фотографии? А если это панорамная фотография?

Исследователи из Стенфордского университета проанализировали 50 миллионов фотографий из Google Street View [1]
и научились определять типы автомобилей и, соответственно, предсказывать голосования в местах где они сделаны.
Всего система умеет предсказывать с высокой точностью уровень доходов, расовые признаки, образование и привычки в голосовании с детальностью до почтового индекса (ZIP кода).

Все это социологам и в России на заметку, кроме Google Street View в России ещё есть Яндекс Панорамы и алгоритмы позволили бы провести реальные исследования устройства российского общества.

Подробнее об исследовании [2]

Ссылки:
[1] https://www.nytimes.com/2017/12/31/technology/google-images-voters.html
[2] http://www.pnas.org/content/114/50/13108.full.pdf

#opendata #data #algorithms
Об обратной стороне открытости и о том как в США еще в 80-х вводили ограничения на доступность персональных данных. Подобные примеры важны для понимания баланса открытости и ограничений доступа, в первую очередь помня о том что мы живем в мире где есть люди идущие на сознательные преступления.
Forwarded from Open Government Digest
Government data: How open is too open?
http://thegovlab.org/government-data-how-open-is-too-open/

Sharon Fisher at HPE: "The notion of "open government” appeals to both
citizens and IT professionals seeking access to freely available government
data. But is there such a thing as data access being too open? Governments may
want to be transparent, yet they need to avoid releasing personally
identifiable information. There's no question that open government […]

Full Post: [Government data: How open is too
open?](http://thegovlab.org/government-data-how-open-is-too-open/)
19 тихоокеанских стран создают совместную единую платформу для учета граждан. В первую очередь это касается регистрации рождения и смерти, но этим не ограничивается и в будущем система будет использоваться и для других целей - таких как регистрация прав на недвижимость, digital identity. И вот здесь важным аспектом является соглашение об обмене данными на которое идут все участники. Подробнее в статье на GovInsider
Forwarded from Open Government Digest
Exclusive: Why 19 Pacific countries are building a single civil registration platform
http://govinsider.asia/innovation/jeff-montgomery-pacific-civil-registrars-network-new-zealand/

Interview with Jeff Montgomery, New Zealand’s Registrar-General and GM of
Births, Deaths, Marriages, Citizenship and Translations. Innovation
О сборе новостей и переносе сборщиков RSS в телеграм на английском языке в Medium [1].
Напомню что большие тексты на английском языке я буду писать именно в блоге на Medium, а на русском языке на Яндекс.Дзен [2]

Ссылки:
[1] https://medium.com/@ibegtin/how-i-find-opendata-and-opengov-news-and-create-newsfeeds-with-telegram-814bd953cae9
[2] https://zen.yandex.ru/media/id/5a315e1300b3dd77beb64261

#opendata #opengov
Свежий документ Минфина с классификацией субъектов федерации по тому насколько они зависят от федерального бюджета.

Приведу оттуда лишь 2 списка, остальные Вы можете посмотреть сами.

Регионы не получавшие субсидии на выравние бюджетной обеспеченности:
- Республика Татарстан (Татарстан)
- Ленинградская область
- Московская область
- Самарская область
- Сахалинская область
- Свердловская область
- Тюменская область
- город федерального значения Москва
- город федерального значения Санкт-Петербург
- Ненецкий автономный округ
- Ханты-Мансийский автономный округ - Югра
- Ямало-Ненецкий автономный округ

Регионы у которых дефицит бюджета превышал 40% последние 3 года.
- Республика Алтай
- Республика Дагестан
- Республика Ингушетия
- Республика Крым
- Республика Тыва
- Чеченская Республика
- Камчатский край

Никаких невероятных открытий в этих списках нет, важно просто помнить, в том числе, это говоря о том как устроена наша страна.

#opendata #opengov
Forwarded from Госфинансы
Приказ Минфина России от 15.11.2017 № 1029 «Об утверждении перечней субъектов Российской Федерации в соответствии с положениями пункта 5 статьи 130 Бюджетного кодекса Российской Федерации»
https://minfin.ru/ru/document/?id_4=121666

© Официальный сайт Минфина России
Сложная, лично мне непонятная, но несомненно красивая визуализация данных OddityViz как мемориал Дэвиду Боуи[1].

Ссылки:
[1] https://medium.muz.li/oddityviz-a-tribute-to-david-bowie-with-data-3566d3bd6bd8

#opendata #opengov
Пока мы работаем с, в общем-то, скучными данными, активисты создают Open Cannabis Project [1] для защиты малых производителей каннабиса от патентов и монополий.

Кроме всего прочего этот проект про данные, о чём они и пишут в своем блоге [2] о том что собирают базу, в первую очередь, патентов.

Ссылки:
[1] https://opencannabisproject.org
[2] https://medium.com/opencannabisproject/2018-the-year-of-the-database-a5701eb66d6b

#opendata
Tableau версии 10.5 получил интегрированный движок Hyper. Пока на линуксе и обещают в 5 улучшение скорости отработки запросов.
Подробнее в их блоге [1]

Ссылки:
[1] https://www.tableau.com/about/blog/2018/1/hyper-and-linux-arrive-tableau-105-80538