Ivan Begtin
8.1K subscribers
2.01K photos
3 videos
102 files
4.73K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
加入频道
Forwarded from Open Government Digest
Government data: How open is too open?
http://thegovlab.org/government-data-how-open-is-too-open/

Sharon Fisher at HPE: "The notion of "open government” appeals to both
citizens and IT professionals seeking access to freely available government
data. But is there such a thing as data access being too open? Governments may
want to be transparent, yet they need to avoid releasing personally
identifiable information. There's no question that open government […]

Full Post: [Government data: How open is too
open?](http://thegovlab.org/government-data-how-open-is-too-open/)
19 тихоокеанских стран создают совместную единую платформу для учета граждан. В первую очередь это касается регистрации рождения и смерти, но этим не ограничивается и в будущем система будет использоваться и для других целей - таких как регистрация прав на недвижимость, digital identity. И вот здесь важным аспектом является соглашение об обмене данными на которое идут все участники. Подробнее в статье на GovInsider
Forwarded from Open Government Digest
Exclusive: Why 19 Pacific countries are building a single civil registration platform
http://govinsider.asia/innovation/jeff-montgomery-pacific-civil-registrars-network-new-zealand/

Interview with Jeff Montgomery, New Zealand’s Registrar-General and GM of
Births, Deaths, Marriages, Citizenship and Translations. Innovation
О сборе новостей и переносе сборщиков RSS в телеграм на английском языке в Medium [1].
Напомню что большие тексты на английском языке я буду писать именно в блоге на Medium, а на русском языке на Яндекс.Дзен [2]

Ссылки:
[1] https://medium.com/@ibegtin/how-i-find-opendata-and-opengov-news-and-create-newsfeeds-with-telegram-814bd953cae9
[2] https://zen.yandex.ru/media/id/5a315e1300b3dd77beb64261

#opendata #opengov
Свежий документ Минфина с классификацией субъектов федерации по тому насколько они зависят от федерального бюджета.

Приведу оттуда лишь 2 списка, остальные Вы можете посмотреть сами.

Регионы не получавшие субсидии на выравние бюджетной обеспеченности:
- Республика Татарстан (Татарстан)
- Ленинградская область
- Московская область
- Самарская область
- Сахалинская область
- Свердловская область
- Тюменская область
- город федерального значения Москва
- город федерального значения Санкт-Петербург
- Ненецкий автономный округ
- Ханты-Мансийский автономный округ - Югра
- Ямало-Ненецкий автономный округ

Регионы у которых дефицит бюджета превышал 40% последние 3 года.
- Республика Алтай
- Республика Дагестан
- Республика Ингушетия
- Республика Крым
- Республика Тыва
- Чеченская Республика
- Камчатский край

Никаких невероятных открытий в этих списках нет, важно просто помнить, в том числе, это говоря о том как устроена наша страна.

#opendata #opengov
Forwarded from Госфинансы
Приказ Минфина России от 15.11.2017 № 1029 «Об утверждении перечней субъектов Российской Федерации в соответствии с положениями пункта 5 статьи 130 Бюджетного кодекса Российской Федерации»
https://minfin.ru/ru/document/?id_4=121666

© Официальный сайт Минфина России
Сложная, лично мне непонятная, но несомненно красивая визуализация данных OddityViz как мемориал Дэвиду Боуи[1].

Ссылки:
[1] https://medium.muz.li/oddityviz-a-tribute-to-david-bowie-with-data-3566d3bd6bd8

#opendata #opengov
Пока мы работаем с, в общем-то, скучными данными, активисты создают Open Cannabis Project [1] для защиты малых производителей каннабиса от патентов и монополий.

Кроме всего прочего этот проект про данные, о чём они и пишут в своем блоге [2] о том что собирают базу, в первую очередь, патентов.

Ссылки:
[1] https://opencannabisproject.org
[2] https://medium.com/opencannabisproject/2018-the-year-of-the-database-a5701eb66d6b

#opendata
Tableau версии 10.5 получил интегрированный движок Hyper. Пока на линуксе и обещают в 5 улучшение скорости отработки запросов.
Подробнее в их блоге [1]

Ссылки:
[1] https://www.tableau.com/about/blog/2018/1/hyper-and-linux-arrive-tableau-105-80538
Forwarded from Data is good
Tableau Launches Hyper — a Data Engine that Gives Faster Insights
https://medium.com/martech-advisor/tableau-launches-hyper-a-data-engine-that-gives-faster-insights-6941e1723b1a?source=rss------data-5

![](https://cdn-images-1.medium.com/max/786/0*K0MOUzByAA1c-r1i.jpg)

Data visualization company Tableau Software is all set to try and give its
business a major boost with a new data engine acquired from a startup in
Germany, almost eighteen months ago.

The company announced the availability of its new data engine, Hyper, on
Wednesday. The company says that Hyper will help breakdown large volumes of
data in seconds thereby even improving the speed of querying and building
reports off large data
В Великобритании начинает работать система "открытости банков" (Open Banking) которая обязывает банки предоставлять клиентам возможность подключать приложения других компаний к финансовым данным клиента в случае если клиент это разрешает. Подробнее об этом пишет BBC [1].

Это важное развитие банковского сектора - что не банку, а его клиенту принадлежать его финансовые данные. И клиент, а не банк имеет право на передачу этой информации третьим лицам.

Не буду загадывать возможно ли подобное в России, но изменение важное в части доступа малого и среднего бизнеса и стартапов к персональным данным.

Ссылки:
[1] http://www.bbc.com/news/business-42253051

#opendata #opengov #openbanking
На выходных я вспомнил что программирование - это не профессия, а призвание и доделал, вернее, подготовил к публикации 3 библиотеки и утилиты:
- qddate - https://github.com/ivbeg/qddate Quick and dirty date processing. Библиотека очень быстрого парсинга дат для Питона
- docx2csv - https://github.com/ivbeg/docx2csv - библиотека и утилита извлечения таблиц из docx файлов
- lazyscraper - https://github.com/ivbeg/lazyscraper- ленивый скрейпинг HTML. утилита командной строки и библиотека для превращения HTML таблиц и xpath запросов в CSV

Последние 2 я ранее публиковал, но к ним не было, ни документации, ни пакета в PyPi, ни чистого кода.
А теперь все есть, пакеты в PyPi и код в ReadTheDocs.org - http://qddate.readthedocs.io/en/latest/

qddate - это библиотека которая используется внутри бота https://yangx.top/FeedRetranslatorBot который превращает HTML страницы в RSS. Собственно главной проблемой обработки огромного числа страниц всегда была обработка дат и qddate было заточено ровно под решение именно этой задачи - обработки сотен тысяч строк с датами в секунды.

Код очень старый, все время было потрачено, не на программирование, а на документирование.

Все это много лет использовалось для быстрого сбора и обработки данных в самых разных проектах связанных с обработкой данных и с открытыми данными.

Не могу обещать частой публикации кода, большая часть времени у меня сейчас в запуске и развитии больших проектов, но свой маленький вклад в open source обязательно должен быть

#opensource
Ростелекому помощь не нужна.

Встреча В.В.Путина и Михаила Осеевского (глава Ростелекома). Откровений я не увидел, а вот подтверждение что для РТК приоритетом остаются ЦОДы и индустриальный интернет - это, по моему, уже было.
Встреча с президентом компании «Ростелеком» Михаилом Осеевским
http://kremlin.ru/events/president/news/56647

М.Осеевский информировал главу государства об итогах работы ПАО «Ростелеком» в
2017 году и приоритетных направлениях деятельности на 2018 год.

![C президентом ПАО «Ростелеком» Михаилом
Осеевским.](http://static.kremlin.ru/media/events/photos/small/WCnWrOBnnAk65LXta2WEb2OGClUIc6Ak.jpg)
Ничего не знаю про то кто будет следующим главой кабинета министров.

Но знаю что в ТЗ на 2018 год на сайт Правительства указана, в том числе, доработка сайта da-medvedev.ru

Или ТЗ потом поменяют, заключив доп. соглашение, или "или".
Какое-то время назад я писал о том что открытость государства как термин не то что устарел, но перестроился.

Не только Gartner определяет Digital Government как развитие Open Government [1], но и такое явление как цифровая пятерка (Digital 5) [2] говорит о том же. Еще в 2014 году 5 стран подписали хартию цифровой пятерки где обозначили правила цифровизации в которых открытость государства (в части открытых данных) ключевым приоритетом.
Вот список принципов заложенный в хартии:
...
3.1. User needs
3.2. Open standards
3.3. Open source
3.4. Open markets
3.5. Open government (transparency)
3.6. Connectivity
3.7.Teach children to code
3.8. Assisted digital
3.9. Commitment to share and learn
...

Open Government становится лишь частью повестки Digital Government.

Это то что я ранее говорил. Открытые данные становятся частью "приличий", а не ключевым приоритетом развития. Предполагается что в развитом обществе нет необходимости об этом говорить лишний раз, речь идет не о том должны или не должны они публиковаться, а о том какой социальный и экономический эффект они создают.

В развитие этой мысли я сейчас вижу много публикацией где авторы делают акцент на использовании открытых данных в контексте AI powered government. То есть в контексте бесплатного топлива для разработки автоматизированных алгоритмов.

Я повторю свое предсказание для гартнеровской модели. Она меняется раз в несколько лет, обычно провоцируя или предсказывая изменения в публичной риторике и концепциях.

Следующая "глобальная" концепция будет вокруг AI в государстве. Я предсказываю одно из называний: AI government, AI powered government или cognitive government.

Россия пока существует скорее в собственной повестке чем в мировой. Предсказать как это будет в России я пока не берусь.

Ссылки:
[1] https://www.gartner.com/doc/3764382/introducing-gartner-digital-government-maturity
[2] https://www.ict.govt.nz/governance-and-leadership/international-leadership/d5-wellington-2018/
[3] https://www.ict.govt.nz/assets/Uploads/D5Charter-signed-accessible.pdf

#opendata #opengov #digitalgov
3-4 марта в Москве мы, Инфокультура, вместе с партнерами организуем Open Data Day (http://msk.opendataday.ru/) и скоро будем всех туда зазывать, опубликуем программу и тд.

Я понимаю что часто важна даже не тема, а люди и хочу задать всем вопрос.

Кого бы Вы хотели увидеть там в спикерах? Чьего выступления Вы ждете и жаждете?

Напишите мне на [email protected] или в чат https://yangx.top/begtinchat
Я просто оставлю это здесь https://gov.gosuslugi.ru/ может быть появился шанс что gov.ru наконец-то станет приличным и по содержанию и по дизайну.
30 января в Роскомнадзоре состоится день открытых дверей который они хотят посвятить персональным данным [1]. Нет ощущения что услышым что-то новое, но зарегистрироваться можно у них на сайте по контактам [2]

Ссылки:
[1] https://rspectr.com/novosti/52718/rkn-posvyatit-zashite-personalnyh-dannyh-den-otkrytyh-dverej
[2] http://rkn.gov.ru/news/rsoc/news53904.htm
Всяческие напоминания, о том как можно помочь нашим проектом по открытым данным и открытым знаниям, а также начинать и продолжать свои.

Самый простой способ помощи - это волонтерство и открытый код.
В github'е есть несколько списков/каталогов полезных проектов, они называются awesome lists у нас такие тоже есть:
- Awesome opendata in Russian https://github.com/infoculture/awesome-opendata-rus о проектах по открытых данным на русском языке

- Awesome list for data journalists and future data journalists https://github.com/infoculture/awesome-datajournalism для тех кто интересуется дата-журналистикой

-Awesome openbudget list https://github.com/infoculture/awesome-openbudget для тех кто интересуется открытостью бюджетов

Все эти списки пополняются в открытую волонтерами прямо в github'е через механизм "pull request", для него достаточно открыть файл Readme.md в списке файлов и добавить то чего, на Ваш взгляд, нехватает.

При том что открытый код не является нашим основным направлением у Инфокультуры много открытого кода - https://github.com/infoculture, мы открываем его по всем проектам в которых у нас нет юридических ограничений.

Если Вам нравится только тема открытости, но и конкретно то что мы делаем в Инфокультуре, то простой способ помочь - это пожертвовать по кнопке "Поддержать нас" на нашем сайте https://www.infoculture.ru/ Неважно сколько Вы готовы пожертвовать 1 рубль или 1 тысячу рублей, важнее то что рублем Вы голосуете за то что мы делаем что-то по настоящему нужное.

Мы уже работаем над тем чтобы сделать специальную форму для поддержки.

Если Вы хотите поддержать наши мероприятия, такие как День открытых данных https://msk.opendataday.ru - выступив их спонсором, и взяв на себя, помощь в аренде помещения или оплату оплату поездки экспертов из других городов/стран или Вы заинтересованы организации мероприятия по открытым данным по теме которая Вам более близка, напишите мне на [email protected].

По всем нашим проектам важной помощью является обратная связь - написать то что Вам бы хотелось увидеть на Открытой полиции, Госзатратах и иных проектах которыми Вы пользуетесь. Все они собраны у нас на сайте https://www.infoculture.ru/projects/

#opendata