Ivan Begtin
8.1K subscribers
2.01K photos
3 videos
102 files
4.73K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
加入频道
В Великобритании начинает работать система "открытости банков" (Open Banking) которая обязывает банки предоставлять клиентам возможность подключать приложения других компаний к финансовым данным клиента в случае если клиент это разрешает. Подробнее об этом пишет BBC [1].

Это важное развитие банковского сектора - что не банку, а его клиенту принадлежать его финансовые данные. И клиент, а не банк имеет право на передачу этой информации третьим лицам.

Не буду загадывать возможно ли подобное в России, но изменение важное в части доступа малого и среднего бизнеса и стартапов к персональным данным.

Ссылки:
[1] http://www.bbc.com/news/business-42253051

#opendata #opengov #openbanking
На выходных я вспомнил что программирование - это не профессия, а призвание и доделал, вернее, подготовил к публикации 3 библиотеки и утилиты:
- qddate - https://github.com/ivbeg/qddate Quick and dirty date processing. Библиотека очень быстрого парсинга дат для Питона
- docx2csv - https://github.com/ivbeg/docx2csv - библиотека и утилита извлечения таблиц из docx файлов
- lazyscraper - https://github.com/ivbeg/lazyscraper- ленивый скрейпинг HTML. утилита командной строки и библиотека для превращения HTML таблиц и xpath запросов в CSV

Последние 2 я ранее публиковал, но к ним не было, ни документации, ни пакета в PyPi, ни чистого кода.
А теперь все есть, пакеты в PyPi и код в ReadTheDocs.org - http://qddate.readthedocs.io/en/latest/

qddate - это библиотека которая используется внутри бота https://yangx.top/FeedRetranslatorBot который превращает HTML страницы в RSS. Собственно главной проблемой обработки огромного числа страниц всегда была обработка дат и qddate было заточено ровно под решение именно этой задачи - обработки сотен тысяч строк с датами в секунды.

Код очень старый, все время было потрачено, не на программирование, а на документирование.

Все это много лет использовалось для быстрого сбора и обработки данных в самых разных проектах связанных с обработкой данных и с открытыми данными.

Не могу обещать частой публикации кода, большая часть времени у меня сейчас в запуске и развитии больших проектов, но свой маленький вклад в open source обязательно должен быть

#opensource
Ростелекому помощь не нужна.

Встреча В.В.Путина и Михаила Осеевского (глава Ростелекома). Откровений я не увидел, а вот подтверждение что для РТК приоритетом остаются ЦОДы и индустриальный интернет - это, по моему, уже было.
Встреча с президентом компании «Ростелеком» Михаилом Осеевским
http://kremlin.ru/events/president/news/56647

М.Осеевский информировал главу государства об итогах работы ПАО «Ростелеком» в
2017 году и приоритетных направлениях деятельности на 2018 год.

![C президентом ПАО «Ростелеком» Михаилом
Осеевским.](http://static.kremlin.ru/media/events/photos/small/WCnWrOBnnAk65LXta2WEb2OGClUIc6Ak.jpg)
Ничего не знаю про то кто будет следующим главой кабинета министров.

Но знаю что в ТЗ на 2018 год на сайт Правительства указана, в том числе, доработка сайта da-medvedev.ru

Или ТЗ потом поменяют, заключив доп. соглашение, или "или".
Какое-то время назад я писал о том что открытость государства как термин не то что устарел, но перестроился.

Не только Gartner определяет Digital Government как развитие Open Government [1], но и такое явление как цифровая пятерка (Digital 5) [2] говорит о том же. Еще в 2014 году 5 стран подписали хартию цифровой пятерки где обозначили правила цифровизации в которых открытость государства (в части открытых данных) ключевым приоритетом.
Вот список принципов заложенный в хартии:
...
3.1. User needs
3.2. Open standards
3.3. Open source
3.4. Open markets
3.5. Open government (transparency)
3.6. Connectivity
3.7.Teach children to code
3.8. Assisted digital
3.9. Commitment to share and learn
...

Open Government становится лишь частью повестки Digital Government.

Это то что я ранее говорил. Открытые данные становятся частью "приличий", а не ключевым приоритетом развития. Предполагается что в развитом обществе нет необходимости об этом говорить лишний раз, речь идет не о том должны или не должны они публиковаться, а о том какой социальный и экономический эффект они создают.

В развитие этой мысли я сейчас вижу много публикацией где авторы делают акцент на использовании открытых данных в контексте AI powered government. То есть в контексте бесплатного топлива для разработки автоматизированных алгоритмов.

Я повторю свое предсказание для гартнеровской модели. Она меняется раз в несколько лет, обычно провоцируя или предсказывая изменения в публичной риторике и концепциях.

Следующая "глобальная" концепция будет вокруг AI в государстве. Я предсказываю одно из называний: AI government, AI powered government или cognitive government.

Россия пока существует скорее в собственной повестке чем в мировой. Предсказать как это будет в России я пока не берусь.

Ссылки:
[1] https://www.gartner.com/doc/3764382/introducing-gartner-digital-government-maturity
[2] https://www.ict.govt.nz/governance-and-leadership/international-leadership/d5-wellington-2018/
[3] https://www.ict.govt.nz/assets/Uploads/D5Charter-signed-accessible.pdf

#opendata #opengov #digitalgov
3-4 марта в Москве мы, Инфокультура, вместе с партнерами организуем Open Data Day (http://msk.opendataday.ru/) и скоро будем всех туда зазывать, опубликуем программу и тд.

Я понимаю что часто важна даже не тема, а люди и хочу задать всем вопрос.

Кого бы Вы хотели увидеть там в спикерах? Чьего выступления Вы ждете и жаждете?

Напишите мне на [email protected] или в чат https://yangx.top/begtinchat
Я просто оставлю это здесь https://gov.gosuslugi.ru/ может быть появился шанс что gov.ru наконец-то станет приличным и по содержанию и по дизайну.
30 января в Роскомнадзоре состоится день открытых дверей который они хотят посвятить персональным данным [1]. Нет ощущения что услышым что-то новое, но зарегистрироваться можно у них на сайте по контактам [2]

Ссылки:
[1] https://rspectr.com/novosti/52718/rkn-posvyatit-zashite-personalnyh-dannyh-den-otkrytyh-dverej
[2] http://rkn.gov.ru/news/rsoc/news53904.htm
Всяческие напоминания, о том как можно помочь нашим проектом по открытым данным и открытым знаниям, а также начинать и продолжать свои.

Самый простой способ помощи - это волонтерство и открытый код.
В github'е есть несколько списков/каталогов полезных проектов, они называются awesome lists у нас такие тоже есть:
- Awesome opendata in Russian https://github.com/infoculture/awesome-opendata-rus о проектах по открытых данным на русском языке

- Awesome list for data journalists and future data journalists https://github.com/infoculture/awesome-datajournalism для тех кто интересуется дата-журналистикой

-Awesome openbudget list https://github.com/infoculture/awesome-openbudget для тех кто интересуется открытостью бюджетов

Все эти списки пополняются в открытую волонтерами прямо в github'е через механизм "pull request", для него достаточно открыть файл Readme.md в списке файлов и добавить то чего, на Ваш взгляд, нехватает.

При том что открытый код не является нашим основным направлением у Инфокультуры много открытого кода - https://github.com/infoculture, мы открываем его по всем проектам в которых у нас нет юридических ограничений.

Если Вам нравится только тема открытости, но и конкретно то что мы делаем в Инфокультуре, то простой способ помочь - это пожертвовать по кнопке "Поддержать нас" на нашем сайте https://www.infoculture.ru/ Неважно сколько Вы готовы пожертвовать 1 рубль или 1 тысячу рублей, важнее то что рублем Вы голосуете за то что мы делаем что-то по настоящему нужное.

Мы уже работаем над тем чтобы сделать специальную форму для поддержки.

Если Вы хотите поддержать наши мероприятия, такие как День открытых данных https://msk.opendataday.ru - выступив их спонсором, и взяв на себя, помощь в аренде помещения или оплату оплату поездки экспертов из других городов/стран или Вы заинтересованы организации мероприятия по открытым данным по теме которая Вам более близка, напишите мне на [email protected].

По всем нашим проектам важной помощью является обратная связь - написать то что Вам бы хотелось увидеть на Открытой полиции, Госзатратах и иных проектах которыми Вы пользуетесь. Все они собраны у нас на сайте https://www.infoculture.ru/projects/

#opendata
Немного о качестве государственных и муниципальных данных на примере муниципальных бюджетов
О качестве муниципальных бюджетов.

На прошлых выходных прошел хакатон по связанным данным и исследованию данных по контрольно-надзорной деятельности. Готовила к нему презентацию, в которой обобщила ошибки в бюджетах муниципальных образований Санкт-Петербурга, встречавшиеся пару лет назад:

Во-первых, невнимательное отношение к использованию бюджетной классификации:
- Опечатки в ЦСР (код 7950100 в следующей строке превращается в код 7950101. Какой из них верный понять невозможно)
- Разные наименования в кодах одних и тех же видов расходов (моя гипотеза - использование разных версий одного и того же классификатора в одном файле, но может быть и что-то еще)
- Отсутствие наименований или кодов (например, в одном из бюджетов нет наименования для кода подраздела, и в этом же файле нет кода для одного из распорядителей бюджетных средств)

Во-вторых, неверное понимание бюджетной классификации. МО "Дворцовый" двум разным муниципальным образованиям присвоил один и тот же код ЦСР и упорно доказывал, что у него все правильно, а мне стоит почитать Бюджетный кодекс (об этом кейсе я напишу отдельно), но после консультаций с Комитетом финансов СПб муниципальное образование признало свою ошибку.

В-третьих, периодически в формулах встречаются ссылки на локальные (неопубликованные) файлы с компьютера "Марии" или "Ирины", то есть бюджет опубликован, но некоторых сумм в нем нет, и восстановить их невозможно.

В-четвертых, не все представители местных администраций знают, что "скрытые строки" и "скрытые столбцы" можно раскрыть. Иногда в них скрывается что-то интересное, вроде черновых записей или формул расчета сумм, а иногда они просто затрудняют работу парсера.

В-пятых, некоторые администрации считают, что пустые ячейки в "Лесенке Минфина" можно заполнить чем угодно - это могут быть нули (один или несколько), могут быть тире или другие символы. Все это мешает правильно восстанавливать муниципальные классификаторы, которые отдельно нигде не публикуются.

До сих пор не понимаю, как муниципальные образования могут основывать свою работу на финансовых документах с таким низким качеством. Если есть интерес к этой теме, могу написать об этом подробнее и системнее.
Очень положительная новость - API ГАС "Правосудие", для полного счастья нехватает только слепков баз данных для аналитической работы, но и это прекрасно
Forwarded from Sk LegalTech
Отличная новость для всех разработчиков LegalTech:
"API ГАС "Правосудие" – это официальный программный интерфейс, предназначенный для получения открытых данных ГАС "Правосудие" по судам общей юрисдикции.

С помощью API вы можете реализовать на своих сайтах или мобильных приложениях поиск и отображение открытых данных судов общей юрисдикции РФ, а также статистические и аналитические инструменты.

Документация к API находится в разделе "Документация к API".
Для работы с API необходимо пройти регистрацию на сайте и получить уникальный токен."

https://api.sudrf.ru/
Forwarded from Городские данные (Andrey Karmatsky)
Друзья, уже по традиции, третий год подряд АНО «Информационная культура» проводит день открытых данных в начале марта. Как и в прошлый раз евент пройдёт в

OpenDataDay — лекции, мастер-классы, обсуждение и нетворкинг для всех кто интересуется темой открытых данных, использует или хотел бы использовать их.

Как и в прошлом году, я помогаю с секцией «Город» — тематическим блоком, раскрывающим тему использования открытых данных в контексте городской среды и идеей рассказывать о том, как открытые данные помогают улучшить наши города.



Как и в прошлом году, красивые картинки о том «как в других городах» вы можете посмотреть в этом канале или найти в интернете. Поэтому, было бы очень интересно показать пусть и не супер-масштабные проекты, а которые делают это здесь и сейчас.

!!!Друзья — open call спикеров!!!
Ищу всех желающих рассказать о своём проекте, о том, как вы работаете с открытыми данными или же создаёте открытые данные или программное обеспечение и о том, как эти данные могут помочь сделать город лучше. Это может быть и коммерческий проект и исследовательский, это может быть и просто идея, которую вы начали делать и готовы поделиться опытом, обсудить с аудиторией. Формат участия — рассказ на 20-30 минут про проект.

А во второй день, хотелось бы провести пару мастер-классов на тему аналитики и визуализации городских данных, на примере open data. Поэтому если есть желающие организовать мастер-класс на 1-1,5 часа — так же добро пожаловать с идеями.

Пишите, мне сюда или в почту — [email protected]
До ~1 фев. принимаются любые заявки.

http://msk.opendataday.ru/
Обратите внимание на то что есть вот такие полезные брошюры из проекта Открытая полиция. Их еще много и мы готовы раздавать желающим.

Кстати, Открытая полиция - это наш самый "человечный проект", остальные куда больше про данные, а тут про граждан.

Потому что мы начинали его тоже про данные, но быстро поняли что главная проблема в том что граждане просто не знают как работает правоохранительная система _на самом деле_.

Даже когда эти брошюры закончатся, мы найдем способ их допечатать. И, тут, кстати, вопрос в том как они лучше должны быть поданы.

Сейчас это плакаты на стену, а может быть нужны вкладыши в паспорт или большой плакат A1.

Напишите Ваши идеи и мы все постараемся учесть когда очень скоро будем обновлять эти брошюры.

Подробнее на странице проекта в фэйсбуке [1]

Ссылки:
[1] https://www.facebook.com/OpenPolice.ru/photos/a.640194399381425.1073741829.572557332811799/1552966061437583/

#openpolice
«Майнинг», «токен», «криптовалюта» и другие термины объясняются в проекте федерального закона «О цифровых финансовых активах», подготовленного Минфином России https://minfin.ru/ru/document/?id_4=121810
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
3-4 марта пройдет ежегодный и главный профессиональный праздник - День открытых данных. В этом году планируется работа нескольких направлений, одно из которых - государственные данные. Мы планируем собрать выступления и дискуссии о реальных кейсах по раскрытию данных, изменению внутренних бизнес-процессов внутри госорганов в процессе раскрытия данных, взаимодействию активистов с госорганами. Основная идея - включить в программу доклады, в которых будет не просто рассказано, какие сайты запущены или сколько массивов данных опубликовано, а будут раскрываться какие-то технические подробности, полезные для программистов или представителей госорганов. Если вы чувствуете, что вам есть чем поделиться, предлагайте темы своих выступлений (пишите на [email protected]).

Предварительно мы хотим рассмотреть инсайты по раскрытию данных от госорганов, открытость финансовых данных и данных о госзакупках, связанные данные, цифровую экономику и стандартизацию, инсайты по взаимодействию с госорганами. https://www.facebook.com/events/1781400145263541/
Можно ли использовать blockchain в защите персональных данных? Я лично сомневаюсь, а вот авторы проекта DECODE Project [1] пишут именно об этом в "Blockchain powers a personal data revolution" [2]

Ссылки:
[1] https://decodeproject.eu/
[2] https://decodeproject.eu/blog/blockchain-powers-personal-data-revolution

#personaldata