Ivan Begtin
8.09K subscribers
1.99K photos
3 videos
102 files
4.7K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
加入频道
Сложная, лично мне непонятная, но несомненно красивая визуализация данных OddityViz как мемориал Дэвиду Боуи[1].

Ссылки:
[1] https://medium.muz.li/oddityviz-a-tribute-to-david-bowie-with-data-3566d3bd6bd8

#opendata #opengov
Пока мы работаем с, в общем-то, скучными данными, активисты создают Open Cannabis Project [1] для защиты малых производителей каннабиса от патентов и монополий.

Кроме всего прочего этот проект про данные, о чём они и пишут в своем блоге [2] о том что собирают базу, в первую очередь, патентов.

Ссылки:
[1] https://opencannabisproject.org
[2] https://medium.com/opencannabisproject/2018-the-year-of-the-database-a5701eb66d6b

#opendata
Tableau версии 10.5 получил интегрированный движок Hyper. Пока на линуксе и обещают в 5 улучшение скорости отработки запросов.
Подробнее в их блоге [1]

Ссылки:
[1] https://www.tableau.com/about/blog/2018/1/hyper-and-linux-arrive-tableau-105-80538
Forwarded from Data is good
Tableau Launches Hyper — a Data Engine that Gives Faster Insights
https://medium.com/martech-advisor/tableau-launches-hyper-a-data-engine-that-gives-faster-insights-6941e1723b1a?source=rss------data-5

![](https://cdn-images-1.medium.com/max/786/0*K0MOUzByAA1c-r1i.jpg)

Data visualization company Tableau Software is all set to try and give its
business a major boost with a new data engine acquired from a startup in
Germany, almost eighteen months ago.

The company announced the availability of its new data engine, Hyper, on
Wednesday. The company says that Hyper will help breakdown large volumes of
data in seconds thereby even improving the speed of querying and building
reports off large data
В Великобритании начинает работать система "открытости банков" (Open Banking) которая обязывает банки предоставлять клиентам возможность подключать приложения других компаний к финансовым данным клиента в случае если клиент это разрешает. Подробнее об этом пишет BBC [1].

Это важное развитие банковского сектора - что не банку, а его клиенту принадлежать его финансовые данные. И клиент, а не банк имеет право на передачу этой информации третьим лицам.

Не буду загадывать возможно ли подобное в России, но изменение важное в части доступа малого и среднего бизнеса и стартапов к персональным данным.

Ссылки:
[1] http://www.bbc.com/news/business-42253051

#opendata #opengov #openbanking
На выходных я вспомнил что программирование - это не профессия, а призвание и доделал, вернее, подготовил к публикации 3 библиотеки и утилиты:
- qddate - https://github.com/ivbeg/qddate Quick and dirty date processing. Библиотека очень быстрого парсинга дат для Питона
- docx2csv - https://github.com/ivbeg/docx2csv - библиотека и утилита извлечения таблиц из docx файлов
- lazyscraper - https://github.com/ivbeg/lazyscraper- ленивый скрейпинг HTML. утилита командной строки и библиотека для превращения HTML таблиц и xpath запросов в CSV

Последние 2 я ранее публиковал, но к ним не было, ни документации, ни пакета в PyPi, ни чистого кода.
А теперь все есть, пакеты в PyPi и код в ReadTheDocs.org - http://qddate.readthedocs.io/en/latest/

qddate - это библиотека которая используется внутри бота https://yangx.top/FeedRetranslatorBot который превращает HTML страницы в RSS. Собственно главной проблемой обработки огромного числа страниц всегда была обработка дат и qddate было заточено ровно под решение именно этой задачи - обработки сотен тысяч строк с датами в секунды.

Код очень старый, все время было потрачено, не на программирование, а на документирование.

Все это много лет использовалось для быстрого сбора и обработки данных в самых разных проектах связанных с обработкой данных и с открытыми данными.

Не могу обещать частой публикации кода, большая часть времени у меня сейчас в запуске и развитии больших проектов, но свой маленький вклад в open source обязательно должен быть

#opensource
Ростелекому помощь не нужна.

Встреча В.В.Путина и Михаила Осеевского (глава Ростелекома). Откровений я не увидел, а вот подтверждение что для РТК приоритетом остаются ЦОДы и индустриальный интернет - это, по моему, уже было.
Встреча с президентом компании «Ростелеком» Михаилом Осеевским
http://kremlin.ru/events/president/news/56647

М.Осеевский информировал главу государства об итогах работы ПАО «Ростелеком» в
2017 году и приоритетных направлениях деятельности на 2018 год.

![C президентом ПАО «Ростелеком» Михаилом
Осеевским.](http://static.kremlin.ru/media/events/photos/small/WCnWrOBnnAk65LXta2WEb2OGClUIc6Ak.jpg)
Ничего не знаю про то кто будет следующим главой кабинета министров.

Но знаю что в ТЗ на 2018 год на сайт Правительства указана, в том числе, доработка сайта da-medvedev.ru

Или ТЗ потом поменяют, заключив доп. соглашение, или "или".
Какое-то время назад я писал о том что открытость государства как термин не то что устарел, но перестроился.

Не только Gartner определяет Digital Government как развитие Open Government [1], но и такое явление как цифровая пятерка (Digital 5) [2] говорит о том же. Еще в 2014 году 5 стран подписали хартию цифровой пятерки где обозначили правила цифровизации в которых открытость государства (в части открытых данных) ключевым приоритетом.
Вот список принципов заложенный в хартии:
...
3.1. User needs
3.2. Open standards
3.3. Open source
3.4. Open markets
3.5. Open government (transparency)
3.6. Connectivity
3.7.Teach children to code
3.8. Assisted digital
3.9. Commitment to share and learn
...

Open Government становится лишь частью повестки Digital Government.

Это то что я ранее говорил. Открытые данные становятся частью "приличий", а не ключевым приоритетом развития. Предполагается что в развитом обществе нет необходимости об этом говорить лишний раз, речь идет не о том должны или не должны они публиковаться, а о том какой социальный и экономический эффект они создают.

В развитие этой мысли я сейчас вижу много публикацией где авторы делают акцент на использовании открытых данных в контексте AI powered government. То есть в контексте бесплатного топлива для разработки автоматизированных алгоритмов.

Я повторю свое предсказание для гартнеровской модели. Она меняется раз в несколько лет, обычно провоцируя или предсказывая изменения в публичной риторике и концепциях.

Следующая "глобальная" концепция будет вокруг AI в государстве. Я предсказываю одно из называний: AI government, AI powered government или cognitive government.

Россия пока существует скорее в собственной повестке чем в мировой. Предсказать как это будет в России я пока не берусь.

Ссылки:
[1] https://www.gartner.com/doc/3764382/introducing-gartner-digital-government-maturity
[2] https://www.ict.govt.nz/governance-and-leadership/international-leadership/d5-wellington-2018/
[3] https://www.ict.govt.nz/assets/Uploads/D5Charter-signed-accessible.pdf

#opendata #opengov #digitalgov
3-4 марта в Москве мы, Инфокультура, вместе с партнерами организуем Open Data Day (http://msk.opendataday.ru/) и скоро будем всех туда зазывать, опубликуем программу и тд.

Я понимаю что часто важна даже не тема, а люди и хочу задать всем вопрос.

Кого бы Вы хотели увидеть там в спикерах? Чьего выступления Вы ждете и жаждете?

Напишите мне на [email protected] или в чат https://yangx.top/begtinchat
Я просто оставлю это здесь https://gov.gosuslugi.ru/ может быть появился шанс что gov.ru наконец-то станет приличным и по содержанию и по дизайну.
30 января в Роскомнадзоре состоится день открытых дверей который они хотят посвятить персональным данным [1]. Нет ощущения что услышым что-то новое, но зарегистрироваться можно у них на сайте по контактам [2]

Ссылки:
[1] https://rspectr.com/novosti/52718/rkn-posvyatit-zashite-personalnyh-dannyh-den-otkrytyh-dverej
[2] http://rkn.gov.ru/news/rsoc/news53904.htm
Всяческие напоминания, о том как можно помочь нашим проектом по открытым данным и открытым знаниям, а также начинать и продолжать свои.

Самый простой способ помощи - это волонтерство и открытый код.
В github'е есть несколько списков/каталогов полезных проектов, они называются awesome lists у нас такие тоже есть:
- Awesome opendata in Russian https://github.com/infoculture/awesome-opendata-rus о проектах по открытых данным на русском языке

- Awesome list for data journalists and future data journalists https://github.com/infoculture/awesome-datajournalism для тех кто интересуется дата-журналистикой

-Awesome openbudget list https://github.com/infoculture/awesome-openbudget для тех кто интересуется открытостью бюджетов

Все эти списки пополняются в открытую волонтерами прямо в github'е через механизм "pull request", для него достаточно открыть файл Readme.md в списке файлов и добавить то чего, на Ваш взгляд, нехватает.

При том что открытый код не является нашим основным направлением у Инфокультуры много открытого кода - https://github.com/infoculture, мы открываем его по всем проектам в которых у нас нет юридических ограничений.

Если Вам нравится только тема открытости, но и конкретно то что мы делаем в Инфокультуре, то простой способ помочь - это пожертвовать по кнопке "Поддержать нас" на нашем сайте https://www.infoculture.ru/ Неважно сколько Вы готовы пожертвовать 1 рубль или 1 тысячу рублей, важнее то что рублем Вы голосуете за то что мы делаем что-то по настоящему нужное.

Мы уже работаем над тем чтобы сделать специальную форму для поддержки.

Если Вы хотите поддержать наши мероприятия, такие как День открытых данных https://msk.opendataday.ru - выступив их спонсором, и взяв на себя, помощь в аренде помещения или оплату оплату поездки экспертов из других городов/стран или Вы заинтересованы организации мероприятия по открытым данным по теме которая Вам более близка, напишите мне на [email protected].

По всем нашим проектам важной помощью является обратная связь - написать то что Вам бы хотелось увидеть на Открытой полиции, Госзатратах и иных проектах которыми Вы пользуетесь. Все они собраны у нас на сайте https://www.infoculture.ru/projects/

#opendata
Немного о качестве государственных и муниципальных данных на примере муниципальных бюджетов
О качестве муниципальных бюджетов.

На прошлых выходных прошел хакатон по связанным данным и исследованию данных по контрольно-надзорной деятельности. Готовила к нему презентацию, в которой обобщила ошибки в бюджетах муниципальных образований Санкт-Петербурга, встречавшиеся пару лет назад:

Во-первых, невнимательное отношение к использованию бюджетной классификации:
- Опечатки в ЦСР (код 7950100 в следующей строке превращается в код 7950101. Какой из них верный понять невозможно)
- Разные наименования в кодах одних и тех же видов расходов (моя гипотеза - использование разных версий одного и того же классификатора в одном файле, но может быть и что-то еще)
- Отсутствие наименований или кодов (например, в одном из бюджетов нет наименования для кода подраздела, и в этом же файле нет кода для одного из распорядителей бюджетных средств)

Во-вторых, неверное понимание бюджетной классификации. МО "Дворцовый" двум разным муниципальным образованиям присвоил один и тот же код ЦСР и упорно доказывал, что у него все правильно, а мне стоит почитать Бюджетный кодекс (об этом кейсе я напишу отдельно), но после консультаций с Комитетом финансов СПб муниципальное образование признало свою ошибку.

В-третьих, периодически в формулах встречаются ссылки на локальные (неопубликованные) файлы с компьютера "Марии" или "Ирины", то есть бюджет опубликован, но некоторых сумм в нем нет, и восстановить их невозможно.

В-четвертых, не все представители местных администраций знают, что "скрытые строки" и "скрытые столбцы" можно раскрыть. Иногда в них скрывается что-то интересное, вроде черновых записей или формул расчета сумм, а иногда они просто затрудняют работу парсера.

В-пятых, некоторые администрации считают, что пустые ячейки в "Лесенке Минфина" можно заполнить чем угодно - это могут быть нули (один или несколько), могут быть тире или другие символы. Все это мешает правильно восстанавливать муниципальные классификаторы, которые отдельно нигде не публикуются.

До сих пор не понимаю, как муниципальные образования могут основывать свою работу на финансовых документах с таким низким качеством. Если есть интерес к этой теме, могу написать об этом подробнее и системнее.
Очень положительная новость - API ГАС "Правосудие", для полного счастья нехватает только слепков баз данных для аналитической работы, но и это прекрасно
Forwarded from Sk LegalTech
Отличная новость для всех разработчиков LegalTech:
"API ГАС "Правосудие" – это официальный программный интерфейс, предназначенный для получения открытых данных ГАС "Правосудие" по судам общей юрисдикции.

С помощью API вы можете реализовать на своих сайтах или мобильных приложениях поиск и отображение открытых данных судов общей юрисдикции РФ, а также статистические и аналитические инструменты.

Документация к API находится в разделе "Документация к API".
Для работы с API необходимо пройти регистрацию на сайте и получить уникальный токен."

https://api.sudrf.ru/
Forwarded from Городские данные (Andrey Karmatsky)
Друзья, уже по традиции, третий год подряд АНО «Информационная культура» проводит день открытых данных в начале марта. Как и в прошлый раз евент пройдёт в

OpenDataDay — лекции, мастер-классы, обсуждение и нетворкинг для всех кто интересуется темой открытых данных, использует или хотел бы использовать их.

Как и в прошлом году, я помогаю с секцией «Город» — тематическим блоком, раскрывающим тему использования открытых данных в контексте городской среды и идеей рассказывать о том, как открытые данные помогают улучшить наши города.



Как и в прошлом году, красивые картинки о том «как в других городах» вы можете посмотреть в этом канале или найти в интернете. Поэтому, было бы очень интересно показать пусть и не супер-масштабные проекты, а которые делают это здесь и сейчас.

!!!Друзья — open call спикеров!!!
Ищу всех желающих рассказать о своём проекте, о том, как вы работаете с открытыми данными или же создаёте открытые данные или программное обеспечение и о том, как эти данные могут помочь сделать город лучше. Это может быть и коммерческий проект и исследовательский, это может быть и просто идея, которую вы начали делать и готовы поделиться опытом, обсудить с аудиторией. Формат участия — рассказ на 20-30 минут про проект.

А во второй день, хотелось бы провести пару мастер-классов на тему аналитики и визуализации городских данных, на примере open data. Поэтому если есть желающие организовать мастер-класс на 1-1,5 часа — так же добро пожаловать с идеями.

Пишите, мне сюда или в почту — [email protected]
До ~1 фев. принимаются любые заявки.

http://msk.opendataday.ru/