Ivan Begtin

Сложная, лично мне непонятная, но несомненно красивая визуализация данных OddityViz как мемориал Дэвиду Боуи[1].

Ссылки:
[1] https://medium.muz.li/oddityviz-a-tribute-to-david-bowie-with-data-3566d3bd6bd8

#opendata #opengov

Medium

OddityViz — a tribute to David Bowie with data

Data is more than numbers — it is information found all around us, in where we go, what we consume, touch, watch or hear.

929 viewsIvan Begtin, 11:49

Ivan Begtin

Пока мы работаем с, в общем-то, скучными данными, активисты создают Open Cannabis Project [1] для защиты малых производителей каннабиса от патентов и монополий.

Кроме всего прочего этот проект про данные, о чём они и пишут в своем блоге [2] о том что собирают базу, в первую очередь, патентов.

Ссылки:
[1] https://opencannabisproject.org
[2] https://medium.com/opencannabisproject/2018-the-year-of-the-database-a5701eb66d6b

#opendata

Open Cannabis Project

Home - Open Cannabis Project

The Open Cannabis Project is building an archival record of all existing Cannabis strains, in order to ensure that they remain forever in the public domain

879 viewsIvan Begtin, 12:16

Ivan Begtin

Tableau версии 10.5 получил интегрированный движок Hyper. Пока на линуксе и обещают в 5 улучшение скорости отработки запросов.
Подробнее в их блоге [1]

Ссылки:
[1] https://www.tableau.com/about/blog/2018/1/hyper-and-linux-arrive-tableau-105-80538

Tableau Software

Hyper and Linux arrive in Tableau 10.5!

When you upgrade to 10.5 you will automatically have Hyper, Tableau’s patent pending data engine technology. Hyper will deliver up to 5X improved query performance and up to 3X* improved extract creation speed.

738 viewsIvan Begtin, 07:43

Ivan Begtin

Forwarded from Data is good

Tableau Launches Hyper — a Data Engine that Gives Faster Insights
https://medium.com/martech-advisor/tableau-launches-hyper-a-data-engine-that-gives-faster-insights-6941e1723b1a?source=rss------data-5

![](https://cdn-images-1.medium.com/max/786/0*K0MOUzByAA1c-r1i.jpg)

Data visualization company Tableau Software is all set to try and give its
business a major boost with a new data engine acquired from a startup in
Germany, almost eighteen months ago.

The company announced the availability of its new data engine, Hyper, on
Wednesday. The company says that Hyper will help breakdown large volumes of
data in seconds thereby even improving the speed of querying and building
reports off large data

Medium

Tableau Launches Hyper — a Data Engine that Gives Faster Insights

Data visualization company Tableau Software is all set to try and give its business a major boost with a new data engine acquired from a startup in Germany, almost eighteen months ago. The company…

18 viewsIvan Begtin, 07:43

Ivan Begtin

В Великобритании начинает работать система "открытости банков" (Open Banking) которая обязывает банки предоставлять клиентам возможность подключать приложения других компаний к финансовым данным клиента в случае если клиент это разрешает. Подробнее об этом пишет BBC [1].

Это важное развитие банковского сектора - что не банку, а его клиенту принадлежать его финансовые данные. И клиент, а не банк имеет право на передачу этой информации третьим лицам.

Не буду загадывать возможно ли подобное в России, но изменение важное в части доступа малого и среднего бизнеса и стартапов к персональным данным.

Ссылки:
[1] http://www.bbc.com/news/business-42253051

#opendata #opengov #openbanking

BBC News

Why banks will share your financial secrets

A "revolution" in our financial lives will begin next month, but what is it and how will it work?

931 viewsIvan Begtin, 21:19

Ivan Begtin

Forwarded from Open Data Digest

Open Banking: counting the steps towards a strong data infrastructure for the UK
http://theodi.org/blog/open-banking-counting-the-steps-towards-a-strong-data-infrastructure-for-the-uk

Open Data Institute

Open Banking: counting the steps towards a strong data infrastructure for the UK | News | Open Data Institute

Open banking gives consumers more control over data about them. This will change the sector and improve the services customers receive. Other countries and sectors will follow and build a better and more open future for data

20 viewsIvan Begtin, 21:19

Ivan Begtin

На выходных я вспомнил что программирование - это не профессия, а призвание и доделал, вернее, подготовил к публикации 3 библиотеки и утилиты:
- qddate - https://github.com/ivbeg/qddate Quick and dirty date processing. Библиотека очень быстрого парсинга дат для Питона
- docx2csv - https://github.com/ivbeg/docx2csv - библиотека и утилита извлечения таблиц из docx файлов
- lazyscraper - https://github.com/ivbeg/lazyscraper- ленивый скрейпинг HTML. утилита командной строки и библиотека для превращения HTML таблиц и xpath запросов в CSV

Последние 2 я ранее публиковал, но к ним не было, ни документации, ни пакета в PyPi, ни чистого кода.
А теперь все есть, пакеты в PyPi и код в ReadTheDocs.org - http://qddate.readthedocs.io/en/latest/

qddate - это библиотека которая используется внутри бота https://yangx.top/FeedRetranslatorBot который превращает HTML страницы в RSS. Собственно главной проблемой обработки огромного числа страниц всегда была обработка дат и qddate было заточено ровно под решение именно этой задачи - обработки сотен тысяч строк с датами в секунды.

Код очень старый, все время было потрачено, не на программирование, а на документирование.

Все это много лет использовалось для быстрого сбора и обработки данных в самых разных проектах связанных с обработкой данных и с открытыми данными.

Не могу обещать частой публикации кода, большая часть времени у меня сейчас в запуске и развитии больших проектов, но свой маленький вклад в open source обязательно должен быть

#opensource

GitHub

GitHub - ivbeg/qddate: Quick and dirty date parsing Python library to parse HTML dates really fast

Quick and dirty date parsing Python library to parse HTML dates really fast - GitHub - ivbeg/qddate: Quick and dirty date parsing Python library to parse HTML dates really fast

808 viewsIvan Begtin, 07:47

Ivan Begtin

Ростелекому помощь не нужна.

Встреча В.В.Путина и Михаила Осеевского (глава Ростелекома). Откровений я не увидел, а вот подтверждение что для РТК приоритетом остаются ЦОДы и индустриальный интернет - это, по моему, уже было.

753 viewsIvan Begtin, 10:52

Ivan Begtin

Forwarded from Правительственный дайджест

Встреча с президентом компании «Ростелеком» Михаилом Осеевским
http://kremlin.ru/events/president/news/56647

М.Осеевский информировал главу государства об итогах работы ПАО «Ростелеком» в
2017 году и приоритетных направлениях деятельности на 2018 год.

![C президентом ПАО «Ростелеком» Михаилом
Осеевским.](http://static.kremlin.ru/media/events/photos/small/WCnWrOBnnAk65LXta2WEb2OGClUIc6Ak.jpg)

Президент России

Встреча с президентом компании «Ростелеком» Михаилом Осеевским

М.Осеевский информировал главу государства об итогах работы ПАО «Ростелеком» в 2017 году и приоритетных направлениях деятельности на 2018 год.

14 viewsIvan Begtin, 10:52

Ivan Begtin

Ничего не знаю про то кто будет следующим главой кабинета министров.

Но знаю что в ТЗ на 2018 год на сайт Правительства указана, в том числе, доработка сайта da-medvedev.ru

Или ТЗ потом поменяют, заключив доп. соглашение, или "или".

946 viewsIvan Begtin, 15:29

Ivan Begtin

Какое-то время назад я писал о том что открытость государства как термин не то что устарел, но перестроился.

Не только Gartner определяет Digital Government как развитие Open Government [1], но и такое явление как цифровая пятерка (Digital 5) [2] говорит о том же. Еще в 2014 году 5 стран подписали хартию цифровой пятерки где обозначили правила цифровизации в которых открытость государства (в части открытых данных) ключевым приоритетом.
Вот список принципов заложенный в хартии:
...
3.1. User needs
3.2. Open standards
3.3. Open source
3.4. Open markets
3.5. Open government (transparency)
3.6. Connectivity
3.7.Teach children to code
3.8. Assisted digital
3.9. Commitment to share and learn
...

Open Government становится лишь частью повестки Digital Government.

Это то что я ранее говорил. Открытые данные становятся частью "приличий", а не ключевым приоритетом развития. Предполагается что в развитом обществе нет необходимости об этом говорить лишний раз, речь идет не о том должны или не должны они публиковаться, а о том какой социальный и экономический эффект они создают.

В развитие этой мысли я сейчас вижу много публикацией где авторы делают акцент на использовании открытых данных в контексте AI powered government. То есть в контексте бесплатного топлива для разработки автоматизированных алгоритмов.

Я повторю свое предсказание для гартнеровской модели. Она меняется раз в несколько лет, обычно провоцируя или предсказывая изменения в публичной риторике и концепциях.

Следующая "глобальная" концепция будет вокруг AI в государстве. Я предсказываю одно из называний: AI government, AI powered government или cognitive government.

Россия пока существует скорее в собственной повестке чем в мировой. Предсказать как это будет в России я пока не берусь.

Ссылки:
[1] https://www.gartner.com/doc/3764382/introducing-gartner-digital-government-maturity
[2] https://www.ict.govt.nz/governance-and-leadership/international-leadership/d5-wellington-2018/
[3] https://www.ict.govt.nz/assets/Uploads/D5Charter-signed-accessible.pdf

#opendata #opengov #digitalgov

Gartner

Introducing the Gartner Digital Government Maturity Model 2.0

Gartner Research on Introducing the Gartner Digital Government Maturity Model 2.0

1.2K viewsIvan Begtin, 06:34

Ivan Begtin

3-4 марта в Москве мы, Инфокультура, вместе с партнерами организуем Open Data Day (http://msk.opendataday.ru/) и скоро будем всех туда зазывать, опубликуем программу и тд.

Я понимаю что часто важна даже не тема, а люди и хочу задать всем вопрос.

Кого бы Вы хотели увидеть там в спикерах? Чьего выступления Вы ждете и жаждете?

Напишите мне на [email protected] или в чат https://yangx.top/begtinchat

968 viewsIvan Begtin, 09:52

Ivan Begtin

Я просто оставлю это здесь https://gov.gosuslugi.ru/ может быть появился шанс что gov.ru наконец-то станет приличным и по содержанию и по дизайну.

997 viewsIvan Begtin, 10:46

Ivan Begtin

30 января в Роскомнадзоре состоится день открытых дверей который они хотят посвятить персональным данным [1]. Нет ощущения что услышым что-то новое, но зарегистрироваться можно у них на сайте по контактам [2]

Ссылки:
[1] https://rspectr.com/novosti/52718/rkn-posvyatit-zashite-personalnyh-dannyh-den-otkrytyh-dverej
[2] http://rkn.gov.ru/news/rsoc/news53904.htm

Rspectr

РКН посвятит защите персональных данных День открытых дверей

30 января 2018 года в Роскомнадзоре состоится День открытых дверей. Мероприятие приурочено к Международному дню защиты персональных данных, который отмечается 28 января.

958 viewsIvan Begtin, 09:20

Ivan Begtin

Всяческие напоминания, о том как можно помочь нашим проектом по открытым данным и открытым знаниям, а также начинать и продолжать свои.

Самый простой способ помощи - это волонтерство и открытый код.
В github'е есть несколько списков/каталогов полезных проектов, они называются awesome lists у нас такие тоже есть:
- Awesome opendata in Russian https://github.com/infoculture/awesome-opendata-rus о проектах по открытых данным на русском языке

- Awesome list for data journalists and future data journalists https://github.com/infoculture/awesome-datajournalism для тех кто интересуется дата-журналистикой

-Awesome openbudget list https://github.com/infoculture/awesome-openbudget для тех кто интересуется открытостью бюджетов

Все эти списки пополняются в открытую волонтерами прямо в github'е через механизм "pull request", для него достаточно открыть файл Readme.md в списке файлов и добавить то чего, на Ваш взгляд, нехватает.

При том что открытый код не является нашим основным направлением у Инфокультуры много открытого кода - https://github.com/infoculture, мы открываем его по всем проектам в которых у нас нет юридических ограничений.

Если Вам нравится только тема открытости, но и конкретно то что мы делаем в Инфокультуре, то простой способ помочь - это пожертвовать по кнопке "Поддержать нас" на нашем сайте https://www.infoculture.ru/ Неважно сколько Вы готовы пожертвовать 1 рубль или 1 тысячу рублей, важнее то что рублем Вы голосуете за то что мы делаем что-то по настоящему нужное.

Мы уже работаем над тем чтобы сделать специальную форму для поддержки.

Если Вы хотите поддержать наши мероприятия, такие как День открытых данных https://msk.opendataday.ru - выступив их спонсором, и взяв на себя, помощь в аренде помещения или оплату оплату поездки экспертов из других городов/стран или Вы заинтересованы организации мероприятия по открытым данным по теме которая Вам более близка, напишите мне на [email protected].

По всем нашим проектам важной помощью является обратная связь - написать то что Вам бы хотелось увидеть на Открытой полиции, Госзатратах и иных проектах которыми Вы пользуетесь. Все они собраны у нас на сайте https://www.infoculture.ru/projects/

#opendata

GitHub

GitHub - infoculture/awesome-opendata-rus: Opendata resources in Russian / Открытые данные на русском языке

Opendata resources in Russian / Открытые данные на русском языке - infoculture/awesome-opendata-rus

817 viewsIvan Begtin, 07:39

Ivan Begtin

Немного о качестве государственных и муниципальных данных на примере муниципальных бюджетов

668 viewsIvan Begtin, 14:49

Ivan Begtin

Forwarded from Ах, этот Минфин

О качестве муниципальных бюджетов.

На прошлых выходных прошел хакатон по связанным данным и исследованию данных по контрольно-надзорной деятельности. Готовила к нему презентацию, в которой обобщила ошибки в бюджетах муниципальных образований Санкт-Петербурга, встречавшиеся пару лет назад:

Во-первых, невнимательное отношение к использованию бюджетной классификации:
- Опечатки в ЦСР (код 7950100 в следующей строке превращается в код 7950101. Какой из них верный понять невозможно)
- Разные наименования в кодах одних и тех же видов расходов (моя гипотеза - использование разных версий одного и того же классификатора в одном файле, но может быть и что-то еще)
- Отсутствие наименований или кодов (например, в одном из бюджетов нет наименования для кода подраздела, и в этом же файле нет кода для одного из распорядителей бюджетных средств)

Во-вторых, неверное понимание бюджетной классификации. МО "Дворцовый" двум разным муниципальным образованиям присвоил один и тот же код ЦСР и упорно доказывал, что у него все правильно, а мне стоит почитать Бюджетный кодекс (об этом кейсе я напишу отдельно), но после консультаций с Комитетом финансов СПб муниципальное образование признало свою ошибку.

В-третьих, периодически в формулах встречаются ссылки на локальные (неопубликованные) файлы с компьютера "Марии" или "Ирины", то есть бюджет опубликован, но некоторых сумм в нем нет, и восстановить их невозможно.

В-четвертых, не все представители местных администраций знают, что "скрытые строки" и "скрытые столбцы" можно раскрыть. Иногда в них скрывается что-то интересное, вроде черновых записей или формул расчета сумм, а иногда они просто затрудняют работу парсера.

В-пятых, некоторые администрации считают, что пустые ячейки в "Лесенке Минфина" можно заполнить чем угодно - это могут быть нули (один или несколько), могут быть тире или другие символы. Все это мешает правильно восстанавливать муниципальные классификаторы, которые отдельно нигде не публикуются.

До сих пор не понимаю, как муниципальные образования могут основывать свою работу на финансовых документах с таким низким качеством. Если есть интерес к этой теме, могу написать об этом подробнее и системнее.

22 viewsIvan Begtin, 14:49

Ivan Begtin

Очень положительная новость - API ГАС "Правосудие", для полного счастья нехватает только слепков баз данных для аналитической работы, но и это прекрасно

663 viewsIvan Begtin, 07:13

Ivan Begtin

Forwarded from Sk LegalTech

Отличная новость для всех разработчиков LegalTech:
"API ГАС "Правосудие" – это официальный программный интерфейс, предназначенный для получения открытых данных ГАС "Правосудие" по судам общей юрисдикции.

С помощью API вы можете реализовать на своих сайтах или мобильных приложениях поиск и отображение открытых данных судов общей юрисдикции РФ, а также статистические и аналитические инструменты.

Документация к API находится в разделе "Документация к API".
Для работы с API необходимо пройти регистрацию на сайте и получить уникальный токен."

https://api.sudrf.ru/

21 viewsIvan Begtin, 07:13

Ivan Begtin

Forwarded from Городские данные (Andrey Karmatsky)

Друзья, уже по традиции, третий год подряд АНО «Информационная культура» проводит день открытых данных в начале марта. Как и в прошлый раз евент пройдёт в

OpenDataDay — лекции, мастер-классы, обсуждение и нетворкинг для всех кто интересуется темой открытых данных, использует или хотел бы использовать их.

Как и в прошлом году, я помогаю с секцией «Город» — тематическим блоком, раскрывающим тему использования открытых данных в контексте городской среды и идеей рассказывать о том, как открытые данные помогают улучшить наши города.

Как и в прошлом году, красивые картинки о том «как в других городах» вы можете посмотреть в этом канале или найти в интернете. Поэтому, было бы очень интересно показать пусть и не супер-масштабные проекты, а которые делают это здесь и сейчас.

!!!Друзья — open call спикеров!!!
Ищу всех желающих рассказать о своём проекте, о том, как вы работаете с открытыми данными или же создаёте открытые данные или программное обеспечение и о том, как эти данные могут помочь сделать город лучше. Это может быть и коммерческий проект и исследовательский, это может быть и просто идея, которую вы начали делать и готовы поделиться опытом, обсудить с аудиторией. Формат участия — рассказ на 20-30 минут про проект.

А во второй день, хотелось бы провести пару мастер-классов на тему аналитики и визуализации городских данных, на примере open data. Поэтому если есть желающие организовать мастер-класс на 1-1,5 часа — так же добро пожаловать с идеями.

Пишите, мне сюда или в почту — [email protected]
До ~1 фев. принимаются любые заявки.

http://msk.opendataday.ru/

17 viewsIvan Begtin, 14:00

Ivan Begtin

729 viewsIvan Begtin, 08:19

About

Blog

Apps

Platform