Ivan Begtin
8.1K subscribers
2.01K photos
3 videos
102 files
4.74K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
加入频道
Hitachi Consulting вместе с мэрией Копенгагена создали Сity Data Exchange (https://www.citydataexchange.com) , специальный сайт для продажи, покупки, распространения наборов данных. Туда они загрузили первые 56 наборов данных и рассчитывают на то что бизнес и органы власти будут не только публиковать данные, но и формировать общую экосистему продавая те данные которые имеют коммерческую ценность.

При этом, на сегодняшний день, портал больше похож на маркетинговую брошюру чем на полезный инструмент. Hitachi очень постарались в его визуальной упаковке, маркетинге. Например, их описание проекта https://www.hitachiinsightgroup.com/en-us/pdf/solution-profile/hitachi-solution-profile-city-data-exchange.pdf , статьи и прочие материалы о Умных городах https://www.hitachiinsightgroup.com/en-us/smart-cities.html Но реальность далеко не столь радужна.

Первые пользователи пишут о портале https://blog.ldodds.com/2016/05/21/first-impressions-of-copenhagens-city-data-exchange/ в нелицеприятном свете. Отмечая:
- неудобство работы
- то что данные взяты с портала открытых данных и помещены под закрытую лицензию
- то что API отделено от самих данных

Сама идея создания универсальной инфраструктуры имеет смысл, но качество и акценты в реализации также важны.

Итоговые впечатления о портале можно будет сделать где-то через полгода после того как станет понятно будет ли готов бизнес использовать его для продажи своих данных.

И, на закуску. Цифра в 1,511,028,278 bytes of data которую трансилируют они на главной странице - это, всего лишь, 1,5 гигабайта данных. Очень скромно по современным меркам. Ровно тот случай когда «высасывание из пальца» маркетинговых цифр сразу портит всё впечатление.

#opendata #opengov #smartcity
После того как в СМИ уже все прочитали, можно написать об этом и подробнее. Сегодня вышло в свет исследование о текущем состоянии государственной инфраструктуры электронной почты подготовленное Новые облачные технологии, при нашей экспертной поддержке со стороны АНО "Информационная культура"

Об этом очень подробная статья вышла в Коммерсанте http://www.kommersant.ru/doc/2996373 с акцентом на то что почти 80% госслужащих используют публичные почтовые сервисы для официальной переписки.
Исследование, в каком-то смысле, уникальное. Мы и раньше анализировали понемногу то каков уровень информатизации госорганов и _информационная культура_ госслужащих при электронной переписке, но без коллег мы никогда не смогли бы сделать это столь системно и масштабно.

Посмотрите само исследование по прямой ссылке тут http://rosgospochta.ru/MyOffice_email_report_2405_DRAFT.pdf
и сайт с наглядной визуализацией http://rosgospochta.ru
Забегая вперед, это не последнее исследование в котором наша команда принимает участие. Открытые данные дают множество возможностей для качественной аналитики. Какие-то исследования мы будем распространять от Инфокультуры или помогать коллегам, как в этом случае, своей экспертной поддержкой.

Другие мы уже проводим от нашей аналитической компании "Бюро контрактной информации" которое специализируется на анализе всего что связано с контрактными отношениями - закупками, контрактами, их исполнением, ценами и продукцией.
Нельзя быть сапожником без сапог, нельзя говорить про бизнес на открытых данных и всячески демонстрировать отказ от него. Аналитические исследования - это одно из наиболее полезных применений открытых данных на практике и никак не вредящее самой идеологии открытости, аналитика всегда требует большого объёма качественной общедоступной машиночитаемой информации.

А, возвращаясь к этому исследованию, конечно оно охватывает далеко не всё. Мы взяли почту как самый-самый базовый сервис отсутствие которого вызывает большие сомнения в качестве информатизации ОГВ и бюджетных учреждений.

Кроме них есть ещё такие как:
- хостинг для сайтов созданных на бюджетные средства
- распространение официальных документов через бесплатные файлообменные сервисы: Яндекс.Диск, Google Drive, Dropbox и другие
- использование различных SaaS сервисов для организации работы сотрудников (включая зарубежные SaaS сервисы)
- сливание персональных данных граждан через установку веб-счётчиков в закрытых частях сайтов, требующих авторизацию
И многое и многое и многое другое. Это ведь даже не вопрос того - импортное или отечественное, не только вопрос границ, но и вопрос последовательности государственной политики. Она не может существовать в вакууме и игнорировать сложившуюся реальность.
#‎opendata #‎opengov #‎privacy #‎publicinfractructure
От Nesta (ранее NESTA, National Endowment for Science, Technology and the Arts) НКО в Великобритании занимающегося инновациями вышел большой документ/исследование How Innovation Agencies Work: International lessons to inspire and inform national strategies. Они разбирают в документе кейсы 10 инновационных агентств национального уровня (Россию не рассматривают, но есть финны и чилийцы, к примеру). Исследование, как минимум, стоит прочитать чтобы понять как устроен подход к инновациям в этих 10 странах.

Что нужно отдать должным современным документам идущим от госструктур и мозговых центров UK - это понятность без bullshit. Этим они резко констрастируют со всеми документами международных консалтеров вроде PwC или McKinsey
В Великобритании развивается общественная дискуссия вокруг приватизации земельного реестра. Правительство страны запустило публичные консультации которые должны закончится 26 мая этого года, а члены OGN (Open Governement Network) составили свой отзыв с критикой этого решения. Их отзыв подписан 47 пользователями данных включая 27 представителей организаций членов OGN.

В чём проблема с приватизацией? Приватизация переводит в частную собственность сам земельный реестр. Его данные, одни из ключевых по экономическому эффекту открытости, перестают быть общественным достоянием. Новый владелец реестра неизбежно начнет монетизировать доступ к данным.

Официальные консультации на сайте Правительства UK: https://www.gov.uk/government/consultations/land-registry-moving-operations-to-the-private-sector

Ссылка на сайте OGN: http://www.opengovernment.org.uk/2016/04/26/what-impact-would-land-registry-privatisation-have-on-transparency-help-write-the-ogns-consultation-response/

Отзыв OGN на решение: https://docs.google.com/document/d/1A-3ckBTAAIWSwgpSTSD3IaPVWniLoeSd_eNJgrXgDc4/edit?usp=sharing
#opendata #opengov #uk
Мы в Инфокультуре и OKF Russia принялись всерьёз за работу с сообществом по открытым данным и проводим перепись активистов

Цель переписи в том чтобы составить список:
- активистов, разработчиков проектов и менторов готовых участвовать в жизни сообщества;
- тех кто готов участвовать в мероприятиях и не пропустить самые интересные;
- тех кому важно знать что происходит в теме открытых данных в России и в мире;

Для участия просим заполнить анкету по адресу - https://infoculture.typeform.com/to/QXF6a6

А также отправьте её, пожалуйста, тем кто, как Вы знаете, занимается открытыми данными, но стесняется об этом сказать сам.

#‎opendata #‎opengov
Очередной журнал «Internet Policy Review» вышел с темой «Большие данные: большие изменения во власти?» (Big Data: Big power shifts) и полностью посвящён теме различных аспектов этики использования и практики регулирования больших данных, в первую очередь в Евросоюзе. В частности, там весьма интересная статья о больших данных в агропромышленном секторе и о то что недавно Monsanto купили компанию ClimatePro и также собирают погодные данные со всех своих тракторов и не только. Это про то как информационное неравенство в данных играет на руку крупным компаниям и убивает бизнес малых в лице фермеров.

Статья: «Regulating “big data education” in Europe: lessons learned from the US» посвящена анализу больших данных в образовании и большей власти вендоров и меньшей у школ. Одной из ключевых тем является приватность данных студентов и специальное регулирование посвящённое этой теме во многих странах.

Другие статьи, также, заслуживают внимания.

Выпуск журнала: http://policyreview.info/articles/analysis/big-data-big-power-shifts
Статья о Monsanto: http://policyreview.info/articles/analysis/ethics-big-data-big-agriculture
Статья о анализе больших данных в образовании: http://policyreview.info/articles/analysis/regulating-big-data-education-europe-lessons-learned-us

#opendata #bigdata #privacy #agridata #edudata
Одними из сильнейших драйверов открытости в мире являются даже не национальные правительства и, часто, даже не граждане, а межгосударственные институты, в первую очередь институты развития, которые выцепляют лучшие национальные практики и начинают активно их предлагать.

Год назад Marcos Siqueira в блоге Всемирного банка написал пост: «What if we disclosed everything?» [1] (Что было бы если бы мы раскрывали всё?) где рассказал о своём опыте раскрытия информации о контрактах частно-государственных партнёрств в Бразилии и с призывом к радикальной прозрачности в этой области.

Сейчас в блоге FOMIN (подструктура МежАмериканского банка развития) появилась публикация о развитии этой практики в Мексике и использовании стандарта Open Contracting для этой цели. В публикации «Open data + increased disclosure = better public-private partnerships» [2] подробно рассмотрены выгоды общества от подобного раскрытия информации.

Эти публикации особенно показательны на фоне российской истории с «Платоном» когда изначально непрозрачная практика принятия решения и отсутствие вовлечения граждан и стали приводить к принципиальному общественному неприятию этого проекта. Аналогичная непростая ситуация с московскими парковками и похожая ситуация зреет со многими другими действующими проектами и системами которые некоторые чиновники уже хотят передать в концессию.


[1] http://blogs.worldbank.org/ppps/what-if-we-disclosed-everything
[2] http://www.fomin.org/en-us/Home/FOMINblog/Blogs/DetailsBlog/artmid/13858/articleid/6275/Open-data-increased-disclosure-better-public-private-partnerships.aspx

#opendata #opengov #ppp #privatepublic
С момента приказа о присоединении ФСКН к МВД прошло чуть менее 5 месяцев, но лично я уже вижу итоги и результаты, как минимум, с точки зрения сохранения информации.

Из 19 официальных сайтов территориальных управлений ФСКН в ЦФО недоступно уже 10 (на 2016-06-01), можно смело предполагать что с остальными официальными сайтами не лучше, их оперативно выпиливают из интернета.
Краткая сводка текущей доступности их сайтов тут https://docs.google.com/…/1d5Y7MiCeYLr2qIywx2qMPABwur…/edit…

Но картина, в целом, удручающая. Хуже чем с силовиками ситуация обстоит только с банками. После отзыва лицензии сайт банка живет только пару часов. А иногда и сразу же исчезает.
Для сравнения, ЦБ РФ хранит и даёт доступ к архивам всех официальных сайтов поглощённых им структур с 2003 года http://cbr.ru/finmarkets/?PrtId=archive

В России, есть много областей в которых есть просто нулевая активность государства:
- архивация цифровых материалов (не путайте с цифровыми архивами). Эта архивация про сохранение того что изначально создавалось в цифровой форме
- открытый исходный код. Можно сколько угодно спорить о его нужности-ненужности, особом российском пути, но в десятках стран сотни госструктур раскрывают свой исходный код и ведут открытую разработку.


#‎digitalpreservation #opensource
Одна из ключевых тем которую слишком часто избегают упоминать крупные вендоры и стартапы - это «Big Data Ethics». Фундаментальные вопросы приватности в работе с большими данные и информационное неравенство которое лишь нарастает от дисбаланса возможностей тех кто с данными работает по сравнению с теми о ком данные собираются. 2 года назад эта тема была хорошо раскрыта в статье «What’s Up With Big Data Ethics?»[1] на O’Relly Data, а за это время ситуация только усугубляется с каждым годом всё больше и больше.

Основная причина и проблемы в низкой грамотности граждан в том что касается данных (data literacy) и незнании как защищать свои права и приватность. В том же 2014 году в MIT вышла статья «openPDS: Protecting the Privacy of Metadata through SafeAnswers» [2] с примером инструмента который помогал бы пользователю предоставлять информацию по запросу.

Сейчас анализ больших данных и вся тема Big Data стала мейнстримом и большие данные, в том числе данные персональные, являются частью бизнес страгии многих компании что можно увидеть ещё в отчёте WEF за 2011 год «Personal Data: The Emergence of a New Asset Class».
И в том как уже сейчас сотовые операторы в России и другие компании деляться с банками и другими потребителями данных информацией о своих клиентах и их поведению [4].

О data literacy и этике и практике использования данных мобильных телефонов много написано в DataPop Alliance [5], но главный вопрос не решён глобально, осознание потребителями мобильной связи, мобильных приложений и гаджетов что они не только находятся под непрерывным наблюдением и сбором данных о них, но и помогают собирать данные об окружающих. Включение сенсоров в телефонах может использоваться не только для слежки для его владельцем, но и для сбора данных на каком-то расстоянии от него, как минимум в том что касается звуков, каналов Wifi и Bluetooth

Другая практика о которой не принято распространяться - это уже существующий или потенциальный доступ правохранительных данных к Вашим данным при проведении расследований.
Примеры:
- поиск свидетелей. Запрос в сотовые операторы и сервисы о списках людей и их местонахождении рядом с прошедшим преступлением.
- проверка на лежсвидельствование и алиби. Не только по сотовому оператору, но и по наличию действий на телефоне и тому насколько шаблоны поведения на телефоне соответствовали этому пользователю.
- доп источники информации. Например, при расследовании ДТП запрос на актуальное местонахождение водителя в выбранный момент времени и, при фиксации показателей гироскопов в телефоне, то и выявление точного времени столкновения до секунды и точный перечень всех свидетелей на дороге.

И, наконец, самое важное - это использование результатов анализа больших данных от маркетинга до манипулирования. Составление профиля потребителя и, самое главное, предсказание его поведения. Вероятности того что:
- в определенное время, он будет в определенном месте
- кому-то позвонит
- отправит кому-либо сообщение
- использует определенное приложение
- откроет определённый сайт
- … и будет в определённом психоэмоциональном состоянии

Как не продать человеку его старую «потребность» по прошлым поисковым запросам, а то что он может захотеть купить в будущем? Как повлиять на его поведение для извлечения из него максимальной маржи? Как научится предсказывать придёт ли он или нет на выборы и за кого проголосует? Как повлиять на решение тех кто на выборы пойдет? И многое другое

Big Data Ethics - это именно про огромный потенциал манипулирования гражданами со стороны data corporations и государств, активно трансформирующихся в data government.

[1] http://radar.oreilly.com/2014/03/whats-up-with-big-data-ethics.html
[2] http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0098790
[3] http://www3.weforum.org/docs/WEF_ITTC_PersonalDataNewAsset_Report_2011.pdf
[4] http://rusbase.com/howto/big-data-in-russia/
[5] http://datapopalliance.org/work/#data-ethics-and-literacy

#opendata #bigdata #privacy #bigdataethics
В блоге OCCRP большой текст ‘Attack on Poroshenko Reporting is PR, Not Analysis’ [1] обличающий статью в Politico Europe «Ukrainian innocent caught in Panama Papers web» [2].

Журналисты OCCRP, фактически, обвиняют Адриана Карачинского (Adrian Karatnycky) в том что он лоббист, а не журналист, а его Myrmidon Group LLC [3] является, буквально, иностранным агентом в изначальном понимании законодательства США. А то есть зарегистрированным лоббистом Республики Сербской в Боснии, и соответственно президента Республики Милорада Додика который также попался на коррупции в расследования OCCRP [4].

В отличии от Карачинского за OCCRP есть репутация и отсутствие аффилированности с любой одной из групп интересов. Поэтому эта история интересна ещё и «вскрытием» PR активности и лоббирования сменившихся властей на Украине. И поддержанием нейтральной позиции OCCRP в своих расследованиях.

Лично я готов поспорить что до конца дня сегодня об этом напишет несколько десятков российских СМИ, в основном государственных и окологосударственного толка. Впрочем, вопрос по прежнему в сохранении объективной картины которую эти СМИ, также, могут исказить.

[1] https://www.occrp.org/en/40-press-releases/presss-releases/5311-occrp-responds-criticism-poroshenko-ukraine-panama-papers
[2] http://www.politico.eu/article/panama-papers-defending-ukraine-president-petro-poroshenko-corruption-tax-finance-evasion/
[3] http://myrmidongrpllc.com/
[4] https://www.occrp.org/en/daily/4581-bosnia-and-herzegovina-former-high-representative-warns-of-criminally-captured-state

#panamapapers
В субботу 4 июня в США проходил National Day of Civic Hacking проходящий при поддержке Администрации Барака Обамы [1]. Сотни программистов по всей стране собрались на более 100 [2] параллельно идущих хакатонов и других мерориятий. Надо отдать должное организаторам Code For America, которые за всем эти стоят, мероприятия более чем посещаемые и эффективные в организации сообщества.

А их Fundraising Handbook [3] мог бы быть наглядным пособием для многих российских НКО. Что характерно - это уже 3-й такой National Day и до этого они уже проходили в 2013 и 2014 годах (что было в 2015 - непонятно).

Но самое главное что это масштабное мероприятие - это часть экосистемы государственных проектов по вовлечению граждан, а Civic hacking - это гораздо более широкая тема чем просто открытые данные.


[1] https://www.whitehouse.gov/blog/2016/06/03/open-data-and-innovation-national-day-civic-hacking-2016
[2] https://cache.codeforamerica.org/events/national-day-2016/
[3] https://docs.google.com/document/d/1c9Jbtdj_wKP2dDwxslXhBQoobzpTwsxkrSjAlLQdkI0/edit

#opendata #opengov
В журнале Public Policy Review, Vol.12, No.1, за март 2016 вышло исследование «Open Data as an Infrastructure —Impact of Availability of Government Data as Open Data on the Japanese Economy—» [1] за авторством Hideyuki Tanaka и Soichiro Takagi.

В исследовании разобрана модель экономики использования баз данных и рассчитан экономический эффект от открытия данных органами власти. Итоговый эффект измеряется в пределах от 158.6 миллиардов йен до 701 миллиарда йен, это от 3.5% до 16% от ВВП страны.

Это не первое и не финальное исследование в области экономики открытых данных. Более всего подобных исследований было в Евросоюзе в рамках исследований в области PSI (Public Sector Information) и в Великобритании где ODI делает особый акцент на экономическом эффекте от открытости данных.

В этом исследовании, к сожалению, мало обзора непосредственно практики использования данных, но много экономических расчетов, формул и оценок.

[1] https://www.mof.go.jp/english/pri/publication/pp_review/fy2015/ppr012_01b.pdf

#opendata #opengov
В The Financial Times вышла статья [1] с анализом корреляции между демографическими показателями переписи населения в Лондоне в 2011 году и результатами выборов мэра в 2016.

В статье приводится множество примеров соответствия того как пары с детьми больше склонны голосовать за консерваторов, а «чёрные» за лейбористов.

Но интереснее другое. Такой анализ возможен только благодаря доступности данных, в случае Лондона - это 140 датасетов опубликованных на их портале открытых данных [2] и охватывающих 570 округов города. Доступность подобных данных даёт возможность независимым аналитикам и политическим партиям корректировать свою электоральную стратегию для охвата той части аудитории до которой они не могут достучаться.

В России информация о выбора более-менее доступна на специальном сайте [3] ЦИКа однако открытые данные не публикуются и карты электоральных участков надо реконструировать по текстовому описанию. Данные же переписи с детализацией более чем до региона - попросту недоступны. Эти данные не публикуются ни Росстатом, ни Мосгорстатом, ни Мэрией Москвы.

К сожалению, именно политические возможности связки электоральных и социодемографических данных переписи и ставят на них крест в России. Их публикация сократит информационное неравенство партии/власти победителей выборов и конкурирующие с ними партии. В то же время можно не сомневаться что связка электоральных данных и данных переписи используется при проектировании избирательных кампаний тех кто имеет к ним доступ. А при наличии дополнительных данных - таких как данных от сотовых операторов и даже данных с мобильных телефонов пользователей от установленных там программ, всё это может использоваться при политических инициативах более чем активно.

#opendata #opengov

[1] http://blogs.ft.com/ftdata/2016/05/23/london-mayoral-election-census-data-who-voted-whom/
[2] http://data.london.gov.uk/census/data/
[3] http://www.izbirkom.ru/region/izbirkom
Это, в целом, большое заблуждение полагать что крупные Интернет и ИТ компании заинтересованы в открытии данных и работе в этом направлении. В лучшем случае внутри них есть политика поддержки экосистемы открытости как это делает Google с Google Summer of Code [1] для поддержки open source проектов или же делает Nike [2] раскрывая данные из своих отчётов об устойчивом развитии (sustainability report).

В остальном же чем крупнее интернет компания тем более она пользуется любой темой исключительно в целях GR и ничего более. Тема открытых данных не исключение и последний актуальный пример - это данные о движении общественного транспорта. Летом 2015 года во время сбора совета по открытым данным на площадке Яндекса как раз и был пример такого случая. Яндекс лоббировал не появление открытых данных в общем доступе, а исключительно своё соглашение с Правительством Москвы о их получении [3].

Буквально сразу же после этого заседания совета я написал письмо Михаилу Абызову (Министру по открытости) о том что это тупик и в таком виде Совет по открытым данным бессмысленнен чуть меньше чем совсем. Собственно с чего и началась реорганизация совета, которая, впрочем, ничем хорошим не закончилась. При совете создали кучу рабочих групп бессмысленных и перенасыщенных бездятельными людьми. Сам совет сохранил формат «театра одного актёра» - ни разу не выполняя свою функцию, а исключительно выступая ширмой для легализации решений принятых Абызовым или его аппаратом внутри АЦ Форума.

История с этим заседанием в Яндексе - это лишь триггер кризиса «ничего». Главное отличие стран лидеров в открытых данных от России в том что в них открытые данные декларируются и продвигаются не министрами без полномочий, а главами этих государств.

Поэтому ситуация в России далеко не лучшая в мире, но не худшая из возможных в России. Слушая сегодня на форуме «И+ Общество» представителей Роскомнадзора о рисках которые создаёт Интернет можно ощутить что всё может быть и хуже.

И вот это рассмотрение любой ситуации что всё конечно нехорошо, но может быть и хуже и приводит к тому что все кто более-менее активен переключаются на более деятельные занятия чем тратить время и силы на убеждение чиновников о пользе открытости.

Ссылки:
[1] https://developers.google.com/open-source/gsoc/
[2] http://www2.deloitte.com/content/dam/Deloitte/uk/Documents/deloitte-analytics/open-data-driving-growth-ingenuity-and-innovation.pdf
[3] http://open.gov.ru/events/5513262/

#opendata #opengov
Вчера Алексея Херсонцева, главу департамента по административной реформе в Минэкономразвития назначили главой Федерального агенства по аккредитации (Росаккредитация), а Савву Шипова, теперь уже бывшего главу Росаккредитации назначили зам. министра экономики и поставили Росаккредитацию курировать [1] .

Многие поздравляющие Алексея отмечают что именно он приложил много усилий к проекту МоиДокументы, де-факто ребрендингу и продвижению МФЦ и развитию их сети в России. Я мало знаю об успешности или неуспешности этой программы и вполне допускаю что Алексей много сделал чтобы она работала и работала хорошо.

Я знаю его работу с совсем другой стороны. Именно Алексей Херсонцев активно саботировал тему открытых данных в течении 2012-2013 года всячески препятствуя созданию портала открытых данных от Минкомсвязи. Я как сейчас помню как это звучало «Мы считаем что это нецелесообразно». Ещё до формирования совета по открытым данным, на встречах у министра Абызова как раз именно Алексей Херсонцев всячески от темы отстранялся. До тех пор пока не стала понятна причина. В 2013 году Минэком была заказана работа по разработке методических стандартов публикации данных которую выиграло и делало НИУ ВШЭ. Тогда на том первом этапе и я как один из экспертов участвовал в составлении самой первой редакции этих методических стандартов.

Кстати тогда же, мы запустили от Инфокультуры, как раз при поддержке Открытого Правительства (тогда Абызов был ещё активен в этой теме) Школу открытых данных [2]. И туда, помимо всех прочих, ходило несколько представителей компании Госбук, подрядчика Минэкономразвития по мониторингу госсайтов и создатели системы Госмонитор с рейтингами официальных сайтов.

Уже ближе к сдаче работы, как раз Алексей Херсонцев и начал, фактически, настойчиво рекомендовать подключать «компетенции коллег из Госбука» к этой работе. При том что все компетенции что у «коллег» были - это как раз посещения нашей школы открытых данных.

Очень быстро «ларчик приоткрылся». На одной из встреч с представителями ФОИВов представители Минэка стали представлять и активно продвигать инструмент Госбука для публикации данных на официальных сайтов госорганов. Этот инструмент - это «генератор HTML’ек» с RDFa для агрегации на централизованный портал. С точки зрения мировой практики это звучало как редкий бред - в мире федеральные порталы открытых данных не являются агрегаторами. Данные либо публикуются у них на сайте, либо загружаются через их открытые API. Здесь же предлагалась pull-технология агрегации. Как помню я тогда открытым текстом на этом совещании это и сказал.

Дальше стало ещё понятнее. Как раз Алексей Херсонцев резко переменил мнение и сразу с принятием поправок в 8-ФЗ в котором была закреплена роль Минэкономразвития как головного госоргана, сразу же он же и поднял вопрос о едином портале. Но, портале-агрегаторе собирающем данные с сотен сайтов органов власти. Минэк тогда же симулировал публичное обсуждение создания этого портала выкинув все содержательные комментарии, а в архитектуре портала прописав вот такую вот модель сбора. А вскоре Минэкономразвития и объявили конкурс который, разумеется, выиграла компания Госбук, как напрямую, так и через субподряд у Аналитического центра при Правительстве. Я писал о этой ситуации подробно в октябре 2013 года [3] когда Госбук попался на том что они начали делать работу по порталу до того как портал официально появился. Иначе говоря их можно обвинить в сговоре с госзаказчиком и единственная причина почему это не произошло - это потому что тогда мне лично было жаль тратить время на это, а не на практическую работу на собственными проектами по открытым данным. А этот случай был лично для меня очередным наглядным подтверждением того что не надо рассчитывать на государство в том что оно может сделать что-то прилично, развивать тему можно и самостоятельно.

Федеральный портал открытых данных за эти годы мало изменился. Будучи агрегатором четверть его данных - это мелкие таблицы из Росстата, более двух третей - это региональные и муниципальные данные и совсем немного данных федеральных органов власти. Пор
тал созданный по принципу «не быть, а казаться» даже не кажется полезным.

Это, конечно, не единственная история. Ещё до неё и параллельно с ней Алексей Херсонцев был тем что запускал и анонсировал портал regulation.gov.ru по обсуждению проектов нормативных документов. Портал слабый, бессмысленный и с нулевой обратной связью. Нельзя увидеть отзывы других, свои, комментарии, принять участие в практической экспертизе.

Что важнее - этот портал заменил экспериментальную тогда систему экспертизы законопроектов zakon.government.ru [5] (уже 4 года недоступна) где шли реальные и интенсивные обсуждения законопроектов. Но Дмитрий Медведев ещё тогда наигрался в демократию, а с его приходом в Правительство из Президента многие содержательные проекты быстро были заменены на бессмысленные или имеющие исключительно PR функцию. Проект zakon.government.ru тогда делался аппаратом Правительства (Путина) и новый аппарат правительства Медведева его даже не понимал.

У меня нет и не было цели писать про Алексея Херсонцева что-то хорошее. Он жив и здравствует, скорее всего сделает ещё карьеру до министра, поскольку хорошо понимает правила административной игры, а жертвовать смыслом и будущим страны ему привыкать не придётся.


Ссылки:
[1] http://economy.gov.ru/minec/press/news/2016150605
[2] https://www.facebook.com/opendataschool/
[3] https://habrahabr.ru/company/infoculture/blog/198644/
[4] http://data.gov.ru
[5] http://archive.premier.gov.ru/events/messages/18312/

#opendata #opengov
Роман Иванов (Кукуц) вместе с группой товарищей на днях открыл поиск по всему архиву ЖЖ с 2000 года по 2015 год [1]. При том что это хороший проект, полезный, но всегда возникает вопрос в том когда многие создающие некоммерческие проекты не вкладывают сил в создание экосистемы. Когда я вижу все подобные проекты, то первый вопрос - отчего не выложить весь архив онлайн? Второй немаловажный вопрос в том что Роман Иванов в общем-то в Яндексе, а ресурсы для сервиса предоставляет Servers.ru [2].

Если причиной этого оказывается что в том что проект некоммерческий, то можно однозначно предположить лишь что Яндекс занимается теперь только коммерческими проектами. То можно было бы назвать социальной ответственностью, работой с сообществом, всё это как-то не очень, прямо скажем. Управление рисками сильно и сильно на первом месте.

А вот свежеанонсированный Clickhouse [3], как инструмент для аналитической обработки данных, очень интересен. Особенно поддержкой SQL чтобы бывает особенно удобно в некоторых случаях.


Ссылки:
[1] https://ljsear.ch/
[2] https://roem.ru/14-06-2016/226387/not-yandex-lj-search/
[3] https://clickhouse.yandex/

#yandex #tech