Ivan Begtin
8.1K subscribers
2.02K photos
3 videos
102 files
4.75K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
加入频道
А ведь неудивительно, меня поражает лишь что масштаб нарушений в госИТ так мал
Госорганами нарушаются требования механизма координации информатизации
http://audit.gov.ru/press_center/news/34932

Госорганами нарушаются требования механизма координации информатизации
Да тут оказывается и до анонимных телеграм каналов дошла тема с подготовкой CDO/CDTO, только в терминологии они путаются. Chief Data Officer - это про данные, а CDTO - это Chief Digital Transformation Officer, он про цифровые продукты. Первый высокопоставленный исполнитель, второй руководитель ставящий задачи.

Но вот до чего же смешно читать всю эту конспирологию.

Всё гораздо проще. CDO и CDTO - это синхронизация государства с окружающей его действительностью. Для бизнеса сейчас цифра - это такое неизбежное настоящее, требующее быстрой адаптации. Для государства - это попытка соответствовать нарастающим ожиданиям потребителям его функций и услуг.
Forwarded from Shadow policy
Chief Digital Officer готовят отдельно по расширенной программе.

Кто контролирует цифру - контролирует нервную систему госуправления. И вопрос лояльности этих CDO остаётся открытым - будут ли они работать на команды губернаторов и министров; группы, пролоббировавшие их участие в программе переподготовки; либо идеологов этого повышения квалификации и неких демиургов цифрового госуправления, стоящих за ними.
https://yangx.top/scienpolicy/1795

Если Россия сможет организовать подготовку CDO самого высокого уровня, то появится потенциал для экспорта этого ресурса, как минимум, в пространстве ЕАЭС.
Дабы там все позиции не перехватили специалисты из других государств.
- Какой должна быть государственная политика открытости?
- Как должно измениться отношение государства ко всей этой теме с учётом всего того что Открытое правительство успело сделать хорошего и плохого за последние 6 лет?
- И делается ли всё это так чтобы было полезно нам - гражданам и бизнесу ?

АНО "Инфокультура" проводит опрос по открытости государства. По ссылке [1] можно и нужно пройти и заполнить его. Ваша помощь будет неоценима, потому что в диалоге с государством мы сами и многие кто занимаются этой темой должны иметь опору в лице потребителей данных. Как рядовых граждан, так и журналистов, активистов, предпринимателей и, в том числе, государственных служащих также использующих открытые данные в своей работе.

Подробнее об этом опросе в статье Анны Сакоян на Polit.ru [2]

Не забудьте, также, распространить этот пост, и попросить Ваших коллег и друзей заполнить форму опроса.

Ссылки:
[1] https://docs.google.com/forms/d/e/1FAIpQLSfW-KrAXNtf6uIZC4acTi7k6rL6EXS_-qERNeNU_SOyBIh-WQ/viewform
[2] http://polit.ru/article/2018/10/24/open/

#opendata #opengov
Оперирующие термином большие данные часто не знают что это такое и называют ими данные в условные 1-2 гигабайта, кто-то говорит что большие данные это то что не может обработать 1 сервер. Поскольку это маркетинговый термин с самого начала, то как и вокруг многих терминов было много баталий.

Но есть те кто использует именно большие данные - пример это Uber. В последнем посте блога в Uber Engineering [1] они пишут про их платформу больших данных. А у них они _действительно велики_ - это более 100 петабайт в кластере серверов и Hadoop'е и в рамках их аналитической платформы Hudi [2] [3] с открытым кодом [4] поверх Hadoop'а.

Это данные 700 городов, 70 стран и от более чем 2 миллионов водителей собираемые в реальном времени и анализируемые data scientist'ами на платформе Hudi и это по настоящему большие данные.

Ссылки:
[1] https://eng.uber.com/uber-big-data-platform/
[2] https://databricks.com/session/hudi-near-real-time-spark-pipelines-at-petabyte-scale
[3] https://conferences.oreilly.com/strata/strata-ny-2018/public/schedule/detail/70937
[4] https://github.com/uber/hudi

#data #bigdata
Каков размер рынков данных? В обзоре OnAudience Global Data Market Size 2016-2018 он измеряется в 18,2 миллиарда долларов США на 2018 год. Это значительно меньше 65 миллиардов евро размера рынка в Европе по оценке Lisbon Group, к примеру, и методология OnAudience не проясняет как они получили их цифры.

Однако даже если считать эту оценку консервативной, то 1 миллиард долларов размер рынка в России, в отчёте OnAudience - это хорошая минимальная оценка объёма рынка данных в России.

Ссылки:
[1] https://www.onaudience.com/files/Global_Data_Market_Size_OnAudience_Report.pdf

#data #datamarket
Только что отшумела публично и думаю что крепко шумит теперь непублично история про утечку перс-данных вип персон, данных по инфраструктуре и т.д. у оператора Акадо [1] у которого обнаружили раскрытие персональных данных в их whois сервисе.

Случай не беспрецендентный, их не так уж мало, скорее тут важно что после обращения в службу безопасности Акадо не предпринял вообще никаких действий. Это действительно плохо, хуже может быть только если Акадо ещё и проблему не признает и никого не уволит.

Впрочем бывают ситуации гораздо серьёзнее. Я неоднократно сталкиваюсь с утечками перс. данных из государственных систем, но ничего не публикую об этом, вместо этого связываюсь с администраторами системы и объясняю им что надо исправить. Но бывают ситуации которые не исправить просто отключив whois сервис, часто проблемы куда глубже и куда серьёзнее.

Ссылки:
[1] https://bit.ly/2AHKFgZ

#dataleaks
Очередная инициатива по снижению открытости государства

... Авторы доклада предлагают рекомендовать Верховному суду РФ при участии заинтересованных госорганов проработать вопрос о необходимости внесения ряда изменений в 262-й федеральный закон. Они касаются исключения размещения в интернете текстов судебных актов, которые содержат упомянутую информацию о безопасности транспортной инфраструктуры...

Подробнее по ссылке: [1]

Проблема в том что и сейчас доступ к судебным актам для серьёзного анализа ограничен. Для арбитражных судов - это pravo.ru являющееся де-факто монополистом, для судов общей юрисдикции нет открытых данных. Впрочем открытых данных в российской юриспруденции что в судебной что в законодательной - нет нигде. Хотя это главный продукт производства государства

Ссылки:
[1] https://legal.report/article/02112018/publikaciyu-sudebnyh-aktov-predlagaetsya-ogranichit

#opendata #opengov
В Open Data Institute обзор их попыток рисовать "карты данных" [1]. Хорошая затея, не от владельцев, а от характеристик данных. Впрочем все карты данных сложны в отрисовке, всегда упираешься в сложность темы, отраслевую специфику и необходимость понимания как работа с данными устроена. Мне ближе подход идущий от инвентаризации источников данных, тогда карта данных - это лишь промежуточный продукт брейншторма

Ссылки:
[1] https://theodi.org/article/data-access-archipelago-mapping-the-myriad-ways-we-share-data/

#opendata
У Минкомсвязи (официальное сокращённое наименование - Министерства цифрового развития и т.д.) не открывается нормальным образом сайт под https потому чтор работает он с сертификатом Symantec который постепенно Google выводит из поддержки в Google Chrome.

Если открыть сайт https://minsvyaz.ru в Google Chrome то можно увидеть предупреждение безопасности.

Ситуация смешная сапожника без сапог.
#security
Проблема с HTTPS совсем не новая, у многих стран и госорганов плохо с политиками безопасности и приватности и тут в пору вспомнить "а как там у них". В США на правительственном уровне действует проект Pulse [1] где мониторится внедрение не только HTTPS на каждом веб-сайте, но и его безопасные расширения. Например в США для госдоменов сейчас обязательным является использование стандарта HSTS [2], есть требования по использованию HTTPS-only [3] без использования HTTP протокола, а также есть требования по отказу от старых алгоритмов шифрования RC4 и RC5 и старых версий SSLv2 [4].

Всё это и мониторит Pulse, кстати проект с открытым кодом и ничто не мешает и никогда не мешало Минкомсвязи взять этот код и организовать мониторинг госсайтов в России. А если у них нет списка госдоменов, то он есть тут в открытом доступе [5].

А то ведь рано или поздно такой мониторинг сделает кто-нибудь от общественности и будут регулярно тыкать Минкомсвязь в некомпетентность. Некрасиво будет, ну право слово.

Ссылки:
[1] https://pulse.cio.gov/https/domains/
[2] https://https.cio.gov/guide/#options-for-hsts-compliance
[3] https://https.cio.gov/
[4] https://cyber.dhs.gov/bod/18-01/
[5] http://github.com/infoculture/govdomains

#security #privacy #https
Многие, очень многие, говорят что ИТ в России сейчас стремительно меняется и разделяется, очень чётко на ИТ бизнес которые ориентируется на государство и на ИТ бизнес который ориентируется только на другой бизнес или на граждан. Причём этот водораздел становится всё более явным, для многих на рынке работать с госсектором, даже через посредников - это дополнительные риски, издержки и куча ограничений

И наоборот компании работающие с органами власти не хотят или не могут работать с корпоративными заказчиками.

Но, при этом, все без исключения заинтересованы в защите от госрегулирования, именно в защите, поскольку хорошего от нормотворцев сейчас практически никто не ждёт. Лишь очень редко и лишь в ослаблении ряда положений в законах которые реально мешают, но не в принятии новых.

Но откуда берётся такое разделение? Я бы сформлировал следующие причины:
1. Госзакупки. 94-ФЗ и потом 44-ФЗ привели к тому что на рынке ГЗ постепенно остались те компании которые готовы играть по условиям предложенных законотворцами. А то есть без авансирования, без возможности менять условия договора при изменении ситуации, без возможности улаживания конфликтов кроме как через ограниченный набор формальных процедур, с необходимостью имитировать конкуренцию и помогать заказчику затачивать ТЗ под свои услуги/продукты.

2. Нарастающие требования к ГосИТ, в том числе во введении в эксплуатации госинформсистем, требования по импортозамещению и тд. С того момента как вообще тема импортозамещения всплыла многие интеграторы столкнулись с ситуацией необходимости: или переучивать сотрудников, или уходить с госрынка. Иначе говоря это для всего ИТ рынка завязанного на гос-во совсем не бесплатная история.

3. Не транслируемость решений для гос-ва на другие рынки. Я знаю несколько ИТ компаний интеграторов которые работают на постсоветском пространстве. Их продукты в других странах отличаются от российских и, в основном, их делают другие команды. Причина в том российское госИТ накладывает кучу своих ограничений по использованию российской криптографии, ЕСИА и других специфичных для страны продуктов не переносимых на другие рынки - коммерческие и других стран

4. ИТ в государстве - это всегда водопадная модель ИТ разработки. Там просто невозможно что-то другое и эта невозможность закладывается ещё с планов мероприятий по разработке ИТ систем и госпроектов на уровне Правительства. Во все эти планы не закладываются сценарии решения о том что делать если что-то пойдёт не так, если что-то не получится, если где-то решение надо будет поменять.

5. Начиная с определённых сумм в госИТ - это "клановая" игра. И правила её в том что без административного веса у ИТ игрока на рынке мало шансов даже при наличии сильной команды и продукта(-ов).

Наверняка к этому можно добавить ещё немало. Я лишь повторю тезис что очень заметно резко нарастающее разделение между ИТ компаниями ориентированных на работу с государством и компаний не работающих с государством ни при каких условиях.

#it
Для разнообразия о том как развиваются технологии открытости государства в мире, на примере стран которые упоминаются гораздо реже. Обычно говорят все про англоязычные страны, а проекты идут и в странах с другими языками.

- Collecticity [1] - французский проект партисипаторного бюджетирования, активно развивающийся стартап
- Cap Collectif [2] - французская SaaS платформа для проектов по сбору идей, партисипаторному бюджету и публичных консультаций
- OGP Toolbox [3] - большая коллекция инструментов и открытого кода по проектам по открытости государства на разных языках и из разных стран
- Decidim [4] - испанский стартап партисипаторного бюджетирования

в области открытых данных очень много продуктов о которых я писал уже ранее. С открытым кодом CKAN, DKAN, JKAN, DataVerse позволяют создавать собственные порталы открытых данных с открытым кодом. А OpenDataSoft, DataPress, Junar и Socrata предоставляют SaaS платформы для таких порталов.

К слову российские метод рекомендации по публикации открытых данных были абсурдны потому как под них ни одна мировая платформа или решения с открытым кодом не подходят. Только в нашей любимой стране придумывают такие велосипеды с квадратными колёсами.


Ссылки:
[1] https://www.collecticity.fr/
[2] https://cap-collectif.com/
[3] https://ogptoolbox.org/en/
[4] https://decidim.org/

#data
Ключевое в законопроекте о кибердружинах - это источники финансирования. Законопроект, как я понимаю, в Госдуму ещё не внесён и о нём написали только Cnews [1], но надо и важно понимать как устроена вся подобная активность. В ней практически нет инициативы, а практически все про-государственные активисты прагматичны. Если за инициативой не будет денег, то и работать эти кибердружины не будут.

А откуда взять деньги? Каналов финансирования не так уж и много:
1. Госзаданиями на региональные ГБУ и АНО созданные местными властями. Это кибердружины на прямом госфинансировании.
2. Субсидиями на социально-ориентированные НКО от профильных департаментов субъектов федерации.
3. Или если эту тему добавят явным или неявным направлением в программы Фонда президентских грантов.

Всё это, разумеется, если вообще допустить что законопроект будет внесён, принят и будет существовать не для галочки.

Ссылки:
[1] http://safe.cnews.ru/news/top/2018-11-02_v_rossii_legalizuyut_armiyu_kiberdonoschikov

#privacy
Напомню что от Инфокультуры мы проводим опрос об открытости государства в России. Не поленитесь и, пожалуйста, заполните его по ссылке https://goo.gl/CGJBJK

Зачем он нужен? Мы проводим исследование в этой области и его результаты, как и многих других исследований, опубликуем.

#opendata #opengov
Интернет-вещей, диктаторы и демократия - рубрика неожиданных проектов.
DictatorAlert [1] - это журналистский проект в виде Twitter-бота [2] который сообщает о том что в аэропорту Женевы (Швейцария) сел самолёт диктатора.

Под диктаторами авторы проекта называют руководителей авторитарных стран согласно Democracy Index 2016 [3]. То есть Россия, Казахстан, Азербайджан, Беларусь под этот их критерий подпадают и самолёты перечислены в списке [4].

Как только самолёт садится в аэропорту, бот пишет соответствующий твит и с указанием номера, марки и страны происхождения самолёта, а также постит обновлённую картинку со статистикой прилёта. На 6 ноября там на первых трех местах: Объединённые арабские эмираты, Катар и Кувейт.

Как этот бот работает? В аэропорту Женевы стоит частная ADS-B антенна [5] с помощью которой журналисты получают сигналы о всех прибывающих самолётах. Это тот же принцип на котором работают FlightRadar24 [6] и другие аналогичные сервисы.

У бота 17 тысяч подписчиков и им пользуется, например, департамент юстиции США осуществляющий мониторинг отмывания доходов [7].

Это пример того что расследовательская журналистика в современном мире - это не обязательно только про данные, это и про другие технологии тоже.

Ссылки:
[1] https://dictatoralert.org/
[2] https://twitter.com/GVA_Watcher
[3] https://www.eiu.com/public/topical_report.aspx?campaignid=DemocracyIndex2016
[4] http://dictatoralert.org/wp-content/uploads/2017/08/GVAplanes090817.xlsx
[5] https://ru.wikipedia.org/wiki/%D0%90%D0%97%D0%9D-%D0%92
[6] https://www.flightradar24.com/
[7] https://www.justice.gov/criminal-mlars

#data #techmedia