Ivan Begtin
8.1K subscribers
2.03K photos
3 videos
102 files
4.76K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
加入频道
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
March 3, 2020
По поводу ситуации с тем что Яндекс в рамках ОРД передал сведения о поездках Ивана Голунова мне есть что написать. Но прежде дам ссылку на разбор ситуации на Roem [1].

А далее мои комментарии. особенности почти всех существующих дата-корпораций, дата-сервисов, стартапов работающих с потребителями в том что сбор данных сейчас заложен во все из них. Бесплатная почта, сервисы предоставляющие коллосальный дисконт, бесплатные соц сети и всё остальное, вообще всё что бесплатно и полубесплатно достаётся в цифровом мире и вообще всё что является платным - всё это инструменты и способы сбора сведений о потребителе. Наша экономика сейчас - это экономика слежки, капитализм слежки или ещё можно сказать "капитализм цифрового выпаса' когда цифровые компании собирают максимум данных.

Пример с Яндексом пример того что может происходить и происходит во всех остальных областях. Отследить конкретного человека можно по данным сотовых операторов, по передвижениям на такси, по мобильным приложениям имеющих доступ к геолокации, по трекерам внутри мобильных приложений имеющим доступ к геолокации в этих приложениях, по отслеживанию через точки wi-fi и Bluetooth и ультразвуковые биконы.

Иначе говоря слежка за потребителями развилась настолько что давно уже куда совершеннее государственной инфраструктуры слежки за гражданами. Нам не нравится то что государство использует эту инфраструктуру за хорошими людьми. Например, Ивана Голунова мы к ним относим. Но что мы можем сделать? Это очень непростой вопрос на который у меня нет до сих пор полноценного ответа, только рассуждения.

1. Усилить давление на дата-компании чтобы они не собирали данные.
Проблема: Это их основная бизнес модель. Ограничивая им это в одной юрисдикции они немедленно перебираются в другую. И это почти невозможно делать без участия государства.

2. Убедить компании делать свои продукты такими чтобы данные обезличивались и не представляли ценности для правоохранителей
Проблема: Потеря коммерческого преимущества и риски госрегулирования, например, государство насильно отрегулирует такси обязывая регистрировать каждую поездку в специальной государственной информационной системе.

3. Добиться противодействия компаний госрегулированию. Требовать судебных ордеров и тд.
Проблема: Дураков нет и никто в бизнесе самоубийственным юридическим противостоянием заниматься не будет. Скорее, опять же, попытаются сменить юрисдикцию, но это плохо работает в эпоху экс-территориального регулирования вроде GDPR

4. Не пользоваться сервисами к которым имеют доступ правоохранители
Проблема: Это работает только пока они не становятся популярными, как только становятся, то на них начинается давление по хранению данных в РФ.

5. Не пользоваться цифровыми сервисами в принципе. Вызывать такси по телефону или не пользоваться такси
Проблема: Для многих это снижение качества жизни. Дискомфорт от времени подачи такси, необходимости звонить, качества автомобиля и тд. Такси это пример, конечно же, относится ко всем цифровым сервисам.


Что в итоге? Главный союзник общества во влиянии на дата-корпорации и этичность сбора данных - это государство. Но когда государство само заинтересовано в нарушении прав граждан, это не работает.

У меня нет ответа и решения в текущей ситуации. Единственный совет который можно дать озабоченным своей приватностью - это не использовать цифровые сервисы везде где только возможно. Платить наличными, использовать self-hosted решения везде где только возможно, не заказывать такси через цифровые сервисы, не пользоваться бесплатной электронной почтой и так далее и тому подобное.

Но сколько тех кто готов к этому? Тусовка криптопанков всегда была небольшой и я сильно сомневаюсь что современные журналисты готовы к таким самоограничениям.


Ссылки:
[1] https://roem.ru/03-03-2020/281432/priyatniy-orm/

#data #privacy
March 3, 2020
Свежая статья в Новой газете о подготовке "цифровых замминистров" [1] достаточно взвешенная и подробная и, в том числе, с моими комментариями. Прочитать будет полезно, обзор весьма толковый.

Ссылки:
[1] https://novayagazeta.ru/articles/2020/03/03/84153-chrezvychaynaya-tsifrovaya-komissiya

#govtech
March 3, 2020
March 4, 2020
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
March 5, 2020
March 6, 2020
Forwarded from Shumanov
Принадлежащее государству АО «Мелодия» (ранее ФГУП «Мелодия»), владеющее правами на сотни тысяч советских аудиозаписей, недавно было приватизировано всего за 330 млн рублей.

«Мелодию» купила компания «Формакс», которую контролирует никому неизвестный житель города Нерехта Костромской области Михаил Суконцев. После небольшого расследования мы выяснили, что Суконцев является номинальным владельцем компании.

Его фотографии в социальных сетях указывают на то, что, скорее всего, он является водителем Алексея Клевцова. Клевцов, в свою очередь, является бизнес-партнёром и другом генерального директора АО «Мелодия» и «Российского союза правообладателей» Андрея Кричевского.

Ожидаемо, что топ-менеджеры АО «Мелодии» выкупили права на сотни тысяч советских аудиозаписей через подставных лиц почти за бесценок.
March 6, 2020
В Сингапуре местные власти активно рассылают уведомления о коронавирусе через WhatsUp. В статье в GovInsider [1] подробно рассказывается об этой практике.

Как это организовано:
1. Перевод с помощью ИИ.
В Сингапуре 4 языка. Китайский, Английский, Малайский и Тамильский. Чиновники используют алгоритмы которые готовят черновики текстов и на их основе быстро доделывают тексты до финальных.

2. Быстрая подписка.

Человек выбирает нужный язык через Form.gov.sg [2], инструмент помогающий чиновникам запускать рассылку за 30 минут и связывать разные государственные системы.

3. Быстрые обновления

Сейчас система рассылает до 500 сообщений в секунду, это около 30 минут на 500 тысяч подписчиков.

Всё это делает команда Open Government Products [3], внутренняя команда правительства Сингапура. Одна из цифровых команд в мире, работающих по принципу in-house и решающие оперативные задачи.


Ссылки:
[1] https://govinsider.asia/innovation/singapore-coronavirus-whatsapp-covid19-open-government-products-govtech/
[2] https://form.gov.sg
[3] https://open.gov.sg

#opengov #notification #digitalgov
March 6, 2020
Реформа государственного сектора на повестке далеко не только в России. В Великобритании есть сообщество OneTeamGov [1] выступающее за радикальную реформу госуправления под позитивной повесткой.
В их принципах [2]:
1. Работать открыто и позитивно
2. Предпринимать практические действия
3. Экспериментировать и повторять
4. Быть диверсифицированными и инклюзивными
5. Глубокая забота о гражданах
6. Работать через границы
7. Развивать технологии

Кроме Великобритании сообщества есть в Финляндии [3], Норвегии [4], Канаде [5], Швеции [6], Новой Зеландии [7].
Все они действуют также как неформальные сообщества в некоммерческом секторе, проводят митапы, завтраки, обсуждают продуктивность, как организовать рабочее место и так далее.

Ссылки:
[1] https://www.oneteamgov.uk/
[2] https://www.oneteamgov.uk/principles
[3] https://www.oneteamgov.uk/finland
[4] https://www.oneteamgov.uk/norway
[5] https://oneteamgov.ca/
[6] https://www.oneteamgov.se/
[7] https://oneteamgov.nz/

#opengov #gov
March 7, 2020
March 8, 2020
March 8, 2020
В проекте Our World in Data интересная публикация с анализом и сравнением эпидемии "испанки" в 1918-1920 году, текущего коронавируса и других эпидемий [1]. Помимо всего прочего там же сравнения стран по средней продолжительности в том числе, в годы эпидемий.

Там же, ещё одна публикация с обзором зарождения и распространения коронавируса [2] и того как собираются сведения о нём. В Our World in Data практически все материалы - это лонгриды с большой работой над текстами, помимо наглядных графиков. Всячески могу порекомендовать смотреть их публикации как пример качественной подачи информации.

Ссылки:
[1] https://ourworldindata.org/spanish-flu-largest-influenza-pandemic-in-history
[2] https://ourworldindata.org/coronavirus

#coronavirus #opendata
March 9, 2020
March 9, 2020
Для тех кто мог пропустить ранее, например я пропустил, в июне 2019 года вышел отчёт офиса аудита Великобритании об использовании данных в органах власти "Challenges in using data across government" [1]. В этом, относительно кратком отчёте на 59 страниц, помимо обзора стратегий работы с данными, ещё и присутствует большой раздел об используемых идентификаторах для граждан и бизнеса. Несмотря на то что это неполный список, он довольно впечатляющий, и включает:
- номер национального страхования
- номер получателя соцподдержки
- уникальный идентификатор налогоплательщика
- уникальный идентификатор учащегося
- уникальный идентификатор студента присваиваемый образовательным учреждением
- номер паспорта
- номер водительского удостоверения
и так далее.

Наверняка если поисследовать по России то число идентификаторов будет не меньшее, а скорее большее. Кросс-использование их органами власти будет, скажем так, разным.

В целом этот документ можно описать как результат аудита стратегии правительства в области данных. Полезный по многим причинам, не затрагивающий вопросы финансов и затрагивающий вопросы результатов.

Ссылки:
[1] https://www.nao.org.uk/wp-content/uploads/2019/06/Challenges-in-using-data-across-government.pdf

#data #audit
March 10, 2020
В России тема Сингапура особенно популярно среди государственных служащих как пример того как должно быть устроено государство и как пример его эффективности. Но используется ли сингапурский опыт в России?

В Сингапуре вот уже несколько лет действует "государственная цифровая команда" создающая открытые государстсвенные продукты [1] среди которых есть такие как:
- портал открытых данных data.gov.sg [2]
- мобильное приложение для парковок [3]
- сервис для заполнения государственных форм Forms.sg [4]
- конструктор для госсайтов Isomer [5]
- сокращатель ссылок для госслужащих [6]
- конструктор общедоступных документов [7]
- сервис авторизации с приватностью [8]

Большая кода команды общедоступна на Github [9], [10], [11].

Что главное в этом всём? Все эти продукты, кроме приложения для парковки - это G2G продукты.
Многие из них, например, конструктор для госсайтов и конструктор документов сделаны столь хорошо что вполне пригодны для использования и за пределами властей Сингапура. В них Github используется для создания сайтов с разметкой markdown а госслужащих учат использованию этой разметки для подготовки и публикации документов.

Ссылки:
[1] https://open.gov.sg/
[2] https://open.gov.sg/products/datagovsg/
[3] https://open.gov.sg/products/parkingsg/
[4] https://open.gov.sg/products/formsg/
[5] https://open.gov.sg/products/isomer/
[6] https://open.gov.sg/products/gosg/
[7] https://open.gov.sg/products/opendoc/
[8] https://open.gov.sg/products/sgid/
[9] https://github.com/datagovsg
[10] https://github.com/opengovsg
[11] https://github.com/opendocsg/

#singapore #opendata #opensource #opengov
March 11, 2020
March 11, 2020
March 11, 2020
Public Health England открыли официальную панель для информирования о распространении коронавируса. Подробности можно узнать у них на сайте [1], а саму панель просмотреть здесь [2].

Также, все данные сразу отдаются в форматах CSV, с публикацией ежедневно обновляемых индикаторов [3].

Ссылки:
[1] https://www.gov.uk/government/publications/covid-19-track-coronavirus-cases
[2] https://www.arcgis.com/apps/opsdashboard/index.html#/f94c3c90da5b4e9f9a0b19484dd4bb14
[3] https://www.arcgis.com/home/item.html?id=bc8ee90225644ef7a6f4dd1b13ea1d67

#uk #government #coronavirus
March 11, 2020
March 11, 2020
На работу требуются "сторож данных" и "управляющий складом данных" без вредных привычек (c)

Среди множества профессий вокруг работы с данными, таких как data scientists, data engineers или data analytics незаслуженно забывают или просто не вспоминают о как минимум двух ролях data steward (управляющий данными) и data custodian (сторож данных).

Это термины наиболее распространённые в зарубежной академической и архивной среде, например, в NC State University [1] или в университете Рочестера [2] и в некоторых странах, например, в Новой Зеландии [3] есть большая область деятельности "Управление данными", но в правильном переводе с русского на английском - это не "data management", а именно "data stewardship".

Кто такой data steward? Это роль в организации, ответственная за организацию сбора, создания и использования данных для максимальной точности данных, как содержания так и метаданных. Их задача в том чтобы работа с данными, правилами работы с ними соответствовали регуляторным и внутренним требованиям.
Часто эта роль совмещена с ролью data custodian (сторож данных) который, в свою очередь, отвечает за безопасность доступа к данным, их передачи, хранения и так далее. Часто эти роли совмещены или пересекаются.

Иногда, как по ссылке выше [1], выделяют роль data trustee (попечителя данных) и выстраивают иерархию из этих трёх ролей, где data trustee отвечает за стратегию, data steward за правила и принципы, а data custodian за конкретные данные и за их защиту, в том числе.

Термин data steward часто заменяют на data curator (куратор данных), очень близкий по смыслу и роли человека ответственного за сопровождения тех или иных баз данных и процессов их сбора.

Потребности в "управляющих данными" хорошо сформулированы в публикации "Wanted: data stewards" [4] вышедшей в начале марта. Где авторы пере-определяют этот термин и описывают его как "лидеры организаций и команд имеющие возможность создавать общую ценность используя повторно данные (и экспертизу в данных) организации".

Ссылки:
[1] https://oit.ncsu.edu/it-security/data-framework/data-categories-trustees-stewards-and-custodians/
[2] https://tech.rochester.edu/data-custodian-duties/
[3] https://www.data.govt.nz/manage-data/data-stewardship/a-draft-data-stewardship-framework-for-nz/
[4] https://www.thegovlab.org/static/files/publications/wanted-data-stewards.pdf

#opendata #data #datasteward #datacustodian
March 12, 2020