Ivan Begtin
8.01K subscribers
1.94K photos
3 videos
101 files
4.64K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
加入频道
Публикую обещанную открытую часть материалов. По ссылке можно прочитать обзор 16 удостоверяющих центров из которых 9 государственные и во всех из них можно получить персональные данные в виде ФИО, места работы, email, ИНН и СНИЛС по физ. лицам через общедоступные реестры сертификатов. В общей сложности это около 63 тысяч записей о физ. лицах.

Ссылка на исследование: https://begtin.tech/pdleaks-p1-uc/

Это очень длинный лонгрид, с документированными примерами и скриншотами по каждому случаю, а также последовательностью воспроизведения.

Обратите внимание на то что:
- исследование проводилось в августе-сентябре 2018 года и в некоторых случаях проблема уже исправлена, но в это меньшая часть УЦ в которых вскрылась подобная ситуация;
- никаких несанкционированных действий в отношении УЦ не проводилось, был анализ только общедоступной информации;

В данном конкретном случае с удостоверяющими центрами проблема в регулировании и в применении этого регулирования УЦ. Подробнее об этом в тексте.

И, я ещё раз оговорюсь, публикуемое - это меньшая часть общего исследования по ситуации с персональными данными в созданных или регулируемых государством информационных системах. Во многих других случаях ситуация значительно хуже.

#data #privacy #personaldata
По утечкам персональных данных из государственных и регулируемых государством информсистем.

Следующий обзор - онлайнинспекция.рф

https://begtin.tech/pdleaks-p2-oninsp/

Это одна из наименьших утечек перс данных, около 1000 записей. Но есть случаи и посерьёзнее. На основе этого примера будет понятно как многие из них можно выявлять.

#privacy #personaldata
В качестве регулярного напоминания и ответов на вопросы. Подборка ссылок на материалы о том где узнавать о том что такое открытые данные и не только. Мой список рекомендаций.
- The Living Library [1] - библиотека от The GovLab по открытости, прозрачности и цифровизации. Много научных и популярных публикаций
- Surveillance capitalism [2] книга от Shoshana Zuboff о том как устроен современный капитализм слежки, основанный на коммодизации персональных данных.
- Open Data Impact [3] подборка примеров того как открытые данные оказывают влияние на рынки и отрасли
- The Week in Data [4] рассылка ссылок по работе с данными от The Open Data Institute в Великобритании
- Data Elixir [5] еженедельная рассылка про работу с данными. Куча подписчиков, не спамят.
- Рассылка Инфокультуры [6] регулярная рассылка материалов Инфокультуры, про открытые данные, данные и не только
- Scoop.it Big Data [7] поток новостей через сервис Scoop.it по теме Big Data
- Awesome Public Datasets [8] огромная подборка ссылок на общедоступные наборы данных большого объёма
- Re3data [9] реестр открытых научных репозиториев данных по всему миру

Ссылки:
[1] https://thelivinglib.org/
[2] https://en.wikipedia.org/wiki/Surveillance_capitalism
[3] http://odimpact.org/
[4] https://theodi.org/knowledge-opinion/the-week-in-data/
[5] https://dataelixir.com/
[6] https://infoculture.us7.list-manage.com/subscribe?u=2e38b8af0d8a547b51427dc9b&id=dadb533f05
[7] https://www.scoop.it/i/big-data
[8] https://github.com/awesomedata/awesome-public-datasets
[9] https://www.re3data.org/

#data #opendata #bigdata
История про суперсервисы - это, не про технологии, история об обязательствах государства, про социальные гарантии, про удобство взаимодействия с государством минуя бюрократические проволочки. По крайней мере, так бы хотелось всем нам, чтобы нами управляли лучшие из нас, а то что они делали соответствовало интересам большинства, а там где соответствия достичь было бы сложно, то государство выступало бы с позиции "заботливого патернализма" объясняющее нерадивым чадам в что делается им во благо, даже ограничивая их права. Иначе говоря демократия как механизм соблюдения всех прав, а не только право большинства и власть толпы.

Суперсервисы - это группы госуслуг объединённые одной жизненной ситуацией. Например, та же ситуация с рождением ребёнка - это важная часть жизни не только его матери, но и семьи в целом, начиная с момента подготовки к его рождению и до нескольких лет после. В некоторых странах, таких как Новая Зеландия, такие сервисы уже реализуются. Там, правда, нет такого явления как "суперсервисы", это просто естественное развитие государственной опеки и перевод её в более удобную форму.

Но что кроме рождения ребёнка может быть автоматизировано и упаковано в суперсервис ? Как ни странно, это будет не то что пытаются сделать в Минцифразе. Самыми востребованными были и будут все сервисы касающиеся получения денег от государства: пособий, налоговых вычетов и льгот. И, казалось бы, где если не внутри органов власти формируются массивы больших данных на основе которых предоставление льгот можно автоматизировать, автоматически перечислять налоговые вычеты, автоматически перечислять льготы и многое другое. Так почему этого не происходит? Причины просты и банальны - фактический объём социальных обязательств государства значительно превышает выделяемые на эти обязательства средства.

Любые автоматически и автоматизируемо работающие сервисы дающие гражданам возможность получить господдержку столкнуться с тем что денег на всех нет. Это всё относится и к вопросу о том что тема проактивных госуслуг и суперсервисов, это тема политическая, тема справедливого распределения социальных благ и рано или поздно всплывёт в активной публичной дискуссии и за пределами небольшой "команды по цифре". И эта тема плотно связана с другой важнейшей историей - персонификация господдержки гражданам.

Оборотной стороной создания единого реестра граждан, цифрового профиля, консолидация данных о гражданах в государственных информационных системах является реальные знания о его "белой" деятельности для органов власти. Но все кто полагают что главными здесь будут спецслужбы, с выискиванием оппозиции и террористов, заблуждаются. Главное и основное применение сводных реестров о гражданах - это бюджетная и налоговая оптимизация. Реформа государственных обязательств, в той или иной форме, будет происходить от получения картины о реальных доходах гражданина. Сокращения льгот обладающих относительно большими доходами и персонификация государственных гарантий. В какой форме это будет сделано - мы все пока не знаем. Но новая версия государственного цифрового патернализма однозначно будет идти в этом направлении. Главный вопрос, как всегда, будет о справедливости и доверии. О доверии граждан к тому что все эти модели перераспределения общественных благ будут к их пользе, а не очередным витком сокращения обязательств государства.

#digital #government
Что происходит с открытыми данными по всему миру, краткий обзор в ссылках:
- открылся портал открытых данных города Лиона [1] с данными по земле и кадастру в приоритете.
- о том как готовят данные для публикации в проекте OpenSpending [2], проект по открытости бюджетов
- о том как работать с разработчиками, Jонлайн форум по открытым данным при транспортном агентстве Северо-Западного Уэльса, Австралия [3]
- все данные национальной сельскохозяйственной библиотеки США собранные в исследованиях публикуются онлайн в проекте Ag Commons [4]
- Гондурас присоединился к хартии открытых данных Open Data Charter [5]

Ссылки:
[1] https://data.beta.grandlyon.com/fr/accueil
[2] http://www.fiscaltransparency.net/blog_open_public.php?IdToOpen=6681
[3] https://opendataforum.transport.nsw.gov.au/
[4] https://data.nal.usda.gov/
[5] https://medium.com/opendatacharter/beyond-transparency-honduras-adopts-the-open-data-charter-b6768672031b

#opendata #data #opengov
В РБК вышла статья по доступности персональных данных на электронных торговых площадках [1]. Более 2,2 миллиона записей и это продолжение результатов моего исследования о персональных данных в удостоверяющих центрах [2].

В этот раз я, вместо того чтобы самому публиковать, передал коллегам из РБК чтобы появился полноценный материал с комментариями экспертов.

В третьей части самое ключевое - государственные информационные системы и то какие персональные доступны через них. Но это уже самая серьёзная история

Ссылки:
[1] https://www.rbc.ru/politics/29/04/2019/5cc2df569a7947c83b69b0d5
[2] https://begtin.tech/pdleaks-p1-uc/

#data #personaldata #privacy #leaks
Напомню, в первой части публикацию об утечках персональных данных в удостоверяющих центрах http://begtin.tech/pdleaks-p1-uc/

В этот раз речь пойдёт об утечках персональных данных на электронных торговых площадках. Прежде чем публиковать эту часть исследования я передал их РБК для публикации без технических подробностей и чтобы у электронных площадок было время на то чтобы отреагировать на суть проблемы.

Статью в РБК можно прочитать по ссылке https://www.rbc.ru/politics/29/04/2019/5cc2df569a7947c83b69b0d5

Анализ проводился в отношении 6 уполномоченных на размещение электронных аукционов площадок и затрагивает такие их разделы как:
* Реестр поставщиков на площадке Сбербанк АСТ
* Реестр аккредитованных участников площадки ZakazRf
* Реестр участников площадки РТС Тендер
* Реестр участников площадки Росэльторг
* Реестр участников Национальной электронной торговой площадки
* Реестр участников ЭТП РАД

В общей сложности из электронных торговых площадок доступно 2,2 миллиона записей с персональными данными которые можно поделить на 2 группы.

1. Паспортные данные из решений об одобрении крупных сделок.
Эти документы должны публиковаться по закону и нормативной-базе 44-ФЗ, "Закона по контрактной системе". По практике российской подготовки подобных документов, в них, часто содержатся паспортные данные учредителей.

2. ФИО, место работы, должность, email, ИНН и СНИЛС из файлов электронной подписи

После применения файлов электронной подписи в файлах .sig после их декодирования можно получить метаданные сертификата который использовалься для подписи. Эти метаданные содержат ФИО, место работы, должность, email, ИНН, СНИЛС и иногда и другую информацию о персоне.

Подробное исследование со скриншотами и оценками по каждой площадке можно скачать по ссылке
http://files.begtin.tech/f/18ec197cd4f5481481fb/?dl=1

Что привело к подобной ситуации:
1. Несоответствие регулирования практикам документооборота.
2. Отсутствие активных действий электронных площадок по предотвращению публикации сканов решений с паспортными данными.
3. Отсутствие внутреннего мониторинга у электронных торговых площадок на предмет раскрытия персональных данных.
4. Низкая квалификация законодателей, регуляторов и операторов систем приведшая к массовому раскрытию персональных данных из электронных подписей.

*Связаться со мной проще всего по электронной почте [email protected] и https://yangx.top/begtin в Телеграм.*
Итоги публикации персональные данные на про электронных торговых площадках.

Приняли меры по сокрытию перс данных:
- РТС Тендер (http://www.rts-tender.ru) - убрали все документы поставщиков и все файлы подписей к документам
- Сбербанк АСТ (https://www.sberbank-ast.ru) - убрали полностью страницы поставщиков с документами и подписями
- ZakazRF (http://etp.zakazrf.ru) - убрали все документы поставщиков и подписи к документам
- Национальная электронная площадка (https://etp-ets.ru/) - убрали все документы и подписи к ним
- Российский аукционный дом (https://gz.lot-online.ru) - убрали аккредитационные документы

Никаких мер не предприняли:
- Росэльторг (https://www.roseltorg.ru) - никаких изменений, аккредитационные документы по прежнему доступны

Напомню предысторию https://begtin.tech/pdleaks-p2-etp/

Чтож друзья, печальная новость в том что никакие другие рычаги воздействия кроме медийного, не работают.

Даже не знаю что добавить.

#leaks #privacy #data #personaldata
Forwarded from ЗаТелеком 🌐
Как и следовало ожидать, главным бенефициаром "яровой" в итоге стал Huawei:

https://www.kommersant.ru/doc/3961802

Ну, в кто еще?
Разумеется, схема воровства будет в пользу "российских бизнесменов", но те деньги просто украдут, а вот китайцы... А китайцы наработают скиллов и поддержат собственную промышленность.

Голосуем:

* палец вверх — китайцы крутые, и денег подымут и шпионить будут
* палец вниз — просто палец вниз
* КОЗА — нужно больше голосовалок про развал Россиющке
С 1-го июля вступает в силу 71-ФЗ [1], Федеральный закон "О внесении изменений в Федеральный закон "О контрактной системе в сфере закупок товаров, работ, услуг для обеспечения государственных и муниципальных нужд".

В нём огромное количество изменений в текущую контрактную систему, а сам закон, можно сказать что впервые идёт по пути ослабления административной нагрузки на госзаказчиков по 44-ФЗ.

Многое из изложенного там разумно: ускоренные сроки рассмотрения заявок, ускоренное проведение процедур в целом, сокращение сроков обжалования и повышение лимита расходов не требующих проведения процедур до 300 тысяч рублей и даже типовые контракты имеют смысл.

Но всегда важно не только то что есть, но и то чего нет:
- сохраняется надзорно-контрольный уклон во всем что касается госзаказа причём с сохранением уклона на процедурный контроль вместо контроля за исполнением и достижением поставленных задач;

- сохраняется тренд на унитаризацию полномочий. В контрактной системе все полномочия стянуты на федеральные органы власти, субъекты федерации и муниципальная власть полностью потеряли функции регулирования и новые измения не восстанавливают их даже в самой малой степени. Это вопрос более политический на уровне президента-правительства чем регуляторов;

- отсутствуют федеральные рамочные договора с крупнейшими производителями, как монополистами, так и на олигопольных рынках (до 10-12 игроков когда держат определенный рынок). Фактически пр-во пытается напрямую взаимодействовать только с производителями и продавцами топлива и электроэнергии, но нет аналогичной работы на всех ключевых рынках и поставках. Примеры таких рынков: мониторы компьютеров, томографы, автомобили и многое др.

- адаптация под отдельные рынки идёт от "набитых шишек" и лоббизма. Сейчас отдельно в регулировании выделяются в России только строительство, фарма и ИТ. Каждое по своему и только после того как принятые общие нормы настолько мешают работе что крупнейшие лоббисты включаются на их адаптацию

- сохраняется аукционный уклон в контрактной системе. Закупки чего угодно что не измеряется в простых показателях всё равно сводится к простым показателям и, в итоге, получается так как оно получается.

Я могу добавить ещё многое, но это не в формат Facebook'а. Могу сказать лишь что российская контрактная система развивается в очень изолированной от мира форме. Её главное достоинство - открытость, её главный недостаток - невозможность любой качественной работы

Ссылки:
[1] https://rg.ru/2019/05/07/fz71-dok.html

#goszakaz #44fz #71fz
"Эрдэс баялагийн гэрээний нэгдсэн мэдээллийн систем" [1] в Монголии заработал портал раскрытия договоров добывающих компаний с местными властями, властями страны и на совместную добычу. Всё это часть глобальной инициативы EITI (Extractive Industries Transparency Initiative) [2] по раскрытию контрактов добывающих компаний для граждан.

Инициативы в которой на постсоветском пространстве участвуют Казахстан и Украина [3], а в мире, в принципе, не так уж много стран, в том числе европейских или США - их там почти нет за исключением Великобритании, Германии, Нидерландов и Норвегии.

И вот тут мы подходим к самому главному вопросу к открытости государства или, вернее, открытости элит по отношению к рядовым гражданам. Многие справедливо считают что открытость государства в том что оно делает - это важно, но не самое главное. Взаимоотношения власти и крупнейших корпораций - вот что самое главное. Раскрытие данных о деятельности компаний формирующих ВВП страны - это ключевое в прозрачности власти.

Кроме EITI подобным занимаются в Publish What You Pay [4], а также индивидуальные проекты вроде OpenOIL [5]

Казалось бы, почему в России нет ни одного проекта по открытости добывающей отрасли?

Ссылки:
[1] http://resourcecontracts.mn/
[2] https://eiti.org
[3] https://eiti.org/countries
[4] https://www.pwyp.org/
[5] http://openoil.net/

#opendata #extractives
На всякий случай напоминаю что помимо того что я тут веду канал и пишу на всякие разные темы, я ещё и являюсь директором Инфокультуры (@infoculture).

У нас в Информационой культуре идёт много проектов и прямо сейчас мы расширяем команду. Нужны разработчики и аналитик по работе с данными. Все проекты которые мы делаем, или про общественную пользу, или сами по себе общественной пользой являются.

Вот тут можно увидеть вакансии подробно - https://moikrug.ru/companies/infoculture а вопросы задавать мне в личке в телеграм https://yangx.top/ibegtin или на почту [email protected]

#jobs #data
У моего канала сильно прибавилось читателей, поэтому я, на всякий случай, напомню кто я и о чём пишу здесь.

Я пишу на такие темы как:
- цифровизация государства
- большие данные
- открытые данные
- открытость государства (во всех аспектах)
- государственное управление (его ИТ аспекты и данные, в основном)
- технологии и стартапы когда они близки к этим темам
- приватность, применительно к данным - персональные данные
- госфинансы и госзакупки
- некоммерческие организации (в контексте данных, госфинансов, госзакупок и тд.)

Реже я пишу о: форенсике (цифровом дознании), запретах в ИТ и телекоме, инфобезе (в контексте утечек данных). Это мои давние интересы, но остались они только в контексте работы с данными которая уже много лет как мой приоритет.

О чём я не пишу:
- политика от слова politics, но не policy.
- "горячие темы" всех сортов
- скандалы, интриги, расследования


Кто я и почему об этом всём пишу: основная моя аффиляция - это руководство АНО "Инфокультура" (https://yangx.top/infoculture) и председательство в Ассоциации участников рынка данных (https://yangx.top/aurdata) в котором мы много лет продвигаем тему открытости данных и открытости государства в целом, при этом делая это вне политики, политических партий и тому подобного. Все остальные мои аффиляции можно легко найти и я не буду их перечислять.

Всё что я пишу здесь в канале я транслирую у себя в Facebook https://facebook.com/ibegtin, а большие тексты и "особые публикации" на личном сайте https://begtin.tech

То что можно обсудить или хочется мне прислать для публикации можно сделать в чате https://yangx.top/begtinchat

#about
Для тех кому хочется поработать с действительно-большими-данными, не обязательно структурированными в гомогенный датасет, но так чтобы объём был огромен, вот несколько ключевых источников таких открытых данных:

CommonCrawl (https://commoncrawl.org/)
Результаты индексирования интернета краулером, база если не сравнивая с Яндекс, Google и Bing'ом, но наиболее к ним приближенная. Это миллиарды ссылок, страниц, документов в петабайтах данных

Internet Archive (https://archive.org)
Крупнейший в мире архив веб-страниц ещё и крупнейший в мире архив всего что только возможно оцифрованного и загруженного пользователями. Огромные объёмы документов, баз данных и иных данных хранится именно здесь

AWS Open Data (https://registry.opendata.aws/)

Огромные по объёмы наборы данных собранные и раздаваемые Amazon'ом в их инфраструктуре AWS. Удивительно что ещё ни один российский интернет провайдер до такого не додумался;)

Wikipedia (https://en.wikipedia.org/wiki/Wikipedia:Database_download)

А ещё вернее все данные фонда Викимедиа. Их много, они активно используются, но с ними надо уметь работать, знать как они структурированы и что с этим можно делать.

#opendata #data #bigdata
Дайджест интересных ссылок про данные:
- доступны материалы конференции CSVConf [1] проходившей 8-9 мая в Портленде [2]. Много интересного по дата-журналистике и работе с данными в сообществах и открытым исследованиям
- о том как наблюдать и понимать за экосистемой городских данных в блоге ODI [3]
- о том как открытость конгресса США породила рост недоверия к нему со стороны граждан [4]. Поскольку вся деятельность лоббистов оказалась как на ладони.
- вышла книга "Digital Government. Managing public sector reforms in the Digital Era" [5] за авторством Mariam Lips. Судя по содержанию - там скорее общие слова, описание того что такое digital government. Для тех кто давно занимается этой темой ничего нового не будет, для тех кто только начинает - может быть интересным.
- The state of open data [6] книга за авторством многих мировых активистов в открытых данных, выходит в ближайший месяц. Фактически это сборник статей, но собранный в разделы и с описанием конкретных историй/областей. Предварительно посмотреть в PDF тоже можно [7]
- Missing Numbers [8] блог о данных которые государство должно собирать, но не собирает

Ссылки:
[1] https://csvconf.com/
[2] https://zenodo.org/communities/csvconfv4/?page=1&size=20
[3] https://theodi.org/article/how-to-understand-and-monitor-a-city-data-ecosystem-to-help-make-better-decisions/
[4] https://www.foreignaffairs.com/articles/united-states/2019-04-16/dark-side-sunlight
[5] https://www.routledge.com/Digital-Government-Managing-Public-Sector-Reform-in-the-Digital-Era/Lips/p/book/9781138655652
[6] https://medium.com/@stateofopendata/exploring-the-state-of-open-data-events-and-discussions-in-may-bfee00c2f4f7
[7] http://www.africanminds.co.za/wp-content/uploads/2019/05/The_State_of_Open_Data_9781928331957_web.pdf
[8] https://missingnumbers.org/

#opendata #opengov #data
8 мая прошёл совет при президенте по стратегическому развитию и национальным проектам. Он транслировался в прямом эфире онлайн по Россия24 и сейчас его видеозапись и стенограмма стали доступными [1].

Я лишь частично успел пересмотреть его в прямом эфире и позже перечитывал стенограмму.

Для тех у кого есть время, можно прочитать стенограмму полностью, для тех кто хочет самую суть рекомендую прочитать выступление Чистовой Веры Ергешевной, заместителя председателя Счётной палаты [2], в видео это 1:25:20

Я сожму произнесённое ей тезисами:
- высокие темпы роста заложенные в нац проекте основаны на "оптимистичном сценарии" развития экономики.
- в паспортах нац. проектов кроме двух «Малое и среднее предпринимательство» и «Жильё» нет упоминания их вклада в нац. цели.
- даже если всё что в нац. проектах запланировано будет сделано, всё равно мало шансов что нац. цели будут достигнуты.
- не более 25% (1/4) всех мероприятий в нац. проектах влияют на нац. цели
- значительная часть мероприятий в нац. проектах не отличается от мероприятий в прошлых нац проектах и госпрограммах (безрезультатных).
- в федеральном статнаблюдении нет показателей нац. проектов
- бюджетный манёвр не был совершён, на здравоохранение и образование выделяется недостаточно средств
- проектный подход не работает, а нац. проекты разбросали по многим госпрограммам. Цифровую экономику разбросали на 10 госпрограмм
- создаются непрозрачные структуры в виде государственных АНО и Фондов выводимых из под 44-ФЗ и 223-ФЗ.
- все паспорта нац. проектов проходят корректировку и должны быть скорректированы на достижение национальных целей.

Остальные выступления не так важны, а это впервые прозвучавший чётко взгляд со стороны на то что делает сейчас исполнительная власть на федеральном уровне.

Я добавлю от себя что я вижу:
- нац проекты реализуются также как раньше реализовывались госпрограммы, по модели бюджетного феодализма. Всё больше полномочий "стянуто" на вице-премьеров, всё более техническую функцию выполняют министры, но ничего не меняется в том что разные нац. проекты никак не смешиваются между собой;
- система управления нац. проектами крайне громоздкая и одновременно непрозрачная. За всё это время полноценные документы нац. проектов с описанием хотя бы взаимосвязи мероприятий и показателей нац. проектов так и не появились. про нац. цели я даже не говорю, это кажется какой-то совсем фантастикой если Правительство сможет это сделать;
- Правительство одновременно не идёт на упрощение 44-ФЗ и отказу от "аукционного крена" в 44-ФЗ и вместо этого всё больше распределяет средств не только на единственный источник, но и просто субсидиями без каких-либо контрактных процедур;

В целом ощущения что очень ненулевая вероятностью что все эти нац проекты или перепишут или часть притушат/закроют/разбросают на другие. Вопрос лишь в том в какой форме это будет сделано. Через бюджетное урезание или через привлечение к ответственности?

Ссылки:
[1] http://kremlin.ru/events/president/news/60485
[2] http://kremlin.ru/events/president/news/60485#sel=169:1:yJF,185:3:UZD

#government #budget #govprograms #govprojects
Forwarded from Инфокультура
Stack Overflow опубликовал результаты ежегодного опроса разработчиков всего мира. Вопросы касаются как предпочтений в технологиях, так и образования, карьеры, профессиональных приоритетов, а также выбора музыки для прослушивания во время программирования.

Некоторые выводы:
- Самый быстрорастущий язык программирования среди разработчиков – Python.
- DevOps’ы и инженеры по надёжности сайтов являются самыми высокооплачиваемыми и довольными специалистами своей работой.
- 7,9% опрошенных являются дата-сайентистами, и еще 7,2% опрошенных идентифицируют себя дата-инженеры.
- Около 65% респондентов работают с программным обеспечением с открытым исходным кодом хотя бы раз в год.

Анонимизированные данные опросов будут опубликованы под лицензией Open Database License (ODbL).

Подробнее: https://insights.stackoverflow.com/survey/2019.
Human Rights Watch опубликовали подробный разбор приложения по массовой слежке китайского правительства за уйгурами [1] через специальное мобильное приложение. О нём же статья в Boing Boing с некоторыми подробностями и акцентами [2] на том что то что экспериментируется в Синцзяне против уйгур будет в дальнейшем применяться по всему Китаю.

Разбор интересен во многих аспектах. И в том что в нем глобально нет ничего нового, лишь подтверждение того что и так было известно, но есть много технических подробностей о тех триггерах на которых приложение срабатывает и о том как отслеживают жителей на специальных постах. Правильнее, конечно, говорить не о мобильном приложении, а о полноценноый сложной системе контроля за поведением огромного числа людей.

При этом, конечно, опасения что создатели аппаратных платформ и программных собирают гораздо больше информации чем даже это китайское приложение - вполне обоснованы. Apple, Google, Samsung, Xiaomi, Microsoft все кто делают как цельное решение от железа до начинки (Apple) так и в связке нескольких решений в одно - все они могут реализовать если не то же самое, то очень близкое. Это всё приводит к очень серьёзному вопросу о юрисдикции и самих компаний и, вопрос о котором нельзя забывать, юрисдикции их датацентров. Но это вопрос глобального противостояния спецслужб, глобальных корпораций и иных интересантов к персональным данным граждан. В основном через ретроспективный доступ, от инцидентов.

Китайский же пример важен именно цельностью внедрённой системы. Приложение + система уведомлений + система чекпоинтов + система централизованного мониторинга и ещё многое что остаётся за кадром.

Пример такого тотального контроля, безусловно страшен. Но реализуем только в ситуации сильной диктатуры. Можно ли перенести китайскую модель на другие страны? В те которые смогут выстроить жёсткую модель государственного насилия - безусловно. В те в которых это не получится - бессмысленно.

Но. Я хочу напомнить что то относительное изобилие в котором живёт человечество в последние десятилетия (пару столетий) может оказаться совсем не долговременным периодом истории человечества. В случае глобальных техногенных, антропогенных и иных катаклизмов способных перевернуть отношение общества к институциональному насилию - сценарий когда подобный подход будет реализовываться в ранее благополучных средах, совсем не иллюзорен.

Ссылки:
[1] https://www.hrw.org/report/2019/05/01/chinas-algorithms-repression/reverse-engineering-xinjiang-police-mass-surveillance
[2] https://boingboing.net/2019/05/07/terrorism-is-the-pretense.html

#privacy #surveillance
3-ю часть исследования про персональные данные из государственных информационных систем я не публиковал сам, а передал РБК. Почему? Вы поймёте это прочитав только что вышедшую статью https://www.rbc.ru/politics/15/05/2019/5cdac8469a79479a27bd4eca о том чьи паспортные данные оказались в открытом доступе. И не только паспортные данные.

В открытом доступе я на днях опубликую открытую часть, без методик воспроизведения.

После прошлой публикации мне "оборвали телефон" журналисты так что сразу ответы на несколько вопросов:
1. Всё это было передано журналистам через 8(!) месяцев после того как материалы передавались Роскомнадзору и они даже отвечали в форме "с чем-то мы согласны, с чем-то несогласны". Роскомнадзору это передавалось после того как значительно ранее часть госорганов я предупреждал что такая проблема в их информационных системах есть, не прореагировал _никто_.
2. По наиболее серьёзным утечкам перс-данных органы власти, операторы систем были предупреждены ещё 8 месяцев назад, а то и раньше. Некоторые по нескольку раз. Лично я понял что механизм предупреждения любыми неформальными способами - не работает.
3. В этот раз проблема не в объёме, а в том чьи данные раскрываются.
4. Особо про Минюст. Я скажу максимально вежливо - очень много вопросов по профессионализму тех кто ведёт их реестры. Утечки перс данных - это лишь один из примеров крайне низкого качества данных в целом.

И да, конечно же, это не все государственные информационные ресурсы на которых публикуют персональные данные. Это та их часть до которой у меня дошли руки полгода назад всё задокументировать.

Самый быстрый способ со мной связаться это почта [email protected] или телеграм https://yangx.top/ibegtin
Я обычно, почти никогда не беру звонки с городских телефонов, и могу не взять звонок с неизвестного телефона если сижу на совещании. Поэтому лучше писать чем звонить.

Но в принципе в статье в РБК всё понятно изложено.

#privacy #security #personaldata
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
На прошедшем Дне открытых данных Юлия Духовнова рассказала о планах ФНС России по публикации в апреле открытых данных налоговой статистики в муниципальном разрезе.

В конце апреля реестр открытых данных ФНС России действительно был дополнен и теперь можно использовать данные о:

- налоговой базе и структуре начислений по налогу, уплачиваемому в связи с применением упрощенной системы налогообложения в разрезе муниципальных образований;
- налоговой базе и структуре начислений по единому сельскохозяйственному налогу в разрезе муниципальных образований;
- налоговой базе и структуре начислений по единому налогу на вмененный доход для отдельных видов деятельности в разрезе муниципальных образований.

Единственное, на мой взгляд, пока не хватает привязки муниципалитетов к регионам, указания наименований муниципалитетов в едином формате и в датасетах отдельных регионов не совсем корректна структура csv. Думаю, что в следующих версиях наборов эти недочеты будут устранены.

А вообще получается странная ситуация: региональных бюджетов на портале "Электронного бюджета" все еще нет (хотя должны были быть с 1 января 2018 года, а с 1 января 2020 года должны быть уже и муниципальные бюджеты, но будут ли?), а муниципальная налоговая статистика уже есть. 🙂

https://www.nalog.ru/opendata/