Ivan Begtin
8.05K subscribers
1.96K photos
3 videos
102 files
4.67K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
加入频道
В Бразилии утечка данных о 16 миллионах пациентах с COVID-19 [1] причём не через взлом, а "криворукость" сотрудника госпиталя в Сан-Пауло. Затронуло президента страны и 17 губернаторов.

А в Intertrust выпустили отчёт о безопасности приложений используемых для слежки при COVID-19, у 85% есть риски утечки данных [2].

Не болейте, болезнь создает новые риски слежки.

Ссылки:
[1] https://www.zdnet.com/article/personal-data-of-16-million-brazilian-covid-19-patients-exposed-online/
[2] https://www.intertrust.com/news/intertrust-releases-2020-security-report-on-global-mhealth-app-threats/

#privacy #covid19
Тем временем исследователи, активисты и ещё многие подписывают письмо о том что все данные о вакцинах от COVID-19 должны быть открыты и прозрачны [1]. Инициаторы письма The GovLab и Federation of American Scientists.

Ранее об этом же писали The Washington Post [2] то что требованием для всех вакцин должна быть полная открытость данных о проведении испытаний.

Необходимо ли аналогичное требование в России? Я считаю что безусловно необходимо. Но пока есть проблемы даже с тем чтобы получить просто достоверные данные по заболеваемости и смертности, об этом мы говорили на секции про открытые данные при COVID-19 в России на ОГФ [3]

Ссылки:
[1] https://openvaccines.thegovlab.org/
[2] https://www.washingtonpost.com/opinions/2020/12/04/fda-should-condition-any-vaccine-approval-open-trial-data/
[3] https://www.youtube.com/watch?v=W9HP2e2knog

#opendata #covid19 #data
В США опубликовали официальные данные по загрузке больниц во время эпидемии COVID-19 [1] с гранулярностью до каждой больницы и по неделям начиная с 31 июля 2020 года.

Также можно обратить внимание что на этом же портале HealthData.gov раскрывается 188 наборов данных связанных с COVID-19 [2] и 4634 по системе здравоохранения в целом [3], причём не менее половины данных поступает из систем здравоохранения отдельных штатов, а сам портал создан U.S. Department of Health которые также ведут HHS Protect Public Data Hub [4] где публикуются дашборды статистики, но сами данные, обязательно, публикуются на HealthData.gov, а уже оттуда транслируются на другие официальные государственные ресурсы.

Ссылки:
[1] https://healthdata.gov/dataset/covid-19-reported-patient-impact-and-hospital-capacity-facility
[2] https://healthdata.gov/search/type/dataset?query=covid-19&sort_by=changed&sort_order=DESC
[3] https://healthdata.gov/search/type/dataset
[4] https://protect-public.hhs.gov/

#opendata #data #covid19 #usa #health
В Nature статья о запросе учёных на полностью открытый обмен данными о коронавирусе [1]. 29 января сотнями ведущих учёных было подготовлено и подписано открытое письмо [2] о том что данные о расшифровке геномов штаммов SARS-CoV-2 должны публиковаться на портале International Nucleotide Sequence Database Collaboration (INSDC) [3] и быть доступными всем желающим.

Это необходимо потому что без этого невозможно поддерживать высокий темп разработки мер противодействия COVID-19.

Откуда возникло это письмо? В статье подробно рассматривается текущая инфраструктура раскрытия геномных данных. Основным порталом для их сбора является GISAID (Global Initiative on Sharing Avian Influenza Data) [4] созданный в форме государтсвенно-частной инициативы [5] правительствами Германии, США, Сингапура, Бразилии, компании Seqirus и фонда Sanofi Pasteur’s Foundation for Influenza Epidemiology.

GISAID изначально был платформой не про открытие данные, а про обмен данными (data sharing). Главная причина в том что учёные работающие над исследованиями хотят точно знать кто скачивал и использует их данные и быть уверенными что результаты их работы
не будут использованы без ссылки на них.

Авторы письма не предлагают открыть данные GISAID, но получится ли создать более полную базу данных и полностью открытую, вот в чём вопрос. Впрочем проблема COVID-19 - это, действительно, мировая проблема и хочется надеяться что принципы ограничения доступа к информации применяемые в "условно-мирное время" могут быть более открытыми во время пандемии.


Ссылки:
[1] https://www.nature.com/articles/d41586-021-00305-7
[2] https://www.covid19dataportal.org/support-data-sharing-covid19
[3] http://www.insdc.org/
[4] https://www.gisaid.org/
[5] https://www.gisaid.org/about-us/public-private-partnerships/

#opendata #openaccess #fair #covid19
Знаете ли Вы что...
Германское приложение по отслеживанию контактов при COVID-19 [1]:
- сделано не Правительством Германии, а компанией SAP в консорциуме с 12 компаниями
- при этом продвигается Правительством Германии [2]
- его исходный код полностью открыт [3] и разработка ведется в открытом режиме
- в нем абсолютно нет никаких трекеров [4], включая Google Firebase и Crashlytics (привет Минцифре в приложении которого они есть [5])

Итого:
- данные собираются не государством
- код открыт и вся разработка видна и публична
- трекеров нет

Другие примеры:
- Австрия, приложение Stopp Corona [6], исходный код открыты с апреля 2020 года [7], создатели - Австрийский красный крест. Трекеров нет [8]
- Австралия, приложение COVIDSafe [9], исходный код раскрыт [10], используют один трекер [11] Google Firebase
- Индия, приложение Aarogya Setu App [12], исходный код раскрыт [13], используют те же трекеры что и российское Google Firebase и Google CrashLytics

и так ещё более 20 официальных государственных приложений для отслеживания COVID-19 разрабатываются полностью с открытым кодом. Некоторые включают трекеры, в основном, Google Firebase, но тогда их использование можно увидеть в исходном коде и уже предметно говорить с разработчиками когда это использование необосновано.

Лично я считаю что весь код созданный за средства государственных бюджетов должен раскрываться и мобильные приложения не исключение. Если даже в Марокко это делают [15], то, казалось бы, что мешает Минцифры России начать публиковать код общественно значимых проектов и перевести их разработку в открытый режим?

Ссылки:
[1] https://www.coronawarn.app/en/
[2] https://www.bundesregierung.de/breg-de/themen/corona-warn-app/corona-warn-app-englisch
[3] https://github.com/corona-warn-app/
[4] https://reports.exodus-privacy.eu.org/en/reports/de.rki.coronawarnapp/latest/
[5] https://reports.exodus-privacy.eu.org/en/reports/com.minsvyaz.gosuslugi.stopcorona/latest/
[6] https://play.google.com/store/apps/details?id=at.roteskreuz.stopcorona
[7] https://github.com/austrianredcross/stopp-corona-android
[8] https://reports.exodus-privacy.eu.org/en/reports/164043/
[9] https://covidsafe.gov.au/
[10] https://github.com/AU-COVIDSafe
[11] https://reports.exodus-privacy.eu.org/en/reports/161910/
[12] https://aarogyasetu.gov.in/
[13] https://github.com/nic-delhi/AarogyaSetu_Android
[14] https://reports.exodus-privacy.eu.org/en/reports/140895/
[15] https://github.com/Wiqaytna-app

#mobile #apps #covid19
Google обновили "Требования к приложениям, имеющим отношение к коронавирусной инфекции COVID-19" [1].

Теперь упоминание COVID-19 в приложении возможно только в случаях если:

1. Приложения, содержащие информацию о болезни, лечении, вакцинировании и тестировании, а также другие данные, связанные с коронавирусной инфекцией COVID-19.
2. Приложения, созданные для помощи в борьбе с коронавирусной инфекцией COVID-19, ее сдерживании, исследованиях, обучении или подготовке в этой сфере.
3. Приложения, созданные для оказания услуг, непосредственно связанных с коронавирусной инфекцией COVID-19, например услуг в области здравоохранения, предоставления социальной поддержки (выплат, продовольственных талонов) или выдачи кредитов.

Приложения должны иметь подтверждение:

1. Письмо на официальном бланке соответствующего государственного учреждения или организации. Оно должно включать название приложения и название его пакета.
2. Государственный регистрационный номер организации здравоохранения (NPI в США, NIN в Индии и т. д.). Применимо не для всех стран.

Также были обновлены разделы "Требования к конфиденциальности" и "Видимость приложения и информирование пользователя".

Похоже что в ближайшее время начнется чистка Google Play от приложений не соответствующих этим требованиям.

Российские приложения, кстати, также необходимо будет проверить на соответствие и, скорее всего, обновить.

Ссылки:
[1] https://support.google.com/googleplay/android-developer/answer/9889712#privacy_requirements

#privacy #covid19
Новый проект Tracing the tracers [1] от Algorithmwatch посвящён мониторинг автоматизированных систем на время пандемии COVID-19.

Объекты мониторинга:
- приложения отслеживания контактов и уведомлений о контактах;
- носимые, биометрические и иные устройства и технологии для мер социального дистанцирования;
- паспорта вакцинации;
- приложения с ИИ для проверки симптомов, предсказания риска заражения или отслеживания безопасности вакцин;
- интеллектуальный анализ агрегированных данных о передвижении;
- QR коды для отслеживания контактов и применения мер поддержания общественного здоровья;
- автоматизированные системы слежки в специальных контекстах (рабочие места, образование и тд.)

Результаты по форме подачи будут похожи на доклад ADM Systems in the COVID-19 Pandemic: A European Perspective [2] и, ожидаемо, будут охватывать только европейские страны.

Параллельно с января идёт проект Vaccine passports and COVID status apps [3] в институте Ады Лавлейс (Ada Lovelace Institute) в Великобритании. Он идёт в виде экспертных панелей обсуждения практических и этических вопросов мониторинга во время COVID-19. А также множество других инициатив, смысл которых в ревизии мер предпринятых в 2020 году по сбору персональных данных и созданию систем автоматизации принятия решений.

Ссылки:
[1] https://algorithmwatch.org/en/project-launch-tracing-the-tracers-adm-covid/
[2] https://algorithmwatch.org/en/project/automating-society-2020-covid19/
[3] https://www.adalovelaceinstitute.org/project/vaccine-passports-covid-status-apps/

#ai #policy #covid19 #research #adm
В Nature письмо учёных с запросом на аудит приложений для отслеживания контактов с обоснованными вопросами о их прозрачности, эффективности и пригодности к общественному аудиту.

Запрос этот не первый, не последний, и явно будет нарастать в этом году. Эти приложения (вернее их создатели) просто таки напрашиваются на тщательную проверку результативности.

Ссылки:
[1] https://www.nature.com/articles/s41591-021-01236-6

#privacy #covid19
13 латиноамериканских стран поменяли свои законы о госзакупках чтобы скрыть сведения о сделках о покупке вакцин. Всё это в расследовании [1] Red Palta (Латиноамериканская сеть журналистов по вопросам транспарентности и борьбы с коррупцией)

Вот так многие страны десятилетия идут в сторону прозрачности госрасходов, а потом во время пандемии всё это стремительно схлопывается. Потому что у пандемии относятся почти как к военному положению и потому что игра идёт по тем правилам кто сильнее. Когда крупный международный фарм. бизнес задаёт правила игры, то у правительств стран нет выбора (мало выбора) кроме как скрывать такие сделки. А скрывают их не столько от граждан, сколько от других стран чтобы те не знали реальных цен и им было бы сложнее торговаться.

Ссылки:
[1] https://www.redpalta.org/post/benefits-to-pharmaceutical-companies-in-the-purchase-of-vaccines/

#opendata #opengov #secrecy #covid19
Для тех кто интересуется о том как устроены приложения по мониторингу COVID-19 в других странах и какие есть методики их анализа и результаты можно узнать из декабрьского исследования Unmasked II [1] от Citizenlab посвящённого приложениям PeduliLindungi в Индонезии и приложений StaySafe PH и COVID-KAYA в Филлипинах.

По сравнению с другими исследованиями и анализом, авторы провели полноценный анализ безопасности приложений, разобрали код и даже смогли вытащить данные из базы Firebase которое филиппинское приложение использовало для отправки сведений о пользователях. В октябре 2020 года исследователи вначале нашли код аутенификации внутри запросов от приложения, а потом с его помощью вытащили из базы Firebase 190 тысяч записей с координатами филлипинских пользователей. Причём разработчик, судя по всему, так и не смог исправить эту ошибку до конца хотя и около месяца пытался это сделать (подробности в исследовании).

Мы в своём исследовании "Приватность государственных мобильных приложений в России" [2] сознательно не проводили такого анализа информационной безопасности, эта тема ближе к компаниям специализирующимся на проверках безопасности, пентестах и так далее. Но это совсем не значит что российские госприложения работающие с данными граждан сделаны так хорошо что там такие проблемы не могут быть.

Ссылки:
[1] https://citizenlab.ca/2020/12/unmasked-ii-an-analysis-of-indonesia-and-the-philippines-government-launched-covid-19-apps/
[2] https://privacygosmobapps.infoculture.ru/

#privacy #covid19 #security #leaks
Тем временем в Великобритании рапортуют о 500 тысячном расшифрованном геноме вируса [1] и новой технологии ускоренной расшифровки геномов вариантов вируса [2]. А также о том что правительство готово помогать другим странам в развертывании этой технологии.

Интересно выложат ли всю эту базу данных в открытый доступ в этом году? Думаю да

Ссылки:
[1] https://www.gov.uk/government/news/uk-surpasses-500000-coronavirus-covid-19-tests-genomically-sequenced
[2] https://www.gov.uk/government/news/groundbreaking-new-technology-to-detect-known-variants-of-concern

#data #covid19
Продолжая рубрику интересных наборов данных, самое что ни на есть актуальное по COVID-19 - архивы русскоязычных чатов антипривочников. 1,1 млн записей (сообщений чуть меньше), 29к уникальных юзеров. Все данных сохранены в архив Хаба открытых данных [1], а также доступны в первоисточнике [2].

Источник публикации не указал условия распространения набора данных, поэтому он пока помечен как Public Domain.

Набор данных будет интересен многим исследователям социальной сферы во время COVID-19

Ссылки:
[1] https://hubofdata.ru/dataset/covid-19-antichat
[2] https://twitter.com/u_sockeye/status/1409224639713320960?s=09

#datasets #covid19
Свежие события о том что происходит в мире вокруг закупок вакцин:
- В Австралии засекретили контракт с AstraZeneca [1] и власти активно сопротивляются запросам независимых сенаторов и журналистов на получение любых сведений о контрактах на поставку вакцин и данные мониторинга заболеваемости в странах тихоокеанского региона
- в Испании "большая четверка" консультантов в мире (Big Four) получила контрактов 83 миллиона евро время пандемии за 2020 год [2]
- в Боснии власти перевели в режим "конфиденциальности" контракт с CinoPharm на поставку полумиллиона вакцин [3]

В принципе, почти во всех странах в мире закупки при COVID-19 сопровождаются теми или иными скандалами. И только в России до сих пор, нет даже маркировки контрактов ушедших на противодействие COVID-19, непрозрачны расходы на производство и поставку вакцин.

Однако, если в России, вакцинация и эти траты - это внутреннее дело, поскольку все вакцины производятся самостоятельно, то в большинстве других стран, это вопрос макрополитический, поскольку вакцины закупаются в России, у AstraZeneca, CinoPharm и тд, и тут сила на стороне продавца, покупатели идут на многие условия, включая секретность сумм и особые условия договоров.


Ссылки:
[1] https://www.abc.net.au/news/2021-07-05/australia-covid-astrazeneca-deal-withheld-national-security/100261920
[2] https://confilegal.com/20210707-las-big-four-obtuvieron-83-m-en-contratos-publicos-durante-el-ultimo-ano/
[3] https://balkaninsight.com/2021/07/08/bosnia-entitys-secrecy-over-vaccine-procurement-draws-criticism/

#openness #covid19
Статистика по заболеваемости COVID-19 — одна из самых злободневных тем в России. Граждане не доверяют государственным органам, активисты и СМИ проводят расследования, где утверждается, что число переболевших уже перевалило за 29 миллионов. Не буду сейчас утверждать, правдивы ли официальные данные или надо верить альтернативным оценкам. Однако факт в том, что за последние десятилетия наше государство, в особенности социальный блок правительства, не сделало ничего, чтобы этого доверия стало больше. Данные о качестве жизни скрываются столь же тщательно, как, например, статистика преступлений...

В Forbes вышла моя колонка " Нездоровая закрытость: почему государство не спешит делиться данными с гражданами" [1]

Ссылки:
[1] https://www.forbes.ru/obshchestvo/435565-nezdorovaya-zakrytost-pochemu-gosudarstvo-ne-speshit-delitsya-dannymi-s

#opendata #covid19 #data
К вопросу о приватности приложений по отслеживанию заболевших COVID-19, в сентябре U.S. Government Accountability Office (GAO), орган высшего парламентского аудита США, в каких-то функциях аналог российской Счетной палаты. Они выпустили доклад Exposure Notification: Benefits and Challenges of Smartphone Applications to Augment Contact Tracing [1] с анализом того какие приложения создавались властями штатов США и какие основные проблемы с ними возникали.

Весь ключевой акцент на приватности, безопасности и технических ограничениях этих приложений. И, в принципе, это хорошо составленный доклад с объяснением того как может осуществляться парламентский контроль и надзор за технологическими инструментами в подобных ситуациях.

Здесь надо оговориться что GAO в США часто выступает в роли мозгового центра. Увы, в России его аналога нет и неизвестно кто такой анализ может проделать.

Ссылки:
[1] https://www.gao.gov/products/gao-21-104622
[2] https://www.gao.gov/assets/gao-21-104622.pdf

#privacy #covid19 #gao #usa
По поводу Роснано я не могу не вспомнить о том как Минэкономразвития формировало Реестр некоммерческих организаций, в наибольшей степени пострадавших в условиях ухудшения ситуации в результате распространения новой коронавирусной инфекции [1] где сейчас перечисленно 15852 организации.

В том числе этот реестр обновляли в апреле 2021 года [2].

Этот реестр создавался по Постановлению Пр-ва РФ от 11 июня 2020 г. № 847 [3], по сути в нем было прописано что его формируют ФОИВы по собственным _непрозрачным критериям_.

Сейчас это постановление утратило силу и вместо него формируют новый реестр СО НКО, его правила формирования прописаны в Постановлении Правительства Российской Федерации от 30.07.2021 № 1290 "О реестре социально ориентированных некоммерческих организаций" [4]

Так вот вопрос - кто войдет в этот реестр?

Например, в текущем реестре присутствуют НКО находящиеся в 100% подчинении Правительству или Госкорпорации и не являющиеся благотворительными, а, по сути, выполняющие функции "агентов Правительства". У того же Роснано всё ещё есть Фонд инфраструктурных и образовательных программ [5] на котором сейчас значительная часть проектов Роснано. Так вот в апреле 2021 г. он был включён Минэкономразвития России в перечень этих самых наиболее постарадавших НКО [6]. Чтобы было понятнее, у ФИОПа выручка за 2020 год 3.4 миллиарда рублей, а за 2019 г. 1.8 миллиардов рублей. Всего на 2020 год у ФИОП 25 млрд. рублей активов [7] и это не единственная из крупнейших госНКО "особенно постарадавших от коронавируса".

Я писал о "косяках" реестров СОНКО ещё в июне 2020 года в колонке для РБК [8], с той поры ничего не изменилось.

Здесь должна быть какая-то мораль и завершающая мысль, но всё не могу сформулировать и уже почти не удивляюсь.

Ссылки:
[1] https://data.economy.gov.ru/analytics/sonko-affected/all
[2] https://economy.gov.ru/material/dokumenty/reestr_nko.html
[3] http://pravo.gov.ru/proxy/ips/?docbody=&prevDoc=102710737&backlink=1&&nd=102751
[4] http://publication.pravo.gov.ru/Document/View/0001202108020026?index=0&rangeSize=1
[5] http://fiop.site
[6] https://data.economy.gov.ru/analytics/sonko-affected/all
[7] https://bo.nalog.ru/organizations-card/2943128
[8] https://www.rbc.ru/opinions/society/17/06/2020/5ee8ce139a79479edce77585

#ngo #sonko #covid19