Ivan Begtin
8.1K subscribers
2K photos
3 videos
102 files
4.72K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
加入频道
Новый проект Tracing the tracers [1] от Algorithmwatch посвящён мониторинг автоматизированных систем на время пандемии COVID-19.

Объекты мониторинга:
- приложения отслеживания контактов и уведомлений о контактах;
- носимые, биометрические и иные устройства и технологии для мер социального дистанцирования;
- паспорта вакцинации;
- приложения с ИИ для проверки симптомов, предсказания риска заражения или отслеживания безопасности вакцин;
- интеллектуальный анализ агрегированных данных о передвижении;
- QR коды для отслеживания контактов и применения мер поддержания общественного здоровья;
- автоматизированные системы слежки в специальных контекстах (рабочие места, образование и тд.)

Результаты по форме подачи будут похожи на доклад ADM Systems in the COVID-19 Pandemic: A European Perspective [2] и, ожидаемо, будут охватывать только европейские страны.

Параллельно с января идёт проект Vaccine passports and COVID status apps [3] в институте Ады Лавлейс (Ada Lovelace Institute) в Великобритании. Он идёт в виде экспертных панелей обсуждения практических и этических вопросов мониторинга во время COVID-19. А также множество других инициатив, смысл которых в ревизии мер предпринятых в 2020 году по сбору персональных данных и созданию систем автоматизации принятия решений.

Ссылки:
[1] https://algorithmwatch.org/en/project-launch-tracing-the-tracers-adm-covid/
[2] https://algorithmwatch.org/en/project/automating-society-2020-covid19/
[3] https://www.adalovelaceinstitute.org/project/vaccine-passports-covid-status-apps/

#ai #policy #covid19 #research #adm
Германское правительство расширяет требования по обязательной открытости данных госорганов и госструктур. 10 февраля принят акт [1] который расширяет регулирование 2017 года и включает требования по публикации открытых данных организациям "indirect administration", не являющихся министерствами. Например, это разного рода институты, корпорации и фонды и иные структуры, за исключением малых организаций.

Для этого будут наняты координаторы открытых данных, но они будут обязательны только для организаций с административным аппаратом более 50 человек (таких организаций не так много).

Ссылки:
[1] https://www.euractiv.com/section/digital/news/german-government-will-make-more-data-publicly-available-with-new-law/

#opendata #germany #policy
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
Знаете ли вы, что в середине декабря Росмолодежь провела онлайн Хакатон идей? Этот хакатон, оплаченный из бюджетных средств, стоил нам, гражданам, 16 млн руб.

Заявки на хакатон принимались с 16 ноября. Контракт заключили 23 ноября со сроком исполнения до конца 2020 года. Результатов хакатона на сайте хакатона нет, официальный пресс-релиз Росмолодежи с результатами также не нашла. Никакой информации о менторах, жюри, участниках, победителях и количестве победителей нет.

Один из победителей (Академия МЧС) на своем сайте пишет, что на хакатон поступило 1500 заявок.

"Опубликованное" на сайте видео с трансляцией трех дней хакатона недоступно. В сообществе ВК 269 участников, с 11 декабря (даты начала хакатона) публикаций в сообществе не было. В FB - 6 участников, с конца ноября публикаций не было.

Телефон "горячей линии" хакатона молчит, телефон Росмолодежи также не отвечает.

Интересно, что значимость "цены контракта" в закупке составляла 60%. Победитель в своей заявке снизил стоимость работ на 1,5 млн руб., а в день начала проведения хакатона было подписано доп. соглашение, увеличивающее стоимость контракта на 1,4 млн руб. (10% - максимально допустимое увеличение суммы контракта доп. соглашением).

Дата доп. соглашения (11.12) в скане написана карандашом, а размещено в системе ЕИС доп. соглашение только после завершения хакатона (15.12).

Еще интересно, что в контракте отсутствует смета/стоимость работ. То есть невозможно определить, сколько из 15,9 млн руб. составляет оплата работ поставщика, а сколько - призовой фонд хакатона.

Ознакомиться с контрактом можно тут: https://zakupki.gov.ru/epz/contract/contractCard/common-info.html?reestrNumber=1770367235120000062
В NewYorker статья "Who Should Stop Unethical A.I.?" [1] о нарастающей тревоге учёных за результаты разработки искусственного интеллекта. Чем лучше идут исследования, чем совершеннее становятся системы автоматического принятия решения, тем больше опасений. Многие начинают избегать направления исследований которые потенциально могут привести к появлению оружия нового поколения.

Там же отсылки про саморегулирование научного сообщества, как это было с исследованиями плутония в 1941 году, когда учёные сознательно, придерживали их до конца войны или с исследованиями связанными с возможностью создания биооружия. Главные риски в том что почти все исследования в области ИИ имеют двойное назначение.

Сейчас Вы разрабатываете автономных дронов для доставки грузов вместо курьеров, а через несколько лет они могут разрушать инфраструктуру противника в гибридных войнах. Сейчас Вы проектируете системы распознавания лиц, поведения и угроз для выявления преступников, а через несколько лет они могут использоваться диктатурами для подавления протестов населения и ужесточения контроля за гражданами. И так далее, это длинный список всех рисков и последствий.

И, действительно, в случае ИИ до сих пор нет "своей Хиросимы", большого знакового события-катастрофы с участием ИИ или автоматической системы принятия решения способного напугать человечество.
Если оно произойдёт то мы получим мощнейший всплеск нео-луддизма с тотальным ограничением всех ИИ исследований по всему миру.

Ссылки:
[1] https://www.newyorker.com/tech/annals-of-technology/who-should-stop-unethical-ai

#ai #ethics
Для тех кто очень любит расследования, но не всегда имеет нужные инструменты под рукой Aleph Data Desktop [1] [2] изначально создано для проекта Aleph с данными расследований OCCRP, а также само по себе является простым инструментом построения диаграм взаимосвязей разных сущностей. Удобный и бесплатный инструмент не только для тех кто занимается цифровым дознанием на общественных началах, но и тем для кого это профессиональная деятельность. Инструмент не идеальный, очень простой, всё ещё в разработке, но быстрого описания кейсов более чем удобный.

С тем как развивается стек инструментов OCCRP я бы даже предположил что через 2-3 года их инструменты начнут использовать в правоохранительных органах как базовый инструментарий.

Хорошая тема для мероприятий - это совместно превращать в инфографику расследования в виде текстов.

Ссылки:
[1] https://github.com/alephdata/datadesktop
[2] https://docs.alephdata.org/guide/building-out-your-investigation/network-diagrams

#opendata #opensource #datajournalism
У меня всё не доходили руки посмотреть на ВПЦТ (Ведомственные программы цифровой трансформации) опубликованные на сайте ФГИС КИ [1] и вот, наконец, дошли. Это такие документы которые должны были бы заменить планы информатизации ФОИВов. Конечно, они интересны, в первую очередь, самим сотрудникам ФОИВов, системным интеграторам и в меньшей степени журналистам и аналитикам. В меньшей степени потому что все эти ВПЦТ не про смысл, а про сочетание деньги-показатели.

Но даже про это слишком много вопросов возникает:
1. Все ВПЦТ публикуются как PDF документы, хотя состоят целиком и полностью из таблиц. И работать с ними надо исключительно как с таблицами, а в текущем виде они непригодны к машинному анализу ни в какой форме.
2. Очень удивительно наблюдать не просто PDF документы, но PDF документы в виде сканов. У ФНС России [2] или Минтранса РФ [3]. Вроде бы 21 век на дворе, цифровая трансформация и всё такое. Даже на портале госзакупок документы публикуются с цифровыми подписями, а тут сканы.
3. Некоторые документы пустые. Например, ВПЦТ Ространснадзора включает только сопроводительное письмо [4], без приложения.

Сказать что это плохо - ничего не сказать. Форма публикации документов ужасает и это если ещё не заглядывать в их содержание. Потому что есть подозрение что если заглянуть, то ситуация окажется ещё хуже.

Это ведь вопрос не только культуры работы с документами. Это вопрос их доступности для надзорных органов. Когда-то, когда деревья были большими, а я только-только столкнулся с тем как делаются госпроекты, один опытный чиновник объяснял мне как устроена приёмка отчетности НИРов и НИОКРов. "Вот смотри", - говорил он. "Вот это отчет за НИР на 2 миллиона рублей и тут 200 страниц, а вот отчет по вашему НИРу за 10 миллионов и всего 150 страниц. А надо хотя бы 500, а лучше 1000 и больше. "

Зачем так много? У этого безумия есть практическое объяснение. Проверки контрольно-надзорных органов, таких как органы прокуратуры или контрольно-счетные палаты ограничены, как правило, 2 неделями и 2-3 вовлечёнными сотрудниками. Чем больше им проделывать работу по переводу из скана/бумаги в текст, чем больше им читать документы на бумаге, тем больше возможность скрыть что-либо или понадеяться что в отведенный срок нечто скрываемое найдено не будет.

Поэтому, лично я, вот уже много лет, когда сталкиваюсь с документами запредельного объёма или с тем что они публикуются сканами, исхожу из того что авторам есть что скрывать.

Так что же скрывается внутри программ ВПЦТ?

Ссылки:
[1] https://portal.eskigov.ru/documents?category=vpct_programs
[2] https://portal.eskigov.ru/system/documents/uploads/000/938/686/original/%D0%92%D0%9F%D0%A6%D0%A2_%D0%A4%D0%9D%D0%A1.pdf
[3] https://portal.eskigov.ru/system/documents/uploads/000/961/362/original/ВПЦТ_Минтранс.pdf
[4] https://portal.eskigov.ru/system/documents/uploads/000/939/549/original/ВПЦТ_Ространснадзора.pdf

#budgets #digital #documents #government
Для тех кто ищет вдохновения в визуализации данных, подборка примеров и инструментов:
- USAFacts [1] - большой некоммерческий проект по визуализации показателей экономики США. Создан по инициативе Стиве Баллмера, бывшего главы Майкрософт. Также наглядно визуализируют тренды по COVID-19 [2]
- DataUSA [3] - визуализация государственных данных США об экономике, занятости и образованиии с детализацией до штата, города, университета и профессии. Также визуализируют данные по COVID-19 наглядно [4]
- GapMinder [5] - наглядная визуализация, зачастую, неочевидных данных от одноимённой некоммерческой организации
- Our World In Data [6] - визуализация данных совмещённая с лонгридами и акцентами на глобальных мировых проблемах.
- Atlas of Economic Complexity [7] - атлас экономической сложности, с визуализацией импорта и экспорта стран вместе с анализом сложности их экономик и несколькими способами наглядной визуализации.
- The Pudding [8] - коллекция необычных визуализаций на необычные темы.
- Oligrapher [9] - инструмент визуализации связей и влияния между людьми от команды LittleSis [10], общественного проекта по мониторингу лоббистов в США.
- Examples of Fiscal Data Visualization [10] - большая подборка примеров визуализации данных по госфинансам (расходы, доходы, дефицит, контракты и так далее). Более 230 примеров
- Timeplots [11] - коллекция наглядных постеров "Смерть и налоги" с визуализацией бюджета США и множество других постеров с историей органов власти. К сожалению не обновляют их уже более 6 лет. Скорее всего потому что сделали фокус на интерактивную инфографику для больших межгосударственных и государственных организаций [12]


Ссылки:
[1] https://usafacts.org/
[2] https://usafacts.org/issues/coronavirus/
[3] https://datausa.io
[4] https://datausa.io/coronavirus
[5] https://www.gapminder.org/
[6] https://ourworldindata.org/
[7] https://atlas.cid.harvard.edu/
[8] https://pudding.cool/
[9] https://littlesis.org/oligrapher
[10] https://dx.doi.org/10.6084/m9.figshare.1548331.v1
[11] https://www.timeplots.com/
[12] https://www.graphicacy.com/

#dataviz #visualization
Публикация "Collective bargaining on digital platforms and data stewardship" [1] за авторством Astha Kapoor. Публикация актуальная не только для азиатских или европейских стран, но и для России, и в отношении всех компаний которые практикуют корпоративный алгоритмический менеджемент за рабочей силой (агрегаторы такси, доставки еды и так далее).

Автор обозначает проблему несправедливости управления персоналом и рассматривает одно из решений в виде community data stewards выступающих кем-то вроде представителей профсоюза работников наблюдающие за решениями принимаемыми автоматизированной/автоматической системой.

Ссылки:
[1] http://library.fes.de/pdf-files/bueros/singapur/17381.pdf

#ai #workforce #data
В Nature письмо учёных с запросом на аудит приложений для отслеживания контактов с обоснованными вопросами о их прозрачности, эффективности и пригодности к общественному аудиту.

Запрос этот не первый, не последний, и явно будет нарастать в этом году. Эти приложения (вернее их создатели) просто таки напрашиваются на тщательную проверку результативности.

Ссылки:
[1] https://www.nature.com/articles/s41591-021-01236-6

#privacy #covid19
Тем временем Facebook, не дожидаясь принятия австралийского закона о выплатах СМИ, просто запретил публиковать ссылки на на австралийские СМИ, а под бан попали множество других организаций [1]. А довольно быстро выяснился главный бенефициар нового регулирования - это ABC (Australian Broadcasting Company) [2], государственный медиа-концерн Австралии, сравнимый с BBC в Великобритании или с РИА Новостями (до декабря 2013 года).

А вот, например, Microsoft поддержали австралийские власти [3], но потому что их бизнес модель куда меньше зависит от рекламного рынка.

Впрочем совсем не очевидны последствия, в том числе для самих австралийских СМИ. Если же австралийский регуляторный эксперимент удастся, то велика вероятность его повторения в других странах, в том числе в России.

Ссылки:
[1] https://www.theguardian.com/technology/2021/feb/18/facebook-blocks-health-departments-charities-and-its-own-pages-in-botched-australia-news-ban
[2] https://www.theverge.com/2021/2/19/22291406/abc-news-app-top-charts-facebook-ban-australia
[3] https://blogs.microsoft.com/on-the-issues/2021/02/11/endorsement-australias-proposal-technology-news/

#tech #regulation
Журналисты нашли в плане законопроектной деятельности Минфина России [1] то что Министерство финансов до октября 2021 года внесет в правительство законопроект о создании «закрытой» части в государственном информационном ресурсе финансовой отчетности компаний.

План был подписан и опубликован 17 февраля 2021 года [2], то есть совсем свежий. Опубликован, ожидаемо, в виде отсканированного документа, зато (вздох) с подписью министра Силуанова.

При том что ещё в 2018-2019 года они умели публиковать его, если не таблицей, то хоть текстом [3] [4], а с 2020 года уже сканы [5]. Но это я отвлекаюсь от сути, хотя предоставление сканами и важно с точки зрения находимости ключевых документов

На самом деле известно об этом было ещё полтора месяца назад. Постановлением Правительства N2386 от 30.12.2020 г. была утверждена госпрограмма «Управление государственными финансами и регулирование финансовых рынков» [6] и там этот законопроект был прописан как один из результатов мероприятия 3.5., но, указано, что её инициатором был сам Минфин России.

В чем проблема этого регулирования - это очередной шаг в снижении открытости сведений о контрагентах. С размытыми формулировками можно скрывать какие-угодно компании от публичного раскрытия информации о их хозяйственной деятельности.

В целом, тренд на закрытие ключевой информации о государственных и окологосударственных организациях сохраняется. И в этом, конечно, хорошего мало.

Ссылки:
[1] https://www.rbc.ru/economics/20/02/2021/602fe18d9a79470a153f2bc2
[2] https://minfin.gov.ru/ru/document/?id_4=132589-plan_zakonoproektnoi_dyeyatelnosti_ministerstva_finansov_rossiiskoi_federatsii_na_2021_god
[3] https://minfin.gov.ru/ru/om/PlanReport/plans/?id_4=122412-plan-grafik_normativno-pravovoi_raboty_minfina_rossii_na_2018_god_i_na_srednesrochnuyu_i_dolgosrochnuyu_perspektivu_razdel_iv
[4] https://minfin.gov.ru/ru/om/PlanReport/plans/?id_4=126679-plan-grafik_normativnoi_pravovoi_raboty_minfina_rossii_na_2019_god_po_sostoyaniyu_na_08.02.2019
[5] https://minfin.gov.ru/ru/om/PlanReport/plans/?id_4=129257-plan_ministerstva_finansov_rossiiskoi_federatsii_po_ryealizatsii_kontseptsii_otkrytosti_federalnykh_organov_ispolnitelnoi_vlasti_na_2020_god
[6] https://minfin.gov.ru/ru/perfomance/budget/govprog/gosfin/?id_57=132348-postanovlenie_pravitelstva_rossiiskoi_federatsii_ot_30.12.2020__2386_o_vnesenii_izmenenii_v_gosudarstvennuyu_programmu_rossiiskoi_federatsii_upravlen

#open #closed #finances
Китайские экономисты проанализировали публикации в 37 экономических журналах Китая с 2001 по 2019 годы и выяснили что публикация открытых данных дала значительный эффект к росту цитирования статей. Об этом в "Does open data boost journal impact: evidence from Chinese economics" [1]

Некоторые журналы, например, China Industrial Economics, с 2016 года требуют обязательной открытой публикации исследовательских данных.


Ссылки:
[1] https://link.springer.com/article/10.1007/s11192-021-03897-z

#opendata #openaccess
С ноября 2020 года в Индонезии действует новое регулирование платформ, приложений и социальных сетей MR5 [1] очень похожее на регулирование германский закон NetDZ [2] и похожие законы и регулирование в Австралии, Индии, Венесуэле, России, Малайзии, Кении, Филиппинах и других странах.

Регулирование в Индонезии создано Министерством коммуникации и информации и вводит следующее:
- операторы любой цифровой платформы или сервис (Private Electronic System Operator, private ESO) должны зарегистрироваться и получить сертификат, в противном случае их могут заблокировать. Это требование экстерриториально и распространяется на все сервисы доступные индонезийским пользователям. Это охватывает все соцсети, цифровые маркеплейсы, цифровые сервисы, сервисы обрабатывающие данные о гражданах и так далее.
- регистрация этих операторов должна произойти до середины мая 2021 года, каждый зарегистрировавшийся должен будет предоставить прямой доступ к их системам для мониторинга и доступа правоохранителей
- у всех компаний/сервисов цифровой контент которых используется в Индонезии должен быть свой локальный представитель ответственный за исполнение требований по предоставлению персональных данных и удаление контента
- MR5 включает формулировки требующие удалять по требованию любые материалы "создающие социальную напряжённость" и "требование удалять которые предусмотрено местным законодательством" и тому подобное. Фактически могут удаляться любые материалы по требованию их Министерства коммуникации и информации
- платформам/сервисам запрещено информировать пользователях о способах получения доступа к запрещённым документам (это можно расшифровать как полный запрет на VPN и документы/тексты/публикации с рекомендациями по настройке VPN, даже на уровне ссылок на соответствующие инструкции). Такие "рекомендации" регулятор Индонезии уже выдавал пользователям [3]
- операторы (кроме облачных провайдеров) обязаны мониторить то что запрещённого цифрового контента нет на их платформах
- в MR5 указана новая официальная должность назначаемого чиновника, условно "Министра по блокированию доступа" который имеет право запросить удаление информации, которая должна быть удалена в течение 24 часов при стандартном запросе и 4 часов при срочном запросе.

Всё это в материале EFF на английском [4].

В целом принятое регулирование является довольно жёстким и, казалось бы, в случае многих других стран цифровые корпорации и сервис-провайдеры могли бы его проигнорировать, но Индонезия сейчас - это 175 миллионов пользователей при 271 миллионном населении [4] и это огромный рынок который ещё и активно растёт. С другой стороны если цифровые платформы, соцсети и сервисы согласятся на подобное, то значительно ускорится введение аналогичного регулирования в других странах. Пока же страны с куда меньшим экономическим влиянием, идут по пути Китая с созданием централизованного интернет-шлюза с жёсткой фильтрацией. Такой декрет принят в Камбодже в начале февраля 2021 года [6]

Ссылки:
[1] https://jdih.kominfo.go.id/produk_hukum/view/id/759/t/peraturan+menteri+komunikasi+dan+informatika+nomor+5+tahun+2020
[2] https://www.article19.org/wp-content/uploads/2017/12/170901-Legal-Analysis-German-NetzDG-Act.pdf
[3] https://www.asiasentinel.com/p/indonesia-minister-anti-vpn-threat-free-speech
[4] https://www.eff.org/deeplinks/2021/02/indonesias-proposed-online-intermediary-regulation-may-be-most-repressive-yet
[5] https://www.slideshare.net/DataReportal/digital-2020-indonesia-january-2020-v01
[6] https://www.reuters.com/article/cambodia-internet-idUKL4N2KN20W

#regulation #internet #indonesia
В Сингапуре власти ввели налог на онлайн покупки низкостоящей продукции (менее $400) [1] Внедрять его будут через
The Overseas Vendor Registration (OVR), Режим регистрации зарубежных вендоров [2] анонсированный ещё в 2018 году и введенный в работу с 2020 года и распространяющийся на сервисы с выручкой от $1 мллиона с тем чтобы не менее $100 000 приходилось на покупателей из Сингапура [3]. Это регулироване ещё называли "налогом на Netflix".

Новое регулирование - это, фактически, аналог российских таможенных пошлин на почтовые посылки, но работающее по другим механизмом, через налоговое, а не таможенное администрирование.

Ссылки:
[1] https://www.straitstimes.com/singapore/budget-2021-spore-to-impose-gst-on-goods-bought-online-imported-by-air-or-post
[2] https://www.straitstimes.com/singapore/over-100-overseas-digital-service-providers-register-for-gst-ahead-of-jan-1-deadline-iras
[3] https://www.straitstimes.com/politics/parliament-bill-to-tax-imported-services-from-2020-passed

#regulation #tech
Я на днях ругался в адрес Минфина России который опубликовал план законопроектной деятельности в виде скана. Но, всё, как говорится, познаётся в сравнении.

Например, Минтруд не публиковал план законопроектной деятельности на 2020 год и не публикует на 2021 [2].

Минэнерго публикует только приказ об утверждении плана законопроектной деятельности и не публикует сам план [3]

Другие примеры:
- Минпромторг - публикует в PDF, не сканом [4]
- Минтранс - распоряжение сканом PDF и сам план файлом MS Word пригодном для работы [5]
- Минкультуры [6] - невозможно найти планы на 2019-2021 годы
- Минстрой РФ [7] - не публикуют план с 2019 года
- Минприроды [8] - до сих пор не опубликовали план на 2021 год, все предыдущие публиковали в виде сканов
- Минюст [9] - последний раз публиковали в 2019 году на 2019 год (1 марта вышло распоряжение) с той поры более нет
- Минцифра [10] - почему-то называют это планом законопроектных работ, последний раз был такой на 2018 год.

Такого ещё много, и здесь несколько вопросов. Вопрос прозрачности работы исполнительных органов власти, вопрос организации работ над нормативными документами и вопрос публикации открытых данных, потому что эти планы существуют все в табличной форме. И, конечно, отдельный вопрос к том что публикуется далеко не всё. Ежеквартально ФОИВы отчитываются перед Минюстом о исполнении плана и эти отчёты не публикуются [11] и отдельный вопрос - почему так происходит.

А я напомню что НПА - это, вообще-то, изначально основной продукт деятельности органов власти. Прозрачность нормотворчества - это прозрачность государства.

Ссылки:
[1] https://yangx.top/begtin/2590
[2] https://mintrud.gov.ru/ministry/opengov/13
[3] https://minenergo.gov.ru/node/10760
[4] https://minpromtorg.gov.ru/activities/practice/plans/
[5] https://mintrans.gov.ru/documents/2/11113?type=2
[6] https://culture.gov.ru/documents/?DOCS%5BKEYWORDS%5D=%D0%9F%D0%BB%D0%B0%D0%BD+%D0%B7%D0%B0%D0%BA%D0%BE%D0%BD%D0%BE%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%D0%BD%D0%BE%D0%B9+%D0%B4%D0%B5%D1%8F%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D0%B8+%D0%9C%D0%B8%D0%BD%D0%B8%D1%81%D1%82%D0%B5%D1%80%D1%81%D1%82%D0%B2%D0%B0+%D0%BA%D1%83%D0%BB%D1%8C%D1%82%D1%83%D1%80%D1%8B+%D0%A0%D0%BE%D1%81%D1%81%D0%B8%D0%B9%D1%81%D0%BA%D0%BE%D0%B9+%D0%A4%D0%B5%D0%B4%D0%B5%D1%80%D0%B0%D1%86%D0%B8%D0%B8&DOCS%5BVIEW_DOCUMENTS%5D=&DOCS%5BAUTHORITY%5D=&DOCS%5BTYPE_DOCUMENTS%5D=&DOCS%5BDATE_1%5D=&DOCS%5BDATE_2%5D=&DOCS%5BNUMBER%5D=
[7] https://minstroyrf.gov.ru/trades/normativno-pravovaya-deyatelnost/normativnaya-baza/
[8] http://www.mnr.gov.ru/docs/open_ministry/plan_normotvorcheskoy_deyatelnosti_minprirody_rossii/plan_normotvorcheskoy_deyatelnosti_minprirody_rossii_na_2020_god/
[9] https://minjust.gov.ru/ru/documents/7595/
[10] https://digital.gov.ru/ru/documents/?words=%D0%9F%D0%BB%D0%B0%D0%BD+%D0%B7%D0%B0%D0%BA%D0%BE%D0%BD%D0%BE%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%D0%BD%D0%BE%D0%B9+%D0%B4%D0%B5%D1%8F%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D0%B8&type=&directions=&department=&start_date=&end_date=
[11] https://www.consultant.ru/document/cons_doc_LAW_87670/0190686c0773ecbabbdea1599fa197cb301c0ae0/

#opengov #opendata #laws #legal
Не бывает нормальных госреестров, бывают недообследованные (с)

Чтобы для коллег из Минцифры которые читают мои публикации потом это не было неожиданностью, несколько фактов про реестр аккредитованных ИТ компаний [1]

1. Примерно у 1.5% записей недостоверные реквизиты, около 200 записей из 13543. Не точно потому что где-то записи дублируются, а где-то, например, перепутаны названия организаций и реквизиты ИНН/ОГРН соседних записей и требуется ручная проверка. Скорее всего реально записей с ошибками больше.
2. Многие ИТ компании одновременно являются образовательными учреждениями и я не понимаю как они заявляют (заявили) выручку от ИТ в 90%. Примеры: Университет Иннополис, Московский технологический университет, Прайм-Сервис и др.
3. В реестре ИТ компаний много госучреждений, ФГУПов и компаний учрежденных органами власти. Трудно отнести их к ИТ компаниям, хотя, формально под критерии они могут подпадать. Последний забавный пример, ФГУП «Главный научно-исследовательский вычислительный центр» Управления делами Президента Российской Федерации теперь также "ИТ компания" с пониженным налогообложением.
4. Это ещё не все вопросы. Самый главный вопрос всегда в достоверности того что основной выручкой компаний является ИТ деятельность.

И отдельная большая тема, интересная по другому, о том почему многие компании в ИТ рынке с большой выручкой не регистрируются в этом реестре.

Однажды у меня или коллег дойдут руки посмотреть на это всё более пристально. Пока же лишь обращаю на этот реестр внимание и на то что в других отраслях ситуация не сильно лучше и чаще сильно хуже и по достоверности данных и тому что в госреестры вносят. Достаточно вспомнить Минэкономразвития с реестром СО НКО который почистили от ошибок по формату и ничего не сделали со смысловыми ошибками.

Ссылки:
[1] https://digital.gov.ru/ru/activity/govservices/1/

#government #registries #it
Я здесь регулярно пишу о НКО и госНКО (учреждённых государством в разных формах) и не могу не напомнить про два некоммерческих проекта по НКО которые ведёт Инфокультура.

Открытые НКО [1] - база всех некоммерческих организаций, их контрактов, субсидий, грантов, бухбалансов и отчетов. С открытыми данными, API и тд. Это не только те НКО которые регистрируются в Минюсте, но и те которые имеют регистрацию только в ФНС России.

Данные НКО [2] - портал для публикации данных собираемых некоммерческими организациями. В том числе данные которые мы сами в Инфокультуре собираем.

О том как устроен некоммерческий сектор "на самом деле" я довольно много писал в блоге на Яндекс.Дзен и в колонках в РБК.

- Как устроен некоммерческий сектор в России. Часть 1 [3]
- Как устроен некоммерческий сектор в России. Часть 2 [4]
- Некоммерческий бюджет: как чиновники стали использовать стали использовать НКО в своих целях [5]
- Незачет по НКО: чем плох реестр социально ориентированных организаций [6]

При этом данных о НКО гораздо больше, не все получается быстро и просто интегрировать в централизованную базу Открытых НКО, поэтому они лежат наборами данных в Данных НКО.

Например:
- Архивные данные президентских грантов за 2013 год [7] (до появления Фонда президентских грантов)
- Данные грантовых конкурсов Ростуризма [8] включают данные по НКО тоже
- НКО зарегистрированные на портале Душевная Москва [9]
- Данные аналитического доклада "Некоммерческий сектор в России" [10]
- Некоммерческие организации в зарегистрированные органами власти [11]

И другие наборы данных в категории "Некоммерческие организации" [12].

Ссылки:
[1] https://openngo.ru
[2] http://ngodata.ru
[3] https://zen.yandex.ru/media/id/5a315e1300b3dd77beb64261/kak-ustroen-nekommercheskii-sektor-vrossii-chast-1-5a363ff08139ba06ba669bf7
[4] https://zen.yandex.ru/media/id/5a315e1300b3dd77beb64261/kak-ustroen-nekommercheskii-sektor-v-rossii-chast-2-5a3a1e898139ba9e538c916b
[5] https://www.rbc.ru/opinions/politics/13/03/2020/5e69e70a9a7947737fc79cf3
[6] https://www.rbc.ru/opinions/society/17/06/2020/5ee8ce139a79479edce77585
[7] http://ngodata.ru/dataset/prgrants2013
[8] http://ngodata.ru/dataset/grant-contests-rosturizm
[9] http://ngodata.ru/dataset/dushmosorgs
[10] http://ngodata.ru/dataset/nonprofit-sector-russia
[11] http://ngodata.ru/dataset/gov-ngo
[12] https://ngodata.ru/group/ngo

#ngo #data #opendata
Знаете ли Вы что... Государственная фельдъегерская служба (ГФС России) - это, возможно, единственный федеральный орган исполнительной власти одновременно являющийся поставщиком по 44-ФЗ и, возможно, по 223-ФЗ.

Более 1300 контрактов с другими органами власти, на сумму более чем 1.1 миллиарда рублей. Органы власти контрактуются с ГФС России через закупку у единственного поставщика и оплачивают работы переводами на лицевые счета ГФС России по кодам КБК.

Почему до сих пор фельдъегерская служба существует как ФОИВ для меня загадка, подозреваю что никаких причин кроме исторически сложившейся ситуации нет.

Вообще же, анализ, денежных потоков между органами власти и их подведами и подведами других органов власти и госкорпорациями и госкомпаниями - это увлекательнейшее занятие. Где-то есть сложившиеся отношения ещё с советского времени (ГФС России, архипелаг ФСИН), а где-то явный тренд на "чеболизацию" в виде госхолдингов и ряда крупнейших олигархов.

Причём тренд на государственые чеболи сильнее чем на частные. Когда нибудь руки дойдут и до анализа этого всего, но этого всего много, поэтому может и не скоро дойдут. А пока, для тех кто любит анализировать госзакупки и госрасходы напомню что эти и многие другие факты можно найти на порталах Госрасходы [1] и Госзатраты [2].

Ссылки:
[1] http://spending.gov.ru
[2] http://clearspending.ru

#government #it
Comparitech выпустили сравнение 96 стран по тому как те используют биометрические данные [1]. Согласно исследованию хуже всего ситуация в Китае и лучше всего в Эфиопии и Туркменистане (видимо из-за неразвитости технологий). В целом исследование не претендует на научность и практически полностью основано на публикациях в СМИ, которые и приведены в списке источников.

Уровень использования биометрических данных в России лучше чем в США или в Иране, но хуже чем в Польше, Германии или Казахстане.

Опять же, поскольку методология исследования вызывает очень много вопросов, интереснее приводимые там факты. Например, национальная биометрическая база в Китае включающая теперь ещё и данные ДНК [2] или разрешение компаниям собирать данных о мозговых волнах работниках [3].

И так далее, ещё много примеров по другим странам.

Что находится за пределами этого исследования так это то что биометрические данные концентрируются не только в государстве. Если говорить про Россию, то из актуального - это вхождение Яндекса в капитал Генотек'а [4], где хоть и сделано множество оговорок про не передачу Яндексу каких-либо данных, но не тревожить не может.

Впрочем, если говорить про Россию, то у нас наиболее вероятен китайский путь с построением одной или нескольких национальных баз данных с биометрическими данными и постепенное введение регуляторки по сдачи в государственную информационную систему(-ы) биометрических данных собираемых частными компаниями.

P.S. Не все знают и не все понимают природу биометрических данных. Приведу несколько примеров, без ссылок:
- кроме распознавания лиц есть немало других технологий бесконтактного снятия биометрических данных, например, распознавание радужной оболочки возможно на расстоянии до 10 метров, распознавание походки, распознавание по форме рук и кистей и др.
- расшифровка генома - это передача третьей стороне данных не только о себе, но и о своих ближайших родственниках;
- отпечатки пальцев родственников имеют много схожих признаков и, при наличии финансирования исследований в этом направлении, можно научиться выявлять взаимосвязи;

По биометрии не так много хорошей литературы, многие технологии в этой области очень наукоёмки и требуют длительных исследований, с другой стороны, если запреты на именно распознавание по лицам получит распространение, то пойдут инвестиции в исследования в других направлениях: распознавание одежды, формы горла и ушей и иных биометрических признаков.

Ссылки:
[1] https://www.comparitech.com/blog/vpn-privacy/biometric-data-study/
[2] https://www.rfa.org/english/news/china/collect-08232019115209.html
[3] https://www.businessinsider.com/china-emotional-surveillance-technology-2018-4?r=US&IR=T
[4] https://blog.genotek.ru/genotek-and-yandex

#privacy #biometrics #genetics
OpenNeuro - открытый каталог наборов данных в области исследования мозга [1], включает более 500 наборов данных, как правило, очень большого объёма. Проект чем-то похож на Galaxy, другой проект по работе учёных с данными, в области расшифровки генома. OpenNeuro также не просто каталог, а интегрированный инструмент, связанный с такими проектами как Brainlife [2] и имеющий встроенную проверку данных на предмет соответствия стандарту сообщества Brain Imaging Data Structure (BIDS) [3]

Внутри OpenNeuro используется сервис DataLad [4], все данные в OpenNeuro публикуются на Github [5] (вообще, в последнее время, Github всё чаще используют как бесплатное хранилище данных условно любого объёма.
А также сам исходный код платформы общедоступен [6]

Специализированных платформ для публикации открытых научных данных становится всё больше, многие из них - это реинкрнация систем обмена научными данными ещё из раннего периода систем обмена научной информации в Интернете. При этом в таких областях как биоинформатика, геномные исследования, компьютерная лингвистика и других такие платформы оказываются более востребованными чем более универсальные Dataverse или Mendeley и другие.

Ссылки:
[1] https://openneuro.org
[2] https://brainlife.io
[3] http://bids.neuroimaging.io/
[4] https://www.datalad.org
[5] https://github.com/OpenNeuroDatasets
[6] https://github.com/OpenNeuroOrg/openneuro

#opendata #openaccess #openscience