Ассоциация участников рынка данных
96 subscribers
52 photos
1 video
87 links
Пишем о рынке данных в России. http://aurd.ru
加入频道
На информационной портале RSpectr.com опубликована статья, в которой эксперты попытались разобраться в сути создания единого федерального информационного ресурса с данными о населении Российской Федерации. Эксперты рассказали, чем опасна такая централизация данных, какие существуют риски и что нужно учесть в системе информационной безопасности. Но остались и неотвеченные вопросы. Как законопроект Минфина России о разработке федерального информационного ресурса о россиянах связан с концепциями Минкомсвязи России «Цифровой профиль гражданина» и «Национальная система управления данными»? Сколько это будет стоить федеральному бюджету?

#нацпроекты #цифроваяэкономика

Читать: https://www.rspectr.com/articles/536/vseh-poschitayut-kakoj-budet-baza-dannyh-grazhdan-rf
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
На сайте ФНС России опубликованы наборы открытых данных о компаниях за 2018 год. Опубликованы данные о:

- среднесписочной численности работников компаний (https://www.nalog.ru/opendata/7707329152-sshr/);

- специальных налоговых режимах(https://www.nalog.ru/opendata/7707329152-snr/);

- участии в консолидированной группе налогоплательщиков (https://www.nalog.ru/opendata/7707329152-kgn/).

По информации из пресс-релиза к данным, опубликованным в прошлом году, обратились 262 тыс. пользователей.

Напомню, что данные о компаниях публикуются в три этапа - 1.08, 1.10, 1.12, и самое интересное нас ждет в декабре.
Коммерсант сообщает, что ВТБ купил компанию «Первый ОФД» (АО «Энергетические системы и коммуникации»).

В реестре операторов фискальных данных ФНС числится 21 компания. «Первый ОФД» передает фискальные данные в оперативном режиме, от контрольно-кассовой техники в ФНС. Компания обслуживает порядка 400 тыс. касс и входит в тройку крупнейших операторов фискальных данных России с долей рынка 16%.
Сделка позволит усилить позиции ВТБ на рынке эквайринга и даст доступ к массивам данных о конкретных тратах граждан. Совмещение финансовых данных и данных ОФД позволит построить точный профиль клиента и оценить риски.

Источник: https://www.kommersant.ru/doc/4053659
«ФРН повернут к государству, а цифровой профиль – к людям»

Замдиректор департамента развития цифрового государства Минкомсвязи Александр Тютрюмов рассказал, как концепция «Цифровой профиль гражданина» будет связан с проектом Минфина России Федеральным реестром населения (ФРН), который на базе данных ЗАГСов будет создавать Федеральная налоговая служба.

На разработку цифрового профиля из федерального бюджета выделят 235 млн руб, из которых:
- 184 млн рублей пойдут на модернизацию существующих механизмов в программной архитектуре ЕСИА (Единая система идентификации и аутентификации);
- 51 млн рублей пойдут на разработку системы управлением правами на предоставление сведений и правами на «цифровой ID».

В проекте примут участие ФСБ и ФСТЭК.

Подробнее: http://www.cnews.ru/news/top/2019-08-06_tsifrovoj_profil_grazhdan_podeshevel_v_13_razkogda
ФГБУ «Центр геодезии, картографии и инфраструктуры пространственных данных», подвед Росреестра, станет ответственным за создание государственной информационной системы ведения единой электронной картографической основы и за федеральный портал пространственных данных.

Подробнее: http://d-russia.ru/rosreestr-ofitsialno-naznachil-otvetstvennogo-za-edinuyu-elektronnuyu-kartograficheskuyu-osnovu.html
Фонд содействия инновациям до 9 сентября принимает заявки на участие в конкурсе «Старт – Цифровые технологии».

Направления:
- Искусственный интеллект;
- Технологии виртуальной и дополненной реальностей;
- Новые производственные технологии;
- Компоненты робототехники и сенсорика;
- Технологии беспроводной связи;
- Системы распределенного реестра;
- Квантовые технологии.

Главные условия:
- разница между моментом подачи заявки и датой регистрации организации — не более 2-х лет.
- организация-заявитель и ее ключевые сотрудники ранее не получали финансовую поддержку Фонда.

Подробнее: http://fasie.ru/press/fund/start-dataeconomy.
16 августа состоялось экспертное обсуждение с объявленной темой «Концепция создания и функционирования Единой технологической архитектуры информсистем органов исполнительной власти».

Одна из цитат в ходе дискуссии Ивана Бегтина: «Мы все продвигаем идею data-driven decisions - решений, основанных на данных. Давайте будем честными - сейчас то, что вы описали в презентации, это некоторое благопожелание, потому что цифр, подсчета, аналитики у вас, по крайней мере, в презентации не было, - добавил Бегтин. - У вас есть ФГИС координации информатизации, вы, в принципе, знаете - что и как. Материалы там размещены, и у Минкомсвязи туда полный доступ. Хотя, еще в 2015 году Олег Пак обещал, как я помню, что это будет общедоступная система. Давайте для начала вы: «а» - ее откроете, «б» - все утверждения, которые вы делаете, подкрепите ссылками на те материалы, доступ к которым у вас есть. Было ли хоть одно исследование с указанием конкретно - где неоптимально, где что можно использовать? Вообще, насколько у нас пестрая текущая ИТ-архитектура, что нужно менять? На мой взгляд, ключевое — это проблема ИТ-закупок, вообще всего процесса бюджетирования, включая согласование с Минкомсвязью. Вот сверху до низу - от планирования (еще от планирования на уровне постановлений Правительства или поручения Президента) и до постановки на баланс. Архитектура, на мой взгляд, это важный момент, но не ключевой. Мы решаем, что у нас болит, или лечим здоровые органы».

Полный текст: http://www.tadviser.ru/index.php/Статья:Единая_технологическая_архитектура_информационных_систем_органов_исполнительной_власти_(ЕТА_ИС_ОИВ_РФ)
Forwarded from Now-ka
Когда данные используются для каких-то исследований, из них убирается личная информация: имена, даты и места рождения, адреса и прочие подробности, однозначно определяющие конкретного человека. Однако, согласно последним исследованиям, оставшейся информации почти всегда хватает, чтобы точно идентифицировать личность. Да, многие живут в вашем районе, но далеко не у многих такая же собака, машина, цвет глаз и частота походов в магазин за молоком. Эти данные не считаются приватными и даже могут использоваться публично. А ведь это дает гораздо больше информации, чем то, зовут вас Джон или Константин.

(Будем реалистами: анонимность не гарантирует анонимность)

https://www.imperial.ac.uk/news/192112/anonymising-personal-data-enough-protect-privacy/
Forwarded from Инфокультура (Ksenija V. Orlova)
С 10 сентября по 10 октября Центр перспективных управленческих решений проводит конкурс грантов на исследования в сфере governance в России.

Результатом исследования в том числе должны стать практические рекомендации для органов власти.

Одно из грантовых направлений касается темы цифровой трансформации государственного управления.

Подробности: http://cpur.ru/grants.
Правовой прецедент. Апелляционный суд США постановил, что компания HiQ Labs не нарушила федеральный закон CFAA, когда собирала (web-scraping) данные с сайта LinkedIn. Подробнее новость: https://www.eff.org/deeplinks/2019/09/victory-ruling-hiq-v-linkedin-protects-scraping-public-data.

HiQ Labs — компания по анализу данных, которая собирала информацию с аккаунтов пользователей LinkedIn, доступной открыто для широкой публики без авторизации на сайте. Компания объединяла собранные данные с другими и продавала компаниям. В то же время LinkedIn желала монетизировать данные самостоятельно.

Решение суда: http://cdn.ca9.uscourts.gov/datastore/opinions/2019/09/09/17-16783.pdf.

Ученый в области компьютерного права и интернет-слежки Орин Самуэль Керр считает, что это в том числе большой шаг в направлении открытости: https://reason.com/2019/09/09/scraping-a-public-website-doesnt-violate-the-cfaa-ninth-circuit-mostly-holds.
У НСУД(национальная система управления данными) не будет закона

Правительство отказалось от разработки отдельного законопроекта о создании национальной системы управления данных (НСУД).Отдельные положения законопроекта будут включены в подготовленный Минфином проект, что позволит исключить дублирование информации, а также "обеспечить полноту и взаимосвязь" различных информресурсов на базе единого реестра.

На одном из заседаний президиума правительственной комиссии по цифровому развитию было принято решение объединить два законопроекта (проект закона о систематизации и гармонизации информации в РФ,разработанный Минфином;
и законопроект о НСУД, разработанный Минэкономики и АЦ) в один для их оптимизации и формирования единых подходов к регулированию в сфере управления госданными.

Оказалось, Разработанные Минфином правки в 149-ФЗ идеологически пересекаются с проектом ФЗ о национальной системе управления данными.

Изначально проект министерства финансов не включал все возможные вопросы регулирования данных, поэтому необходимо дополнение законопроекта положениями из проекта ФЗ о НСУД.

Принято решение, что на базе Минэкономразвития РФ произойдёт свод предложений по правкам в 149 ФЗ, в котором будут учтены правки Минфина и положения о НСУДе.
Работу над объединением проектов планируется завершить до 30 сентября.
Forwarded from Ivan Begtin (Ivan Begtin)
Сразу 2 новости об ОФД, хорошая и не очень.

Хорошая
1-ОФД выложили открытый код [1] их BigData analytics platform: Yupana
Лично я ещё не пробовал, но любой хороший и открытый продукт по анализу данных всегда найдет применение. Что радует - создатели дают подробное описание и много примеров

Не очень хорошая
У ОФД "Дримкас" [2] утекло 14 миллионов записей и, признаться, реакция этого ОФД на событие необоснованно вялая. Будем надеяться что все ОФД проведут ревизию мер обеспечения безопасности.

Ссылки:
[1] https://github.com/rusexpertiza-llc/yupana
[2] https://iz.ru/921673/vadim-arapov/ushli-iz-bazy-v-set-utekli-14-mln-zapisei-kompanii-i-pokupatelei

#data #dataleaks #leaks
Коллеги из Центра подготовки руководителей цифровой трансформации опубликовали новый выпуск подкаста «Циферкаст». В программе ведущий эксперт Центра Павел Потеев рассказывает, что такое управление изменениями в организации, и в чем выражается их специфика в эпоху цифровой трансформации.

«Организации трансформируются быстро и изменения отражаются на людях – новые должности, роли, требования к знаниям и навыкам, даже к тому, как человек себя ведет (при трансформации культуры)», – объяснил Павел Потеев актуальность темы управления изменениями.

Подкаст доступен для прослушивания на платформах:
• Google Podcasts (https://clck.ru/HENAc)
• Яндекс Музыка (https://clck.ru/HENML)
• Apple Podcasts (https://clck.ru/J969v)
Депутаты Госдумы в первом чтении приняли законопроект о создании единой базы данных о населении, следует из информации на сайте нижней палаты парламента. Новый информационный ресурс предполагает создание базы данных, где содержится информация от ФИО до семейных связей.https://sozd.duma.gov.ru/bill/759897-7
Обзор рынка дата-инструментов в 2019 году:
- Облачные хранилища данных, дата-конвейеры и платформы для анализа данных;
- Инструменты для бизнес аналитики;
- Инструменты для анализа данных с открытым исходным кодом;
- Новые области и решения, например, собственные сервисы размещения тетрадок (self-hosted notebooks), сервисы управления версиями данных (компании Pachyderm и DVC) и совместной работы (Domino, Dataiku), аналитика в облаке (Sigma Computing) и инструменты для экономии времени на разработку документации API (компании Matillion и Fivetran);
- Функции дата-отдела и чем между собой отличаются дата-аналитики, дата-сайентисты, бизнес-аналитики и дата-инженеры.

Подробнее: https://medium.com/public-comps/data-tooling-market-2019-580e38b7475e
Частная компания построила в США систему массовой слежки за автомобилями. Машины, оборудованные специальными камерами с распознаванием номерных знаков, колесят по стране и фиксируют номера всех машин, которые попадаются на их пути. В базе системы уже более 9 миллиардов записей.

Клиенты компании — частные сыщики и страховые компании. "Пробить номер" стоит всего $20, за $70 можно получить оповещение, если искомая машина будет где-то обнаружена. История перемещения автомобиля может многое рассказать о его владельце: местонахождение его дома и работы, круг общения, бытовые привычки и паттерны поведения.

Журналисты Vice получили доступ к системе и убедились, насколько просто это сделать — достаточно заплатить деньги или найти пользователя системы, который поможет вам найти кого надо.

Правовые нюансы позволяют такой системе слежки легально работать в США: компания успешно защитила своё право работать в нескольких штатах, где на неё подавали в суд. Все фотографии машин сделаны в публичных местах, а это абсолютно законно. Сейчас у системы более 1000 платящих пользователей, после этой публикации наверняка станет больше.

Такова жизнь в современном городе — твои перемещения по городу могут отследить не только городские власти по камерам, но и частные лица по номерам авто. Никакой приватности.
TAdviser проводит ежегодную конференцию IT Government DAY, в рамках которой планируется собрать ИТ-руководителей федеральных ведомств и регионов, чтобы обсудить реформы в области информатизации государственного сектора.

Основные темы:
• Регулирование оборота данных.
• ИТ-архитектура государства.
• Особый порядок создания ИТ-решений в рамках госзаказа.
• Задачи и показатели цифрового развития регионов.

Иван Бегтин выступит в качестве модератора дискуссии, посвященной государственным данным.

Когда: 9 октября 2019 года в Москве.
4 октября Rusbase проведет большую конференцию по большим данным и искусственному интеллекту — Ai Stories.

Мероприятие будет интересно всем, кто уже работает с большими данными или только планирует это делать, а также хочет познакомиться с российским дата-сайенс сообществом.

Спикеры из разных индустрий поделятся кейсами, как правильно выстроить работу команды и определить, какую технологию ИИ и для какой задачи использовать.

Мы выступаем партнером мероприятия и предлагаем вам воспользоваться промо-кодом AURD25 со скидкой в 25% для регистрации на Ai Stories.

Спикеры, программа и билеты на сайте https://techdaysrussia.ru/ai.
Forwarded from Инфокультура (Ksenija V. Orlova)
Приглашаем на открытую лекцию Ивана Бегтина «Дата-расследования: тысячи иголок с миллионах стогов сена», которая состоится 8 октября в библиотеке Шанинки.

Иван расскажет про три кейса по работе с открытыми данными и электронными документами госучреждений и информационных систем:

- «Слепые закупки» — что это? Латиница и другие способы искажения информации о государственных и муниципальных закупках в целях ограничения конкуренции и поиска сведений.
- Утечка персональных данных с сайтов государственных информационных систем — как более двух миллионов записей с данными россиян оказались в открытом доступе.
- Пиратский софт — использование пиратского программного обеспечения в российских госорганах. На сайте какого органа исполнительной власти не было найдено ни одного документа с признакам нелицензионного ПО?

Необходима предварительная регистрация: http://msses.ru/about/news/4434/?
Forwarded from Ivan Begtin (Ivan Begtin)
В РБК вышла моя колонка с критикой обсуждаемого законопроекта по регулированию почтовых сервисов [1].

Самые неприятные последствия что этого что других запретительных законов - это падение привлекательности российской юрисдикции для любых интернет проектов. При таком регулировании цифровой экономики не будет.

Ссылки:
[1] https://www.rbc.ru/opinions/politics/14/10/2019/5da033ea9a79478f25ca783c

#laws #runet
Вышел новый выпуск подкаста «Циферкаст» с председателем Ассоциации участников рынка данных Иваном Бегтиным.

Ведущие обсудили с Иваном концепцию открытого государства и поговорили о степени открытости российского правительства. А также узнали, какие успешные проекты уже реализованы и какие проблемы все еще остаются.

- Google Podcasts: https://clck.ru/HENAc
- Яндекс Музыка: https://clck.ru/HENML
- Apple Podcasts: https://clck.ru/JRqK2
- VK https://clck.ru/JcQnS
- Spreaker: https://clck.ru/JRqGi