Ivan Begtin
8.1K subscribers
2.02K photos
3 videos
102 files
4.75K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts [email protected]
加入频道
Портал данных по миграции [1] открыт IOM [2], Международной организации по миграции. На портале собрана международная статистика, удобные инструменты для работы с ней, инфографика, методики и многое другое.

Структуры ООН давно и много собирают данных, при этом сама ООН не так много их публикует как бы хотелось. Из наиболее памятных их проектов это Data.UN [3] и Data Worldbank [4].

Для тех кто занимается международными исследованиями в этих данных найдется что-то полезное.

Ссылки:
[1] http://migrationdataportal.org
[2] https://www.iom.int/
[3] http://data.un.org
[4] http://data.worldbank.org

#opendata #opengov #un
Для тех кто любит данные, связанные данные и утечки - свежий интересный набор данных. Exaptive [1] выложили Панамские бумаги в формате RDF на платформе data.world [2] и разместили пост о том как они это делали в блоге [3] с небольшой рекламой их Exaptive Studio и Cray Graph Engine (CGE) [4] для визуализации графовых баз данных.

Признаться я впервые вижу какое-либо применение CGE, тем более стартапом и, сразу, немного немало, а связанные данные и пока не могу понять дает ли их движок какую-либо реальную добавленную ценность.

А вот блог data.world [5] вполне могу порекомендовать для регулярного чтения. Data.world претендует на то чтобы стать Github'ом для данных и, вполне возможно, у них получится. Это один из стартапов за которым я лично пристально слежу.

Ссылки:
[1] https://exaptive.city
[2] https://data.world/exaptive/panama-papers
[3] https://blog.data.world/how-a-startup-analyzed-over-11-million-panama-papers-in-1-week-bcfe9ea76260
[4] https://www.cray.com/products/analytics/cray-graph-engine
[5] https://blog.data.world

Читайте также мой основной блог на русском языке https://zen.yandex.ru/id/5a315e1300b3dd77beb64261, на английском https://medium.com/@ibegtin, в телеграм https://yangx.top/begtin

#opendata #panamapapers #data #semanticweb
Национальная комиссия по инфраструктуре Великобритании опубликовала доклад Data for Public Good [1] где признала данные инфраструктурой [2] и обозначила значимость открытых данных для инноваций.

Доклад, отчасти, возвращает нас к вопросу чем открытые данные более полезны чем когда они доступны за деньги или иным регулируемым образом. Открытость данных значительно снижает порог входа для data-стартапов и дает возможность создавать информационные продукты значительно быстрее и с меньшими издержками.

Ссылки:
[1] https://www.nic.org.uk/publications/data-public-good/
[2] https://theodi.org/what-is-data-infrastructure

#opendata #opengov #data #uk
В следующем годы наши планы Инфокультуры будут в том чтобы постепенно приводить в порядок наши ресурсы - Хаб открытых данных [1], наш сайт [2], цифровой архив [3] и многое другое.

Большую часть наших проектов мы создаем и поддерживаем сами. Иногда удается найти для них финансирование, а чаще это собственные инициативы.

А также мы начинаем перезапуск комуникационных площадок. Телеграм для них хорош, но он ограничен и поиском по истории и возможностями работы.

Ссылки:
[1] https://hubofdata.ru
[2] https://infoculture.ru
[3] https://ruarxive.org

#opendata #infoculture
Приглашаю в наше сообщество в Slack'е Open Data in Russian. Его преимуществом будет не только несколько каналов, но и интеграция с новостями об открытых данных и база документов.

https://join.slack.com/t/opendatarussia/shared_invite/enQtMjg4ODM2MTQzODU4LWFhYjRiNThjZmFhNjQwMjgyNTZmMDU5NDAwNWUxZmNlYTA2YWI5OGE5MWUyMDBhOGE1ZDUxOTk2NjAyNTY3YWE

Мы создавали его изначально именно для обсуждения открытых данных на русском языке, наряду с сообществами в Facebook и других площадках. За это время более-менее прижился только телеграм, но и у него есть свои пределы удобства. Так что будем реактивировать эту площадку.

#opendata #opengov #infoculture
Тем временем не я один поднимаю вопрос об алгоритмической манипуляции потребителями. В Нью Йорке власти города рассматривают законопроект об обязательной публичности и обследовании всех алгоритмов используемых городскими службами.

Arstechnica пишет [1] что уже публикуют даже алгоритмы анализа ДНК и изучают способы описания работы алгоритмов понятным людям языком. Что особенно важно для безальтернативных алгоритмов используемых госорганами.

Это важная история именно в контексте цифровой экономики и не надо думать что Россию она не затронет.

Однако будем надеяться что наши депутаты еще не скоро до этого догадаются, потому что начнут они регулировать не государство, а коммерческие компании.

Не присылайте им ссылки на этот текст. Не надо.

Ссылки:
[1] https://arstechnica.com/tech-policy/2017/12/new-york-city-moves-to-create-accountability-for-algorithms/

#opendata #opensource #algorithms
Как устроен некоммерческий сектор в России. Часть 2 [1]
Продолжение публикации на основе накопленных нами данных в проекте Открытые НКО и анализа существующих некоммерческих организаций.

В 3-й части я расскажу подробнее о том почему многие организации регистрируются как некоммерческие, а в 4-й расскажу подробнее о проблемах и особенностях расширенной деятельностной классификации НКО и о подходах к этой задаче. А также о том какие выводы можно делать на расширении информации об организациях, их бухгалтерских балансах и отчетах.

Ссылки:
[1] https://zen.yandex.ru/media/id/5a315e1300b3dd77beb64261/kak-ustroen-nekommercheskii-sektor-v-rossii-chast-2-5a3a1e898139ba9e538c916b?

#opendata #openngo #opengovernment
Идея перевода госсайтов на единый ресурс и единую платформу gov.ru актуальна была всегда и то что сейчас ей озадачилось Минсвязи - это неплохо. Статья в РБК [1] обнадеживает то мы можем застать этот процесс уже в следующем году.

Но не стоит рассчитывать что он будет прост. Многие сайты госорганов уже созданы и делать единый ресурс означает покушаться на ИТ бюджеты ФОИВов. Они будут сопротивляться, некоторые обосновано, некоторые рефлекторно, но будут.

Если проект не будет курировать глава правительства лично, шансы его будут невелики.

Ссылки:
[1] https://www.rbc.ru/technology_and_media/22/12/2017/5a3a6b8a9a79470d0525805b

#opendata #opengov #govru
У КБ Стрелка вышло интересное исследование по устройству городских бюджетов региональных столиц [1].

Со многих точек зрения интересное исследование, в первую очередь тем что видна дистанция между городами лидерами по управлению городским имуществом и финансами и городами аутсайдерами.

Всегда жаль лишь что по итогам публикуются только документы исследования, а не созданные данные.

Ссылки:
[1] http://citybudget.strelka-kb.com/
#openbudgets #budget
Поздравляю всех и от себя лично и от АНО "Инфокультура" всех с наступающим Новым годом! В следующем году темы о которых я пишу - открытые данные, государство, технологии, цифровая архивация и многое другое продолжат свое развитие. Кроме открытых данных лично я много внимания буду уделять некоммерческому сектору в России, в первую очередь с точки зрения работы именно с открытыми данными. Другое направление будет - это помощь бизнесу в защите его интересов когда государство открывает или не открывает информацию. И, конечно, продолжать все наши проекты.
Интересные проекты и события уходящего года в области данных в мире
Научные данные:
- Dat [1] децентрализованный протокол обмена данными. Использует обмен данными P2P для ускоренной и удобной доставки наборов данных. Пока, в основном, используется в научном сообществе.
- Code Ocean [2] - стартап по перепроверке результатов исследований онлайн. Предоставляет платформу куда можно публиковать код и данные и предоставлять возможность воспроизводить результаты запуская код в облаке.
- Frictionless Data [3] проект Open Knowledge International по унификации метаданных и распространению CSV файлов с обязательными схемами и спецификациями.
- научные проект поддерживанием Alfred P. Sloan Foundation [4] их довольно много и с каждым годом все больше. В основном они касаются создания, визуализации и обмена научными открытыми данными.

Открытый код:
- Toapi [5] проект с открытым кодом по быстром превращению страниц сайта в API. Работает как конструктор, очень простой в использовании и стремительно набирающий популярность
- Public APIs [6] большая коллекция ссылок на общедоступные API со ссылками на документацию и все разделено по категориям
- Rawgraph [7] удобная библиотека и сервис по визуализации табличных данных

Платформы:
- Data World [8] один из немногих проектов которые реально могут стать аналогом Github для данных
- AirTable [9] являются аналогом Excel'я и конкурентом Google Spreadsheets, но с более быстрым интерфейсом, API и другими возможностями.

Ссылки:
[1] https://datproject.org/
[2] https://codeocean.com/
[3] http://frictionlessdata.io/
[4] https://sloan.org/programs/digital-technology/data-and-computational-research/platforms
[5] https://github.com/gaojiuli/toapi
[6] https://github.com/toddmotto/public-apis
[7] http://rawgraphs.io/
[8] https://data.world
[9] https://airtable.com/

#opendata #opengov
о том как меняется подход к статистике в Великобритании. Команды статистиков работают вместе с data scientist'ами над выработкой удобных инструментов доступа к статистике. Например, органы власти финансируют появление пакетов для языка R для удобной работы с официальными данными.
Forwarded from Open Data Digest
Transforming the process of producing official statistics
https://dataingovernment.blog.gov.uk/2017/11/27/transforming-the-process-of-producing-official-statistics/

In March, we blogged about our work with analysts across government to
transform the way we produce official statistics. We borrowed ideas from
software development and academia to demonstrate what this might look like. We
called the project ‘RAP’, which stands for Reproducible Analytical Pipelines.
30 января выйдет Open Budget Survey за 2017 год с очередным рейтингом открытости бюджетов стран. Не стоит ждать резких прорывов или падений открытости в России - мы там на довольно высоком уровне.
Forwarded from Open Government Digest
How Can We Bridge the Gap Between Citizens and State? Previewing the Open Budget Survey 2017
https://www.internationalbudget.org/2018/01/previewing-the-open-budget-survey-2017/

On 30 January 2018 the International Budget Partnership will release the Open
Budget Survey 2017 – the latest round of the world’s only independent and
comparable assessment of budget transparency, citizen participation, and
independent oversight institutions in the budgeting process.

The post [How Can We Bridge the Gap Between Citizens and State? Previewing the
Open Budget Survey
2017](https://www.internationalbudget.org/2018/01/previewing-the-open-budget-
survey-2017/) appeared first on [Inte
Длинные зимние праздники - это хорошая возможность не только отдохнуть, но и отдохнуть за работой. Я так мало программировал руками в последние годы, что решил за пару дней, одновременно, восстановить старый проект и сделать что-то полезное.

Возникла очень простая идея переноса подписки на RSS новости из привычного онлайн ридера, в телеграм. При этом выделив каждую категорию новостей в отдельный канал.

Поиск таких готовых ботов и сервисов ни к чему не привел, кроме того у источников информации с которыми я работаю есть маленький-большой нюанс. Очень часто они не поддерживают экспорт в RSS ленты. Экспорт новостей в RSS это такая "странная" возможность что регулярно разработчики и заказчики их работы по созданию госсайтов и не только забывают их добавить.

Именно по этой причине много лет назад я и сделал алгоритм "Скъюр" который умел и умеет обрабатывать новости с любой страницы и превращать их в RSS.

Итого, я сделал несколько новых каналов в телеграм:
* Инфокультура - https://yangx.top/infoculture - новости проектов Инфокультуры. С нашего сайта, Госзатрат и Открытой полиции. А в будущем и других проектов
* Open Data Digest - https://yangx.top/opendatadigest - канал не-русскоязычных новостей по открытым данным
* Open Government Digest - https://yangx.top/opengovdigest - канал не-русскоязычных новости по открытости государства
* Правительственный вестник - https://yangx.top/govdigest - канал для трансляции официальных новостей с сайта Правительства, Президента, ряда ФОИВов и окологосударственных мозговых центров

Изначально не было планов делать их публичными, но по здравому разумению ничего секретного в них нет. А делать репосты из каналов гораздо удобнее чем вначале получать их через читалку RSS.

Особенность этих каналов в том что работа с ними происходит через универсальный бот. Он авторизует пользователя по нику в Telegram, принимает команды на добавление лент подписки к каналам и регулярно постит в выбранные каналы собранные новости.

Ему не обязательно передавать RSS ленту, можно скормить ссылку на сайт и тогда он там вначале попробует RSS ленту найти и если не найдет то будет искать текст новостей на самой странице.

После бета тестирования бот будет открыт полностью для всех, с ограничением лишь по числу каналов и подписок.
В целом он уже готов, в нем не включено только автосбор новостей. Вернее он пока отключен.

Если кто-то хочет уже сейчас его опробовать и помочь с обратной связью - пишите мне сообщением в Telegram на https://yangx.top/ibegtin или в чат https://yangx.top/begtinchat

#news #feeds
Важный тренд последних нескольких лет - это появление команд цифровой трансформации очень похожих на команду Alpha Gov (ныне это Government Digital Services) в Великобритании.

Такие команды уже есть в Канаде, Италии, США, Великобритании, Австралии, Новой Зеландии.

То как они работают значительно отличается от того о чем говорят в рамках цифровой экономики / цифровой трансформации в России.

И вот главные отличия:
1. Открытая разработка - все эти команды работают в открытую. Их код опубликован, либо на GitHub'е, либо на собственном экземпляре GitLab, но тоже в открытом доступе. Но открытая разработка - это больше чем просто открытый код, это еще и возможность принять участие в исправлении их кода, отправлять сообщения об ошибкам и взаимодействовать с командами разработки.
2. Открытые данные по умолчанию. На открытости данных уже нет такого акцента как раньше по той причине что они уже признаются неким стандартом де-факто.
3. Простой язык (plain language) во всех документах предназначенных для граждан.
4. Единые стилевые гайды по созданию новых и обновлению имеющихся веб сайтов.
5. Публичные консультации на каждом шагу в реализации.

Все начинается с открытого исходного кода.

#opendata #opengov #digitalgov
На сайте Минфина Раздел "Открытые данные" исчез из раздела "Открытое Министерство". Осталось проверить сайты других министерств, нет ли там аналогичных изменений