Ivan Begtin
8.1K subscribers
2K photos
3 videos
102 files
4.72K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
加入频道
Открытость данных по испански - это когда на национальном портале данных datos.gob.es публикуются данные не только органов власти, но и университетов [1] и других исследовательских центров. А также университеты объединяются [2] и создают негосударственный проект UniversiDATA [3] посвящённый прозрачности университетов и предназначенный для раскрытия ими информации об их деятельности: бюджеты, состав преподавателей, исследовательские центры и программы,

Фактически открытые данные используются как часть инфраструктуры прозрачности как государства в целом, так и в частных случаях требований к организациям.

Ссылки:
[1] https://datos.gob.es/en/catalogo?administration_level=U&_res_format_label_limit=0
[2] https://datos.gob.es/es/noticia/nace-universidata-el-portal-colaborativo-de-datos-abiertos-especializado-en-el-sector-de-la
[3] https://www.universidata.es/

#opendata #data #spain
December 14, 2020
Sanitas, испанская медицинская страховая компания, вхолящая в холдинг Bupa запустила инициативу Data4Good в рамках которой предоставляет доступ к собранным ими данным о COVID-19 [1]

Хотя они и называют это открытыми данными, но, конечно, это не открытые данные в общепринятом смысле потому что для получения доступа надо рассказать о своём исследовании, заполнить форму и направить им на рассмотрение. Тем не менее это подпадает под идею data sharing и частично open access, поскольку акцент сделан на исследователях.

Подробнее на испанском языке [2]

Ссылки:
[1] https://landing.sanitasweb.es/data/opendatacovid/english.html
[2] https://corporativo.sanitas.es/sanitas-abre-a-la-sociedad-sus-datos-medicos-anonimizados/

#opendata #spain #covid-19
March 11, 2021
March 24, 2021
В Испании открылся единый портал инфраструктуры геопространственных данных IDEE [1]. Карты, кадастр, поиск и ещё многое. Интересно будет сравнить его с российским и аналогичными проектами в других странах. Испанцы обещают много открытых данных, что уже интересно.

Например, журналистам ищущим имущество олигархов и чиновников в Испании.

Ссылки:
[1] https://www.idee.es

#opendata #spain #geodata #eu
September 9, 2021
В рубрике как это работает у них проект Nueva Economía de la Lengua [1], Новая языковая экономика в Испании.

В его основе инвестиции в размере 1.1 миллиарда евро в изучение испанского языка из которых:
- 475 миллионов евро идёт на создание цифровой платформы изучение языка и оцифровку материалов Института Сервантеса
- 330 миллионов евро идёт на создание языковых моделей для работы искусственного интеллекта.

Эти модели уже активно создаются. Из последних можно привести в пример ESCORPUS [2] языковая модель высокого качества на 50 миллионов слов, а также исходный код и многочисленные другие модели языков и публикации научные и популярные [3] создаваемые в суперкомпьютерном центре в Барселоне.

Обо всём этом, проектах и результатах, на сайте Министерства экономики Испании [4], результатов там немало.

Всё это делает испанский язык наиболее вероятным языком после английского языка по появлению новых продуктов на базе языковых моделей. Может быть ещё китайский язык составляет конкуренцию, разве что.

С точки зрения работы с данными можно рассматривать этот план как создание огромных качественных открытых наборов данных с чётко сформулированными целями в рамках долгосрочной государственной политики.

Испанский язык один из наиболее распространённых в мире и его распространение явно продолжится.

А есть ли на постсоветском пространстве похожие инициативы? Есть ли государственные инвестиции и открытые модели для русского, казахского, армянского, узбекского и других языков? Можно ли сохранять свои языки популярными и востребованными не вкладываясь в технологии их применения?

Ссылки:
[1] https://planderecuperacion.gob.es/como-acceder-a-los-fondos/pertes/perte-nueva-economia-de-la-lengua
[2] https://huggingface.co/datasets/LHF/escorpius
[3] https://github.com/PlanTL-GOB-ES
[4] https://plantl.mineco.gob.es/Paginas/index.aspx

#opendata #datasets #spain #languages #government #policy #eu
August 13, 2022
May 8, 2023
July 6, 2023
January 31, 2024
July 13, 2024
August 8, 2024