Ах, этот Минфин
1.08K subscribers
281 photos
1 video
12 files
338 links
Заметки о новостях открытых финансовых данных, устройстве госфинансов и качестве открытых данных.
Для вопросов: http://yangx.top/k0shk
加入频道
День открытых данных: 6 марта с 11:00

6 марта с 11:00 в онлайн-формате пройдет ежегодный День открытых данных. В этом году будут представлены выступления об открытых данных в российской науке, об особенностях работы со статистикой внешней торговли, презентация нового проекта Dateno и многое другое.

В 12:45 расскажу о том, что происходит в области открытых госфинансов: повышается ли уровень финансовой открытости, доступ к каким наборам данных мы потеряли, что ожидать в ближайшее время и над какими проектами мы сейчас работаем.

Заспойлерю несколько скриншотов обновленной версии сайта проекта «Госзатраты», расскажу как мы собираем 5 тысяч исторических документов о госфинансах и как мы победили в конкурсе СПб «Твой Бюджет 2.0», по результатам которого Петербургские госорганы опубликуют в открытом доступе 150 тысяч страниц о финансах Петербурга за 100 лет.

Регистрация по ссылке: https://opendataday.ru/msk
Открытые данные в Армении

На прошлых выходных мы провели первый Open Data Day в Армении. Он прошел в уютной атмосфере лофта Еревана с выступлениями представителей госорганов, дата-специалистов и журналистов.

Армения находится в начале своего пути работы с открытыми данными, поэтому на Дне открытых данных планами Министерства Высокотехнологичной Промышленности поделился Аршак Левонович Керобян, начальник Управления цифровизации.

Самым интересным, на мой взгляд, является намерение Министерства поддерживать концепцию open by default - открытость по умолчанию. В этой концепции все, что не является закрытым, должно быть доступным и открытым. Россия не придерживается концепции открытости по умолчанию, поэтому существует (устаревший) список наборов данных, которые должны быть открытыми.

Вторым интересным моментом является инвентаризация всех государственных данных и публикация созданного каталога. При этом, была озвучена идея о том, что госорганы не могут пользоваться и ссылаться на те данные, которые не включены в каталог. На мой взгляд, это отличное решение для того, чтобы госорганы своевременно вносили информацию о своих наборах данных (тем самым актуализируя каталог) и не забывали публиковать их в открытом доступе.

Рассказывали также доработке закона О свободе информации и о том, какую бурную дискуссию он вызвал даже среди потенциальных бенефициаров, которые так долго боролись за повышение открытости и прозрачности.

Закон о персональных данных также сейчас разрабатывают. Удивительно, что для регистрации информации о гражданах существует несколько не связанных друг с другом реестров, каждый из которых устаревает через пять минут.

Надеюсь, что все это (ну или хотя бы то, что касается открытых данных) в ближайшее время будет реализовано.

Кстати, некоторое время назад мы запустили общественный портал открытых данных Армении (https://data.opendata.am), загрузив первые 815 наборов данных. Государственный портал армянское правительство тоже анонсировало.
Цифровой архив госфинансов: Бюджеты Российской империи и СССР в виде книг и открытых данных

К Дню архивиста мы (Инфокультура и Институт Гайдара) запускаем новый проект - Цифровой архив госфинансов и госуправления (finlibrary.ru). Наша главная задача - сохранить и сделать доступными и машиночитаемыми исторические документы о госфинансах. Мы хотим собрать источники о государственном бюджете за 150 лет, агрегировать наиболее полную базу статистических сборников и подготовить открытые данные для разработчиков.

Среди собранных документов можно найти Государственные бюджеты СССР и РСФСР, выпуски журнала “Проблемы экономики” и бюллетени Счетной Палаты РФ, документы департаментов Минфина XIX века, книги по истории Минфина России, бюджеты городов и многое другое. Уже сейчас в нашей базе данных собраны государственные бюджеты за 80 лет, с практически непрерывным покрытием 1866-1945 гг.

При разработке проекта мы делаем акцент на следующих пунктах:

1. Полнота базы данных: мы добавляем все те источники, которые можем найти (не забывая о проверке наличия открытых лицензий). На данный момент мы частично собрали источники из проекта «Исторические документы» Минфина России и проекта «Исторические материалы», а также нашли еще несколько проектов, документы с которых агрегируем в этом году.

2. Открытые данные: мы хотим не только собрать базу документов и добавить к ним текстовый слой, но и разработать на основе них наборы открытых данных.

3. Уникальные документы: года 4 мы скупаем исторические документы с профильных площадок и сканируем их. Также для данного проекта мы отсканировали личный архив исторических книг А.Л. Кудрина (в который вошли, например, 7 томов истории Минфина России). А в 2022 году мы оцифровали архивные отчеты Счетной Палаты.

4. Метаданные: большинство документов, которые мы собрали, практически не систематизированы, поэтому мы ставим для себя задачу обогатить их метаданными и разработать для этого соответствующие классификаторы.

«Почти 25 лет назад Минфин начал сохранять, формировать и популяризировать историю государственных финансов. 
Мне приятно осознавать, что эта деятельность активно развивается и сегодня благодаря усилиям нового поколения специалистов в области компьютерной обработки информации.
 
Желаю исследователям и пользователям проекта «Цифровой архив госфинансов и госуправления» успехов в их непростой, но чрезвычайно интересной работе, требующей универсальных навыков в самых разных сферах – от истории и архивного дела до современных цифровых технологий», - Алексей Кудрин (@AlekseiKudrin), д.э.н., главный научный сотрудник, член Попечительского совета Института Гайдара.

Иногда самые интересные книги могут быть написаны от руки. Например, исторические бюджеты Санкт-Петербурга. Такие случаи требуют особого внимания и поэтому работы предстоит очень много. Мы заинтересованы в партнерах и волонтёрах. Нам нужна помощь в следующих задачах:

⁃ сбор исторических документов с сторонних сайтов;
⁃ разметка базы данных;
⁃ разработка справочников и классификаторов;
⁃ создание наборов открытых данных;
⁃ предоставление исторических документов на оцифровку.

Будем рады пожеланиям и предложениям. Пишите на почту [email protected] (Ольге Пархимович) или в телеграм @k0shk. Более подробную информацию о проекте можно найти в анонсе: https://finlibrary.ru/s/finarchive/page/news.
Чаты госорганов - отдельный вид искусства

Иногда диалоги госорганов с гражданами бесценны. Пока Минфин России традиционно отвечает на все комментарии по опубликованным на выходных ребусам и загадкам и ищет спрятанные цветочки, граждане пытаются выяснить законодательное регулирование криптовалюты (см. прикрепленный скрин).

Но есть и другие примеры. Коллега недавно столкнулась с проблемой неправильного начисления налогов на недвижимость и ошибочных пени. Для решения проблемы были использованы все возможные способы: обращение гражданина, звонок инспектору, личная встреча с замом начальника инспекции, запросы в Прокуратуру. Ситуация длилась несколько недель, все предложенные ФНС решения не срабатывали (сотрудники ФНС упорно предлагали вписать в декларацию то, что в нее не вписывалось), ничего не помогало.

На удивление помог официальный телеграм-чат ФНС: стоило описать в чате ситуацию, как в этот же день перезвонил вежливый сотрудник и решил проблему. Вот такой лайфхак, пользуйтесь :)
Институт Гайдара» и АНО «Информационная культура» запустили  новый проект  - «Цифровой архив госфинансов и госуправления».

Таким образом, мы расширили массив для работы с экономикой данных.

Теперь благодаря новому поколению специалистов в области компьютерной обработки информации мы можем
сохранить исторические источники о государственных финансах и госуправлении и сделать их доступными для экономистов, историков, исследователей, разработчиков и всех, кто интересуется.

Самые ранние материалы исследования датируются концом XIX - началом ХХ века. Теперь они оцифрованы, и  исследователи, учёные получат доступ к уникальным материалам, охватывающим более двух веков истории российских государственных финансов, а студенты смогут реализовать свои проекты, используя оцифрованные и верифицированные наборы данных.
Статистические данные Банка России в формате временных рядов теперь доступны по API и в виде машиночитаемых наборов данных

Всего доступно 49 статистических показателей, среди которых можно найти:

- статистику по ипотечному жилищному кредитованию
- структуру денежной массы
- объемы кредитов, предоставленных субъектам МСП
- платежный баланс РФ
- процентные ставки по вкладам физлиц в рублях
- сведения по кредитам нефинансовым организациям и физлицами
- и многое другое.

Также на сайте Банка России доступна подробная инструкция по работе с сервисом (https://www.cbr.ru/statistics/data-service/user_guide/) и документация к API (https://www.cbr.ru/statistics/data-service/APIdocuemntation/).

Отличная новость, т.к. не так часто нас балуют новыми открытыми данными, особенно финансовыми. Было бы здорово, если и другие финансовые организации возьмут пример с Банка России. Например, Сбер мог бы расширить и детализировать данные, доступные сейчас в СберИндексе, а Тинькофф - хотя бы добавить возможность скачивать данные, доступные в графиках Тинькофф Индекса.

Ссылка на сервис получения данных: https://www.cbr.ru/statistics/data-service/
Предложение Военного отдела Минфина, от которого невозможно отказаться 🙈. 1948 год.

Этот, и многие другие документы, мы отсматривали в Центральном архиве Санкт-Петербурга.

На днях Центральный архив СПб опубликовал первый тендер в рамках проекта «Петербургский цифровой архив госфинансов и госуправления», с которым мы выиграли конкурс «Твой Бюджет 2.0» в прошлом году. В рамках данного тендера будет оцифровано 60 тысяч образов. Всего наш лимит - 150 тысяч образов, которые будут доступны всем без регистрации и смс.

Кстати, сегодня, в День города Санкт-Петербурга, информационный портал «Архивы Санкт-Петербурга» снова доступен бесплатно всем желающим (после регистрации): https://spbarchives.ru
«Первое и важнейшее условие существования всякой благоустроенной системы госфинансов заключается в полнейшей гласности и отчетности расходов каждого фартинга казенных денег», 1870 г.

Удивительно, но все обоснования открытости и подотчетности государства, звучавшие при создании Открытого Правительства, разработке концепции открытых данных и развитии открытости не только в России, но и в других странах, были сформулированы еще 150 лет назад в издании Ливерпульской ассоциации финансовых реформ «Как англичане критикуют свои государственные расходы» (1870 год).

Авторы описывают необходимость открытости и подотчетности госорганов, работу государства за счет налогов граждан, необходимость бережного отношения к деньгам граждан, необходимость еще большей открытости Великобритании, а также высказывают сомнения в точности и добросовестности раскрываемой информации.

Второе издание 1908 года, пополнившее библиотеку Инфокультуры благодаря Максиму Осовскому, мы оцифровываем для проекта Цифрового архива госфинансов (@finlibraryru, подписывайтесь, будем делиться новостями проекта и находками).

Оригинал текста на скриншоте, но для удобства цитирую ниже:

«Первое и важнейшее условие существования всякой благоустроенной системы госфинансов заключается в полнейшей гласности и отчетности расходов каждого фартинга казенных денег. Государственные люди не должны забывать, что большинство доходов казны собирается в форме налогов. т.е. принудительным образом и без вознаграждения подданного каким-нибудь личным эквивалентом. Расход каждого фартинга казенных денег, поэтому, имеет особое, чуть ли не священное значение и должен совершаться с соблюдением величайшей бережливости, осторожности и гласности. … Таким образом, по мысли ливерпульского общества, власть должна производить расходы так, чтобы не только представители народа, но и всякий частный человек имел возможность проследить и проверить, куда и каким путем ушел из рук правительства каждый фартинг денег, ежегодно ассигнуемых народом на нужды государства».
Анкета одного из ЗАГСов Московской области предлагает при регистрации ребенка предоставить логин и пароль от личного кабинета Госуслуг. А мы потом удивляемся, как через Госуслуги квартиры продают без ведома владельцев, и другим видам мошенничества.

Поле как будто бы зачеркнуто, но не удивлюсь, если молодые родители от гормонов или эмоций в него что-то впишут. Да и в целом его наличие в печатной форме (да и наличие самой печатной формы) вызывает большие вопросы.
Пожалуй, самое оригинальное про новую ИТ-ипотеку (можно еще и версию про разблокировку Youtube сделать):

«Приходит Чебурашка в Минцифры и говорит:
— Постановление по ипотеке вышло?
— Нет,— говорит Шадаев.— Как выйдет сообщу!
На следующий день Чебурашка снова приходит в минцифры и спрашивает:
— Постановление вышло?
А Шадаев говорит:
— Если ты еще хоть раз спросишь про постановление, я у тебя аккредитацию заберу!
На третий день Чебурашка приходит и спрашивает:
— А вы можете просто так аккредитацию забрать?
Нет, не можем,— отвечает Шадаев.
— А постановление по ипотеке вышло?»

(с) @mixmebar из ИТ-чата @MIT_union
Рубрика "Цифровая милота"
Всё-таки у нас очень доброе Минцифры - аккредитованному ИТ-специалисту Чебурашке дали всё, что он хотел получить.
А ведь могли и уши гвоздями к полу прибить
Успеть за 60 минут: Портал открытых данных открыли на год позже и снова закрыли спустя час работы

Возобновление работы Портала открытых данных (data.gov.ru) было бы отличной новостью для возобновления постов в моем телеграм-канале, но, пока я готовила пост, Портал снова закрыли. Напомню, что исполнение контракта подрядчиком (дубликат юрлица которого Минэк несколько лет назад отправил в РНП) было просрочено на год. Но кое-что, все-таки, успела заметить:

- В поиске работают только некоторые фильтры, поиск по организациям-поставщикам данных не работает, фильтрация по уровням власти отсутствует - после многочисленных попыток мне не удалось отфильтровать данные Минфина России или найти данные по федеральному бюджету.
- Данные устаревшие. «Свежих данных» годичной-двухлетней давности практически нет, в основном мелькают данные 2019-2022 гг.
- Заметное количество наборов датированы 1970 годом, то есть на каком-то этапе импорт дал сбой, но разработчики это не отследили и не исправили.
- Выгрузка реестра данных не работает - выдает ошибку таймаута.
- Заявленный бот-помощник также не выдает никакой реакции даже на предлагаемые сайтом запросы.
- Контакты техподдержки отсутствуют: в качестве почты указан «левый» адрес [email protected], телефонов нет.
- Из ссылок на соцсети успела перейти только в телеграм-канал и комментарии к нему: хотела выйти на связь с разработчиками, но вместо этого узнала об Индонезийском онлайн-казино.
- Попробовала авторизоваться через Госуслуги - разрешение Портал ОД успешно получил и выдал новую ошибку. Залогиниться так и не удалось.
- Отдельное внимание заслуживает раздел Аналитика: по открытым данным собирают два параметра - количество наборов данных и количество лайков (лайки - это же самое главное для аналитика).
- Региональная статистика тоже в духе минималиста - количество регионов и попытка нарисовать график с количеством организаций-поставщиков данных в каждом регионе (спойлер: не получилось: влезли только 10 регионов с одинаковым количеством организаций).

Как и написано в заголовке, спустя очень короткое время (полчаса-час) Портал перестал открываться - пользователи теперь видят плашку о «этапе проведения аттестационных мероприятий в соответствии с Приказом ФСТЭК России». Но после появления этой плашки возникает ряд вопросов:
- Что делал Минэк весь прошлый год, если на февраль 2024 года был запланирован этап тестирования с целью определить дату запуска?
- Как Минэк принял Портал, если неработающих элементов в нем больше, чем работающих?
- Почему Портал, не прошедший аттестационные мероприятия, получает мои персональные данные из Госуслуг?
- Как, кем и в какие сроки проводятся аттестационные мероприятия, если в контракт на разработку Портала они не входили, а отдельного контракта на них нет (по крайней мере в открытом доступе)? Об этом аспекте подробно пишет автор канала «Координация профанации» (https://yangx.top/CynExp/5845)

Так много вопросов и совсем нет ответов.
В повышении ключевой ставки винить… котов

Админы Банка России подзарядились запрошенными у подписчиков фоточками котов и ушли в недельный отпуск менять ключевую ставку
Уже завтра в онлайн-формате пройдет ежегодный День открытых данных, на котором мы:

- представим проект Цифровой архив госфинансов;

- расскажем о визуализации данных о госконтрактах с помощью интерактивных дашбордов;

- покажем Dateno - проект, позволяющий искать по 22 млн датасетов.

Также можно будет узнать об открытой базе бухгалртерской отчетности, визуализации данных по внешней торговле и многом другом.

Зарегистрироваться можно по ссылке: opendataday.ru
С Днем архивов!

Ровно год назад мы запустили новый проект - Цифровой архив госфинансов и госуправления (finlibrary.ru). За этот год мы стремились сохранить и сделать доступными исторические документы о госфинансах и госуправлении и, на наш взгляд, нам это удалось:

- количество документов на сайте Архива превысило 8 тысяч. Мы агрегировали новые источники документов: книги из личного архива А.Л. Кудрина (@AlekseiKudrin) по истории госфинансов, Архив Егора Гайдара и Национальную электронную библиотеку;

- распознали 500 сканов и подготовили 100 новых наборов данных, в основном связанных с государственными бюджетами СССР. Стремимся к созданию временных рядов;

- обогатили метаданными 1500 документов из библиотеки Минфина России и разработали три новых классификатора;

- собрали бюджеты за 1866-1990-е годы и оформили их в виде интерактивного таймлайна (https://finlibrary.ru/s/finarchive/page/timeline). Данные за 12 лет мы пока не нашли и находимся в активном поиске :D (можете нам с этим помочь);

- также в 2024 году мы активно помогали Комитету финансов Санкт-Петербурга (@comfinspb) оцифровать и опубликовать 100 тысяч образов о финансах Санкт-Петербурга за 100 лет, и надеемся, что скоро эти данные будут опубликованы (несмотря на перенос сроков);

- в этом году мы планируем больше взаимодействовать с нашими пользователями - вести телеграм-канал, организовывать конкурс для студентов и взаимодействовать с владельцами документов.
Робот Макс удивляет. Давайте выберем лучшую подпись

- МАКСимум толерантности
- ИИ, который мы заслужили?
- ИИ-ксенофоб
- ИИ, обученный на датасете из Бирюлево

Месяц назад 30 госорганизаций из нескольких регионов присоединились к обучению робота Макса (https://news.egov.itmo.ru/25-02-03-64.html). Их рук дело?

(Пояснение: до 1 марта владельцам животных необходимо их зарегистрировать, сделать это можно на портале Госуслуг. Но Максу, похоже, об этом не сообщили)
Ах, этот Минфин
Робот Макс удивляет. Давайте выберем лучшую подпись - МАКСимум толерантности - ИИ, который мы заслужили? - ИИ-ксенофоб - ИИ, обученный на датасете из Бирюлево Месяц назад 30 госорганизаций из нескольких регионов присоединились к обучению робота Макса (h…
Если вчера днем удивлял Робот Макс, то вечером удивляли (приятно) коллеги из Госуслуг, отвечающие за Макса.

Буквально через час после поста появился подробный ответ о том, как устроена работа Макса, приведена статистика запросов по данной теме, варианты ответа GPT-версии Макса и поддержана идея добавления «дисклеймера» в ответы Макса, если он не нашел точный ответ.

Уже вечером Макс повысил свою квалификацию и начал подробно отвечает о том, как зарегистрировать животных, в каких регионах это является обязательным и предоставлять соответствующие ссылки на региональные порталы Госуслуг.

Я даже не знаю, может ли быть обратная связь от государственного сервиса оперативнее и качественнее. Никита, спасибо.

(Оригиналы ответов можно почитать в комментариях к предыдущему посту).