Forwarded from Национальный цифровой архив
О том как сохранять видео файлы с Youtube.
Для архивации с Youtube наиболее популярный инструмент youtube-dl [1] это утилита для командной строки где можно указать ссылку на видео и формат сохранения и скачать локально файл с видео или аудиозаписью.
Для тех кто не привык работать с командной строки, есть несколько инструментов создания пользовательских интерфейсов над этой утилитой:
- Open Video Downloader (youtube-dl-gui) [2] - интерфейс над youtube-dl
- youtube-dlG [3] - интерфейс над youtube-dl
- dvd [4] - умеет архивировать не только Youtube, но и другие видео сайты
- Hitomi Downloder [5] - умеет архивировать изображения, видео и текст с десятков сайтов
- FireDM [6] - умеет выгружать обычные файлы и видеофайлы с YouTube
А также обязательно хочу напомнить про ArchiveBox [7] проект созданный специально для ведения личных архивов. Он поддерживает, в том числе, сохранение видеофайлов, а также много разных вариантов другого контента.
Ссылки:
[1] https://ytdl-org.github.io/youtube-dl/index.html
[2] https://github.com/jely2002/youtube-dl-gui
[3] https://github.com/MrS0m30n3/youtube-dl-gui
[4] https://github.com/yausername/dvd
[5] https://github.com/KurtBestor/Hitomi-Downloader
[6] https://github.com/firedm/FireDM
[7] https://archivebox.io/
#digitalpreservation #videoarchives #archives #tools
Для архивации с Youtube наиболее популярный инструмент youtube-dl [1] это утилита для командной строки где можно указать ссылку на видео и формат сохранения и скачать локально файл с видео или аудиозаписью.
Для тех кто не привык работать с командной строки, есть несколько инструментов создания пользовательских интерфейсов над этой утилитой:
- Open Video Downloader (youtube-dl-gui) [2] - интерфейс над youtube-dl
- youtube-dlG [3] - интерфейс над youtube-dl
- dvd [4] - умеет архивировать не только Youtube, но и другие видео сайты
- Hitomi Downloder [5] - умеет архивировать изображения, видео и текст с десятков сайтов
- FireDM [6] - умеет выгружать обычные файлы и видеофайлы с YouTube
А также обязательно хочу напомнить про ArchiveBox [7] проект созданный специально для ведения личных архивов. Он поддерживает, в том числе, сохранение видеофайлов, а также много разных вариантов другого контента.
Ссылки:
[1] https://ytdl-org.github.io/youtube-dl/index.html
[2] https://github.com/jely2002/youtube-dl-gui
[3] https://github.com/MrS0m30n3/youtube-dl-gui
[4] https://github.com/yausername/dvd
[5] https://github.com/KurtBestor/Hitomi-Downloader
[6] https://github.com/firedm/FireDM
[7] https://archivebox.io/
#digitalpreservation #videoarchives #archives #tools
GitHub
GitHub - jely2002/youtube-dl-gui: A cross-platform GUI for youtube-dl made in Electron and node.js
A cross-platform GUI for youtube-dl made in Electron and node.js - jely2002/youtube-dl-gui
По поводу того что все обсуждают что Минцифры/Правительство потребовало от сайтов госорганов в РФ перенести их на российский хостинг и избавиться от зарубежных счетчиков, баннеров, кода и тд. Я несколько лет, а может уже с десяток лет писал про то насколько в России это аномально то что госсайты хостились где попало, были увешены счетчиками посещаемости и тд. Тогда это было остро-актуально в контексте приватности данных пользователей. Госорганы и госпроекты - это монополии, вешать на них счетчики - это не оставлять пользователю никакого выбора.
Сейчас все это обсуждают в контексте информационной безопасности, а я напомню несколько важных фактов:
1. Я веду полный реестр госдоменов уже несколько лет. Значительная его часть доступа в репозитории на Github [1]
2. Важно помнить что кроме госорганов в России около 100 тысяч разного рода бюджетных и муниципальных учреждений., о которых все забыли
3. Даже без госучреждений сайты ФОИВов и их проектов разбросаны по 164 сетям (ASN)
4. Счетчики, внешний код javascript, баннеры и тд. - это массовое явление, сложно даже описать все случаи когда их использовали
и т.д.
Я всё это фиксировал ещё когда приоритетом цифровой архивации были госсайты, там была регулярная проблема с сохранением сайтов до того как ликвидируют орган власти. Сейчас другие проблемы, одномоментно исчезают сайты СМИ.
Впрочем об этом я пишу в канале @ruarxive.
Ссылки:
[1] https://github.com/infoculture/govdomains
#opendata #government #domains
Сейчас все это обсуждают в контексте информационной безопасности, а я напомню несколько важных фактов:
1. Я веду полный реестр госдоменов уже несколько лет. Значительная его часть доступа в репозитории на Github [1]
2. Важно помнить что кроме госорганов в России около 100 тысяч разного рода бюджетных и муниципальных учреждений., о которых все забыли
3. Даже без госучреждений сайты ФОИВов и их проектов разбросаны по 164 сетям (ASN)
4. Счетчики, внешний код javascript, баннеры и тд. - это массовое явление, сложно даже описать все случаи когда их использовали
и т.д.
Я всё это фиксировал ещё когда приоритетом цифровой архивации были госсайты, там была регулярная проблема с сохранением сайтов до того как ликвидируют орган власти. Сейчас другие проблемы, одномоментно исчезают сайты СМИ.
Впрочем об этом я пишу в канале @ruarxive.
Ссылки:
[1] https://github.com/infoculture/govdomains
#opendata #government #domains
GitHub
GitHub - infoculture/govdomains: Создание реестра всех доменных имён Российской Федерации относящихся к органам власти, государственным…
Создание реестра всех доменных имён Российской Федерации относящихся к органам власти, государственным учреждениям, а также региональным и муниципальным властям. - infoculture/govdomains
Из относительно хороших новостей - ProtonMail не планирует блокировать пользователей из России и разослали всем российским пользователям уведомление о том что не будет отключать их в случае невозможности проведения оплаты. А также предложили оплатить сразу годовую подписку и пообещали возможность оплаты через UnionPay и MIR. А также принимают банковские переводы и биткоин.
#privacy #protonmail
#privacy #protonmail
Новости закрытия данных в России
ЦБ РФ разрешил банкам сдавать упрощённую банковскую отчетность [1]
Минфин России скроет все закупки по 223-ФЗ организаций попавших под санкции [2]
Ссылки:
[1] http://www.cbr.ru/press/event/?id=12737
[2] http://publication.pravo.gov.ru/Document/View/0001202203070006
#opengov #opendata #notopen
ЦБ РФ разрешил банкам сдавать упрощённую банковскую отчетность [1]
Минфин России скроет все закупки по 223-ФЗ организаций попавших под санкции [2]
Ссылки:
[1] http://www.cbr.ru/press/event/?id=12737
[2] http://publication.pravo.gov.ru/Document/View/0001202203070006
#opengov #opendata #notopen
В связи с тем что многие онлайн сервисы в России будут недоступны уже скоро или будет невозможно их продлять напомню что я веду Awesome Data Takeout, на Github'е список ссылок и описания способов экспорта данных[1].
Из некоторых сервисов данные получить легко, в случае других - это много ручной работы. В принципе, могу сказать, что при выборе любого онлайн продукта наличие возможности экспорта данных должно быть существенным фактором. Иногда продукт настолько хорош что это можно проигнорировать, но всё равно потом возникнет ситуация когда это потребуется и часто с этим есть проблемы.
Например, только ряд сервисов которыми лично я пользовался/пользуюсь:
- у Miro отсутствует возможность забрать все данные. Только по одному, каждый объект. Очень неудобно
- BeautifulAI не дает возможности забрать данные, но синхронизует их с Google Drive
- Google даёт полный takeout данных организации, почти всего и довольно удобно, но через Google Cloud и всё вместе обычно оказывается большого объёма.
- Creately позволяет рисовать красивые графики, но самого понятия экспорта данных у них нет.
- у Telegram один из лучших сервисов экспорта данных в настольном приложении, но даже они не дают инкрементального резервирования данных.
Пополняйте список на Github'е, он пригодится ещё многим и не раз. Регулярная архивация личных данных полезна и необходима, не забывайте про неё.
Ссылки:
[1] https://github.com/ivbeg/awesome-data-takeout
#privacy #data #personaldata #datatakeout
Из некоторых сервисов данные получить легко, в случае других - это много ручной работы. В принципе, могу сказать, что при выборе любого онлайн продукта наличие возможности экспорта данных должно быть существенным фактором. Иногда продукт настолько хорош что это можно проигнорировать, но всё равно потом возникнет ситуация когда это потребуется и часто с этим есть проблемы.
Например, только ряд сервисов которыми лично я пользовался/пользуюсь:
- у Miro отсутствует возможность забрать все данные. Только по одному, каждый объект. Очень неудобно
- BeautifulAI не дает возможности забрать данные, но синхронизует их с Google Drive
- Google даёт полный takeout данных организации, почти всего и довольно удобно, но через Google Cloud и всё вместе обычно оказывается большого объёма.
- Creately позволяет рисовать красивые графики, но самого понятия экспорта данных у них нет.
- у Telegram один из лучших сервисов экспорта данных в настольном приложении, но даже они не дают инкрементального резервирования данных.
Пополняйте список на Github'е, он пригодится ещё многим и не раз. Регулярная архивация личных данных полезна и необходима, не забывайте про неё.
Ссылки:
[1] https://github.com/ivbeg/awesome-data-takeout
#privacy #data #personaldata #datatakeout
GitHub
GitHub - ivbeg/awesome-data-takeout: Awesome list of data export pages/tools for most common online services
Awesome list of data export pages/tools for most common online services - ivbeg/awesome-data-takeout
Forwarded from Roskomsvoboda
⚡️Statement of Roskomsvoboda:
Sanctions of foreign IT-companies against Russian users only help censorship
❗️ Access to the Internet and electronic means of communication is vital, because only this helps Russians to receive objective information and make the right decisions. The exclusion of Russians from the global Web deprives of reliable external information and in the long run will become an obstacle to the peaceful resolution of the humanitarian crisis.
Today, many technology companies located in the jurisdictions of the US, EU and other countries are carrying out mass shutdowns of Russian user accounts. This process involves domain registrars, software developers, gaming platforms, cryptocurrency exchanges, backbone providers, cloud and other digital services.
Such actions will not improve in the situation in Ukraine, but will significantly worsen the situation with respect for fundamental human rights in the Russian Federation.
➡️ https://roskomsvoboda.org/post/zayavlenie-protiv-otklyuchenia-rf-akkov
➡️ Roskomsvoboda’s statement is available here in Russian, English and French.
Sanctions of foreign IT-companies against Russian users only help censorship
❗️ Access to the Internet and electronic means of communication is vital, because only this helps Russians to receive objective information and make the right decisions. The exclusion of Russians from the global Web deprives of reliable external information and in the long run will become an obstacle to the peaceful resolution of the humanitarian crisis.
Today, many technology companies located in the jurisdictions of the US, EU and other countries are carrying out mass shutdowns of Russian user accounts. This process involves domain registrars, software developers, gaming platforms, cryptocurrency exchanges, backbone providers, cloud and other digital services.
Such actions will not improve in the situation in Ukraine, but will significantly worsen the situation with respect for fundamental human rights in the Russian Federation.
➡️ https://roskomsvoboda.org/post/zayavlenie-protiv-otklyuchenia-rf-akkov
➡️ Roskomsvoboda’s statement is available here in Russian, English and French.
Роскомсвобода
Заявление «Роскомсвободы»: Санкции иностранных IT-компаний в отношении обычных российских пользователей только помогают цензуре
Доступ к интернету и электронным средствам связи жизненно необходим, поскольку только с его помощью россияне могут получать объективную информацию и принимать правильные решения, а их исключение из глобальной Сети лишает достоверной внешней информации и в…
Forwarded from Национальный цифровой архив
Для тех у кого нет возможности выкачать архив сайта Эха Москвы который мы ранее выкладывали, мы сейчас ведем выгрузку mp3 файлов отдельных передач радиостанции, они пока ещё доступны онлайн по прямым ссылкам.
Сейчас это 37277 ссылок из которых скачано 4167 файла и выгрузка продолжается.
Тем кто хочет успеть сохранить конкретные передачи, список всех выкладываем пока ещё активные ссылки.
В файле echomskru_mp3_urls.zip - все пока ещё работающие ссылки на mp3 файлы которые мы успели собрать с сайта радиостанции.
В файле echomskru_lists.zip - те же ссылки разбитые по названиям программ.
Ссылки ведут на CDN сервер Эха Москвы, он пока ещё доступен за пределами России, для выгрузки, Вам, возможно потребуется VPN подключение.
Списки можно загружать в любую программу поддерживающую выгрузку файлов списками, например Persepolis, бесплатная программы для выгрузки с открытым кодом [1].
Ссылки:
[1] https://persepolisdm.github.io/
#webarchives #archives #echomskru
Сейчас это 37277 ссылок из которых скачано 4167 файла и выгрузка продолжается.
Тем кто хочет успеть сохранить конкретные передачи, список всех выкладываем пока ещё активные ссылки.
В файле echomskru_mp3_urls.zip - все пока ещё работающие ссылки на mp3 файлы которые мы успели собрать с сайта радиостанции.
В файле echomskru_lists.zip - те же ссылки разбитые по названиям программ.
Ссылки ведут на CDN сервер Эха Москвы, он пока ещё доступен за пределами России, для выгрузки, Вам, возможно потребуется VPN подключение.
Списки можно загружать в любую программу поддерживающую выгрузку файлов списками, например Persepolis, бесплатная программы для выгрузки с открытым кодом [1].
Ссылки:
[1] https://persepolisdm.github.io/
#webarchives #archives #echomskru
Forwarded from Национальный цифровой архив
Я постепенно буду возвращаться к регулярным публикациям в канале про то о чём писал раньше - данных, технологиях, государстве. Насколько возможно буду писать про открытость, хотя и места у неё теперь многократно меньше в "текущей политической ситуации".
Из общественной деятельности у меня не вызывает сомнений в востребованности и актуальности только цифровая архивация, о которой я буду писать больше здесь и в телеграм-канале @ruarxive. Цифровые архивы актуальны как никогда.
Гораздо сложнее будет рассказывать о зарубежных стартапах и коммерческих продуктах, поскольку я писал о них изучая рыночные ниши в Modern data stack, новом подходе к архитектуре приложений на данных, а сейчас, если делать дата-продукты в России то это совсем другая экосистема, другие продукты да и многое совсем другое.
Даже если делать сильный акцент на продуктах с открытым кодом - это, всё равно, совсем всё по другому.
#blogging #data
Из общественной деятельности у меня не вызывает сомнений в востребованности и актуальности только цифровая архивация, о которой я буду писать больше здесь и в телеграм-канале @ruarxive. Цифровые архивы актуальны как никогда.
Гораздо сложнее будет рассказывать о зарубежных стартапах и коммерческих продуктах, поскольку я писал о них изучая рыночные ниши в Modern data stack, новом подходе к архитектуре приложений на данных, а сейчас, если делать дата-продукты в России то это совсем другая экосистема, другие продукты да и многое совсем другое.
Даже если делать сильный акцент на продуктах с открытым кодом - это, всё равно, совсем всё по другому.
#blogging #data
Forwarded from Национальный цифровой архив
Как устроены общественные проекты по цифровой архивации в мире
В мире существует много инициатив по цифровой архивации, это могут быть целевые проекты по архивации данных и кода, библиотек сканов старинных книг и многое другое. Чаще всего такие проекты инициируются государством или являются проектами госархивов и национальных библиотек. Но есть множество проектов которые созданы волонтерами для решения срочных задач, вот некоторые из них.
Climate Mirror (http://climatemirror.org/)
Зеркало данных о изменении климата. Данные собирались сообществом после прихода к власти Трампа и анонса удаления данных с государственных сайтов в США.
DataRefuge (https://www.datarefuge.org/)
Проект по сбору данных о изменении климата и состоянию окружающей среды. Также возник после действий администраций Трампа, включает архивацию данных, каталог, хакатоны по сбору данных и многое другое
End of term web archive (http://eotarchive.cdlib.org/)
Проект The End of Term Web Archive создан в Калифорнийской цифровой библиотеке при Университете Калифорнии и включает слепки всех государственных сайтов США за каждый выборный цикл: 2008, 2013, 2017 годов.
SUCHO (https://sucho.org)
Свежий проект по архивации объектов цифрового культурного наследия Украины, создан участникам из нескольких университетов в США, работает как волонтерский проект.
—
А также, конечно, важный проект ArchiveTeam (https://archiveteam.org) сообщества архивистов-активистов срочно архивирующих сайты, в первую очередь, крупнейших закрываемых проектов, например, соцсетей или сервисов коротких ссылок. Это особенно большой проект, о нем ещё напишу отдельно.
Важно то что все эти проекты основаны на открытости результатов, архивы не закрыты, не спрятаны, не складированы в неизвестном месте, а доступны для выгрузки.
#ruarxive #archives #webarchives #digitalpreservation
В мире существует много инициатив по цифровой архивации, это могут быть целевые проекты по архивации данных и кода, библиотек сканов старинных книг и многое другое. Чаще всего такие проекты инициируются государством или являются проектами госархивов и национальных библиотек. Но есть множество проектов которые созданы волонтерами для решения срочных задач, вот некоторые из них.
Climate Mirror (http://climatemirror.org/)
Зеркало данных о изменении климата. Данные собирались сообществом после прихода к власти Трампа и анонса удаления данных с государственных сайтов в США.
DataRefuge (https://www.datarefuge.org/)
Проект по сбору данных о изменении климата и состоянию окружающей среды. Также возник после действий администраций Трампа, включает архивацию данных, каталог, хакатоны по сбору данных и многое другое
End of term web archive (http://eotarchive.cdlib.org/)
Проект The End of Term Web Archive создан в Калифорнийской цифровой библиотеке при Университете Калифорнии и включает слепки всех государственных сайтов США за каждый выборный цикл: 2008, 2013, 2017 годов.
SUCHO (https://sucho.org)
Свежий проект по архивации объектов цифрового культурного наследия Украины, создан участникам из нескольких университетов в США, работает как волонтерский проект.
—
А также, конечно, важный проект ArchiveTeam (https://archiveteam.org) сообщества архивистов-активистов срочно архивирующих сайты, в первую очередь, крупнейших закрываемых проектов, например, соцсетей или сервисов коротких ссылок. Это особенно большой проект, о нем ещё напишу отдельно.
Важно то что все эти проекты основаны на открытости результатов, архивы не закрыты, не спрятаны, не складированы в неизвестном месте, а доступны для выгрузки.
#ruarxive #archives #webarchives #digitalpreservation
www.datarefuge.org
Data Refuge
Data Refuge is a community-driven, collaborative project to preserve public climate and environmental data
Хорошая краткая заметка о том как использовать недокументированные API - How to use undocumented web APIs [1] в данном случае про то как это делается с помощью Chrome developer tools и curl. Довольно коротко и неплохо. Я довольно много писал ранее про недокументированные API государственных информационных систем, но и не только. Можно делать это разными способами, не только Chrome + curl, но и Firefox + httpie + Postman и многими другими инструментами. Важнее то что недокументированного API ну очень много.
Ben Stancil пишет про покупку сервиса Streamlit за 800 миллионов USD компанией Snowflake [2]. Одно из крупных поглощений на рынке данных. Особенность Streamlit в том что это сервис по созданию data apps (приложений на данных) и тут важно, конечно, помнить что Streamlit - это open source продукт и весьма успешный.
В блоге Bit.io заметка про доступ к их сервису через шаблон Jupyter Notebook [3] хорошая идея, надо бы аналогичное нам в Datacrafter. Jupyter Notebook всё таки стандарт де-факто для data science.
На сайте The Open Data Institute свежее исследование Measuring the impact of data institutions [4] о том как институты развития по помогают развитию рынков и сообществ данных. Неплохо подобранные кейсы, в основном из Великобритании.
P.S. Как я писал ранее, я постепенно буду возвращаться к регулярной ленте заметок и новостей по работе с данными. Невозможно забрасывать профессиональную деятельность даже несмотря на творящийся апокалипсис.
Ссылки:
[1] https://jvns.ca/blog/2022/03/10/how-to-use-undocumented-web-apis/
[2] https://benn.substack.com/p/the-data-app-store?s=r
[3] https://innerjoin.bit.io/automate-jupyter-notebooks-on-github-9d988ecf96a6
[4] https://theodi.org/article/measuring-the-impact-of-data-institutions-report/
#opendata #opensource #startups
Ben Stancil пишет про покупку сервиса Streamlit за 800 миллионов USD компанией Snowflake [2]. Одно из крупных поглощений на рынке данных. Особенность Streamlit в том что это сервис по созданию data apps (приложений на данных) и тут важно, конечно, помнить что Streamlit - это open source продукт и весьма успешный.
В блоге Bit.io заметка про доступ к их сервису через шаблон Jupyter Notebook [3] хорошая идея, надо бы аналогичное нам в Datacrafter. Jupyter Notebook всё таки стандарт де-факто для data science.
На сайте The Open Data Institute свежее исследование Measuring the impact of data institutions [4] о том как институты развития по помогают развитию рынков и сообществ данных. Неплохо подобранные кейсы, в основном из Великобритании.
P.S. Как я писал ранее, я постепенно буду возвращаться к регулярной ленте заметок и новостей по работе с данными. Невозможно забрасывать профессиональную деятельность даже несмотря на творящийся апокалипсис.
Ссылки:
[1] https://jvns.ca/blog/2022/03/10/how-to-use-undocumented-web-apis/
[2] https://benn.substack.com/p/the-data-app-store?s=r
[3] https://innerjoin.bit.io/automate-jupyter-notebooks-on-github-9d988ecf96a6
[4] https://theodi.org/article/measuring-the-impact-of-data-institutions-report/
#opendata #opensource #startups
Julia Evans
How to use undocumented web APIs
A different way to "bundle" Data Platforms [1] заметка от Petr Janda о другом подходе к категоризации современного стека данных. К существующим категориям Ingestion, Storage, Transformation, Virtualization, он добавляет кросс-категории перекрывающие эти: Provisioning, Scheduling, Access Management, Logging, Alerting.
Классификация вполне полезная, покрывающая многие задачи решаемые этими инструментами и то какие возможности ожидаются от продуктов.
Команда продукта Atlan по каталогизации данных привлекла $50M инвестиций в его развитие. По многим критериям это один из наиболее интересных продуктов по data lineage, отслеживания происхождения данных и каталогизации данных и метаданных [2].
Canner, тайваньский продукт построения data mesh, получил $3.5M инвестиций [3]. Они обещают, по сути, единую платформу с интеграцией с десятком видов хранилищ данных и с инструментами для потребления данных. Странно что при этом инвестиции невелики, впрочем это серия A инвестиций. Плюс вся документация на китайском языке [4]. Общедоступного продукта у них нет, только по запросу. Но документация весьма подробна.
Ссылки:
[1] https://petrjanda.substack.com/p/data-platform-bundle
[2] https://humansofdata.atlan.com/2022/03/atlan-raises-series-b/
[3] https://cannerdata.com/product
[4] https://docs.cannerdata.com/
#data #startups #moderndatastack
Классификация вполне полезная, покрывающая многие задачи решаемые этими инструментами и то какие возможности ожидаются от продуктов.
Команда продукта Atlan по каталогизации данных привлекла $50M инвестиций в его развитие. По многим критериям это один из наиболее интересных продуктов по data lineage, отслеживания происхождения данных и каталогизации данных и метаданных [2].
Canner, тайваньский продукт построения data mesh, получил $3.5M инвестиций [3]. Они обещают, по сути, единую платформу с интеграцией с десятком видов хранилищ данных и с инструментами для потребления данных. Странно что при этом инвестиции невелики, впрочем это серия A инвестиций. Плюс вся документация на китайском языке [4]. Общедоступного продукта у них нет, только по запросу. Но документация весьма подробна.
Ссылки:
[1] https://petrjanda.substack.com/p/data-platform-bundle
[2] https://humansofdata.atlan.com/2022/03/atlan-raises-series-b/
[3] https://cannerdata.com/product
[4] https://docs.cannerdata.com/
#data #startups #moderndatastack
petr@substack
A different way to "bundle" Data Platforms
Why should we stop focusing on bundling tools in our data stacks?
Как обещал я время от времени буду писать про общественный проект который сейчас даже более остроактуален чем просто работа над открытыми данными
Forwarded from Национальный цифровой архив
Новости проекта на начало недели
Начата архивация издания Бумага (paperpaper.ru) в связи с его блокировкой в России и возможной приостановкой деятельности в будущем, поскольку как минимум домен издания находится в зоне .ru и может быть разделегирован.
Идёт перенос медиа-архива записей на Эхе Москвы в облачное хранилище и дополнительных мест для его хранения. Это порядка 465GB файлов mp3 около 20тысяч записей передач. К сожалению сохранить удалось не всё.
Идет работа над обновлением сайта проекта и созданием интерфейса над последними созданными архивами. Вначале хотя бы в самом базовом виде, так чтобы можно было посмотреть архивные материалы по коллекциям и скачать файлы архивов.
Ранее собранные архивы можно посмотреть в таблице "Планы архивации" на Airtable.
—
Если Вы знаете сайты и иные цифровые ресурсы которые могут исчезнуть в ближайшее время, напишите в чате @ruarxhivechat или заполните форму.
Напомню что ключевые критерии сохранения сайта/цифрового ресурса в нашем архиве:
1) Цифровой ресурс представляет общественную ценность даже для небольшой группы людей
2) Цифровой ресурс имеет существенные риски исчезновения в ближайшее время, от дней до месяцев.
#ruarxive #news #archives
Начата архивация издания Бумага (paperpaper.ru) в связи с его блокировкой в России и возможной приостановкой деятельности в будущем, поскольку как минимум домен издания находится в зоне .ru и может быть разделегирован.
Идёт перенос медиа-архива записей на Эхе Москвы в облачное хранилище и дополнительных мест для его хранения. Это порядка 465GB файлов mp3 около 20тысяч записей передач. К сожалению сохранить удалось не всё.
Идет работа над обновлением сайта проекта и созданием интерфейса над последними созданными архивами. Вначале хотя бы в самом базовом виде, так чтобы можно было посмотреть архивные материалы по коллекциям и скачать файлы архивов.
Ранее собранные архивы можно посмотреть в таблице "Планы архивации" на Airtable.
—
Если Вы знаете сайты и иные цифровые ресурсы которые могут исчезнуть в ближайшее время, напишите в чате @ruarxhivechat или заполните форму.
Напомню что ключевые критерии сохранения сайта/цифрового ресурса в нашем архиве:
1) Цифровой ресурс представляет общественную ценность даже для небольшой группы людей
2) Цифровой ресурс имеет существенные риски исчезновения в ближайшее время, от дней до месяцев.
#ruarxive #news #archives
Airtable
Airtable | Everyone's app platform
Airtable is a low-code platform for building collaborative apps. Customize your workflow, collaborate, and achieve ambitious outcomes. Get started for free.
Я ранее писал неоднократно что с момента моего ухода из проектов Счетной палаты РФ я занимаюсь проектом Datacrafter (data.apicrafter.ru) - это крупнейший каталог данных с технологиями идентификации данных, обработки данных, их сбора, построения схем и ещё многое другое. А также проектом APICrafter через который мы предоставляем API к крупным базам данных таким как госконтракты, госзакупки, реестры юридических лиц и многое другое.
Изначально продукт создавался как сервисные API, постепенно мы его перестраивали в платформу для работы с данными.
Конечно, текущий гуманитарный апокалипсис ему также сильно повредил. Проект делался под привлечение инвестиций, а поиск инвестиций в проекты на данных в России теперь сильно усложнены. Но проект продолжается, в этом волноваться не стоит. Возможно он частично перейдет в открытый код.
А пока в ближайшее время мы переносим проект на другой хостинг, поэтому временно не будет работать обновление данных и в какие-то дни он может быть временно недоступен. Как только миграция на новый хостинг завершится, мы вернемся к регулярному обновлению данных и продолжим загрузку новых данных которых тоже много накопилось.
Больше новостей проекта в отдельном телеграм канале @apicrafter
#data #opendata #apicrafter
Изначально продукт создавался как сервисные API, постепенно мы его перестраивали в платформу для работы с данными.
Конечно, текущий гуманитарный апокалипсис ему также сильно повредил. Проект делался под привлечение инвестиций, а поиск инвестиций в проекты на данных в России теперь сильно усложнены. Но проект продолжается, в этом волноваться не стоит. Возможно он частично перейдет в открытый код.
А пока в ближайшее время мы переносим проект на другой хостинг, поэтому временно не будет работать обновление данных и в какие-то дни он может быть временно недоступен. Как только миграция на новый хостинг завершится, мы вернемся к регулярному обновлению данных и продолжим загрузку новых данных которых тоже много накопилось.
Больше новостей проекта в отдельном телеграм канале @apicrafter
#data #opendata #apicrafter
Прокуратура блокирует сайты быстрее чем я их архивирую (с)
А если серьёзно, то риски исчезновения цифрового контента в мире существовали всегда. Раньше главным "злодеем" была компания Yahoo, которые безжалостно закрывали огромные проекты вроде хостинга Geocites и многого другого. В чистом виде были корпоративные злодеи. Но они, как бы, распоряжались собственными проектами. И закрытие проектов цифровыми корпорациями раньше было основной причиной смерти контента, наряду с разделегированием доменов, сломанными дисками, взломом хакеров, смертью или недееспособностью создателей личных сайтов и многого другого.
Ещё очень часто сайты/контент исчезали при ликвидации организаций. Я помню как пару лет следил за тем как ЦБ ликвидирует банки. После анонса ликвидации сайта банка исчезал где-то через 2-4 часа. В 9:00 пройдет новость, а в 11:00 вместо сайта уже заглушка. Кто-то скажет что ну и что такого, но это просто пример. Эхо Москвы тоже пример одномоментного исчезновения огромного объёма контента.
А сейчас в рисках для российских медиа появилась блокировка Роскомнадзора - это риск исчезновения из сети, но есть нюансы. Издания у которых домены, адреса вне зон .ru, .рф, .su, нет рисков что их домены могут быть разделегированы. У изданий у которых нет юр лиц в России нет рисков что против этих юр. лиц могут применяться административные меры воздействия. В результате когда сейчас Роскомнадзор блокирует сайты в зоне .ru или сайты относящиеся к российским юр. лицам - риски исчезновения этих сайтов усиливаются.
Мне, как цифровому архивисту, это совершенно не нравится и, конечно, архивировать такие ресурсы надо по повышенному приоритету.
А ещё одна причина исчезновения цифрового контента сейчас - это невозможность владельцами оплачивать их хостинг в евро или долларах. Трудно пока предсказать сколько всего будет исчезать через 1-2 месяца по этой причине.
Если Вы знаете цифровые ресурсы под угрозой исчезновения и имеющие общественную ценность - пишите мне или в чат @ruarxivechat
#digitalpreservation #archives #webarchives
А если серьёзно, то риски исчезновения цифрового контента в мире существовали всегда. Раньше главным "злодеем" была компания Yahoo, которые безжалостно закрывали огромные проекты вроде хостинга Geocites и многого другого. В чистом виде были корпоративные злодеи. Но они, как бы, распоряжались собственными проектами. И закрытие проектов цифровыми корпорациями раньше было основной причиной смерти контента, наряду с разделегированием доменов, сломанными дисками, взломом хакеров, смертью или недееспособностью создателей личных сайтов и многого другого.
Ещё очень часто сайты/контент исчезали при ликвидации организаций. Я помню как пару лет следил за тем как ЦБ ликвидирует банки. После анонса ликвидации сайта банка исчезал где-то через 2-4 часа. В 9:00 пройдет новость, а в 11:00 вместо сайта уже заглушка. Кто-то скажет что ну и что такого, но это просто пример. Эхо Москвы тоже пример одномоментного исчезновения огромного объёма контента.
А сейчас в рисках для российских медиа появилась блокировка Роскомнадзора - это риск исчезновения из сети, но есть нюансы. Издания у которых домены, адреса вне зон .ru, .рф, .su, нет рисков что их домены могут быть разделегированы. У изданий у которых нет юр лиц в России нет рисков что против этих юр. лиц могут применяться административные меры воздействия. В результате когда сейчас Роскомнадзор блокирует сайты в зоне .ru или сайты относящиеся к российским юр. лицам - риски исчезновения этих сайтов усиливаются.
Мне, как цифровому архивисту, это совершенно не нравится и, конечно, архивировать такие ресурсы надо по повышенному приоритету.
А ещё одна причина исчезновения цифрового контента сейчас - это невозможность владельцами оплачивать их хостинг в евро или долларах. Трудно пока предсказать сколько всего будет исчезать через 1-2 месяца по этой причине.
Если Вы знаете цифровые ресурсы под угрозой исчезновения и имеющие общественную ценность - пишите мне или в чат @ruarxivechat
#digitalpreservation #archives #webarchives
В последней версии Firefox 98.0.1 удалены поисковые системы Yandex и Mail.ru [1]. Это наверняка можно поменять в конфигурационных файлах, но по умолчанию их нет.
Хотя там ещё остались Ozon.ru и Price.ru, но надолго ли? Судьба российских технологических компаний и продуктов в западных экосистемах это теперь очень большой и болезненный вопрос.
Ссылки:
[1] https://www.mozilla.org/en-US/firefox/98.0.1/releasenotes/
#russia #digital
Хотя там ещё остались Ozon.ru и Price.ru, но надолго ли? Судьба российских технологических компаний и продуктов в западных экосистемах это теперь очень большой и болезненный вопрос.
Ссылки:
[1] https://www.mozilla.org/en-US/firefox/98.0.1/releasenotes/
#russia #digital
Правительство тут регулярно вводит те или иные меры экономической поддержки в России. Иногда читаешь и думаешь, вот люди, вот молодцы, вот заботятся наконец-то о нас простых предпринимателях, но, честно говоря, все этим меры совсем не кажутся чем-то реально помогающим.
Я не могу не перечислить то что делать надо и надо было ещё очень давно, вне зависимости от степени экономической катастрофы в России:
1. Резкое сокращение госаппарата
В 2-3 раза начиная с вице-премьеров, министров и их заместителей. Как минимум необходимо:
- сократить число вице премьеров до 2-х. Сейчас их 10
- сократить число ФОИВов в 2 раза. Сейчас их более 60, а достаточно будет 20-30
- сократить число заместителей министров до 2-х. Сейчас кое-где их 9 [1], а кое-где 7 [2]
и так далее.
2. Бессрочная отмена всех контрольных и надзорных мероприятий
Не на 1-2-3 года, а бессрочно отмена вместе с ликвидацией надзорных и контрольных органов. Какое-то время будут проблемы и много жалоб на нарушения, и там где их будет много там и восстанавливать госнадзор. С нуля и только там где это будет остро необходимо.
Не буду объяснять почему эти меры не будут приняты. И так всё понятно.
У меня ещё много разных идей с тем что можно сделать чтобы выправить текущую ситуацию, но большая их часть ограничена свежими и несвежими федеральными законами о-том-о-чём-нельзя-говорить.
Ссылки:
[1] http://government.ru/gov/persons/#vice-premiers
[2] https://minfin.gov.ru/ru/ministry/
[3] https://minstroyrf.gov.ru/about/structure/
#economy #sanctions
Я не могу не перечислить то что делать надо и надо было ещё очень давно, вне зависимости от степени экономической катастрофы в России:
1. Резкое сокращение госаппарата
В 2-3 раза начиная с вице-премьеров, министров и их заместителей. Как минимум необходимо:
- сократить число вице премьеров до 2-х. Сейчас их 10
- сократить число ФОИВов в 2 раза. Сейчас их более 60, а достаточно будет 20-30
- сократить число заместителей министров до 2-х. Сейчас кое-где их 9 [1], а кое-где 7 [2]
и так далее.
2. Бессрочная отмена всех контрольных и надзорных мероприятий
Не на 1-2-3 года, а бессрочно отмена вместе с ликвидацией надзорных и контрольных органов. Какое-то время будут проблемы и много жалоб на нарушения, и там где их будет много там и восстанавливать госнадзор. С нуля и только там где это будет остро необходимо.
Не буду объяснять почему эти меры не будут приняты. И так всё понятно.
У меня ещё много разных идей с тем что можно сделать чтобы выправить текущую ситуацию, но большая их часть ограничена свежими и несвежими федеральными законами о-том-о-чём-нельзя-говорить.
Ссылки:
[1] http://government.ru/gov/persons/#vice-premiers
[2] https://minfin.gov.ru/ru/ministry/
[3] https://minstroyrf.gov.ru/about/structure/
#economy #sanctions