Инфокультура
884 subscribers
244 photos
4 videos
4 files
812 links
Новости Информационной культуры. https://infoculture.ru
加入频道
Семантический анализ текста в неевклидовой геометрии. Видео
https://www.infoculture.ru/2019/05/21/semanticheskij-analiz-teksta-v-neevklidovoj-geometrii-video/

24 апреля состоялась дата-среда из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, рассказал о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста.
Дата-среда: «Как извлекать полезную информацию из текста – система PolyAnalyst»
https://www.infoculture.ru/2019/05/23/data-sreda_4_polyanalyst/

29 мая приглашаем на четвертую дата-среду из цикла «Большие данные в
экономике». Тема встречи — «Как извлекать полезную информацию из текста – система PolyAnalyst». Дата-среду проведет Сергей Ананян, генеральный директор компании Мегапьютер (www.megaputer.com), кандидат физмат наук, специалист по решению прикладных задач анализа данных. Надежное извлечение полезной информации из текстовых документов открывает путь к решению многих важнейших бизнес-задач в самых разных областях деятельности.
«Открыто по мере возможности, закрыто по мере необходимости», — учёный Марк Ханнел делится собственными опытом обмена данными в научной среде:

«Cначала я начал выкладывать в открытый доступ свои файлы. Из этого массива данных и возник сайт figshare.com, куда каждый может бесплатно загрузить научные данные, прикрепить метаданные. А мы уже позаботимся об интеграции материалов в академическую среду: сделаем данные цитируемыми, открытыми для поиска, видимыми в Google Scholar, PubMed, у крупнейших издателей, присвоим DOI и т.д.».

Подробнее: https://indicator.ru/article/2019/05/22/internet-byl-sozdan-dlya-obmena-nauchnymi-dannymi-no-seychas-rabotaet-ploho.
Рассылка Инфокультуры 51: дата-среды, вакансии и другие новости
https://mailchi.mp/infoculture/51
Активисты собирают базу знаний по работе с данными. На досках в trello «Инструменты» и «Данные» собираются карточки с ссылками и кратким описанием полезных ресурсов.

На доске об инструментах собраны приложения и сервисы, помогающие извлекать, обрабатывать и визуализировать данные, а также средства для картографирования и каталог каталогов.

На доске «Данные» собраны в основном источники, описывающие Россию, устройство государства и общественную жизнь: статистика, судебная и правоохранительная системы, госфинансы, демографические и социальные показатели, гео-пространственные данные и др.

Списки неисчерпаемы и требуют постоянного мониторинга и обновлений.

Напомним, что Инфокультура тоже публикует собранные данные, задачи, а также ссылки на приложения и сервисы здесь: https://github.com/infoculture.

Инструменты: https://bit.ly/2wsP4Sk.
Данные: https://bit.ly/2YS5C25.
29 мая на заседании в Правительстве министр цифрового развития Константин Носков представил концепцию создания и функционирования Национальной системы управления данными перед главой и членами Правительства.

Иван Бегтин считает, что текущий формат принятой концепции не доработан и имеет множество существенных минусов, проблем и неотвеченных вопросов:

- Отсутствие открытых данных в повестке.
- НСУД системно не решает проблемы качества данных, так как разрабатывается как агрегатор данных.
- Этическая сторона вопроса использования данных граждан в НСУД.
- Что будет происходить с персональными данными: они будут храниться в системе или только обрабатываться?
- Что будет с данными бизнес-корпораций?

Напомним, что в этом году на Дне открытых данных в Москве в рамках направления “Государство и бизнес: участники рынка данных” состоялась дискуссия о НСУД: https://youtu.be/NdW3TD-8M4k. Эксперты разбирались, что изменится в нашей жизни, когда появится НСУД, в чём преимущества системы. Действительно ли государство должно тратить миллиарды бюджетных денег на разработку? Существуют ли альтернативы?

Подробнее: http://aurd.ru/nsud-business.
Хакатон «Цифровой рост» — http://hackathonranepa.ru

16 и 22 июня 2019 года Информационная культура, Ассоциация участников рынка данных и РАНХиГС проведут хакатон «Цифровой рост». Приглашаем к участию выпускников бакалавриата ИТ-специальностей, а также начинающих специалистов, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование.

Участники будут соревноваться в решении задач на машинное обучение, текстовый анализ, маркетинговую аналитику, а также в создании различных типов проектов на основе данных: расширения для веб-браузеров, инфографику, прототипы интернет-сервисов и мобильных приложений, боты. Участники могут решить одну из предложенных задач или разработать свой проект на основе предложенных данных.

Для победителей и участников хакатона предусмотрены призы, а также льготные условия обучения на магистерских программах РАНХиГС «Системы больших данных в экономике» и «Цифровая экономика и современная комбинаторика» (дистанционная программа).

Для победителей и участников хакатона предусмотрены призы, а также льготные условия обучения на магистерских программах РАНХиГС «Системы больших данных в экономике» и «Цифровая экономика и современная комбинаторика» (дистанционная программа).

Регистрация участников открыта до 14 июня: http://hackathonranepa.ru.

Присоединяйтесь в чат участников хакатона: https://yangx.top/bigdataeconomy.
«Инерционная открытость»: эксперты Счетной палаты подготовили рейтинг, посвященный открытости госструктур
https://www.infoculture.ru/2019/06/05/audit-open-government/

Представляем доклад «Открытость государства в России», подготовленный экспертами Инфокультуры и Центра перспективных управленческих решений специально для Счетной палаты Российской Федерации.

Авторы проанализировали работу 22 федеральных министерств и 50 федеральных служб и представили их рейтинг открытости. Полностью открытыми можно назвать лишь четыре министерства.

Исходные данные оценок федеральных министерств и служб по всем категориям представлены в виде электронной таблицы XLSX и доступны для скачивания: https://www.infoculture.ru/2019/06/05/audit-open-government.

8 июня на ПМЭФ авторы проведут презентацию доклада «Открытость государства в России» на профильной сессии.

Текст исследования: http://www.ach.gov.ru/about/document/Открытость-доклад.pdf.
Завтра, 8 июня, в 12:00 на Петербургском международном экономическим форуме состоятся публичные дебаты на тему «Открытое государство в цифровой реальности: мониторинг национальных целей». В рамках сессии состоится презентация доклада «Открытость государства в России». Участники:
- Иван Бегтин, директор АНО «Инфокультура» и руководитель проектного направления «Открытые данные» Счетной Палаты РФ;
- Алексей Кудрин, председатель Счетной палаты Российской Федерации;
- Максим Орешкин, министр экономического развития РФ;

И другие.

Модератор сессии — генеральный директор Центра перспективных управленческих решений Мария Шклярук.

Подключайтесь завтра к онлайн-трансляции: https://www.forumspb.com/programme/71093/

Читать полный текст доклада: https://www.infoculture.ru/wp-content/uploads/2019/06/Otkrytost-doklad.pdf.
Forwarded from Рюмочная ИПП
Сейчас у всех на слуху задержание Ивана Голунова, журналиста "Медузы", известного множеством расследований о коррупции. У Ивана якобы нашли наркотические вещества. Многие считают, что наркотики подбросили, в данный момент проходит акция солидарности — многие люди выходят на одиночные пикеты в Москве и Петербурге. Наш сотрудник Алексей Кнорре написал в РБК о том, насколько вообще подброс наркотиков распространён в России (спойлер: распространён, хотя и непонятно, в каких масштабах).
Forwarded from Рюмочная ИПП
Тема распределения масс изъятых наркотиков в природе как никогда актуальна. Самое время напомнить об исследовании 2015 года наших сотрудников Алексея Кнорре и Дмитрия Скугаревского «Как МВД и ФСКН борются с наркотиками…».

Одной из самых занимательных находок стало поведение подозреваемых в хранении героина, — значительная доля которых держит при себе в аккурат чуть более, чем необходимо для минимизации ответственности.

Читайте также на эту тему статью Андрея Заякина в Новой.
Forwarded from КГИ
На этой неделе многие выйдут на улицы, чтобы поддержать свободную журналистику и Ивана Голунова.

Проект КГИ "Открытая полиция"рассказывает, как вести себя, если к вам подошёл полицейский.

Подробная инструкция здесь: https://www.openpolice.ru/pages/pomosh/kak-vesti-sebya-pri-zaderzhanii-i-oformlenii-administrativnogo-p/

#СвободуИвануГолунову
16-22 июня приглашаем выпускников бакалавриата ИТ-специальностей, а также начинающих специалистов участвовать в хакатоне, посвященном системам больших данных в экономике.

Компании Первый ОФД, Эвотор, DataCoon, проект КГИ "Госзатраты" и др. предоставят данные для решения задач с применением таких технологий, как машинное обучение, текстовый анализ, маркетинговая аналитика, а также для создания различных типов проектов на основе данных: расширения для веб-браузеров, инфографика, прототипы интернет-сервисов и мобильных приложений, боты.

Для победителей и участников хакатона предусмотрены призы, а также льготные условия обучения на магистерских программах РАНХиГС «Системы больших данных в экономике» и «Цифровая экономика».

Подробности и регистрация: http://hackathonranepa.ru
The New York Times опубликовали материалы курса для журналистов по работе с данными.

«You can now VLOOKUP the SUMPRODUCT of the Times’ training efforts. It’s SORT of a TREND; even AVERAGE journalists can CONVERT data skills TO_DOLLARS».

Иными словами внутри курса есть все, что нужно знать при работе с таблицами в Google Spreadsheets (применимо и к Excel). Вы узнаете такие важные функции, как сводные таблицы, сортировка и поиск трендов, формулы — ВПР (VLOOKUP), подсчет средних показателей, очистка и особенности работы с разными форматами данных и др.

Подробности: https://www.niemanlab.org/2019/06/the-new-york-times-has-a-course-to-teach-its-reporters-data-skills-and-now-theyve-open-sourced-it/

Материалы и упражнения: https://drive.google.com/drive/u/0/folders/1ZS57_40tWuIB7tV4APVMmTZ-5PXDwX9w
Forwarded from data.csv (Alexey Smagin)
Журналистка из РБК Дада Линделл победила в конкурсе Data Journalism Awards в номинации «Лучший молодой дата-журналист года». Поздравляем коллегу!

Тут (https://www.rbc.ru/rbcfreenews/5d024eeb9a79473f90310a49) можно посмотреть видео журналистки для конкурса, а здесь (https://datajournalismawards.org/projects/dada-lyndell-young-data-journalist-of-the-year-portfolio-entry/) — работы победительницы
Прямо сейчас проходит заочный хакатон «Цифровой рост», который совместно организовали Информационная культура, РАНХиГС и АУРД.

Защита проектов состоится в субботу 22 июня. Еще можно присоединиться!

Хакатон проводится при поддержке магистерских программ «Системы больших данных в экономике» и «Цифровая экономика».

Участники и победители получат скидки на обучение в размере 20% и 50% соответственно, а также денежный призовой фонд 30 000 рублей.

Задачи хакатона: https://github.com/infoculture/hackathon-ranepa.

Консультации в телеграм-чате: https://yangx.top/bigdataeconomy.

Подробности: http://hackathonranepa.ru.
8 июня на ПМЭФ-2019 прошли публичные дебаты на тему «Открытое государство в цифровой реальности: мониторинг национальных целей».

Что важнее открытость или доверие? Какие данные нужны экономике и гражданам: статистика или big data?

«Открытость – один из немногих эффективных способов гарантировать, что решения принимаются корректно. Сейчас же органы власти не готовы открывать данные, так как они плохого качества, но они не станут лучше, если их не раскрывать», – считает Иван Бегтин, директор АНО «Инфокультура» и руководитель проектного направления «Открытые данные» Счетной палаты Российской Федерации.

Подробнее: https://www.infoculture.ru/2019/06/18/forumspb_opengov.
В связи с делом Ивана Голунова в последние дни много говорят о расследовательской журналистике в России. Мы хотим на кейсах «Новой газеты» рассказать, как работают расследователи и почему сегодня невозможно представить их работу без открытых данных.

Этой весной журналисты дата-отдела «Новой газеты» и авторы дата-блога Алеся Мароховская, Ирина Долинина и Алексей Смагин выступили на московском Дне открытых данных и рассказали, как они работают над своими материалами, используя в основе открытые данные и алгоритмы.

Подробнее: https://www.infoculture.ru/2019/06/19/investigation-data-journalism.
Национальные стратегии работы с данными. Часть 5. Новая Зеландия
https://begtin.tech/new-zealand-data-strategy/

Государственная стратегия работа с данными в Новой Зеландии отличается, с
одной стороны большим акцентом на проработку общих принципов и правил, и с
другой приоритетом на открытости государства, открытость данных и алгоритмов.

* Chief Government Data Steward (Главный управляющий государственными данными) - человек ответственный за управление данными в Новой Зеландии.