Nodes and Links
977 subscribers
228 photos
7 files
453 links
Канал для исследователей и аналитиков социальных сетей. Полезные инструменты сетевого анализа, обзоры научных статей, информация про мероприятия и конференции, а также новости лаборатории прикладного сетевого анализа НИУ ВШЭ
https://anr.hse.ru/
加入频道
Друзья, обновление в сегодняшних мероприятиях:
🔸 В 18.30 приходите на трансляцию Вышки Онлайн с нашей студенткой Марией Ермолаевой.

🔹А в 19.00 ждём вас на мастер-классе DASS «Анализ данных без кода», регистрация - здесь.

До встречи!
Как использовать социальные сети для сбора информации в чрезвычайных ситуациях?
Будь то наводнение, лесной пожар, террористическая атака или военные действия, зачастую Telegram-каналы и СМИ собирают публикации местных жителей и пострадавших о происшествии для того, чтобы показать, как именно разворачиваются события в отсутствии официальных данных. Авторы статьи «Twitter* analysis in emergency management: recent research and trends» показывают, как данные из социальных сетей могут быть полезны в случаях, когда и сами власти не обладают всей информацией для быстрого и эффективного решения проблемы.

Авторы собрали обзор литературы о том, какие стратегии исследователи менеджмента ЧС выбирают на этапах:
🔸 сбора данных (APIs, скрепинг HTML-страниц социальных сетей, использование готовых приложений);
🔹 подготовки данных (фильтрация, очистка, токенизация и перевод в матричный вид);
🔸 анализа данных (контент-анализ, сетевой анализ, анализ метаданных, NLP модели и пространственный анализ).

Только некоторые из представленных в статье исследований:
🔹Wong, C. M. L., & Jensen, O. (2022). The paradox of trust: perceived risk and public compliance during the COVID-19 pandemic in Singapore. In COVID-19 (pp. 189-198). Routledge.
Контент-анализ данных из социальных сетей позволил изучить взаимосвязь между доверием к правительству, восприятием рисков и соблюдением ограничений в первые месяцы COVID-19 в Сингапуре.
🔸Schempp, T., Zhang, H., Schmidt, A., Hong, M., & Akerkar, R. (2019). A framework to integrate social media and authoritative data for disaster relief detection and distribution optimization. International Journal of Disaster Risk Reduction.
Статистический анализ в связке с анализом геотегов позволили сформировать представления о потребностях и ресурсах (например, питьевой воды или спасательных шлюпках) в различных зонах стихийных бедствий.
🔹Gulesan, O. B., Anil, E., & Boluk, P. S. (2021). Social media-based emergency management to detect earthquakes and organize civilian volunteers. International Journal of Disaster Risk Reduction.
K-Nearest Neighbors (KNN), Support Vector Machine (SVM), и the Naive Bayes алгоритм используются для анализа аномалий в твитах для мгновенной идентификации землетрясений, потребностей пострадавших и предложений помощи.
🔸Beedasy, J., Zuniga, A. F. S., Chandler, T., & Slack, T. (2020). Online community discourse during the Deepwater Horizon oil spill: an analysis of Twitter interactions. International Journal of Disaster Risk Reduction.
Контент-анализ, МЛ-модели и SNA применены для анализа формирования дискурса вокруг разлива нефти на скважине Deepwater Horizon в 2010 году.
🔹Hunt, K., Wang, B., & Zhuang, J. (2020). Misinformation debunking and cross-platform information sharing through Twitter during Hurricanes Harvey and Irma: a case study on shelters and ID checks. Natural Hazards, 103(1), 861-883.
Статистический анализ дополнительно созданных метрик твитов (продолжительность жизни, разоблачение и кросс-платформенные источники) позволил проанализровать особенности борьбы со слухами о проверке миграционного статуса на входе в укрытия во время ураганов Харви и Ирма.

Если вы интересуетесь анализом ЧС в России, эта статья станет отличным погружением в методы и примеры работ. Несмотря на блокировку Twitter/X*, подобные исследования можно проводить на базе ВКонтакте, который дает доступ к своему API.

* - заблокирован в России
Мастер-класс DASS «Программа Pajek для анализа и визуализации комплексных сетей»
29 августа в 18.30 приглашаем вас на последний летний мастер-класс, посвященный работе в программе для анализа и визуализации больших сетей Pajek.

Мастер-класс проведет заведующая ANR-Lab Дарья Мальцева, которая изучала программу Pajek в процессе стажировок в Университете Любляны и совместной работы с проф. Владимиром Батагелем.

Участники мастер-класса познакомятся с базовым функционалом программы Pajek, научатся создавать и изменять сетевые данные, рассчитывать базовые сетевые метрики для отдельных узлов и сетей в целом, делать визуализации сетей, а также узнают о возможностях продвинутого анализа сетевых данных различных типов (двумодальные, ацикличные, многореляционные сети, кластеризация и блокмоделинг и др.). Мастер-класс будет нацелен на то, чтобы участники получили полное представление о процессе работы с сетевыми данными и смогли работать в программе Pajek в ходе своих исследований.

Регистрация по ссылке!
День открытых дверей с выпускницей программы
1 сентября в 13.00 онлайн программа «Data Analytics and Social Statistics» («Аналитика данных и прикладная статистика») проведет день открытых дверей с выпускницей программы Диной Яковлевой.

Дина расскажет, кому подойдёт данная программа, и какие карьерные перспективы появляются у ее выпускников. А также, можно ли успешно влиться в обучение на программе без опыта в математике или программировании. И как можно применить полученные знания уже в процессе обучения.

Язык семинара — русский.

Для участия необходимо зарегистрироваться.
Forwarded from Вышка Онлайн
Please open Telegram to view this post
VIEW IN TELEGRAM
Привлекают ли белки-хирурги цитируемость? Отвечает ChatGPT 🐿🎓
В своем исследовании Майк Телволл задаётся вопросом, может ли такая LLM как ChatGPT заменить рецензента, решающего, какие статьи заслуживают публикации, а какие нет.

Для этого он самостоятельно оценил по специальной шкале 50 своих статей, часть из которых была опубликована, а часть — забракована автором или рецензентами. Затем сформулировал критерии этой шкалы и обучил модель давать по ней оценки статьям.

Сравнение оценок человека и ChatGPT показало, что модель оценивает статьи неточно (большое среднее отклонение) и объясняет только 25% дисперсии человеческих оценок. При повторах, модель оценивала одни и те же статьи по-разному.

Наконец, Телволл заменил в слабой статье людей на белок, получив заголовок «Do squirrel surgeons generate more citation impact?». ChatGPT высоко оценил оригинальность статьи, ее методологическую точность и потенциальное влияние на науку и практику.

Да, вероятно, LLM смогут когда-нибудь стать подспорьем рецензентов, но нужно помнить, что ChatGPT — это всё ещё тот самый узник «китайской комнаты» Джона Сёрля, бездумно сопоставлющий незнакомые иероглифы. Модели смогут заменить рецензентов только тогда, когда они же полностью заменят и авторов, и респондентов.
Forwarded from DASS (MASNA) Admissions
Анализируй и визуализируй!

Уже сегодня в 18.30 состоится уникальный мастер-класс DASS «Программа Pajek для анализа и визуализации комплексных сетей».

Мастер-класс проведет заведующая ANR-Lab Дарья Мальцева, которая изучала программу Pajek в процессе стажировок в Университете Любляны и совместной работы с профессором Владимиром Батагелем.

Участники мастер-класса познакомятся с базовым функционалом программы Pajek, научатся создавать и изменять сетевые данные, рассчитывать базовые сетевые метрики для отдельных узлов и сетей в целом, делать визуализации сетей, а также узнают о возможностях продвинутого анализа сетевых данных различных типов (двумодальные, ацикличные, многореляционные сети, кластеризация и блокмоделинг и др.).

Подключайтесь в 18.30
Forwarded from DASS (MASNA) Admissions
This media is not supported in your browser
VIEW IN TELEGRAM
​​Анализ цитирований в российских публикациях в Web of Science

В последнем выпуске Journal of Scientometric Research в соавторстве с Дарьей Мальцевой (ВШЭ) вышла статья, посвященная библиометрическому анализу российской науки на базе 1,38 млн публикаций российских (со)авторов.

В основе работы — использование метода спектроскопии года публикации цитируемых работ (RPYS — Reference Publication Year Spectroscopy), разработанного в 2013 Вернером Марксом. Этот метод, как правило, применяется для более ограниченных датасетов (например, для публикаций одного исследователя, журнала или научной дисциплины). Для обработки миллионов записей данных метод был масштабирован авторами исследования с использованием СУБД, что позволило проанализировать исторические корни российской науки.

В качестве исходных данных был взят массив статей, индексированных в WoS до мая 2022 года, у которых хотя бы один из авторов имеет российскую аффилиацию, в виде текстовых файлов. Почти все статьи приходятся на период с 1992 по 2022 гг, до 1992 публикаций крайне мало. Общее количество ссылок в описанном массиве — более 32 млн, при этом 1,66 млн ведут на статьи, входящие в исходный датасет.

Согласно результатам исследования:

🔹 Количество ссылок в статьях заметно возросло с течением времени: если в 1992 г. в публикации приводилось в среднем 15 ссылок, то в 2022 г. их было 47.
🔹 Один из основных объектов анализа — разница в «возрасте» между статьей и публикациями, которая она цитирует. Подавляющее большинство ссылок приходится на группу 20+ лет — это означает, что российская наука в значительной степени опиралась на более «старые» фундаментальные исследования.
🔹 Общий средний возраст цитируемых статей составил 14,5 лет, и в рассматриваемый период (с 1992 по 2022) он увеличился примерно на 14%. Следует отметить и динамику: так, средний возраст достигает пика (15,5 лет) в 2014 г., а затем снижается. Таким образом, авторы публикаций, написанных после 2014 года, начинают чаще цитировать более «свежие» статьи.

Если говорить о научных журналах, то во все периоды чаще всего цитировались Physical Review Letters, Physical Review B, Physical Review D, The Astrophysical Journal, The Journal of Chemical Physics и Journal of the American Chemical Society, а также Nature и Science. До 2000 года в топ-10 входили также «Доклады Академии Наук СССР», но после 2000-х цитировать их практически перестали.

Так или иначе, подавляющее число цитирований приходится на долю естественных наук, что отмечают и сами авторы.

#обзор #цитирования #RPYS #WebofScience
Вебинар "Как анализировать рынок труда: сравнение россйских и международных рекрутинговых платформ"
5 сентября в 18:30 онлайн программа «Data Analytics and Social Statistics» («Аналитика данных и прикладная статистика») проводит семинар по изучению рынка труда аналитиков данных.

Мы изучили компетенции, формируемые у выпускников, и сравнили их с вакансиями, представленными на рекрутинговых платформах.

На вебинаре мы расскажем:
🔸 Какие курсы программы DASS могут помочь в анализе рынка труда.
🔹 Какие навыки по сбору данных, которым мы учим на программе, пригодятся для работы с рекрутинговыми платформами.
🔸 В чем заключается специфика вакансий аналитиков данных.
🔹 Каковы сходства и отличия российских и международных вакансий по анализу данных.
🔸 Как прикладной сетевой анализ поможет в понимании рынка труда.

Язык семинара — русский.

Для участия необходимо зарегистрироваться.
Forwarded from DASS (MASNA) Admissions
Через полчаса состоится вебинар с выпускницей программы Диной Яковлевой.

Дина расскажет, какие карьерные перспективы появляются у выпускников программы "Аналитика данных и прикладная статистика".

Язык семинара — русский.

Подключайтесь в 13.00
История философских споров в одной сети
Турецкие исследователи Денис Ондуйгу , Хусейн Кущу и Эсер Айгюн создали красочную и интересную визуализацию связи философских идей, концепций и дискуссий.

Проект “History of Philosophy” был начат в 2014 году как любительский: Денис отмечает, что не является академическим философом. Мотивацией для создания проекта послужил интерес к философии и визуализации идей: концепты лучше воспринимаются в свете других схожих или полностью противоположных мнений философов по тому или иному вопросу. Данные для сети собирались и кодировались вручную Денисом и командой, а в дальнейшем были превращены в единую сеть.

Визуально интерактивная сеть представляет собой большой круг, пересеченных хордой. На такой хорде в историческом порядке расположены философы и мыслители. История начинается с таких классических авторов как Ксенофонт и Платон, а заканчивается современными мыслителями: Джеймс Лэдиман и Дэвид Чалмерс; ближе к центру круга находятся такие эпохальные философы как Карл Поппер и Ханна Арендт. Философы связаны дугообразными линиями (самые большие дуги, связывающие наиболее отдаленные эпохи как раз образуют очертания круга). У каждого из философов есть сразу несколько исходящих дуг, отображающих его главные концепты: если эти концепты противоречат другому философу, то цвет дуги красный, если концепты разных философов не противоречат, то цвет дуги зеленый. Например, если св. Фома Аквинский сходится с Платоном по вопросу справедливости Бога, то их дуга по этому вопросу будет зеленой, а если Уильям Оккам не сходится с Аквинатом, то их дуга будет красной.

Сама сеть очень массивная и запутанная, чтобы посмотреть на дискуссию философов разных эпох по конкретному вопросу, нужно нажать на конкретный концепт или цитату философа правой кнопкой мыши, и веб приложение выведет именно эту дискуссию с всеми участниками и дугами. В таком формате смотреть за дискуссией сильно удобнее.
День открытых дверей о стратегиях карьеры аналитика данных
10 сентября в 18:30 онлайн программа «Data Analytics and Social Statistics» («Аналитика данных и прикладная статистика») проведет день открытых дверей.

Вы узнаете, как проходит обучение на программе и кем могут работать выпускники.

Выпускница программы поделится своим опытом и расскажет, на кого рассчитана программа, а также какие карьерные перспективы возможны. Вы сможете узнать, как найти свою нишу в этой области — например, как Елена нашла свою специализацию в визуализации данных. Также будет обсуждаться важный вопрос: как совмещать учебу и работу, чтобы успешно развиваться в выбранной профессии. Не упустите возможность задать ваши вопросы и получить полезные советы!

Язык семинара — русский.

Для участия необходимо зарегистрироваться.
Forwarded from Рюмочная ИПП
Паттерны установки камер наблюдения как зеркало представлений о безопасности

Городские камеры обычно воспринимаются как аватары Большого брата — распределенный дисциплинирующий взгляд, стремящийся охватить все возможное пространство. Но даже если допустить, что проекты уличного наблюдения и правда стремятся к паноптикону, то их реализация имеет технические ограничения: камеры не могут появиться везде в одну ночь, они занимают пространство постепенно и неравномерно.

Что если использовать это и посмотреть на камеры из неоинституциональной перспективы — определить паттерны расположения камер и попробовать восстановить логику их установки? Так мы можем получить представления о «проектах безопасности», в русле которых действуют власти.

Наши сотрудники Дмитрий Серебренников и Дмитрий Скугаревский сделали подход к этой задаче и проанализировали системы наблюдения в четырех европейских столицах — Москве, Париже, Брюсселе и Эдинбурге. Дизайн позаимствован из экологических исследований: камеры рассматриваются как вид, занимающий определенные ниши в городском пространстве. Для анализа было применено объяснимое машинное обучение (CatBoost + SHapley Additive ExPlanations или SHAP).

Исследование показывает, что московский «проект безопасности» имеет значимые отличия от парижского и брюссельского (в Эдинбурге камер оказалось недостаточно, чтобы выделить паттерны). Во всех трех городах камеры ожидаемо тяготеют к публичным пространствам: парковкам, магазинам, точкам торговли уличной едой, — но если в Париже и Брюсселе второй большой нишей камер являются транспортные хабы, то в Москве это территории вокруг двух типов символических объектов — детских пространств (детские площадки, сады, школы) и храмов.

Кроме того, отличается расположение камер относительно центра. В Париже и Брюсселе камеры убывают по мере удаления от центра, в Москве же, напротив, они сконцентрированы в центре и на окраинах. Дальнейшее прояснение специфики намеченных «проектов безопасности» требует уже отдельного исследования.

Статья коллег называется A tale of four cities: Exploring security through environmental characteristics of CCTV equipment placement, она вышла в Journal of Computational Social Science и находится в открытом доступе.
Семинар ANR-Lab «Новые индексы центральности. Уязвимость стран к импорту»
9 сентября в 16:30 Даниил Ткачев, младший научный сотрудник Международного центра анализа и выбора решений, выступит с темой "Новые индексы центральности. Уязвимость стран к импорту".

Одной из основных задач сетевого анализа является выявление важных вершин, которые выявляются с помощью индексов центральности. Однако классические индексы центральности имеют ряд недостатков и ограничений. Для учета группового влияния и параметров вершин были введены индексы центральности Bundle и Pivotal. В данном докладе Даниил Ткачев рассмотрит индексы Bundle и Pivotal и представит новые модели выявления уязвимости стран к импорту зерновых культур, соединений редкоземельных элементов, нефти основанные на значениях центральности Bundle и Pivotal.

Регистрация по ссылке!
Мы обновили сайт ANR-Lab!
Наша лаборатория растет и развивается, поэтому этим летом мы поставили перед собой задачу описать все направления нашей работы. Каждый сотрудник уделил время, чтобы рассказать о своих исследованиях, мы собрали эти тексты по тематическим разделам, а потом вышли на долгую дорогу борьбы с HTML-разметкой hse.ru. И все ради того, чтобы любой желающий смог разобраться, что же это за тайная лаборатория Факультета социальных наук с кабинетами в закоулках Покровского бульвара.

Теперь при переходе в раздел «Научная деятельность» вы можете изучить 7 основных направлений нашей работы со ссылками на статьи и авторов. Если вы ищете, с кем устроить коллаборацию, кого позвать быть научным руководителем или под чьим руководством пройти практику — это отличный ресурс. Не стесняйтесь писать нам на почты!

Другая наша гордость — новый дизайн страницы онлайн-магистратуры «Аналитика данных и прикладная статистика» (DASS). Мы делаем все для того, чтобы наши студенты получали высококлассное образование, и каждый подписчик этого канала знает, что мы считаем важным делиться нашими знаниями со всеми желающими. Теперь страница DASS в полной мере отражает эти ценности и рассказывает всю полезную информацию о поступлении. Кстати, о нем: прием заканчивается 16 сентября, так что мы вас ждем!

Отдельную благодарность выражаем младшему научному сотруднику ANR-Lab и администратору наших страниц на сайте Вышки Тамаре Щегловой 🧡
«Темные» показатели преступности: сравнение данных полиции и больниц об изнасилованиях 👮‍♂👩‍⚕
Далеко не секрет, что в полицию редко обращаются жертвы изнасилований, из-за чего трудно бороться с систематическими преступлениями. Для определения таких областей исследователи-криминологи предлагают обратиться к т.н. «темным показателям» преступности — это события, которые по определенным критериям выделяются как преступные, но не попадают в официальную статистику.

Применив ядерную оценку плотности (KDE), коэффициенты Джинни и пространственную оценку паттернов, авторы статьи сравнивают данные о заведенных в полиции делах об изнасилованиях и данные о опроснике для жертв изнасилований в местной больнице в Кампинас, Бразилия за 3 года. Они обнаружили, что:
🔹данные полиции и больницы совпадали только для 50% случаев, «темные» данные лучше отражают проблемные зоны по городу;
🔸официальные данные не улавливают существенную связь изнасилований с близостью к барам и автобусным остановкам, но шанс заведения дела связан с близостью к полицейским участкам и камерам наблюдения;
🔹жертвы изнасилований в бедных районах менее склонны к обращению в полицию, а увеличение плотности застройки положительно влияет на рост зарегистрированных случаев.

Советуем ознакомиться с текстом статьи, где авторы предлагают свои объяснения для выявленных связей и советуют, как их можно применить в борьбе с изнасилованиями.