Выше квартилей
3.01K subscribers
117 photos
1 video
1 file
329 links
HSE: Home of Scientometrics and Expertise

Обучение и консультирование по практическим вопросам research evaluation и управлении наукой.

Все вопросы и предложения направляйте @vyshekbot или на почту Наукометрического центра ВШЭ: [email protected]
加入频道
Конференция OpenAlex: по горячим следам

Как мы уже упоминали, 30 и 31 мая состоялась первая онлайн-конференция OpenAlex. Мы внимательно наблюдали за ней (и даже задали пару вопросов), и хотим поделиться кратким описанием докладов и новостей, которые показались нам наиболее интересными.

День 1:

1️⃣ В первой секции сделали доклады Джессика Эдвардс (библиотекарь Columbia University) и Сильвия Орнер (библиотекарь University of Scranton). Их презентации были посвящены специфике применения OpenAlex в работе университетских библиотек. Энди Херцог (библиотекарь University of Minnesota) рассказал о том, как интегрировал OA в систему управления научной информацией в библиотеке своего университета.
2️⃣ Во второй секции был представлен доклад Дэниела Санфельда (доцент Universidade de Brasilia), посвященный Laguna — бразильскому data lake, который может строить сети цитирований с использованием облачных вычислений. Александр Гейтс (научный сотрудник University of Virginia School of Data Science) на основе данных OA проанализировал, как фрагментирование глобальной науки ограничивает распространение идей: например, как скоро концепция после упоминания в одной стране появляется в другой.
3️⃣ В третьей секции Саджад Эбрахими (Toronto Metropolitan University) презентовал работу своей компании — это Reviewer.ly, приложение для поиска рецензентов. Чем-то похоже на нынешнюю версию интерфейса OA, но с большим упором на визуализацию, в особенности сетей коллабораций и облака слов. Еще один инструмент для визуализации, Complemetrix, представил Альберт Диас-Гилера (Universidad de Barcelona). Двое докладчиков рассказывали про scite.ai: Шон Райф, сооснователь компании, предложил подход к построению рейтингов на основе OA, а Рикардо Хартли (Universidad Central de Chile) рассказал о непосредственном применении scite.

Завершили первый день конференции Кайл Демес и Джейсон Портеной из компании OurResearch, которая разработала OpenAlex. Они подвели итоги и поделились последними результатами и планами компании. В частности, буквально в последние недели были реализованы: стемминг поисковых запросов (теперь поисковой движок должен воспринимать различные словоформы) и интеграция с Retraction Watch. В ближайшее время планируется добавить: метаданные финансирующих учреждений, выбор полей для экспорта, новые опции поиска и новые фильтры, настраиваемые группы и взвешенный citation impact для различных предметных областей. Чуть позже будут реализованы визуализация и аналитические инструменты внутри OpenAlex, дополнительные поля, помимо количества, в группировке (group-by), больше источников, больше метрик, больше грантов и больше встреч пользователей.

День 2:

1️⃣ Во второй день было больше докладов от институтов и аналитических заметок. В первой секции доклады представили Самуэль Мок (библиотекарь University of Twente) и Сара Критцлер (библиотекарь Duisburg-Essen University) — они рассказали о своих проектах, посвященных унификации метаданных и созданию кастомизированных библиометрических отчетов. Присутствовал также Эрик Жанжирар, представитель Министерства высшего образования и науки Франции, команда которого работает над Works Magnet — инструментом для курирования метаданных.
2️⃣ Во второй секции была презентация Нееса Яна ван Эка (CWTS Leiden University) о визуализации данных OA при помощи VOSViewer. Ян Хан (The University of Arizona) рассказал об использовании OA для измерении вклада научных сотрудников университета.
3️⃣ В третьей секции интересный доклад представила Малгожата Лагиш (University of South Wales) — о больших научных коллективах и их вкладе в большую науку. И, наконец, Паскаль Поплен и Амели Черч (Sorbonne Université) рассказали об опыте полного перехода со Scopus на OpenAlex, который не так давно предприняла Сорбонна.

Программу конференции можно найти на сайте OpenAlex. Там же чуть позже будут размещены презентации докладчиков и запись эфира.

#openalex #конференция
​​Королевство пустых зеркал

В рамках нашей рубрики #историянаукометрии мы уже не раз показывали, что наука о науке не сразу обрела собственный предмет.

В дискуссии, получившей название «Как перестать беспокоиться и полюбить реферируемые журналы», А. Космарский отметил, что наукометрия как способ изучения работы научных практик может быть интересна в двух перспективах. С одной стороны, интерес к изучению науки как самостоятельного предмета может быть внутренней практикой самой науки, ее саморефлексией над происходящими внутри науки процессами. С другой стороны, в ней заинтересованы внешние по отношению к науке лица, например, государство, которое может прибегать к использованию продуктов наукометрии для (не-)эффективного администрирования процессов самой науки.

Т. Франссен и П. Воутерс в своем исследовании об изменениях использования библиометрии подчеркивают, что две эти перспективы в отношении гуманитарных наук последовательно сменяют друг друга: с 1960-х по 1980-е годы библиометрия является частью социологической оптики для изучения внутринаучных процессов, в то время как с 1980-х годов библиометрия начинает в большей степени рассматриваться как эмпирический материал для формирования научных политик и оценки исследований.

Учитывая наш личный интерес к теме, мы не могли пройти мимо анонса нашего коллеги Андрея Герасимова, который приглашает принять участие в конференции «Королевство пустых зеркал: социальные исследования социальных наук». Конференция, которая пройдет в Шанинке и онлайн, будет посвящена как эмпирическим исследованиям, реконструирующим путь становления наук и изменения их формы, так и теоретическим подходам к научной самообъективации. Направления конференции затронут в первую очередь разные социологические подходы, будь то исследования социо-гуманитарного знания в СССР, интеллектуалов, подходов к социальным наукам или социология социологии. Кроме того, одним из заявленных направлений, которое может особенно заинтересовать наших постоянных читателей, выступит наукометрическая перпектива (а также ее враги!): как цифры характеризуют нынешнее положение социальной науки, а также при помощи каких практик наука изучает эти цифры?

Мы же, по обыкновению, решили посмотреть, как схожие темы представлены в OpenAlex. Выборку было решено делать по концепциям, а не по недавно появившимся тематикам, поскольку только среди концепций удалось найти соответствующие пункты. Для анализа мы выбрали следующие концепции: Scientific integrity, Scientific thinking, Scientific evidence, Sociology of knowledge, Scientific modelling, Scientific reasoning, History of science, Scientific society, Scientific revolution, Scientific method, Scientometrics, Scientific progress, Science studies, Sociology of scientific knowledge, Scientific theory, Informetrics, порог балла связи (score) 0,5, временной период — с 2014 по 2024 гг. Результаты представлены на диаграмме (есть и интерактивная версия). Больше всего как цитирований, так и публикаций насчитывает наукометрия — более 3 тысяч статей были процитированы почти 25 тысяч раз. Сразу обращают на себя внимание концепции «научное доказательство» (scientific evidence) и история науки — публикаций по каждой из концепций около 2 тысяч, но при этом цитирований у первой более 20 тысяч, а у второй — всего 5479.

#конференция #OpenAlex #аналитика
История библиометрических баз данных и их разновидностей. Часть 1

Научные базы данных обеспечивают доступность и систематизацию растущего потока статей, материалов конференций, патентов и других исследований. Сегодня обращение к Web of Science, Scopus или другим базам данных для поиска статей — рутина любого исследователя. Мы используем базы данных, не придавая большого значения их различиям и не задумываясь об истории их появления. В сегодняшнем посте, посвященном истории наукометрии, мы посмотрим, как происходило становление баз данных, окружающих нас сегодня.
 #историянаукометрии #Scopus #WoS #MAG #OpenAlex
​​Гендерная гомофилия — исследование RSCI

Недавно мы писали об исследовании гендерной гомофилии, опубликованном в PLoS ONE. Нас заинтересовало более актуальное положение в различных научных областях, прежде всего по российским источникам. Мы решили проанализировать публикации 2023 года на предмет гендерного распределения исследователей, основываясь на данных OpenAlex. Выборка состояла из журналов RSCI (включая их переводные версии).

Наш исходный датасет включал 42 353 публикации со следующими параметрами: тип публикации "article"; не менее двух авторов, год публикации = 2023. Для определения предполагаемого пола авторов использовался пакет gender в R, который рассчитывает вероятность того, является ли имя мужским или женским, основываясь на данных за 1932-2012 гг. Для имен, которые не удалось распознать, дополнительно анализировалось родовое окончание фамилии. Всего в рассматриваемом датасете оказалось 187 303 автора, из которых 60 802 — женщины, 66 233 — мужчины, у 60 268 пол не был распознан. Последний результат частично связан с несовершенством метаданных в OpenAlex, но в большой степени со страновыми особенностями. Во-первых, пакет gender довольно часто не распознает азиатские и ближневосточные имена; во-вторых, в ряде стран (например, в Индии) принято указывать только инициалы и фамилию, что делает распознавание имени невозможным.

Итоговый массив составляет 18 238 публикаций, для которых распознан пол всех авторов. В нем мы выявили 3 079 публикаций, написанных чисто женскими коллективами, 3 940 — чисто мужскими. В 3 494 случаях число мужчин и женщин среди авторов было одинаковым. Также выяснилось, что чисто мужские коллективы обычно незначительно крупнее, чем чисто женские — 2,29 авторов-мужчин и 2,27 авторов-женщин в среднем.

Показательным также оказалось распределение по предметным областям. Наибольший разрыв по-прежнему сохраняется в инженерных дисциплинах — мужских коллективов более чем в два раза больше, чем женских, тогда как во всех науках о здоровье, включая общую медицину, число авторских женских коллективов значительно превосходит число мужских (причем это характерно только для нашей выборки по журналам RSCI — на общемировой выборке женщины имеют преимущество только в сестринском деле, общих науках о здоровье и нейронауках, причем перевес незначителен).

#аналитика #гомофилия #соавторство #OpenAlex
​​FWCI в OpenAlex: первые пробы

12 августа 2024 OpenAlex добавил к своим показателям FWCI (Field-weighted Citation Impact — индекс цитирования, взвешенный по области науки). Рассчитывается он как и в других случаях через отношение количества цитирований за три года (плюс год публикации) к ожидаемому количеству цитирований по данному типу и предметной области (в OpenAlex используется третий по детализации уровень классификации — subfield).

Изначально FWCI появился в SciVal как одна из snowball-метрик. В Web of Science есть аналогичная метрика — CNCI (Category Normalized Citation Impact), однако исследователи давно заметили, что показатели FWCI и CNCI для одной и той же публикации различаются — иногда значительно. Это связано с рядом причин:

🔸 разный охват баз данных Web of Science и Scopus, и, следовательно, разное количество индексируемых цитат;

🔸 различия в предметных классификаторах;

🔸 способ расчета CNCI и FWCI для публикаций, которые относятся к более чем одной предметной области.

У OpenAlex есть своя специфика в расчете FWCI:

1. База в принципе содержит больше данных и включает в себя множество работ без цитирований — это снижает средние ожидаемые значения цитирования, поэтому цитируемые работы, скорее всего, будут иметь более высокие значения FWCI в OpenAlex.

2. У OpenAlex принципиально другой подход к классификации — тематика (primary topic), по которой нормализуется цитируемость, присваивается публикации, а не журналу. Поэтому FWCI/CNCI, нормализованный по предметным областям журналов, может значительно отличаться от FWCI согласно OpenAlex.

3. В OpenAlex датой публикации считается дата, когда публикация впервые появилась в сети. Однако дата выхода периодического издания может быть на год позже сетевой публикации, что влияет на окно цитируемости.

Небольшой пробный анализ мы сделали на недавнем массиве публикаций, которые мы использовали для анализа гендерной гомофилии (тип публикации "article", год публикации 2023, выборка из журналов RSCI, включая переводные версии). Общее количество таких публикаций на данный момент составляет 56 641. 47 359 (!) публикаций имеют нулевой FCWI, при этом у 2261 работы ненулевая цитируемость.

На графике визуализированы 25 наиболее популярных областей (то есть таких, в которых количество работ было наибольшим — разброс составил от 565 до 1751 публикаций: по инфекционным заболеваниям и по социологии и политическим наукам соответственно). Нулевые значения FWCI убраны из рассмотрения, поскольку сильно смещают график вниз; также удалено 46 выбросов (с FWCI от 10,03 до 146,352; наибольшее значение у статьи под названием "2021 ESC Guidelines for the diagnosis and treatment of acute and chronic heart failure", опубликованной в Российском Кардиологическим журнале).

Области, в которых основной массив публикаций располагается выше 1, можно считать достаточно авторитетными в российских журналах: это означает, что большинство тех статей, которые в принципе цитируются, цитируется чаще, чем ожидается на среднемировом уровне.

Однако выбросы, которые мы удалили (FWCI > 10), наглядно демонстрируют, что метрика должна использоваться с большой осторожностью: например, у целого ряда работ FWCI составляет 12,179 при количестве цитирований, равном 2.

#OpenAlex #Scopus #FWCI #цитируемость #визуализация
Дискуссия недели в картинке недели: оптика OpenAlex

Решение Нобелевского комитета о награждении Джона Дж. Хопфилда и Джеффри Э. Хинтона премией по физике вызвало немало дискуссий, так как работы лауреатов, на первый взгляд, относятся в большей степени к области компьютерных наук, чем к фундаментальной физике. При этом, как заметили наши читатели, с учетом результатов премии по химии было бы странно не отметить Нобелевской премией авторов метода, который позволил совершить открытие мирового уровня. Но насколько верным было решение дать награду именно в отмеченной научной области?

Алексей Хохлов в своей заметке указывает, что «корни того, что мы называем искусственный интеллект, зародились, когда Хопфилд исследовал системы магнетиков методами теоретической физики». Здесь фактически приводится обоснование самого Нобелевского комитета, подробно разъясняющего, почему истоки нейронных сетей и машинного обучения следует искать именно в областях физики.

Мы же решили на дискуссию недели ответить рубрикой «Картинка недели». Так, мы посмотрели, какое количество различных областей науки затронула публикация Дж. Дж. Хопфилда "Neural networks and physical systems with emergent collective computational abilities" (Proceedings of the National Academy of Sciences of the USA, 1982), которую позже цитировал в своих работах Дж. Э. Хинтон, второй лауреат премии. Всего изначальная статья Хопфилда цитируется 17 884 раза. Для того, чтобы построить сеть цитирований с учетом тематик OpenAlex, мы использовали VOSviewer, и вот, что у нас получилось.

Как видно, физика по объему публикаций действительно занимает далеко не первое место, но общий вклад для этой тематической области оказывается значительным. Нейронные сети позволили значительно продвинуться в различных тематических направлениях, включая и отдельные разделы физики, при этом влияние работы на другие области также оказывается велико. Таким образом, общий вклад в науку лауреатов трудно переоценить (особенно учитывая информационный шум вокруг искусственного интеллекта в последние несколько лет) и в действительности не так существенно, по какой «статье» принято решение. Ведь, в конце концов, у Дж. Дж. Хопфилда докторская по физике. Интерактивная версия доступна по ссылке.

#нобелевскаянеделя #физика #VOSviewer #OpenAlex
Влияет ли Википедия на науку?

Википедия была запущена в 2001 году, и уже по состоянию на 2023 год включала в себя более 55 миллионов статей примерно на 300 языках с охватом 400 млн уникальных посетителей в месяц.

В академической сфере, как правило, не принято ссылаться на статьи из Википедии в публикуемых работах, так как в отличие от традиционных энциклопедий, материалы в которых тщательно проверены экспертами, информация, опубликованная в Википедии зависит от «мудрости толпы» (wisdom of the crowds). Несмотря на это некоторые исследователи утверждают, что свободная энциклопедия все же имеет заметное влияние на формирование научного ландшафта.

Например, результаты рандомизированного контролируемого испытания, проведенного несколько лет назад, показали, что исследователи предпочитают использовать в своих научных статьях выражения и цитаты, встречаемые на страницах Википедии, т.е. статья в Википедии может влиять на то, как ученые пишут о предмете в своих собственных исследованиях.

Хотя энциклопедии в целом не всегда активно цитируются в научных статьях, результаты анализа цитирований двух краудсорсинговых и двух экспертных энциклопедий (Wikipedia, Britannica, Baidu Baike и Scholarpedia) показали, что Википедия — наиболее цитируемая энциклопедия из представленных. Так, на свободную энциклопедию ссылались в 141 991 документе Scopus (с 2002 по 2020 г.), в то время как на Британскую энциклопедию (Britannica) — в 15 929 (с 2002 по 2020 г.), на Энциклопедию Байду (Baidu Baike) — в 2934 (с 2007 по 2020 г.) и на Scholarpedia — в 8399 (с 2007 по 2020 г.).

Несмотря на то, что Википедия многоязычна, её больше читают и цитируют на английском языке (95 % всех цитирований). Чаще всего ссылаются на Википедию в США (26 % от числа всех упоминаний), далее следуют Китай (12 %), Индия (11 %), Великобритания (6 %) и Германия (4 %).

Также в последнее время растет интерес к Википедии как к объекту исследования. Результаты недавнего анализа научных статей, индексируемых в WoS с 2001 г. по 2021 г., показывают, что количество упоминаний слов 'wikipedia' и 'wiki' в заголовках, аннотациях и ключевых словах статей растет примерно на 10 % в год. А исследования, посвященные Википедии, публикуют такие журналы, как PloS ONE, Journal of the Association for Information Science and Technology, Journal of the Association for Information Science and Technology, IEEE Access и Information Processing and Management.

Кроме того, публикация научной статьи в качестве источника на Википедии значительно повышает видимость исследования, из-за чего издатели (например, Wiley) начали открывать каталоги своих публикаций для проверенных редакторов, что способствует повышению уровня доверия к опубликованной в энциклопедии информации.

Традиционно также обратим внимание и на OpenAlex, целый топик которого посвящен кластеру работ, фокусирующихся на коллаборациях и динамике взаимодействия сообщества в контексте Wiki (более 27 тысяч публикаций с 188 тысячами цитирований). И это не считая работ с указанием аффилиации Wikimedia Foundation.

Википедия пусть и не всегда явно, но все же оказывает влияние на научное поле. Она способствует открытому распространению научного знания и её несомненный вклад заключается в уменьшении неравенства в получении свободного доступа к нему, что особенно существенно в контексте завершающейся Международной недели открытого доступа.

#Wikipedia #Википедия #OpenAlex #Цитирования
«Вероятно, да»: неопределенность в русскоязычных статьях

Задумывались ли вы о когда-нибудь о том, есть ли баланс в отношении использования выражений неопределенности в академическом письме? «Возможно», «вероятно», «гипотетически» — такие слова, с одной стороны, могут свидетельствовать об осторожности и педантичности ученого, пишущего статью, но с другой — демонстрировать (или казаться) признаком неуверенности. Стремясь избежать последнего, в ряде случаев исследователи могут намеренно или неосознанно начать использовать более «позитивный» язык, в котором меньше места отводится выражению сомнений, что, безусловно, влияет на восприятие исследовательских выводов.

В прошлом году китайские ученые провели масштабный анализ текстов статей в журнале "Science" за 1997-2021 гг., чтобы определить частоту использования выражений неопределенности (которые исследователи довольно метко назвали «хедж-словами») и возможные закономерности их изменения. Корпус состоял из 2600 статей, содержащих в общей сложности более 11 млн слов. Авторы провели детальный статистический анализ, в том числе по отдельными частям речи, и выяснили, что за 25 лет частота использования хедж-слов упала более чем на 40% — с 115.8 до 67.42 на 10 тысяч слов.

Мы решили проверить, подтверждаются ли эти наблюдения для работ на русском языке на основе данных OpenAlex c 2001 по 2024 г. и составили список слов, выражающих неопределенность, включая наречия, прилагательные, местоимения и частицы. При этом мы рассчитали отношение количества публикаций, содержащих каждое из хедж-слов, к общему числу публикаций на русском языке, так как полные тексты анализировались через n-граммы. Поскольку в OpenAlex реализована возможность полнотекстового поиска, мы ввели в качестве фильтра API-запроса наличие полнотекстовой версии (всего таких работ 241 615 из 2 138 926 за указанный период времени). Ограничением API OpenAlex и нашего анализа стала невозможность использования метасимволов (wildcards) в поиске, поэтому все леммы прописывались вручную.

Сгруппировав информацию о доле статей, содержащих хедж-слова, по годам и по укрупненным научным областям, мы получили график, приведенный по ссылке и на диаграмме, приложенной к посту. При таком методе анализа для русскоязычного сегмента, выводы китайских ученых подтверждаются лишь частично. В медицине и науках о жизни процентное соотношение хедж-слов стабильно низкое — не более 10 % за весь рассматриваемый период с незначительными колебаниями.

Для физических наук наблюдается резкий рост доли хедж-слов с 2005 по 2006 г., далее рост замедляется, а после 2008 года начинается постепенное неравномерное снижение, с локальными максимумами в 2012 и 2015 гг. В социальных науках постепенный рост использования выражений неопределенности начинается с 2013 года, в 2019-2020 показатель выходит на плато, а затем снижается, причем довольно стремительно.

Не вполне очевидно (присоединяемся к неуверенной когорте), говорит ли это о том, что российские ученые выбирают более аккуратные выражения, даже если текст выглядит от этого менее точным, или результаты продиктованы особенностями академического письма на русском языке.

В случае такого авторитетного журнала, как Science, использование хедж-слов может быть неявной стратегией продвижения своего исследования одновременно со снижением риска встретиться с критикой, спорами и сомнениями. Вместе с тем природа академического знания зачастую действительно неопределенна, поэтому поиск баланса (особенно в отдельных дисциплинах) продолжает оставаться нетривиальной задачей.

#аналитика #неопределенность #OpenAlex
Специальные выпуски: анализ уровней Белого списка

Сегодня мы хотим вернуться к теме специальных выпусков, которая продолжает оставаться весьма дискуссионной. Мы решили проанализировать публикации в специальных выпусках российских журналов, чтобы определить, есть ли взаимосвязь между количеством спецвыпусков и уровнем журнала.

Для анализа мы выбрали российские журналы, входящие в RSCI. Временной промежуток выборки — с 2021 по 2023 год. Данные были получены из БД OpenAlex, которая по-прежнему не полностью индексирует некоторые журналы, из-за чего в массиве встречались пропуски. Полученная выборка составила 956 журналов и 203 тысячи статей. Мы определили список различных вариантов названия спецвыпусков (например, Suppl.1, Special Issue, S1 и др.), хранящиеся в поле 'biblio.issue' в OpenAlex. Всего мы получили 35 вариаций обозначений, хотя и ожидаем, что в действительности их намного больше.

Согласно нашим данным, около 10 % (2043) статей из выборки относятся к специальным выпускам. Для дальнейшего анализа мы отобрали только те журналы, которые хотя бы один раз за рассматриваемый период времени публиковали спецвыпуски (всего их 46, а число публикаций в них — 13 402).

Первое, что обращает на себя внимание, — это средняя цитируемость, которая для общего массива составляет 1,259 цитат на материал, для статей из сквозных выпусков — 1,365, а для статей из спецвыпусков — 0,674, что вдвое ниже, чем общее среднее.

Опираясь на уровни журналов из Белого списка, мы проанализировали цитируемость и число публикаций для каждого из четырех уровней. Наиболее интересные результаты получены для последнего: в процентном соотношении статьи из спецвыпусков составляют 29% от общего числа публикаций в журналах 4 уровня со спецвыпусками, однако они получают всего 7,2% от общего числа цитат, а средняя цитируемость для них составляет 0,14.

Если же анализировать сами выпуски, то мы видим, что для журналов 1-3 уровней среднее число публикаций в спецвыпусках, как правило, вдвое меньше, чем число публикаций в выпусках сквозной нумерации. Для 4 уровня справедливо обратное — в спецвыпуске в среднем публикуется почти вдвое больше работ, чем в обычном. Мы проверили эту информацию в Elibrary, и обнаружили, что в качестве спецвыпусков нередко маркируются сборники докладов с форумов и конференций. С одной стороны, строго говоря, такие выпуски не являются специальными в узком понимании этого термина; с другой — они выходят за рамки сквозной нумерации, при этом публикуются нерегулярно и содержат значительное число работ (до 350).

Таким образом, наш базовый анализ показывает, что разница между спецвыпусками и регулярными выпусками журналов, с одной стороны, а также между журналами различных уровней Белого списка — с другой, несомненно, присутствует. На следующих этапах планируем глубже погрузиться в тему спецвыпусков с учетом сквозной нумерации.

#OpenAlex #специальныевыпуски #specialissues #БелыйСписок #аналитика
Публикационные и тематические паттерны публикаций erratum

В этом году мы неоднократно поднимали тему ретракции (отзыва) опубликованных статей в случае обнаружения грубых ошибок в методологии исследования или откровенной фальсификации данных. Однако нередко возникает ситуация, когда ошибка, обнаруженная в статье уже после публикации, является не слишком серьезной, но всё же влияет на смысл, и автор по собственной инициативе хочет внести исправления или дополнения, чтобы читатель верно понял содержание. В таких случаях журнал выпускает специальные типы публикаций: erratum (в случае, если ошибка была допущена издательством при обработке рукописи) или corrigendum (если ошибку допустил сам автор).

Такие публикации могут иметь разное название и тип в различных библиометрических базах: Correction, Addendum, Erratum и другие. Разумеется, такая практика является хорошим тоном в академической среде и служит доказательством серьезного и ответственного отношения к научной работе. Мы решили посмотреть, насколько характерна публикация erratum для различных издательств, и есть ли у них закономерности.

Для анализа мы загрузили из OpenAlex массив из 107 тыс. публикаций типа erratum за 2019-2023 гг. и дополнили датасет данными об общем количестве публикаций всех упомянутых издательств за тот же временной период. Из анализа исключены издательства, у которых было менее 1000 erratum за период, а также журналы, для которых не указаны издательства. По оси X отмечается общее количество публикаций, по оси Y - количество публикаций типа erratum, а размер точки отражает их соотношение.

Первое, что обращает на себя внимание — это экстремальный выброс, который представляет собой Elsevier BV. Более 4 млн. публикаций и более 23 тыс. статей-исправлений смещают график далеко вправо, при этом соотношение между этими двумя числами остается относительно невысоким. Если же убрать выброс, то картина получается следующей: общее число исправлений не превышает 10 тыс., а наиболее высокое соотношение наблюдается у American Medical Association (4,5%) и Nature Portfolio (2,8%).

Если же говорить об областях науки, то выбросом является медицина — на ее долю приходится 21 тыс. исправлений на 10,5 млн. публикаций, а в биохимии, генетике и молекулярной биологии — более 21 тыс. исправлений на 4 млн. публикаций. Довольно высокое соотношение исправлений в смежных областях — фармакологии, нейронауках, сестринском деле; максимума же соотношение достигает в иммунологии: 1,7%, или 15 тыс. исправлений на 878 тыс. публикаций.

Очевидно, что в науках о здоровье, где данные постоянно уточняются и корректируются после проведения дополнительных исследований и экспериментов, соотношение исправлений к общему числу статей велико. Но каковы же паттерны в других областях наук? На этот вопрос попробуем ответить уже в следующем году.

Поздравляем подписчиков с наступающими праздниками, и пусть ни одна ваша статья не нуждается в erratum!

#erratum #OpenAlex #аналитика #поздравление
​​Успешный наставник — удача или наказание?

Наставничество имеет большое значение в построении карьеры ученого. Так, наставник может влиять на научные связи подопечного, цитируемость его работ и даже на трудоустройство, поэтому нередко начинающие исследователи стремятся работать под началом состоявшихся и успешных ученых. Наставники тоже получают от подопечных некоторую (преимущественно скромную) выгоду, например, удовлетворенность от работы, более высокую производительность, чем у «одиноких» коллег, и более широкие научные связи. Кроме того, успешные подопечные укрепляют институциональное признание наставника, ведь чем больше результативных подопечных — тем выше влияние и авторитет ученого.

На днях в Nature Human Behaviour вышла статья, авторы которой изучили влияние количества подопечных наставника на их выживаемость в академической среде. Связи между учеными и наставниками были извлечены из баз данных The Academic Family Tree и OpenAlex. Авторы собрали информацию о 1,5 млн ученых, опубликовавших в общем около 16 млн статей и сформировавших 1,8 млн менторских связей в области химии, нейронаук и физики (с 1980 по 2022 год). На базе полученных данных они построили генеалогические древа исследователей, а затем проанализировали их.

Согласно основным выводам, чем продуктивнее наставник, тем ниже «выживаемость» его подопечных в академической среде на ранних этапах карьеры (уровень «выживаемости» демонстрирует выраженную тенденцию к снижению после 2003 года во всех рассмотренных дисциплинах). Вероятно, это связано с тем, что высокопродуктивные и успешные наставники часто совмещают обязанности (проводят исследования, редактируют и рецензируют статьи, курируют студенческие работы и т.д.). Следовательно, молодым ученым в больших группах приходится конкурировать за их время и внимание.

Но есть и приятная сторона: цитируемость «выживших» подопечных из больших групп в целом выше, они также широко представлены среди 10 % наиболее цитируемых ученых. Эта закономерность остается неизменной во всех трех упомянутых областях. Более того, такие исследователи с большей вероятностью будут вести большую научную группу в «зрелом» академическом возрасте. Таким образом, работа с наставником, ведущим большую научную группу, все же может дать некоторые конкурентные преимущества.

Конечно, есть области, для которых эти тенденции не являются актуальными (в клеточной биологии студенты из больших групп имеют больше шансов «выжить», а в физике нет существенных различий в количестве цитирований среди подопечных из разных групп). Также стоит отметить, что количество соавторов на ранних этапах карьеры играет положительную, но незначительную роль в краткосрочном «выживании».

По мнению авторов, распределение внимания наставников имеет ключевое значение для академического процветания ученого. Несмотря на важную роль молодых ученых в научной экосистеме значительная часть начинающих исследователей слишком быстро покидает академическую среду, что действительно может быть связано с неверным типом наставничества. Это приводит не только к потере потенциальных новаторов, но и подсвечивает глубинные организационные проблемы, которые могут препятствовать удержанию и развитию талантов.

#обзор #наставничество #академическаягенеалогия #TheAcademicFamilyTree #OpenAlex

Использована иллюстрация Robert Neubecker