Цифровой филолог (Даня Скоринкин)
1.84K subscribers
87 photos
1 file
64 links
Digital Humanities, количественные методы анализа текстов, вычислительная филология, компьютерная лингвистика, бытование текстов, языка и литературы в эпоху чат-гопоты, умных машин и безумных людей
Ранее известен как Ебаный DH
Ведёт Даня @skorinkin
加入频道
Как мы шли по «цифровым следам»👣 серийного доносчика

Расскажем вместе с Сашей Архиповой про «кейс Коробковой» уже в это воскресенье. В отличие от материала на BBC, тут будет именно с исследовательской 🔍🔬 перспективы:
Forwarded from (Не)занимательная антропология (Alexandra Arkhipova)
А.Архипова, Д. Скоринкин. Как найти доносчика научными методами: кто такая «Анна Васильевна Коробкова»

Онлайн-лекция, 29 декабря, 17.00 по Парижу, ссылка на ютьюб будет здесь.


НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН, РАСПРОСТРАНЕН И (ИЛИ) НАПРАВЛЕН ИНОСТРАННЫМ АГЕНТОМ АЛЕКСАНДРОЙ СЕРГЕЕВНОЙ АРХИПОВОЙ, СОДЕРЖАЩЕЙСЯ В РЕЕСТРЕ ИНОСТРАННЫХ АГЕНТОВ ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА АЛЕКСАНДРЫ СЕРГЕЕВНЫ АРХИПОВОЙ, СОДЕРЖАЩЕЙСЯ В РЕЕСТРЕ ИНОСТРАННЫХ АГЕНТОВ 18+

Как многие из вас знают, только что BBC написало и также сделало видео про нашей с Даней Скоринкиным расследование, доказывающее, что "Анна Коробкова" и Иван Абатуров - одно и тоже лицо.

Но многое туда не вошло, например, какое отношение имеет эпос (что? Да!) к доносам, при чем тут базы данных, как проверить гипотезу о тождестве Абатурова и Коробковой.

Если еще короче - какие научные методы использовали для поиска "Коробковой" лингвист Даниил Скоринкин (вот потрясающий канал Дани) и ваша покорная слуга.

Если еще короче - зачем вообще нужны ученые. Приходите!

Непонятная картинка - это результат кластерного стилометрического анализа, показывающий, что статья о Коробковой написана самой "Коробковой".

Приходите на онлайн-лекцию в воскресенье 29 декабря, и мы расскажем увлекательные подробности.

29 декабря, 17.00 по Парижу, 18.00 по Иерусалиму, 19.00 по Москве.

Это площадка дружественного семинара "Языки психиатрии". Если вы хотите получить ссылку, пишите @annoory (особенно если вы в РФ и все заблокировано).

Но вообще будет идти стрим лекции на ютьюб (ютьюб-канал Языки психиатрии), а ссылка на ютьюб-стрим появится здесь в 15.00 по Парижу 29 декабря.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Вдогонку к предыдущему посту: иронично, что на скриншоте из Popular Science про стилометрический деанон Джоан Роулинг, который уже лет 8 гуляет по разным моим слайдам, написано буквально “how your four-grams may be undermining your anonymous erotica-writing career” — то есть как ваши 4-граммы могут подорвать вашу карьеру анонимного автора эротики. А в нашем случае 4-граммы же подрывают “карьеру анонимного доносчика” 🤣
Изгибы советских биографий в зеркалах электронных баз

По случайному совпадению ровно в тот же день, когда на BBC вышло расследование про Абатурова-Коробкову, в научном журнале с грозным названием Slavic Military Studies вышла наша с историком Ирой Махаловой статья (а точнее, Ирина статья со мной на подпевках) о реконструкции биографий советских граждан при помощи пересечения разных биографических баз. Эта статья — один из моих редких выходов с цифрогуманитарными методами в область исторических исследований.

С расследованием об Абатурове статью роднит то, что в обоих случаях как источник использовались базы участников ВОВ, оцифрованные Минобороны (как помнят внимательные читатели, у Абатурова там нашелся дедушка). Ну и, наверно, некоторый общий вывод о том, насколько живой человек (в отличие от лакированных парадных биографий) ситуативен, изменчив и адаптивен.

В нашем исследовании мы использовали разные базы по ВОВ для полуавтоматическиого поиска людей, чьи биографические факты не бьются друг с другом. И чьи полные биографии, будучи собранными воедино при содействии цифровых методов, совершенно не укладываются в шаблонно-героические нарративы гос-официоза о безупречных “героях” и ужасных “предателях”.

Вот представьте, что есть у вас в базе участников ВОВ некий человек с довольно редкой комбинацией имени, фамилии и отчества (скажем, Иосиф Алиевич Лебедь), а также с датой и местом рождения, ну и местом призыва на войну. И есть на него, например, донесение о безвозвратных потерях — погиб, мол, в октябре 1944, похоронен в такой-то чешской деревне в могиле номер 5 возле церкви (так и писали, время военное, не до бюрократии).

Вроде ничего необычного… пока в другой базе, на этот раз уже содержащей имена подсудимых на послевоенных процессах по коллаборационизму, не всплывает такой же точно Иосиф Алиевич Лебедь, найденный по полному совпадению ФИО и года рождения. Ну и совпадение места призыва уже не оставляет сомнений. И выясняется, что в 1949 году вполне живого Лебедя допрашивали о его службе в немецкой полиции во время оккупации в 1941 году. То есть в 1941 Лебедь был полицаем, а в 1944 после деоккупации был призван в РККА и успел повоевать на правильной стороне. И что особенно пикантно, в другой базе ВОВ обнаруживается, что уже в 1986 все тот же Иосиф Алиевич Лебедь получил Орден Отечественной войны II степени (их тогда на 40-летие Победы выдали всем дожившим ветеранам).

Таких биографий мы нашли не одну, а героическая Ира Махалова их подробно исследовала, прочитав протоколы допросов. Там есть, например, человек, который сначала был мобилизован в РККА, потом попал (либо сдался) в плен, стал полицаем, участвовал в расстреле евреев в оккупации, а потом после деоккупации снова был призван в РККА и успел получить боевую награду “За боевые заслуги” в феврале 1945-го…

В общем, как я уже сказал, главное, чему меня (дилетанта в области исторической науки) учит это исследование, — это ситуативность человека. Все меньше я верю в статичных “героев” и “злодеев”. Живая жизнь — всегда сложная динамика свойств личности и обстоятельств. Помнить об этом — неплохое лекарство от статичных черно-белых пропагандистских нарративов со всех сторон: и про “менталитет”, и про “орков”, и про “укронацистов”. Даже самые настоящие всамделишные нацисты были совершенно обычными людьми, которых совратили власть, страх, обида, жадность и самые пошлые бытовые обстоятельства. И на любой другой войне солдаты — обычные люди.
Скандальная слава соучастника деанонимизации доносчицы “Коробковой” продолжает преследовать вашего мамкиного лингвиста-расследователя 😅 Теперь вот я сходил с рассказом о стилометрии, атрибуции авторства, компьютерной филологии и компьютерной лингвистике в подкаст “Похажи язык” к замечательной Ксении Busy English Fox. Обсуждали:

— Что такое компьютерная лингвистика и почему ею часто занимаются вовсе не лингвисты🧑‍💻

— Чем занимаются программирующие литературоведы? 💻📚

— Как любовь к определённым предлогам помогла разгадать загадку из истории первых лет становления США🗽

— Почему у Сергея Лукьяненко все подряд “исполинское” 🪐 (реально, поищите в любом его тексте!)

— Почему старые методы атрибуции авторства через редкие конструкции и сочетания похожи на поиск родимых пятен, а современный стилометрический метод — на анализ ДНК.. 🔬🧬

— .. и чем же стилометрия все-таки отличается от анализа ДНК в худшую сторону (увы.. или ура?) 🤷

— Как доносчик Абатуров сам помог себя обнаружить 🎯

— Что “драйвило” Скоринкина и Архипову в поиске “Коробковой”

— Как в установлении истины помог пример великого лингвиста А.А. Зализняка 🎓

Слушайте на всех подкаст-платформах 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
(продолжение)

🚬 Атмосферные детали: и ChatGPT, и писатель вводят в рассказ похожие мелкие декорации: в сгенерированном рассказе тишину в университетской аудитории нарушает «лишь слегка вибрирующий шум кондиционера», а у Александра Сорге герои сидят на кухне, где «жужжит над столом одинокая лампочка». Похоже, такие детали а ля Дэвид Линч стали клишированными и их легко вынимают из общего «коллективного бессознательного» и люди, и нейросети.

Итого:
У писателя-человека получился емкий и погружающий в себя кусочек антиутопии, хотя и с шаблонными деталями. Нейросеть, в отличие от человека, не придумывает мир сама, она по умолчанию создает самый заурядный реалистичный сеттинг и конструирует его самыми стандартными литературными приемами: нарратив в третьем лице, прошедшее время и натужный хэппи энд в конце 🤡
Please open Telegram to view this post
VIEW IN TELEGRAM
Тем временем в Потсдаме после примерно месяца тухлой апрельской погоды дали настоящий снег — и ваш ебобо-филолог забыл про все свои исследовательские, расследовательские и прочие там просветительские дела — и побежал принимать снеговые ванны!🛁 ❄️☃️😶‍🌫️

#не_про_dh
Пушкин и геометрия, или Что бы еще посчитать в литературе?

Еще до появления "сферического коня в вакууме" Яков Перельман придумал "конический холм на равнине".
Демонстрируя широкий кругозор, он составил задачки еще и по Толстому и Шекспиру.

Перельман Я.И. Новый задачник по геометрии. 1925

*Ответ в первом комментарии.
Please open Telegram to view this post
VIEW IN TELEGRAM
Сколько статей пишут о Пушкине каждый год? Чем отличается образ Пушкина в учебниках, в медиа и в науке? Как ученые используют цифровые коллекции пушкинских текстов? Зачем нужен проект Пушкин ⟨цифровой⟩?

Жизнь классики в цифровом пространстве — давно волнующая меня тема (я какое-то время занимался цифровой реинкарнацией текстов Льва Толстого), а вот в пятницу 7 марта будет по этой теме мероприятие в Digital-Humanities-центре ИТМО, вокруг проекта Пушкин цифровой. Пишут, что можно заглянуть онлайн без регистрации и СМС 💁‍♂️

🗓7 марта, пятница

🕐13:00
мск

📍DH-центр ИТМО (Санкт-Петербург, Биржевая, 16) и онлайн

——

Чтобы прийти в DH-центр ИТМО очно, надо зарегистрироваться по ссылке.

Для онлайн-слушателей регистрация не обязательна, ко встрече можно сразу подключиться здесь
На днях будет 3 года моей работы в Потсдаме. Поэтому пост не о науке, а о жизни цифрового филолога. Расскажу о своем опыте существования в немецкой академии: плюсы, минусы, подводные камни🙂 М.б. кому-то эта перспектива поможет понять что вам это не надо что-то о себе. Поехали:

1. Плюсы немецкой академической жизни на контрасте с московской (NB: Москва — не Россия)

· Нет авралов. За эти 3 года я разучился работать по ночам (особенно когда кончил преподавать в Вышке удаленно) и научился отдыхать в выходные. В немецкой академии всё делают сильно заранее. Приглашая человека провести у вас лекцию через год, вы можете выяснить, что его расписание “на через год” уже расписано. В апреле я сам провожу школу по Digital Humanties — и преподавателей я начал звать еще прошлой весной! А летом для них уже были забронированы отели.

· Человечность в обществе и в академии. Германия в целом после Москвы поражает тем, сколько внимания уделяется ивалидам, людям с особенностями, их семьям, маломобильным и незрячим и т.п. Люди в инвалидных колясках сами ходят в супермаркеты, ездят на автобусах, выходят на демонстрации, приезжают на конференции… На некоторых конференциях организуют и бэбиситтеров для детей участников. В декрет уходят и матери, и отцы, у них общий срок на двоих. В университетских туалетах лежат бесплатные тампоны и прокладки. Студенты сами организуют службы психподдержки…

· Чистая природа. Только в Германии я понял, как грязны парки и леса Москвы и Подмосковья. В Москве с её киберпанковым шармом круто жить, но за природой придется пилить километров 200. Здесь леса с косулями, зайцами и белками встроены в городские кварталы и университетские кампусы (не только в Потсдаме) Можно иметь хорошую квалифицированную работу — и потом идти в лес к зверушкам (прямо сейчас пишу этот пост в университете, а за окном на ветку дуба сел большой зеленый дятел).

2. Минусы

· Все медленно. Обратная сторона плюса номер 1. В Москве все двигаются быстрее, проекты растут в телеграм-чатиках в режиме 24/7, а не от зума к зуму раз в 3 недели. В немецкой академии вместо нормального проектного менеджмента часто происходят бесконечные заседания и стенограммы.

· Консерватизм. Хотя Россия иногда пытается изображать “оплот традиционных ценностей”, это, конечно, чистый постмодернистский китч. Наши “традиции” придуманы/переизобретены позавчера и никто за них крепко не держится, при необходимости переобувание мгновенное. А вот в немецкой академии можно встретить настоящий глубинный консерватизм. Отсюда куда более строгое отношение к дисциплинарным границам и вера в свою колею. Многие местные студенты свято верят, что как гуманитарии должны исключительно ходить с тетрадочкой в библиотеку, а к компьютеру относиться как к дьявольскому наущению. Вместо энтузиазма, который я видел рассказывая про Digital Humanities гуманитарным студентам в Москве, здесь я чаще вижу вежливое недоумение и испуг. Еще в Германии для большинства работ важен формальный диплом по специальности — вера в степени и формальные квалификации очень высока. Чтобы работать в библиотеке, надо отучиться на библиотекаря и т.д.

· Датеншутц как религия. Немцы очень боятся за свои данные. Немец спокойно купается голым на глазах у всего города, но не хочет заводить аккаунт в Google, т.к. данные уйдут американским капиталистам. Электронные госуслуги? Нет, это опасно, примите пожалуйста 20 бумажных писем. Почтальон не нашел ваш адрес? Хм, жаль, ведь в этом письме был ваш рабочий договор, а в следующем — зарплатная карта😅 Те самые гуманитарные студенты не хотят пользоваться ChatGPT для разметки, потому что “а вдруг журналы 1956 года, которые я исследую, содержат персональные данные”? Datenschutz — национальная паранойя, и как с этим жить 21й век — неясно.

3. Небольшое Итого/ Fazit

Думаю, мне нужно было вырваться из московского беличьего колеса сюда. Я выехал из “колеи” в “лес”, расширил горизонты, а еще стал добрее. Москва с её темпами и достигаторством ожесточает — здесь же снова вспоминаешь, что вокруг люди и они важнее метрик и KPI. Но застрять здесь на много лет я бы все еще не хотел.
Мем с курящим траву Илоном Маском, поверх которого тут был наложен Ю.М. Лотман, плохо состарился (как и сам Илон Маск и все, что с ним связано), поэтому уберем его, наконец.. Пусть тут лучше сверкает мой еблет, так хотя бы вы знаете, что за каналом стоит (сидит, лежит) конкретный живой человек Даня Скоринкин