Системный Блокъ
10.8K subscribers
241 photos
2 videos
1 file
874 links
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.

Финалист премии «Просветитель»

sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/

Присоединяйтесь к команде: sysblok.ru/join
加入频道
Юдифь и Саломея: как мифические девицы искусство делили

Помните ли вы истории двух библейских героинь Юдифь и Саломеи? C помощью Викиданных мы выяснили, какая из двух героинь пользуется большей популярностью, и попытались понять почему. Всё самое главное — в наших карточках, а подробности — в этом посте.
Мандельштам или Некрасов: какому поэту подражает нейросеть?

В рамках недавнего эксперимента Бориса Орехова нейросеть подражала одному из русских поэтов, а студенты-филологи — определяли, чей стиль она воспроизводит. Предлагаем и вам отгадать, на чьем корпусе LSTM-модель научилась писать следующие строки.

А ещё даём небольшую подсказку: у нейросети не было цели написать качественное и связное четверостишие, ей нужно было только уловить особенности поэтического стиля, чтобы читатель явно понял, кто перед ним — Борис Пастернак или Петр Вяземский.

И карточки не слышал.
Он был уж добрый свет,
Но как бы мог прибавил
Какой-то бедного покой.
Поясни за стиль. Какому поэту подражает нейросеть?

Цифровые филологи научились «измерять стиль»: у «Системного Блока» есть подборка статей о стилометрии и гайд о том, как провести собственное стилометрическое исследование. Нейросети зашли еще дальше: современные технологии уже позволяют выделять стиль текстов и даже подражать ему (об этом мы писали здесь). Сегодня мы расскажем о новом эксперименте Бориса Орехова, в котором исследователь оценивает, насколько хорошо модель может скопировать узнаваемый авторский стиль.

Кратко: о чем статья?

Исследуя тот или иной авторский стиль, мы фокусируемся не только на том, что сказано, но и на том, как сказано. И если нам необходимо воспроизвести стиль определенного поэта, на помощь могут прийти нейросети. Чтобы проверить, насколько хорошо им это удается, Борис Орехов обратился к трем LSTM-моделям, обученным на корпусах Николая Некрасова, Осипа Мандельштама и раннего Бориса Пастернака.

Студентам-филологам предлагали три случайно выбранных сгенерированных четверостишия и просили определить, на чьём корпусе стихотворений училась нейросеть. Подражание Некрасову студенты определили верно в 40,4% случаях, Мандельштаму — в 43,6%, а Пастернаку — в 48,9%.

О том, можно ли считать этот результат успешным и как на него влияла честность студентов, узнаете из полного текста статьи.

Время чтения: 5,5 минут.
Интернет на службе коммунизма: как СССР создавал свою электронную сеть

В конце 60-х гг. не только США разрабатывали компьютерные сети. В СССР также строили грандиозные планы по созданию системы, которая в конечном итоге поможет привести страну к коммунизму. Рассказываем, почему из амбициозного проекта ОГАС и других проектов советского интернета ничего не получилось.

Кратко: о чем статья?

Первым создать «советский интернет» предложил ученый Анатолий Китов. В начале 1950-х он увлекся кибернетикой, а затем предложил построить всесоюзную компьютерную сеть (написав об этом Никите Хрущеву). Правда, из этой идеи ничего не вышло.

Зато новый проект советского интернета — Общегосударственную автоматизированную систему учёта и обработки информации (ОГАС) — предложил математик и кибернетик Виктор Глушков. ОГАС должен был собирать информацию со всех предприятий СССР и предлагать экономические решения для наиболее эффективного управления плановым хозяйством. Однако по подсчетам экономистов проект обошелся бы стране слишком дорого, и правительство не хотело делегировать свою власть компьютерным системам. Поэтому после многих рассмотрений и доработок ОГАС окончательно закрылся.

Зато сегодня опыт Китова, Глушкова и других советских кибернетиков активно изучают экономисты и историки как в России, так и за рубежом. 

О том, почему им интересна история советского интернета, когда кибернетика перестала считаться лженаукой и какие проекты автоматизации плановой экономики были в других странах, читайте в полной версии статьи.

Время чтения: 10,5 минут.
Стилометрия кинодиалогов: шесть жанров в поисках автора

Какие закономерности можно обнаружить в речи персонажей, если фильмы относятся к одному жанру? Меняется ли стиль диалогов в зависимости от сценариста или режиссёра? Похожи ли все фильмы одной франшизы друг на друга? Ответы на эти вопросы — в новом материале «Системного Блока».

Кратко: о чем
статья?

Исследование Яна Рыбицкого и Агаты Холобут (оба — Ягеллонский университет, г. Краков) посвящено анализу кинодиалогов с помощью стилометрии и сентимент-анализа (оценки эмоциональности кинодиалогов). Для него ученые собрали многожанровый корпус транскрибированных кинодиалогов из 178 англоязычных фильмов, охватывающий около 84 лет жизни киноиндустрии.

Фильмы разделили на шесть групп: мелодрама/женское кино, вампиры и супергерои. По жанру это романтика, триллер и экшен/приключения. Благодаря стилометрическому анализу выяснилось, что некоторые из них легко делятся на подргруппы. Например, диалоги в романтических фильмах о вампирах явно отличаются от диалогов в хоррорах на ту же тему. «Сумерки», кстати, демонстрируют постепенное «сгущение красок»: первые две части скорее романтичны, а дальнейшие становятся ближе к жанру ужасов. А многие франшизы блокбастеров с точки зрения стилометрии оказываются близки друг другу. Среди них «Пираты Карибского моря», «Матрица», «Властелин Колец» и «Хоббит».

О том, к какому жанру стилометрия отнесла «Титаник», какие фильмы оказались самыми «радостными» и чья стилистика — Квентина Тарантино или Альфреда Хичкока — более явно выражена в диалогах их героев, узнаете из полного текста статьи.

Время чтения: 8,5 минут.
Кому на Руси пить хорошо: какой алкоголь сегодня можно найти в магазинах и кто его покупает

Похвастаться стабильностью в кризисные времена может не каждая отрасль. Но вот кто точно в России не несёт убытки, так это рынок алкогольной продукции. Казалось, санкции должны были сократить и объёмы производства, и ассортимент. Однако ни производить, ни пить россияне меньше не стали. Разбираемся, в чём здесь может быть дело.

Кратко: о чем статья?

После 24 февраля 2022 года крупные западные компании, занимающиеся производством алкоголя, либо полностью ушли с российского рынка, либо ограничили поставки продукции. Однако проблемы труднодоступности известных западных марок ощутимы для относительно малого числа россиян. 75% рынка крепкого алкоголя приходятся на водку, которая преимущественно производится внутри страны.

Больше всего её, кстати, выпускают в ноябре и декабре, поскольку для показателей розничной продажи алкоголя характерна сезонность, и производители ориентируются на спрос. Шампанское чаще всего покупают к новогоднему столу, а пиво, наоборот, — пьют преимущественно летом.

Правда, российские пивовары рискуют сильно пострадать в ближайшем будущем: в стране почти не производится хмель и до санкций его всегда закупали в западных странах. Кроме того, повысятся цены на алюминиевые банки.

О проблемах, с которыми могут столкнуться виноделы, и их потенциальном решении, а также о том, где в России пьют больше и меньше всего, читайте в полной версии материала.

Время чтения: 10 минут.
Утечка в IT: как эмигранты создали бренд русского программиста

«Если проблема нерешаема, мы предлагаем её русским», — заявил в 2007 году президент Intel Russia Стив Чейз. Эти слова говорили о большой популярности русских программистов на глобальном рынке IT. Предпосылки к высокой востребованности IT-специалистов из России были заложены в конце XX века, когда зарубежные компании познакомились с технарями, покинувшими Советский Союз и Россию. Разбираемся, как русский программист стал мировым брендом.

Кратко: о чем статья?

Многие программисты, эмигрировавшие за границу или развивавшие IT в постсоветской России, начинали свой путь в советских физико-математических школах. При этом возможности попрактиковаться именно в программировании в Советском Союзе были ограничены, а информатика как полноценный учебный предмет появилась в советских школах только после 1985 года, когда был взят курс на компьютеризацию образования.

После школы путь к программированию лежал через технические специальности высшего образования. И хотя студенты-физики и инженеры редко имели опыт написания программ, когда они покидали страну, сфера IT оказывалась для них наиболее удобной. Туда можно было попасть благодаря относительно простому (при наличии математической и инженерной базы) обучению и связям с другими русскими эмигрантами, уже занимающимися программированием. Диаспоры, сложившиеся в результате тесных коммуникаций внутри эмигрантской среды и за её пределами, стали решающим фактором для превращения русских программистов в узнаваемое сообщество. А затем транснациональные связи укрепили бренд русского программиста и вывели его с уровня диаспор на глобальный рынок.

Подробнее о том, когда и почему специалисты покидали СССР, как России удалось остановить наибольшую волну эмиграции 1990–2000-х годов и как работает концепция «утечки мозгов» читайте в полной версии статьи.

Время чтения: 13 минут.
Что общего у литературы и биологии, или как развивались Digital Humanities в России

Точные методы в гуманитарных науках появились задолго до компьютеров — и в России их история превышает уже полтора века. Вспоминаем, как филологи, историки, лингвисты, математики и другие исследователи развивали количественные подходы к анализу литературы, языка и других гуманитарных объектов — и создавали базу для становления на российский почве.

Кратко: о чем статья?

История количественного литературоведения в нашей стране началась более ста лет назад — с работ поэта Андрея Белого. В 1910-х годах он разработал свою методику исследования метра и ритма, а затем изучение поэзии квантитативными методами продолжил Московский лингвистический кружок (МЛК). Именно из МЛК выросли лингвистические кружки в Праге, Копенгагене, Нью-Йорке и впоследствии — Международная лингвистическая ассоциация.

Одной из важных фигур в МЛК был Борис Ярхо. В своей «Методологии точного литературоведения» (1936) он объяснял литературу в биологических понятиях эволюции и рассматривал подобно живому организму. В 50-е и 60-е годы на смену биологической перспективе пришла математическая. Благодаря ней появились планы по разработке Машинного фонда русского языка и идея создания корпуса, подобного сегодняшнему Национальному корпусу русского языка.

Подробнее о главных этапах и лицах в истории Digital Humanities (DH) в России, а также о сходствах и различиях российского и мирового опыта DH — читайте в полной версии статьи.

Время чтения: 10,5 минут.
Учителя-мужчины в школе: сколько их и что они преподают

5 октября в России и в мире отмечается День учителя. К празднику «Системный Блокъ» решил проверить, правда ли, что в школе работают в основном женщины, сколько всё-таки учителей-мужчин и какие предметы они ведут. Ответы на эти вопросы мы искали в открытых данных Минпросвещения.

Кратко: о чём статья?

Согласно открытой статистике Минпросвещения в последние шесть лет в среднем 83% всех работников школы — это женщины. Единственная мужская специальность в современной общей школе — это мастера производственного обучения: 68% преподавателей-мужчин. Правда, это исчезающая профессия: на начало прошлого учебного года всех мастеров обоих полов было меньше тысячи человек.

Правда, в ряде регионов распределение сильно отличается, особенно там, где доля мужчин значительно выше среднего. В трёх регионах — Дагестане, Якутии и Чечне — мужчин в профессии аномально много: они составляют почти пятую часть всех учителей, а в средних и старших классах учителей-мужчин 24–26%. В частных школах ситуация тоже несколько отличается, возможно, потому что в них меньше бюрократической волокиты и выше зарплаты. Впрочем, учителя в них составляют всего 2% от общего числа учителей в России.

О самом «мужском» и самых «женских» предметах, а также о гендерном дисбалансе в школах других стран узнаете из полного текста материала.

Время чтения: 7 минут.
Научим любить Родину… и мать твою: о чем говорят в «Разговорах о важном»

С сентября 2022 года в российских школах идут «Разговоры о важном». Это внеклассные уроки, направленные, по словам авторов идеи, на «укрепление традиционных российских духовно-нравственных ценностей» и «воспитание патриотизма» среди российских школьников. Ко дню учителя «Системный Блокъ» изучил содержание этих уроков, применив метод тематического моделирования.

Кратко: о чем статья?

На главном сайте «Разговоров о важном» в течение года выкладывались видео- и аудиоматериалы, сценарии уроков и методические рекомендации. Сейчас там размещены материалы 2023 года: инициатива продолжается в школах и в этом учебном году.  

Мы скачали 175 методических рекомендаций: по 5 файлов к каждому уроку, – собрали информацию из пункта «Формирующие(ся) ценности» и посчитали количество упоминаний одних и тех же ценностей. Главными ценностями, согласно замыслу авторов, оказались «патриотизм» и «любовь к родине». Также в тройку лидеров с большим отрывом от остального списка входят «самореализация/развитие/самоопределение» и «историческая память/преемственность поколений» — не менее 80 уроков для разных возрастов затрагивали каждую тему. Для сравнения, «милосердие» упоминается в рекомендациях к 9 урокам, «гуманизм» — к 4. 

О том, какие темы обсуждаются и какие слова встречаются в «Разговорах о важном» чаще всего, а также о том, как выяснить это с помощью тематического моделирования, читайте в полной версии статьи.

Время чтения: 8,5 минут.
Что читают в 2023? Тест на знание книжного рынка в России

После 24 февраля 2022 года необратимые изменения произошли практически во всех сферах жизни. Издательское дело не стало исключением. Как издательства разбирались с запретом на пропаганду ЛГБТ? Какой процент в ассортименте книжных магазинов составляет доля… книг? Кто отобрал у Стивена Кинга первенство в российском книжном рейтинге?

Наш тест поможет понять, насколько хорошо вы разбираетесь в сегодняшних реалиях книготорговли.
Женщины в IT: существует ли гендерное неравенство?

Нобелевская премия 2023 присуждена за исследование роли женщин в экономике и причин дискриминации женщин в оплате труда. Проблема гендерного неравенства очень заметна и в сфере IT. «Системный Блокъ» изучил, какова доля женщин в IT, сколько девушек готовы обучаться компьютерным наукам и какие стереотипы ограничивают их на рынке труда.

Кратко: о чем статья?

Доля женщин в сфере информационных технологий с каждым годом растёт: в мире доля IT-специалисток за последние четыре года увеличилась до 25%. Тем не менее разрыв в численности и в зарплате сохраняется. Например, во время получения высшего образования мужчины в пять раз чаще намереваются работать в области инженерии и компьютерных наук, в системе высшего образования США женщины составляют лишь 38% бакалавров в традиционных областях STEM (естественные науки, технология, инженерия и математика), а в России разница в заработной плате между специалистами разного пола, имеющими одинаковую квалификацию, составляет 28%.

У такой ситуации несколько причин, но если кратко — все дело в стереотипах. Так, существует популярное мнение о том, что математика не для девочек. Несмотря на то что женщины, имеющие детей, демонстрируют более эффективную работу в коллективе, руководители часто отдают предпочтение трудоустройству мужчин, опасаясь, что женщины внезапно могут уйти в декрет. Кроме того, есть стереотип о том, что «женский склад ума» не подходит для IT-сферы.

Подробнее о том, как проявляется гендерное неравенство в области компьютерных наук в России и за рубежом, а также каковы его причины, читайте в полной версии статьи.

Время чтения: 8 минут.
Правда глаза колет: 150 лет истории айтрекеров

Айтрекинг, или регистрация движений глаз, используется в психолингвистике и психологии, исследованиях зрительной системы и в устройствах взаимодействия между человеком и компьютером. «Системный Блокъ» уже писал про айтрекинг и паттерны чтения.

А в этом материале рассмотрим историю айтрекеров. Готовы ли вы поместить на своё веко тупую иглу, передающую движения глаз в виде звука? А надеть гипсовую контактную линзу, соединённую с рычагом, записывающим движения глаза на барабан? А прикрепить к глазу радиоантенну на резиновой присоске? Всё это приходилось делать участникам айтрекинговых экспериментов до изобретения бесконтактных технологий.

Кратко: о чем статья?

Интерес к изучению движений глаз возник за много веков до появления первых айтрекеров. Особенности зрения интересовали Аристотеля, древнеримского медика и хирурга Клавдия Галена и средневекового ученого Ибн аль-Хайсама.

История айтрекеров же полноценно началась в 1883 году, когда М. Ламар вместе с Л. Жавалем использовали для наблюдений прибор, трансформировавший движения глаз испытуемого в звук, улавливаемый экспериментатором. Но у технологий конца XIX века были очевидные недостатки, поэтому постепенно разрабатывались устройства, не требующие непосредственного крепления глаза к регистрирующей поверхности.

В последние годы технологии позволяют создавать айтрекеры, не требующие фиксации головы. Они представляют собой очки или шлем с двумя вмонтированными видеокамерами: одна из камер записывает изображение, которое видит испытуемый, а вторая фиксирует изображение глаза с помощью отражённого света. Испытуемого в таких очках можно отправить в магазин, в музей или за руль автомобиля.

Подробнее о важных именах и вехах в истории айтрекинга, а также о том, какие ограничения связаны с такими исследованиями в психолингвистике, читайте в полном материале.

Время чтения: 14 минут.
Вы Лев Толстой на словах или на деле? Викторина по редким словам из корпуса текстов писателя

Кого Лев Толстой называл голышом, и где в усадьбе тырла? Кем лучше быть ― келарем или щелкопёром? Писатель был знатоком редких и диковинных слов. Пройдите наш тест и попробуйте отгадать их значения. Сможете ли вы сравниться с графом Толстым в эрудиции?