Год войны в цифрах: жертвы, потери, разрушения, беженцы
24 февраля 2022 года Россия начала полномасштабные боевые действия в Украине. За год погибло минимум 7749 мирных граждан. Это только подтвержденные ООН потери, так что число заведомо занижено — по некоторым оценкам, в десятки раз. Например, здесь не учтены потери при многомесячном штурме Мариуполя. Но даже это минимальное число превышает общее количество пострадавших за предшествующие 8 лет конфликта.
Большинство людей (74%) погибло из-за обстрелов по территории, которая контролировалась украинской стороной. По данным ООН, в 1515 подконтрольных Украине населенных пунктов были жертвы среди гражданского населения в результате артиллерийских, авиационных и ракетных ударов. На российской стороне таких пунктов было 380.
Были разрушены 143 800 жилых зданий. Пострадали не менее 516 культурных объектов, из них 169 — религиозные памятники.
Начало войны запустило крупнейший миграционный кризис. Более 8 миллионов жителей Украины стали беженцами в Европе. 2,8 миллионов человек выехали на территорию России (при этом неизвестно, сколько из них остались в стране).
В России за год задержали 19 586 человек на акциях протеста против войны и мобилизации. 448 человек находятся под уголовным преследованием. Многие уже получили тюремные сроки от 4 до 8 лет.
24 февраля 2022 года Россия начала полномасштабные боевые действия в Украине. За год погибло минимум 7749 мирных граждан. Это только подтвержденные ООН потери, так что число заведомо занижено — по некоторым оценкам, в десятки раз. Например, здесь не учтены потери при многомесячном штурме Мариуполя. Но даже это минимальное число превышает общее количество пострадавших за предшествующие 8 лет конфликта.
Большинство людей (74%) погибло из-за обстрелов по территории, которая контролировалась украинской стороной. По данным ООН, в 1515 подконтрольных Украине населенных пунктов были жертвы среди гражданского населения в результате артиллерийских, авиационных и ракетных ударов. На российской стороне таких пунктов было 380.
Были разрушены 143 800 жилых зданий. Пострадали не менее 516 культурных объектов, из них 169 — религиозные памятники.
Начало войны запустило крупнейший миграционный кризис. Более 8 миллионов жителей Украины стали беженцами в Европе. 2,8 миллионов человек выехали на территорию России (при этом неизвестно, сколько из них остались в стране).
В России за год задержали 19 586 человек на акциях протеста против войны и мобилизации. 448 человек находятся под уголовным преследованием. Многие уже получили тюремные сроки от 4 до 8 лет.
Год после 24 февраля: главные материалы «Системного Блока» о войне
Уже год продолжаются боевые действия на территории Украины. За этот год «Системный Блокъ» рассказывал о пропаганде войны в России и бегстве людей из Украины, об уклонении от мобилизации и том, как диктатуры начинают войны, о сохранении украинского культурного наследия и о сохранении рассудка у россиян. Сегодня предлагаем перечитать наши главные материалы
🕊Был ли геноцид: статистика гибели жителей Донбасса в 2014-2021 годах
Российские власти говорят о «8 годах геноцида» на Донбассе. Именно этим объяснял необходимость «спецоперации» против Украины президент РФ. Но что говорит статистика? Был ли там геноцид? Мы изучили данные из официальных источников Донецкой народной республики и визуализировали жертвы среди ее военных и ее мирных жителей.
🕊Смысл спецоперации и спецоперация смыслов: как пропаганда «денацификации» и «демилитаризации» Украины отражается в поиске
Тезис «Россия проводит специальную военную операцию по демилитаризации и денацификации Украины» будет справедливо дополнить фразой «в российских СМИ». Системный Блокъ проанализировал архив СМИ за первое полугодие 2022 года и узнал, какие смыслы (и сколько) транслируют медиа по поводу «спецоперации».
🕊Неизвестное будущее: как не сойти с ума в условиях неопределенности
Как в условиях неопределенности сохранить способность мыслить? Как поддерживать себя и близких? Как реагировать на острые ситуации? И что делать с планами, которые рассыпались за секунды? «Системный Блокъ» попросил психологов ответить на вопросы, которые волнуют нас сегодня.
🕊Мобилизации не будет: как власти отрицали планы массового призыва россиян
🕊Мобилизация: что говорят цифровые следы поискового спроса
Процессы, которые происходят в обществе, оставляют много цифровых следов. Поисковый спрос достаточно подробно документирует состояние общества и его болевые точки. Рассказываем про взрывной рост интереса к мобилизации в поисковиках.
🕊Что ищут россияне в поисковиках после объявления мобилизации в России
Официально о частичной мобилизации в России было объявлено 21 сентября 2022 года. Но запросы «как уехать» стали появляться днем раньше. «Системный Блокъ» проанализировал, как менялись поисковые запросы россиян во время и после объявления мобилизации
🕊«Персоналистские диктатуры чаще начинают войны»: Эрика Франтц об автократиях, Украине и поводах для оптимизма
Системный Блокъ поговорил с политологом Эрикой Франтц о недемократических режимах, диктаторах и возможностях перехода к демократии. Спойлер: наши шансы на демократический транзит невысоки, но они есть.
Уже год продолжаются боевые действия на территории Украины. За этот год «Системный Блокъ» рассказывал о пропаганде войны в России и бегстве людей из Украины, об уклонении от мобилизации и том, как диктатуры начинают войны, о сохранении украинского культурного наследия и о сохранении рассудка у россиян. Сегодня предлагаем перечитать наши главные материалы
🕊Был ли геноцид: статистика гибели жителей Донбасса в 2014-2021 годах
Российские власти говорят о «8 годах геноцида» на Донбассе. Именно этим объяснял необходимость «спецоперации» против Украины президент РФ. Но что говорит статистика? Был ли там геноцид? Мы изучили данные из официальных источников Донецкой народной республики и визуализировали жертвы среди ее военных и ее мирных жителей.
🕊Смысл спецоперации и спецоперация смыслов: как пропаганда «денацификации» и «демилитаризации» Украины отражается в поиске
Тезис «Россия проводит специальную военную операцию по демилитаризации и денацификации Украины» будет справедливо дополнить фразой «в российских СМИ». Системный Блокъ проанализировал архив СМИ за первое полугодие 2022 года и узнал, какие смыслы (и сколько) транслируют медиа по поводу «спецоперации».
🕊Неизвестное будущее: как не сойти с ума в условиях неопределенности
Как в условиях неопределенности сохранить способность мыслить? Как поддерживать себя и близких? Как реагировать на острые ситуации? И что делать с планами, которые рассыпались за секунды? «Системный Блокъ» попросил психологов ответить на вопросы, которые волнуют нас сегодня.
🕊Мобилизации не будет: как власти отрицали планы массового призыва россиян
🕊Мобилизация: что говорят цифровые следы поискового спроса
Процессы, которые происходят в обществе, оставляют много цифровых следов. Поисковый спрос достаточно подробно документирует состояние общества и его болевые точки. Рассказываем про взрывной рост интереса к мобилизации в поисковиках.
🕊Что ищут россияне в поисковиках после объявления мобилизации в России
Официально о частичной мобилизации в России было объявлено 21 сентября 2022 года. Но запросы «как уехать» стали появляться днем раньше. «Системный Блокъ» проанализировал, как менялись поисковые запросы россиян во время и после объявления мобилизации
🕊«Персоналистские диктатуры чаще начинают войны»: Эрика Франтц об автократиях, Украине и поводах для оптимизма
Системный Блокъ поговорил с политологом Эрикой Франтц о недемократических режимах, диктаторах и возможностях перехода к демократии. Спойлер: наши шансы на демократический транзит невысоки, но они есть.
«И пусть все читают “Одумайтесь”»: Анастасия Бонч-Осмоловская о цифровом Толстом и пересборке DH после 24 февраля
Анастасия Бонч-Осмоловская в 2012-м создала первую современную магистратуру по компьютерной лингвистике в России, а в 2016 — первый большой центр Digital Humanities. Главные проекты центра связаны с продвинутой оцифровкой наследия Льва Толстого. В интервью «Системному Блоку» она рассказала, как и зачем делалось цифровое издание 90-томника Л.Н.Толстого и что изменилось в российских Digital Humanities после 24.02.2022.
Кратко: о чём интервью?
В 2013 году, когда Анастасия Бонч-Осмоловская и её коллеги, Борис Орехов и Михаил Гронас, увлеклись Digital Humanities, они также заинтересовались форматом Digital Edition (цифрового издания). Начать работу решили с текстов Льва Толстого, и скоро стало понятно, что надо разрабатывать отдельный механизм взаимодействия пользователя с цифровым текстом, не такой, как с печатной книгой. Перед создателями издания стояло множество вопросов: какой должна быть разметка? Что должно быть размечено? Нужно ли разделить тексты на те же 90 томов, в которых они были опубликованы? Важно было продумать, как будут выглядеть небольшие, но значимые элементы интерфейса, чтобы читатель мог узнать, что такое «ЕБЖ», когда слово написано неразборчиво или изменено редактором.
Намного более сложной задачей, впрочем, стало создание «семей текстов» для «Слова Толстого». В такие «семьи» в проекте объединяются, например, варианты одного и того же текста. У них всегда есть «семейное» имя, например, в начале написано «Анна Каренина», а потом «первый вариант», «второй вариант», «третий вариант», «планы и заметки». Туда же помещаются все комментарии, которые имеют отношение к тексту. При работе с поиском по такому тексту можно обращаться только к основному варианту, а можно поставить галочку и искать с черновиками и вариантами, и, главное, можно легко переходить в «семейное» древо.
Прочитать больше подробностей о проекте и выросшем вокруг него DH центре Вышки, узнать, изменилось ли что-то в русских Digital Humanities после 24 февраля 2022 года и понять разницу между Digital Preservation и Digital Presentation можно в полном тексте интервью.
Время чтения: 18 минут.
Анастасия Бонч-Осмоловская в 2012-м создала первую современную магистратуру по компьютерной лингвистике в России, а в 2016 — первый большой центр Digital Humanities. Главные проекты центра связаны с продвинутой оцифровкой наследия Льва Толстого. В интервью «Системному Блоку» она рассказала, как и зачем делалось цифровое издание 90-томника Л.Н.Толстого и что изменилось в российских Digital Humanities после 24.02.2022.
Кратко: о чём интервью?
В 2013 году, когда Анастасия Бонч-Осмоловская и её коллеги, Борис Орехов и Михаил Гронас, увлеклись Digital Humanities, они также заинтересовались форматом Digital Edition (цифрового издания). Начать работу решили с текстов Льва Толстого, и скоро стало понятно, что надо разрабатывать отдельный механизм взаимодействия пользователя с цифровым текстом, не такой, как с печатной книгой. Перед создателями издания стояло множество вопросов: какой должна быть разметка? Что должно быть размечено? Нужно ли разделить тексты на те же 90 томов, в которых они были опубликованы? Важно было продумать, как будут выглядеть небольшие, но значимые элементы интерфейса, чтобы читатель мог узнать, что такое «ЕБЖ», когда слово написано неразборчиво или изменено редактором.
Намного более сложной задачей, впрочем, стало создание «семей текстов» для «Слова Толстого». В такие «семьи» в проекте объединяются, например, варианты одного и того же текста. У них всегда есть «семейное» имя, например, в начале написано «Анна Каренина», а потом «первый вариант», «второй вариант», «третий вариант», «планы и заметки». Туда же помещаются все комментарии, которые имеют отношение к тексту. При работе с поиском по такому тексту можно обращаться только к основному варианту, а можно поставить галочку и искать с черновиками и вариантами, и, главное, можно легко переходить в «семейное» древо.
Прочитать больше подробностей о проекте и выросшем вокруг него DH центре Вышки, узнать, изменилось ли что-то в русских Digital Humanities после 24 февраля 2022 года и понять разницу между Digital Preservation и Digital Presentation можно в полном тексте интервью.
Время чтения: 18 минут.
Системный Блокъ
Анастасия Бонч-Осмоловская о цифровом Толстом и пересборке DH
Анастасия Бонч-Осмоловская ― лингвист, филолог, цифровая исследовательница, идейная вдохновительница и душа российских Digital Humanities. «Системный Блокъ» поговорил с Анастасией о работе над цифровым изданием 90-томника Л.Н.Толстого и пересборке российского…
Нейросети и коммунистическая революция в интернете
Призрак революции снова бродит вокруг нас — и борьба с ним все так же бесплодна. Делимся с вами текстом к 175-летию «Манифеста коммунистической партии» Карла Маркса и Фридриха Энгельса. Из блога Даниила Скоринкина узнаете о том, как нейросети национализировали и обобществили дизайн, лишили привилегированный творческий класс его привилегий и принесли долгожданную коммунистическую халяву.
🤖 Подтвердите, что вы не робот
Сегодня нейросети часто радуют пользователей, но огорчают профессиональных художников. Например, польского художника Грега Рутковски «заказывают» у генераторов изображений чаще, чем Леонардо Да Винчи и Пикассо, потому что он рисовал ярко, рисовал много, да еще всегда аккуратно выкладывал картинки с подписями на английском языке, на которых удобно обучать модели. Теперь Рутковски переживает, что год спустя по его имени в интернете все будут находить только нейроплагиат.
👨🏻⚖️ Классовая борьба в XXI веке
Недавно трое художников — Сара Андерсен, Келли МакКернан и Карла Оритц — подали в суд на компанию Stability AI, обвинив ее в «нарушении авторских прав миллионов художников» из-за того, что компания обучала свою модель на миллионах изображений из интернета. Их иск на юридическом языке называется очень по-марксистски: «class action suit» — это означает, что истцы судятся не за себя, а представляют целый «класс» — класс художников-профессионалов.
🦾 Вкалывают роботы, счастлив человек?
Эта история прекрасно иллюстрирует, что приход ИИ в таком виде в чем-то похож на коммунистическую революцию. Художнику, который играл здесь роль обеспеченного своим талантом буржуа или промышленника, стало хуже — его средства производства обесценились. Тем же, кто таланта не имел (интернет-пролетарии), после нейросетевой «национализации» дизайна стало лучше. А ещё подробнее о том, почему нейросети — идеальный штрейкбрехер, узнаете из полного текста блога.
Призрак революции снова бродит вокруг нас — и борьба с ним все так же бесплодна. Делимся с вами текстом к 175-летию «Манифеста коммунистической партии» Карла Маркса и Фридриха Энгельса. Из блога Даниила Скоринкина узнаете о том, как нейросети национализировали и обобществили дизайн, лишили привилегированный творческий класс его привилегий и принесли долгожданную коммунистическую халяву.
🤖 Подтвердите, что вы не робот
Сегодня нейросети часто радуют пользователей, но огорчают профессиональных художников. Например, польского художника Грега Рутковски «заказывают» у генераторов изображений чаще, чем Леонардо Да Винчи и Пикассо, потому что он рисовал ярко, рисовал много, да еще всегда аккуратно выкладывал картинки с подписями на английском языке, на которых удобно обучать модели. Теперь Рутковски переживает, что год спустя по его имени в интернете все будут находить только нейроплагиат.
👨🏻⚖️ Классовая борьба в XXI веке
Недавно трое художников — Сара Андерсен, Келли МакКернан и Карла Оритц — подали в суд на компанию Stability AI, обвинив ее в «нарушении авторских прав миллионов художников» из-за того, что компания обучала свою модель на миллионах изображений из интернета. Их иск на юридическом языке называется очень по-марксистски: «class action suit» — это означает, что истцы судятся не за себя, а представляют целый «класс» — класс художников-профессионалов.
🦾 Вкалывают роботы, счастлив человек?
Эта история прекрасно иллюстрирует, что приход ИИ в таком виде в чем-то похож на коммунистическую революцию. Художнику, который играл здесь роль обеспеченного своим талантом буржуа или промышленника, стало хуже — его средства производства обесценились. Тем же, кто таланта не имел (интернет-пролетарии), после нейросетевой «национализации» дизайна стало лучше. А ещё подробнее о том, почему нейросети — идеальный штрейкбрехер, узнаете из полного текста блога.
Системный Блокъ
Нейросети и коммунистическая революция в интернете - Системный Блокъ
Призрак революции снова бродит вокруг нас — и борьба с ним все так же бесплодна. К 175-летию «Манифеста коммунистической партии» Карла Маркса и Фридриха Энгельса
Пингвины и нейросети: что такое визуализация данных?
Зачастую данные содержат полезную информацию – от цен на «Биг Мак» в разных странах, по которым можно оценить стоимость валюты, до коррупционных схем высших должностных лиц и свидетельств военных преступлений. Поэтому существует множество способов извлечения важной информации из большого и сложно устроенного массива данных. В этом материале мы расскажем об одном из таких методов – о визуализации данных.
Кратко: о чём статья?
Выборки данных (почитать о них можно в этом посте) часто представляют из себя таблицы, где каждая строка содержит различные числовые/строковые значения и является одним конкретным наблюдением. Скажем, в выборке с данными пингвинов 344 наблюдения и 7 признаков. Это относительно немного, но сделать выводы, просто посмотрев на таблицу, уже затруднительно. Здесь поможет построение графиков. Выбор типа графика зависит от цели, которую ставит исследователь.
Впрочем, не всегда данные представляются в виде таблицы, у которой можно взять столбец и построить график. Чтобы выделить из выборки статей BBC за 2004-2005 годы темы, о которых писали журналисты, и слова, которые характеризуют каждую тему, мы можем воспользоваться облаками слов.
Отдельная история — визуализация данных в исследовании нейросетей. О ней, а также о гистограммах, ящике с усами (boxplot), динамических и интерактивных визуализациях узнаете из полной версии статьи.
Время чтения: 14 минут.
Зачастую данные содержат полезную информацию – от цен на «Биг Мак» в разных странах, по которым можно оценить стоимость валюты, до коррупционных схем высших должностных лиц и свидетельств военных преступлений. Поэтому существует множество способов извлечения важной информации из большого и сложно устроенного массива данных. В этом материале мы расскажем об одном из таких методов – о визуализации данных.
Кратко: о чём статья?
Выборки данных (почитать о них можно в этом посте) часто представляют из себя таблицы, где каждая строка содержит различные числовые/строковые значения и является одним конкретным наблюдением. Скажем, в выборке с данными пингвинов 344 наблюдения и 7 признаков. Это относительно немного, но сделать выводы, просто посмотрев на таблицу, уже затруднительно. Здесь поможет построение графиков. Выбор типа графика зависит от цели, которую ставит исследователь.
Впрочем, не всегда данные представляются в виде таблицы, у которой можно взять столбец и построить график. Чтобы выделить из выборки статей BBC за 2004-2005 годы темы, о которых писали журналисты, и слова, которые характеризуют каждую тему, мы можем воспользоваться облаками слов.
Отдельная история — визуализация данных в исследовании нейросетей. О ней, а также о гистограммах, ящике с усами (boxplot), динамических и интерактивных визуализациях узнаете из полной версии статьи.
Время чтения: 14 минут.
Системный Блокъ
Что такое визуализация данных? - Системный Блокъ
Зачастую данные содержат полезную информацию — от цен на «Биг Мак» в разных странах, по которым можно оценить стоимость валюты, до коррупционных схем высших должностных лиц и свидетельств военных преступлений. Поэтому существует множество способов извлечения…
Чебурашка вместо Поттера: какие фильмы есть в российском прокате 2022 года?
После февраля 2022 года несколько крупных голливудских студий приостановили прокат в России, а в феврале 2023 у онлайн-кинотеатров истек срок лицензионных прав, например, на фильмы о Гарри Поттере. Какие фильмы теперь может посмотреть российский зритель?
Кратко: о чем статья?
Соотношение стран-изготовителей фильмов изменилось после начала СВО: например, фильмов из США в кинотеатрах России стало в два раза меньше (с 29% от общей доли показа в 2021 году до 16% в 2022), зато мы теперь можем смотреть больше картин из Европы, Мексики или Южной Кореи. Встречаются и «экзотические» экземпляры — кино из Литвы, Боснии и Герцеговины, Филиппин.
Однако российский зритель не остался совсем без новинок Голливуда: пиратские копии фильмов включают как предпросмотр к официальным прокатам. Выручка от такого «предсеансового обслуживания» составила около 1 млрд рублей.
Какие еще страны показывают свои фильмы в России, а также могут ли фильмы из Мексики и Индии заменить Голливуд, узнаете из полного текста статьи.
Время чтения: 3 минуты.
После февраля 2022 года несколько крупных голливудских студий приостановили прокат в России, а в феврале 2023 у онлайн-кинотеатров истек срок лицензионных прав, например, на фильмы о Гарри Поттере. Какие фильмы теперь может посмотреть российский зритель?
Кратко: о чем статья?
Соотношение стран-изготовителей фильмов изменилось после начала СВО: например, фильмов из США в кинотеатрах России стало в два раза меньше (с 29% от общей доли показа в 2021 году до 16% в 2022), зато мы теперь можем смотреть больше картин из Европы, Мексики или Южной Кореи. Встречаются и «экзотические» экземпляры — кино из Литвы, Боснии и Герцеговины, Филиппин.
Однако российский зритель не остался совсем без новинок Голливуда: пиратские копии фильмов включают как предпросмотр к официальным прокатам. Выручка от такого «предсеансового обслуживания» составила около 1 млрд рублей.
Какие еще страны показывают свои фильмы в России, а также могут ли фильмы из Мексики и Индии заменить Голливуд, узнаете из полного текста статьи.
Время чтения: 3 минуты.
«Коктейль Молотова» массового производства: как судят за поджоги военкоматов
Дата-отдел «Системного Блока» проанализировал собранные ОВД-инфо и Медиазоной данные о поджогах административных зданий в период с февраля по декабрь 2022 и попытался установить, по каким статьям проходят известные фигуранты. Оказалось, что с октября прокуратура чаще отдавала предпочтение 205 статье, а в судебных заключениях стали появляться «обвинения в прохождении обучения терроризму». В диаграмме отражены подтвержденные случаи поджога военкоматов и других административных зданий по месяцам, за этот период их произошло около 63, из них по судебным решениям верифицировать удалось только 37.
После 24 февраля поджоги административных зданий, в частности, военкоматов, часто связывают с выражением антивоенной позиции. Объявленная в сентябре частичная мобилизация могла стать поводом для новых поджогов — теперь они происходят гораздо чаще. Возможно, это дало повод ужесточить наказание: уже 30 сентября власти в лице представителя мобилизационного управления Генштаба ВС РФ Владимира Цимлянского объявил об ужесточении наказания за поджоги военкоматов.
До 2023 года почти все обвинительные заключения для фигурантов таких дел выносились по 167 статье Уголовного кодекса и предусматривали максимальное заключение под стражу до 5 лет. Ранее юрист Павел Чиков сообщил, что с начала осени 2022 года дела о поджоге военкоматов стали квалифицироваться как «терроризм» и чаще передаваться в управление ФСБ.
31 января одному из поджигателей военкоматов впервые вынесли приговор по статье о «терроризме». Владиславу Борисенко из Нижневартовска назначили 12 лет лишения свободы. Борисенко вместе с другим жителем города забросали бутылками с зажигательной смесью нижневартовский военкомат на ул. Мира 78.
Дата-отдел «Системного Блока» проанализировал собранные ОВД-инфо и Медиазоной данные о поджогах административных зданий в период с февраля по декабрь 2022 и попытался установить, по каким статьям проходят известные фигуранты. Оказалось, что с октября прокуратура чаще отдавала предпочтение 205 статье, а в судебных заключениях стали появляться «обвинения в прохождении обучения терроризму». В диаграмме отражены подтвержденные случаи поджога военкоматов и других административных зданий по месяцам, за этот период их произошло около 63, из них по судебным решениям верифицировать удалось только 37.
После 24 февраля поджоги административных зданий, в частности, военкоматов, часто связывают с выражением антивоенной позиции. Объявленная в сентябре частичная мобилизация могла стать поводом для новых поджогов — теперь они происходят гораздо чаще. Возможно, это дало повод ужесточить наказание: уже 30 сентября власти в лице представителя мобилизационного управления Генштаба ВС РФ Владимира Цимлянского объявил об ужесточении наказания за поджоги военкоматов.
До 2023 года почти все обвинительные заключения для фигурантов таких дел выносились по 167 статье Уголовного кодекса и предусматривали максимальное заключение под стражу до 5 лет. Ранее юрист Павел Чиков сообщил, что с начала осени 2022 года дела о поджоге военкоматов стали квалифицироваться как «терроризм» и чаще передаваться в управление ФСБ.
31 января одному из поджигателей военкоматов впервые вынесли приговор по статье о «терроризме». Владиславу Борисенко из Нижневартовска назначили 12 лет лишения свободы. Борисенко вместе с другим жителем города забросали бутылками с зажигательной смесью нижневартовский военкомат на ул. Мира 78.
Мальчики — программисты, девочки — балерины: гендерное неравенство в образовании и науке
Сегодня 8 марта — день борьбы за равные права женщин. В XXI веке гендерное неравенство продолжает оставаться проблемой в большинстве стран мира. Несмотря на формальное равенство возможностей, женщины по-прежнему зарабатывают гораздо меньше мужчин и имеют меньше шансов сделать успешную карьеру. Вспоминаем наш материал о том, как работает гендерное неравенство в академическом сообществе.
Кратко: о чём статья?
Исследование Гарвардских ученых 2019 года показало, что гендерный разрыв в STEM (Science, Technology, Engineering and Math — Наука, Технологии, Инженерия и Математика) начинается со школьной скамьи. К средней школе в США среди детей, мечтающих стать математиками и инженерами, мальчиков вдвое больше, чем девочек. Та же тенденция прослеживается в старшей школе, а в коллежде мужчины в пять раз чаще изучают инженерию и IT.
Другое исследование провели в 2020 году ученые из Северо-Восточного университета Бостона и Копенгагенского университета. Они проанализировали карьеры более семи миллионов ученых по всему миру в период с 1900 по 2016 год. Хотя в целом наблюдается рост доли исследовательниц, процент женщин существенно разнится в зависимости от сферы исследований (15% в STEM и 33% в психологии) и страны (28% в Германии и 50% в России).
О причинах такого дисбаланса и вариантах его проявления, а также об эксперименте ученых из Гарварда узнаете из полного текста статьи.
Время чтения: 8,5 минут.
Сегодня 8 марта — день борьбы за равные права женщин. В XXI веке гендерное неравенство продолжает оставаться проблемой в большинстве стран мира. Несмотря на формальное равенство возможностей, женщины по-прежнему зарабатывают гораздо меньше мужчин и имеют меньше шансов сделать успешную карьеру. Вспоминаем наш материал о том, как работает гендерное неравенство в академическом сообществе.
Кратко: о чём статья?
Исследование Гарвардских ученых 2019 года показало, что гендерный разрыв в STEM (Science, Technology, Engineering and Math — Наука, Технологии, Инженерия и Математика) начинается со школьной скамьи. К средней школе в США среди детей, мечтающих стать математиками и инженерами, мальчиков вдвое больше, чем девочек. Та же тенденция прослеживается в старшей школе, а в коллежде мужчины в пять раз чаще изучают инженерию и IT.
Другое исследование провели в 2020 году ученые из Северо-Восточного университета Бостона и Копенгагенского университета. Они проанализировали карьеры более семи миллионов ученых по всему миру в период с 1900 по 2016 год. Хотя в целом наблюдается рост доли исследовательниц, процент женщин существенно разнится в зависимости от сферы исследований (15% в STEM и 33% в психологии) и страны (28% в Германии и 50% в России).
О причинах такого дисбаланса и вариантах его проявления, а также об эксперименте ученых из Гарварда узнаете из полного текста статьи.
Время чтения: 8,5 минут.
Системный Блокъ
Гендерное неравенство в STEM образовании
Разбираемся, как работает гендерное неравенство в STEM образовании и академическом сообществе
«Да что они понимают»: как младенцы учатся говорить
В младенчестве нам предстояло выучить незнакомый язык на основе речи вокруг себя. Как мы осваивали язык и отделяли слова друг от друга? Вспоминаем архивный материал «Системного Блока» о речевых подсказках для младенцев и о том, как мы прибегали к статистике уже в семь месяцев.
Кратко: о чем статья?
Прежде чем научиться понимать значения слов, младенцам необходимо усвоить, как выделять отдельные слова из беглой речи взрослых (это также называется сегментацией речевого потока). Лингвисты выделяют два вида подсказок, на которые могут опираться младенцы, — статистические и просодические.
Статистические подсказки связаны с вероятностями сочетания слогов внутри слова и на стыке слов. Младенец улавливает, что вероятность следования одних слогов за другими более высокая, чем вероятность их сочетаний с иными слогами (например, после слога «ма» с большей вероятностью идет слог «ма», а сочетание «я-ма» возможно в меньшей степени). Он осваивает эти статистические различия и формирует представление о границах слов.
Просодические подсказки связаны с восприятием основного типа ударения в языке. Рисунки ударений в языках различаются, младенцы слышат это и таким образом могут «чувствовать» границы слов.
О том, какие слова предпочитают слушать младенцы из Германии, Англии и Франции, какие подсказки малыши начинают использовать раньше, а также как изучается речевая сегментация в России, узнаете из полного текста статьи.
Время чтения: 6 минут.
В младенчестве нам предстояло выучить незнакомый язык на основе речи вокруг себя. Как мы осваивали язык и отделяли слова друг от друга? Вспоминаем архивный материал «Системного Блока» о речевых подсказках для младенцев и о том, как мы прибегали к статистике уже в семь месяцев.
Кратко: о чем статья?
Прежде чем научиться понимать значения слов, младенцам необходимо усвоить, как выделять отдельные слова из беглой речи взрослых (это также называется сегментацией речевого потока). Лингвисты выделяют два вида подсказок, на которые могут опираться младенцы, — статистические и просодические.
Статистические подсказки связаны с вероятностями сочетания слогов внутри слова и на стыке слов. Младенец улавливает, что вероятность следования одних слогов за другими более высокая, чем вероятность их сочетаний с иными слогами (например, после слога «ма» с большей вероятностью идет слог «ма», а сочетание «я-ма» возможно в меньшей степени). Он осваивает эти статистические различия и формирует представление о границах слов.
Просодические подсказки связаны с восприятием основного типа ударения в языке. Рисунки ударений в языках различаются, младенцы слышат это и таким образом могут «чувствовать» границы слов.
О том, какие слова предпочитают слушать младенцы из Германии, Англии и Франции, какие подсказки малыши начинают использовать раньше, а также как изучается речевая сегментация в России, узнаете из полного текста статьи.
Время чтения: 6 минут.
Системный Блокъ
Развитие речи младенцев
Как младенцы учатся осваивать речь
Фуникулеры, «Гранд-опера» и главная купеческая улица: три путешествия по Нижнему Новгороду
Сегодня предлагаем вам совершить три «Путешествия с открыткой» по истории Нижнего Новгорода. В каждом из материалов найдёте не только открытки, но также планы, чертежи и фотографии XIX—XX века.
🎼 «Гранд-опера»: Николаевский городской театр
Всякий турист, бывавший в Нижнем Новгороде, совершал прогулку по Большой Покровской улице. Раньше здесь селились дворяне, а к концу XIX века — представители купечества. Сегодня это главный пешеходный маршрут и центр культурной жизни Нижнего Новгорода. Изображенное на открытке здание городского театра занимает центральное место в архитектурном ансамбле улицы. Узнать об истории его строительства, торжественном открытии и различиях для «чистой» и «черной» публики и можно, прочитав полный текст материала.
🚠 Фуникулеры: одни из первых в России
Историческая часть Нижнего Новгорода расположена на Дятловых горах, комплексе из семи холмов по правому (высокому) берегу рек Оки и Волги. Город строился как на самих холмах, так и у их подножий, что затрудняло связь между городскими районами. С развитием трамвайного транспорта на рубеже XIX-XX вв. проблема была решена устройством фуникулеров. На почтовых открытках из собрания проекта «Пишу тебе» изображены Кремлевский и Похвалинский элеваторы. Узнать, что стало стимулом к их строительству, что находится на их месте сегодня и каким был пассажиропоток в 1914 году можно из полного текста статьи.
🎄 От «Рождественской» до «Маяковки» (и обратно)
Нижний Новгород более ста лет назад — это крупнейший торговый центр Российской Империи. Здесь ежегодно проводилась знаменитая Нижегородская ярмарка, собиравшая купцов со всей России и из-за рубежа. В советское время Рождественская улица превратилась в «Маяковку», но в 90-е годы вернула прежнее название, сохранив в нетронутом виде практически всю дореволюционную застройку. О том, как эта улица связана с мифом о воззвании Минина, Александром II, Николаем II и Максимом Горьким узнаете из полной версии статьи.
Сегодня предлагаем вам совершить три «Путешествия с открыткой» по истории Нижнего Новгорода. В каждом из материалов найдёте не только открытки, но также планы, чертежи и фотографии XIX—XX века.
🎼 «Гранд-опера»: Николаевский городской театр
Всякий турист, бывавший в Нижнем Новгороде, совершал прогулку по Большой Покровской улице. Раньше здесь селились дворяне, а к концу XIX века — представители купечества. Сегодня это главный пешеходный маршрут и центр культурной жизни Нижнего Новгорода. Изображенное на открытке здание городского театра занимает центральное место в архитектурном ансамбле улицы. Узнать об истории его строительства, торжественном открытии и различиях для «чистой» и «черной» публики и можно, прочитав полный текст материала.
🚠 Фуникулеры: одни из первых в России
Историческая часть Нижнего Новгорода расположена на Дятловых горах, комплексе из семи холмов по правому (высокому) берегу рек Оки и Волги. Город строился как на самих холмах, так и у их подножий, что затрудняло связь между городскими районами. С развитием трамвайного транспорта на рубеже XIX-XX вв. проблема была решена устройством фуникулеров. На почтовых открытках из собрания проекта «Пишу тебе» изображены Кремлевский и Похвалинский элеваторы. Узнать, что стало стимулом к их строительству, что находится на их месте сегодня и каким был пассажиропоток в 1914 году можно из полного текста статьи.
🎄 От «Рождественской» до «Маяковки» (и обратно)
Нижний Новгород более ста лет назад — это крупнейший торговый центр Российской Империи. Здесь ежегодно проводилась знаменитая Нижегородская ярмарка, собиравшая купцов со всей России и из-за рубежа. В советское время Рождественская улица превратилась в «Маяковку», но в 90-е годы вернула прежнее название, сохранив в нетронутом виде практически всю дореволюционную застройку. О том, как эта улица связана с мифом о воззвании Минина, Александром II, Николаем II и Максимом Горьким узнаете из полной версии статьи.
Demhack 6: хакатон по защите свободы и приватности в интернете
25-26 марта состоится хакатон, посвященный свободе, приватности и исследованиям интернета от коллег из Privacy Accelerator. Эти темы часто оказываются в фокусе у «Системного Блока», и мы стараемся смотреть на них через призму данных. На хакатоне появится возможность стать ближе к нашей команде и поработать вместе — мы принесем несколько датасетов и тем от нашего дата-отдела. Подать заявку на участие можно до конца 16 марта. Призовой фонд хакатона — 120 тысяч рублей.
Темы исследований от издания «Системный Блокъ»
📣Импортозамедление: как снизилась скорость интернета в России после вторжения в Украину
В регионах России скорость интернета снизилась в среднем на 7%. При этом в Москве она выросла на треть. Мы предлагаем исследовать данные РКН об инфраструктуре связи в России: какие операторы работают в регионах и какую скорость предлагают. Дополнительно исследовать, как на их предложения повлияли санкции: известные планы развития, тарифы и т.д.
📣От Оксимирона до Ансамбля Христа Спасителя: что признавали экстремизмом в РФ до и после 2022
В 2022 году зарегистрировано на 50% больше преступлений экстремистской направленности. А что становится экстремизмом в интернете и является угрозой государству? Изменилось ли преследование за распространение экстремистских материалов за последний год?
📣 Самоизоляция Рунета: какие российские онлайн-ресурсы недоступны из-за границы
Предлагаем исследовать, как выглядит российский интернет извне, какие государственные и общественно значимые ресурсы доступны теперь только через VPN.
25-26 марта состоится хакатон, посвященный свободе, приватности и исследованиям интернета от коллег из Privacy Accelerator. Эти темы часто оказываются в фокусе у «Системного Блока», и мы стараемся смотреть на них через призму данных. На хакатоне появится возможность стать ближе к нашей команде и поработать вместе — мы принесем несколько датасетов и тем от нашего дата-отдела. Подать заявку на участие можно до конца 16 марта. Призовой фонд хакатона — 120 тысяч рублей.
Темы исследований от издания «Системный Блокъ»
📣Импортозамедление: как снизилась скорость интернета в России после вторжения в Украину
В регионах России скорость интернета снизилась в среднем на 7%. При этом в Москве она выросла на треть. Мы предлагаем исследовать данные РКН об инфраструктуре связи в России: какие операторы работают в регионах и какую скорость предлагают. Дополнительно исследовать, как на их предложения повлияли санкции: известные планы развития, тарифы и т.д.
📣От Оксимирона до Ансамбля Христа Спасителя: что признавали экстремизмом в РФ до и после 2022
В 2022 году зарегистрировано на 50% больше преступлений экстремистской направленности. А что становится экстремизмом в интернете и является угрозой государству? Изменилось ли преследование за распространение экстремистских материалов за последний год?
📣 Самоизоляция Рунета: какие российские онлайн-ресурсы недоступны из-за границы
Предлагаем исследовать, как выглядит российский интернет извне, какие государственные и общественно значимые ресурсы доступны теперь только через VPN.
Замкнутый круг: в каких городах России не строят метро, но обещают
Москва лидирует в России по количеству открытых станций метро: за 12 лет во всей России построили меньше станций метро, чем в одной Москве в 2021 году. «Системный Блокъ» рассказывает о городах, где метро строят очень медленно или не строят совсем.
Кратко: о чем статья?
Пока в Москве каждый год вводят что-то новое (новая большая Кольцевая линия стала самой длинной кольцевой в мире), остальные города сильно отстают по количеству построенных и запланированных станций. Например, с 2012 по 2022 год в Москве из 76 намеченных станций открыли уже 65, а в Санкт-Петербурге с 2008 года не могут открыть Театральную станцию. В некоторых городах-миллионниках (к примеру, в Челябинске и Красноярске) строительство метро началось и прекратилось в советское время.
Отсутствие больших средств в федеральном бюджете — основная причина, по которой не получается построить новые участки метро вне столицы. Однако шанс найти деньги увеличивается, если случается важное международное событие.
О том, каковы перспективы подземного транспорта и как с ним обстоят дела в Новосибирске, Екатеринбурге и других городах, узнаете из полного текста статьи.
Время чтения: 7 минут.
Москва лидирует в России по количеству открытых станций метро: за 12 лет во всей России построили меньше станций метро, чем в одной Москве в 2021 году. «Системный Блокъ» рассказывает о городах, где метро строят очень медленно или не строят совсем.
Кратко: о чем статья?
Пока в Москве каждый год вводят что-то новое (новая большая Кольцевая линия стала самой длинной кольцевой в мире), остальные города сильно отстают по количеству построенных и запланированных станций. Например, с 2012 по 2022 год в Москве из 76 намеченных станций открыли уже 65, а в Санкт-Петербурге с 2008 года не могут открыть Театральную станцию. В некоторых городах-миллионниках (к примеру, в Челябинске и Красноярске) строительство метро началось и прекратилось в советское время.
Отсутствие больших средств в федеральном бюджете — основная причина, по которой не получается построить новые участки метро вне столицы. Однако шанс найти деньги увеличивается, если случается важное международное событие.
О том, каковы перспективы подземного транспорта и как с ним обстоят дела в Новосибирске, Екатеринбурге и других городах, узнаете из полного текста статьи.
Время чтения: 7 минут.
«Крейсер “Россия”», новый роман Достоевского и другие фантазии ChatGPT
Читали ли вы знаменитый роман Достоевского «Девять пятых»? А «Крейсер “Россия”» Льва Толстого? Мы тоже не читали. А вот ChatGPT знает такие романы и даже может пересказать их сюжет. И это не единственное, о чем безбожно врет самая известная нейросеть нашего времени. Подробный разбор фантазий ChatGPT с участием четырех настоящих (живых, не искусственных) ученых — в блоге Бориса Орехова.
🤖 Как работает ChatGPT?
ChatGPT — это система, построенная на мощной нейронной сети, в основе которой архитектура «трансформер». Суть этой нейронки в том, что она умеет предсказывать следование слов друг за другом, чему она научилась на текстах из интернета. «Словами» при этом могут быть самые разные вещи: от знаков препинания до математической нотации. Чем больше задача, стоящая перед ChatGPT, похожа на языковую, тем лучше нейросеть с ней справляется. А вот работать калькулятором на уровне миллионов-миллиардов у искусственного интеллекта не выходит, потому что такие числа редко встречаются в текстах, а значит, у ChatGPT мало шансов их увидеть и запомнить. Хотя мы привыкли, что машины считают лучше людей, в математике ChatGPT будет допускать ошибки.
📚 А как у неё с литературой?
ChatGPT допускает фактические ошибки даже на уровне школьной программы. Да, она прочла всю Википедию, но фактчекинг после работы нейросети нужен все равно основательный. Льву Толстому она, например, приписывает роман «Крейсер “Россия”», «Ревизора» Гоголя и «Отцов и детей» Тургенева. Достоевский же, согласно нейросети, написал четыре великих романа, один из которых — выдуманный.
🎞️ А как у неё с кино?
Если кратко: главные роли в советском фильме «Любовь и голуби» сыграли Леа Сейдж и Эмили Блант, а лучшую экранизацию «Анны Карениной» в 2017 году снял Кирилл Серебренников (спойлер:нет, он такую не снимал ).
🇬🇧 Может, надо просто спросить её по-английски?
Если задавать запросы не на русском, а на английском языке, ChatGPT действительно часто даёт более точные ответы. Правда, если спросить про что-то, что не у всех на слуху, искусственный интеллект может зарапортоваться. В ответ на вопрос о самом известном романе Пелевина нейросеть не только предложила неочевидную «Жизнь насекомых», но и породила при пересказе какой-то странный аналог «Скотного двора» Оруэлла, потому что не знает содержания текстов. В её пересказе «Отцов и детей», кстати, появился старый казак Бердяев, а вот ни Базарова, ни Кирсанова не обнаружилось.
О том, кому СhatGPT приписывает основание компании Yandex, какие проблемы у нейросети возникают на этапе интерпретации текста и владеет ли она специальной терминологией, узнаете из полного текста поста в блоге.
Читали ли вы знаменитый роман Достоевского «Девять пятых»? А «Крейсер “Россия”» Льва Толстого? Мы тоже не читали. А вот ChatGPT знает такие романы и даже может пересказать их сюжет. И это не единственное, о чем безбожно врет самая известная нейросеть нашего времени. Подробный разбор фантазий ChatGPT с участием четырех настоящих (живых, не искусственных) ученых — в блоге Бориса Орехова.
🤖 Как работает ChatGPT?
ChatGPT — это система, построенная на мощной нейронной сети, в основе которой архитектура «трансформер». Суть этой нейронки в том, что она умеет предсказывать следование слов друг за другом, чему она научилась на текстах из интернета. «Словами» при этом могут быть самые разные вещи: от знаков препинания до математической нотации. Чем больше задача, стоящая перед ChatGPT, похожа на языковую, тем лучше нейросеть с ней справляется. А вот работать калькулятором на уровне миллионов-миллиардов у искусственного интеллекта не выходит, потому что такие числа редко встречаются в текстах, а значит, у ChatGPT мало шансов их увидеть и запомнить. Хотя мы привыкли, что машины считают лучше людей, в математике ChatGPT будет допускать ошибки.
📚 А как у неё с литературой?
ChatGPT допускает фактические ошибки даже на уровне школьной программы. Да, она прочла всю Википедию, но фактчекинг после работы нейросети нужен все равно основательный. Льву Толстому она, например, приписывает роман «Крейсер “Россия”», «Ревизора» Гоголя и «Отцов и детей» Тургенева. Достоевский же, согласно нейросети, написал четыре великих романа, один из которых — выдуманный.
🎞️ А как у неё с кино?
Если кратко: главные роли в советском фильме «Любовь и голуби» сыграли Леа Сейдж и Эмили Блант, а лучшую экранизацию «Анны Карениной» в 2017 году снял Кирилл Серебренников (спойлер:
🇬🇧 Может, надо просто спросить её по-английски?
Если задавать запросы не на русском, а на английском языке, ChatGPT действительно часто даёт более точные ответы. Правда, если спросить про что-то, что не у всех на слуху, искусственный интеллект может зарапортоваться. В ответ на вопрос о самом известном романе Пелевина нейросеть не только предложила неочевидную «Жизнь насекомых», но и породила при пересказе какой-то странный аналог «Скотного двора» Оруэлла, потому что не знает содержания текстов. В её пересказе «Отцов и детей», кстати, появился старый казак Бердяев, а вот ни Базарова, ни Кирсанова не обнаружилось.
О том, кому СhatGPT приписывает основание компании Yandex, какие проблемы у нейросети возникают на этапе интерпретации текста и владеет ли она специальной терминологией, узнаете из полного текста поста в блоге.
Системный Блокъ
«Крейсер “Россия”» и другие фантазии ChatGPT - Системный Блокъ
Всерьез полагаться на ChatGPT пока не стоит. И вот почему. Доцент школы лингвистики НИУ ВШЭ Борис Орехов разобрался на примерах.
Как это устроено: мастерские «Пишу тебе»
Команда проекта «Пишу тебе» каждый месяц проводит специальные мастерские, во время которых все желающие узнают, как правильно расшифровывать почтовые открытки. Участники мастерских могут не только поработать с текстами, но и узнать истории людей, стоящих за их отправкой: отправителей и получателей. Кто-то приносит свои открытки, которые пополняют коллекцию «Пишу тебе».
Кратко: о чём статья?
Первая мастерская по расшифровке дореволюционных открыток состоялась 30 сентября 2022 года в Нижнем Новгороде. Её участникам рассказали об истории появления почтовых открыток и открытках, отправленных из будущего в прошлое (спойлер:всё дело в григорианском и юлианском календарях ). Затем была мастерская на междисциплинарной конференции в нижегородском корпусе НИУ ВШЭ, выставка почтовых открыток с новогодними и рождественскими поздравлениями и мероприятия в разных городах, деревнях и посёлках Нижегородской области.
Не меньший интерес представляют открытки и для исследователей. Например, на научно-методическом семинаре «Цифровая среда» участники обратили внимание на проблему авторства массового источника и проблему «повторяющихся» открыток с одинаковыми изображениями, но разными текстами.
В марте «Пишу тебе» примет участие в зимнем хакатоне, организованном Факультетом гуманитарных наук и Факультетом информатики, математики и компьютерных наук Нижегородской Вышки на базе Информационного центра по атомной энергетике (ИЦАЭ), а в апреле планируется выставка открыток из коллекции проекта в Москве. Узнать больше о грядущих и прошедших событиях, организованных командой проекта, можно из полного текста статьи.
Время чтения: 9 минут.
Команда проекта «Пишу тебе» каждый месяц проводит специальные мастерские, во время которых все желающие узнают, как правильно расшифровывать почтовые открытки. Участники мастерских могут не только поработать с текстами, но и узнать истории людей, стоящих за их отправкой: отправителей и получателей. Кто-то приносит свои открытки, которые пополняют коллекцию «Пишу тебе».
Кратко: о чём статья?
Первая мастерская по расшифровке дореволюционных открыток состоялась 30 сентября 2022 года в Нижнем Новгороде. Её участникам рассказали об истории появления почтовых открыток и открытках, отправленных из будущего в прошлое (спойлер:
Не меньший интерес представляют открытки и для исследователей. Например, на научно-методическом семинаре «Цифровая среда» участники обратили внимание на проблему авторства массового источника и проблему «повторяющихся» открыток с одинаковыми изображениями, но разными текстами.
В марте «Пишу тебе» примет участие в зимнем хакатоне, организованном Факультетом гуманитарных наук и Факультетом информатики, математики и компьютерных наук Нижегородской Вышки на базе Информационного центра по атомной энергетике (ИЦАЭ), а в апреле планируется выставка открыток из коллекции проекта в Москве. Узнать больше о грядущих и прошедших событиях, организованных командой проекта, можно из полного текста статьи.
Время чтения: 9 минут.
Системный Блокъ
Как это устроено: мастерские «Пишу тебе» - Системный Блокъ
Как правильно расшифровывать почтовые открытки? Команда проекта «Пишу тебе» каждый месяц проводит специальные мастерские, во время которых все желающие постигают премудрости расшифровки открыток под присмотром Тимура Хусяинова, куратора отдела добычи открыток…
Учить(ся) DH в эпоху GPT
Эта неделя — неделя GPT в «Системном Блоке»: рассказываем о том, как функционируют и справляются со своими задачами языковые модели. Преподаватели программы цифровых гуманитарных исследований ИТМО Гавриил Беляк и Полина Колозариди спросили ChatGPT о том, как технологии AI (Artificial intelligence) меняют цифровую гуманитаристику (DH), устроили критический разбор ответа, а еще обсудили, что будет, когда модели семейства GPT станут обычной частью учебного процесса.
Кратко: о чём статья?
GPT-3 считает, что «искусственный интеллект может революционизировать цифровые гуманитарные науки, обеспечивая более эффективный и сложный анализ больших наборов данных, а также способствуя новым формам сотрудничества и интерпретации», но отмечает и ряд проблем. Например, «интеграция ИИ в DH поднимает важные этические и юридические вопросы, связанные с конфиденциальностью данных, интеллектуальной собственностью и доступом к информации».
В системе производства знания GPT как интерфейс — это глобальная филологическая революция. Риторика и композиция текста оказываются средством производства, а умение анализировать текст является эволюционным преимуществом в новой среде. В начале 2000-х Яндекс потратил кучу сил, чтобы научиться обрабатывать запрос: «дорогой Яндекс, как мне купить подешевле холодильник рядом с домом?» Но к тому времени, как это удалось, мы уже давно писали: «купить холодильник дешево СПб».
Интересно, что в случае с GPT мы видим симметричный процесс. В ответ на интерфейс на естественном языке мы для получения более точных результатов немедленно изобрели специальные приёмы, которые развились в целые языки и методологии промптов. Основной приём, который они используют для детализации результата или обхода блокировок, связан с созданием условной или предполагаемой ситуации, набора правил. Именно такой запрос наиболее близок к логике обучения, лежащей в основе архитектуры сети.
Правда, науки и их каноны скреплены не столько языком, сколько практиками, включая подспудные и порой нерефлексивные действия. В науке важно умение задавать критические вопросы и проявлять чуткость не только к канону или дисциплинарной истории, но и к настоящему. О том, как с этим справляются GPT — в полном тексте беседы на сайте.
Время чтения: 16,5 минут.
Эта неделя — неделя GPT в «Системном Блоке»: рассказываем о том, как функционируют и справляются со своими задачами языковые модели. Преподаватели программы цифровых гуманитарных исследований ИТМО Гавриил Беляк и Полина Колозариди спросили ChatGPT о том, как технологии AI (Artificial intelligence) меняют цифровую гуманитаристику (DH), устроили критический разбор ответа, а еще обсудили, что будет, когда модели семейства GPT станут обычной частью учебного процесса.
Кратко: о чём статья?
GPT-3 считает, что «искусственный интеллект может революционизировать цифровые гуманитарные науки, обеспечивая более эффективный и сложный анализ больших наборов данных, а также способствуя новым формам сотрудничества и интерпретации», но отмечает и ряд проблем. Например, «интеграция ИИ в DH поднимает важные этические и юридические вопросы, связанные с конфиденциальностью данных, интеллектуальной собственностью и доступом к информации».
В системе производства знания GPT как интерфейс — это глобальная филологическая революция. Риторика и композиция текста оказываются средством производства, а умение анализировать текст является эволюционным преимуществом в новой среде. В начале 2000-х Яндекс потратил кучу сил, чтобы научиться обрабатывать запрос: «дорогой Яндекс, как мне купить подешевле холодильник рядом с домом?» Но к тому времени, как это удалось, мы уже давно писали: «купить холодильник дешево СПб».
Интересно, что в случае с GPT мы видим симметричный процесс. В ответ на интерфейс на естественном языке мы для получения более точных результатов немедленно изобрели специальные приёмы, которые развились в целые языки и методологии промптов. Основной приём, который они используют для детализации результата или обхода блокировок, связан с созданием условной или предполагаемой ситуации, набора правил. Именно такой запрос наиболее близок к логике обучения, лежащей в основе архитектуры сети.
Правда, науки и их каноны скреплены не столько языком, сколько практиками, включая подспудные и порой нерефлексивные действия. В науке важно умение задавать критические вопросы и проявлять чуткость не только к канону или дисциплинарной истории, но и к настоящему. О том, как с этим справляются GPT — в полном тексте беседы на сайте.
Время чтения: 16,5 минут.
Системный Блокъ
Учить(ся) DH в эпоху GPT - Системный Блокъ
Спросили у GPT про искусственный интеллект и DH, увидели в ответе лишь усреднённый здравый смысл. Публикуем текст-диалог о том, какие сюжеты вокруг DH сейчас кажутся важными и почему усреднённых смыслов недостаточно.
Что такое transfer learning в обучении нейросетей
Как нейросеть, обученная под одну задачу, решает другую? Может ли она использовать свой «предыдущий опыт»? Почему это важно и почему корпорации спешат внедрить эту технологию? Рассказываем о популярном методе «переноса знаний» в машинном обучении на примерах языков, ягод и Достоевского.
Кратко: о чем статья?
Нейросети, обученные под одну задачу, можно научить решать другие, похожие. Отсюда и название метода трансферного обучения — мы будто «переносим» (от англ. transfer — передача) предыдущий опыт решения проблемы на новую, еще не решенную. Например, чтобы модель научилась писать тексты в стиле Достоевского, оптимально взять уже готовую русскоязычную версию GPT-3, найти в интернете оцифрованные версии произведений писателя (например, здесь) и дообучить модель на новых текстах.
Плюс, поскольку нейросеть представляет собой последовательность слоев, где каждый слой — математическое преобразование входных данных, в машинном обучении мы можем выбирать, какие слои нейросети нам обучать, а какие — нет. Если мы не хотим обновлять, то есть обучать, какие-то слои, в терминологии глубинного обучения — мы их «замораживаем». Скажем, чтобы нейросеть, уже умеющая определять разные ягоды, научилась распознавать больную клубнику, нужно будет «заморозить» слои, распознающие голубику, малину и клюкву.
Трансферное обучение скрыто и в нашей повседневной жизни: смартфон, который использует детекцию лица вместо пароля дообучается на лице конкретного пользователя; модераторы сайтов используют нейросети для блокировки неприемлемых постов или видео, как это, например, делает YouTube — их модель постоянно дообучается на новых наборах токсичных данных, чтобы лучше распознавать негативный контент.
Больше подробностей о том, как работает transfer learning, а также о других примерах его применения и экологии в IT-сфере — узнаете из полного текста статьи.
Время чтения: 7 минут.
Как нейросеть, обученная под одну задачу, решает другую? Может ли она использовать свой «предыдущий опыт»? Почему это важно и почему корпорации спешат внедрить эту технологию? Рассказываем о популярном методе «переноса знаний» в машинном обучении на примерах языков, ягод и Достоевского.
Кратко: о чем статья?
Нейросети, обученные под одну задачу, можно научить решать другие, похожие. Отсюда и название метода трансферного обучения — мы будто «переносим» (от англ. transfer — передача) предыдущий опыт решения проблемы на новую, еще не решенную. Например, чтобы модель научилась писать тексты в стиле Достоевского, оптимально взять уже готовую русскоязычную версию GPT-3, найти в интернете оцифрованные версии произведений писателя (например, здесь) и дообучить модель на новых текстах.
Плюс, поскольку нейросеть представляет собой последовательность слоев, где каждый слой — математическое преобразование входных данных, в машинном обучении мы можем выбирать, какие слои нейросети нам обучать, а какие — нет. Если мы не хотим обновлять, то есть обучать, какие-то слои, в терминологии глубинного обучения — мы их «замораживаем». Скажем, чтобы нейросеть, уже умеющая определять разные ягоды, научилась распознавать больную клубнику, нужно будет «заморозить» слои, распознающие голубику, малину и клюкву.
Трансферное обучение скрыто и в нашей повседневной жизни: смартфон, который использует детекцию лица вместо пароля дообучается на лице конкретного пользователя; модераторы сайтов используют нейросети для блокировки неприемлемых постов или видео, как это, например, делает YouTube — их модель постоянно дообучается на новых наборах токсичных данных, чтобы лучше распознавать негативный контент.
Больше подробностей о том, как работает transfer learning, а также о других примерах его применения и экологии в IT-сфере — узнаете из полного текста статьи.
Время чтения: 7 минут.
Системный Блокъ
Что такое transfer learning в обучении нейросетей - Системный Блокъ
Как нейросеть, обученная под одну задачу, решает другую? Может ли она использовать свой «предыдущий опыт»? Почему это важно и почему корпорации спешат внедрить эту технологию? Рассказываем о популярном методе «переноса знаний» в машинном обучении на примерах…
Как работает GPT-3 — предшественница самой продвинутой языковой модели
14 марта состоялся релиз GPT-4 — самой продвинутой языковой модели на сегодняшний день. Если вы не успели разобраться с её предшественницей, GPT-3, предлагаем вспомнить нашу статью 2021 года. GPT-3 отлично справлялась написанием целых эссе на заданную тему, удачно отвечала на вопросы, а также писала стихи и программный код. «Системный Блокъ» рассказал, как она работает.
Кратко: о чем статья?
Для обучения GPT-3 применялись прорывные методы контекстного обучения: модель, ранее уже предобученная на огромном корпусе текстов, должна выполнить задачи, предсказав ответ по аналогии с предложенными примерами. Это не обучение модели с нуля, а дообучение, которое требует значительно меньше времени и ресурсов.
Во время контекстного обучения для решения каждой задачи GPT-3 применялось три вида настроек. Few-Shot learning — «обучение в несколько приемов», когда на вход предобученной модели подается описание задачи на естественном языке и несколько примеров ожидаемых результатов. Например, задание на перевод с англиского на французский может быть таким: «sea otter → loutre de mer» и «peppermint → menthe poivrée», а теперь переведи «plush giraffe». One-Shot learning — «однократное обучение», то же, что FS, но дается лишь один пример. И, наконец, Zero-Shot метод — «нулевое», лишь инструкция на естественном языке, никаких примеров.
Примененные методы обучения позволили добиться отличных результатов. GPT-3, например, значительно превосходит другие модели при переводе с французского, немецкого и румынского языков на английский. Отвечая на вопросы об устройстве мира с точки зрения физики, модель показала в среднем 81% точности понимания доказанных фактов о мире.
О преимуществах и недостатках обучения GPT-3, архитектуре строения модели и других результатах обучения узнаете из полного текста статьи.
Время чтения: 8 минут.
14 марта состоялся релиз GPT-4 — самой продвинутой языковой модели на сегодняшний день. Если вы не успели разобраться с её предшественницей, GPT-3, предлагаем вспомнить нашу статью 2021 года. GPT-3 отлично справлялась написанием целых эссе на заданную тему, удачно отвечала на вопросы, а также писала стихи и программный код. «Системный Блокъ» рассказал, как она работает.
Кратко: о чем статья?
Для обучения GPT-3 применялись прорывные методы контекстного обучения: модель, ранее уже предобученная на огромном корпусе текстов, должна выполнить задачи, предсказав ответ по аналогии с предложенными примерами. Это не обучение модели с нуля, а дообучение, которое требует значительно меньше времени и ресурсов.
Во время контекстного обучения для решения каждой задачи GPT-3 применялось три вида настроек. Few-Shot learning — «обучение в несколько приемов», когда на вход предобученной модели подается описание задачи на естественном языке и несколько примеров ожидаемых результатов. Например, задание на перевод с англиского на французский может быть таким: «sea otter → loutre de mer» и «peppermint → menthe poivrée», а теперь переведи «plush giraffe». One-Shot learning — «однократное обучение», то же, что FS, но дается лишь один пример. И, наконец, Zero-Shot метод — «нулевое», лишь инструкция на естественном языке, никаких примеров.
Примененные методы обучения позволили добиться отличных результатов. GPT-3, например, значительно превосходит другие модели при переводе с французского, немецкого и румынского языков на английский. Отвечая на вопросы об устройстве мира с точки зрения физики, модель показала в среднем 81% точности понимания доказанных фактов о мире.
О преимуществах и недостатках обучения GPT-3, архитектуре строения модели и других результатах обучения узнаете из полного текста статьи.
Время чтения: 8 минут.
Системный Блокъ
GPT-3: самая продвинутая языковая модель на сегодняшний день
GPT-3 – языковые модели для тех, кому мало BERT, оптимизированные для трех типов задач языкового моделирования