Спасение утопающих ученых
Статьи в научных журналах — главный продукт современного ученого. Ежегодно исследователи производят около миллиона публикаций. Навигация в этом огромном информационном потоке остается нерешенной задачей. Одна из ключевых проблем — содержание научных статей трудно индексировать для электронного поиска. Мощным подспорьем здесь могут послужить алгоритмы машинного обучения (ML) и обработка естественного языка (NLP).
Уже сейчас существуют системы поиска, позволяющие находить в огромных массивах данных не просто ключевые слова, а скрытые взаимосвязи, и ранжировать результаты по релевантности. Увы, пока семантический анализ в системах поиска далек от идеального. Использование алгоритмов машинного обучения и NLP позволит улучшить качество поиска научных статей и существенно упростит работу.
Стартапы, внедряющие семантический поиск по научным статьям, уже существуют — например, Semantic Scholar. Многие из них предоставляют сервисы поиска близких по смыслу статей на основе ключевых слов, краткой аннотации (абстракта) или ссылки на документ. Получив их, такой поисковик возвращает близкие или смежные статьи в виде сети.
Близость статей передают через силу (вес) связей в получившейся сети. Так пользователь может увидеть на группы наиболее схожих статей в виде плотных клубков.
Еще научный поисковик может использовать рекомендательную систему, как в Amazon или Netflix. Статьи, которые понравились пользователю А, могут рекомендовать пользователю B, у которого схожие научные предпочтения.
В биомедицине поисковики пытаются искать не только по текстам, но и по изображениям. Однако результаты их анализа всё ещё требуют проверки человеком — алгоритмы компьютерного зрения не дают стопроцентной точности.
Ксения Михайлова
Статьи в научных журналах — главный продукт современного ученого. Ежегодно исследователи производят около миллиона публикаций. Навигация в этом огромном информационном потоке остается нерешенной задачей. Одна из ключевых проблем — содержание научных статей трудно индексировать для электронного поиска. Мощным подспорьем здесь могут послужить алгоритмы машинного обучения (ML) и обработка естественного языка (NLP).
Уже сейчас существуют системы поиска, позволяющие находить в огромных массивах данных не просто ключевые слова, а скрытые взаимосвязи, и ранжировать результаты по релевантности. Увы, пока семантический анализ в системах поиска далек от идеального. Использование алгоритмов машинного обучения и NLP позволит улучшить качество поиска научных статей и существенно упростит работу.
Стартапы, внедряющие семантический поиск по научным статьям, уже существуют — например, Semantic Scholar. Многие из них предоставляют сервисы поиска близких по смыслу статей на основе ключевых слов, краткой аннотации (абстракта) или ссылки на документ. Получив их, такой поисковик возвращает близкие или смежные статьи в виде сети.
Близость статей передают через силу (вес) связей в получившейся сети. Так пользователь может увидеть на группы наиболее схожих статей в виде плотных клубков.
Еще научный поисковик может использовать рекомендательную систему, как в Amazon или Netflix. Статьи, которые понравились пользователю А, могут рекомендовать пользователю B, у которого схожие научные предпочтения.
В биомедицине поисковики пытаются искать не только по текстам, но и по изображениям. Однако результаты их анализа всё ещё требуют проверки человеком — алгоритмы компьютерного зрения не дают стопроцентной точности.
Ксения Михайлова
Большинство из наших читателей наверняка слышали про языковые корпуса: Британский национальный корпус (BNC), Корпус языка Пушкина, Национальный корпус русского языка (НКРЯ) с его подкорпусами — газетным, поэтическим, диалектным, историческим...
Но иногда лингвистам для исследований нужны совершенно нестандартные коллекции текстов, и сегодня мы рассказываем о таких необычных корпусах — от рассказов о грушах до учебников русского языка.
https://telegra.ph/Pomedlennee-ya-zapisyvayu-03-03
Но иногда лингвистам для исследований нужны совершенно нестандартные коллекции текстов, и сегодня мы рассказываем о таких необычных корпусах — от рассказов о грушах до учебников русского языка.
https://telegra.ph/Pomedlennee-ya-zapisyvayu-03-03
Telegraph
Помедленнее, я записываю
Классифицируют ошибки, просят рассказать о грушах, считают частотность матерных слов… порой для исследования лингвистам нужны нестандартные коллекции текстов. Подборка из 5 неординарных корпусов русского языка в вашу лингвистическую копилку. 1. Один речевой…
Как поздравляют российских женщин? Изучаем корпус поздравлений с 8 марта — и генерируем собственные с помощью марковской цепи!
СПОЙЛЕР: в процессе изучения этих текстов у нас взорвались три стереотипометра и еще кое-что полыхнуло.
https://telegra.ph/Smejtes-i-detej-rozhajte-iz-chego-sdelany-pozdravleniya-s-8-marta-03-08
СПОЙЛЕР: в процессе изучения этих текстов у нас взорвались три стереотипометра и еще кое-что полыхнуло.
https://telegra.ph/Smejtes-i-detej-rozhajte-iz-chego-sdelany-pozdravleniya-s-8-marta-03-08
Telegraph
Смейтесь и детей рожайте: из чего сделаны поздравления с 8 марта
Международный день борьбы женщин за свои права превратился в «цветочный день почитания прекрасных дам». Ничего не говорит об этом красноречивее текстов поздравлений: девушкам желают цветов, конфет, «обходительных мужчин», просят «поражать своим совершенством»…
Долгое время лингвистика входила в число классических гуманитарных наук, но все изменилось с появлением работ Фердинанда де Соссюра и его последователей-структуралистов в начале XX в. Именно благодаря ним в 40-50-х гг. лингвистика привлекла внимание математиков и инженеров, что повлекло за собой рождение новой дисциплины — компьютерной лингвистики.
Несмотря на то, что компьютерная лингвистика считается относительно молодой наукой, современному человеку уже сложно представить свою жизнь без существования голосовых помощников, эффективных веб-поисковиков или автоматических переводчиков.
Рассказываем о развитии дружбы лингвистики с точными науками: https://telegra.ph/Kak-lingvistika-stala-blizkoj-podrugoj-matematiki-i-informatiki-03-03
Несмотря на то, что компьютерная лингвистика считается относительно молодой наукой, современному человеку уже сложно представить свою жизнь без существования голосовых помощников, эффективных веб-поисковиков или автоматических переводчиков.
Рассказываем о развитии дружбы лингвистики с точными науками: https://telegra.ph/Kak-lingvistika-stala-blizkoj-podrugoj-matematiki-i-informatiki-03-03
Telegraph
Как лингвистика стала близкой подругой математики и информатики?
Системные преобразования Лингвистика — это наука, которая изучает устную и письменную формы человеческого языка, его структуру, элементы, его связь с другими науками. Современная лингвистика имеет два подхода к изучению: синхронический и диахронический. Изначально…
Сторителлинг — исскусство рассказывать истории — существует уже не одно тысячелетие. Как оно трансформировалрсь в век цифровых технологий? Каким образом вписать статистику в увлекательный сюжет? Какую роль в data-сторителлинге играет визуализация? Об этом — наша сегодняшняя статья.
https://telegra.ph/Data-storitelling-dannye-govoryat-sami-za-sebya-12-23
https://telegra.ph/Data-storitelling-dannye-govoryat-sami-za-sebya-12-23
Telegraph
Data-сторителлинг: данные говорят сами за себя
Сторителлинг — это рассказ качественных, запоминающихся историй. В сторителлинге нет ничего нового — люди рассказывают истории с древности. Для улучшения восприятия человеческий мозг кодирует все окружающие объекты в образы, поэтому мы так хорошо и запоминаем…
Исследователи из Стэнфордского университета решили проверить, как выглядят эмоции из литературных произведений, если их перенести на карту города, и провели количественный анализ английских романов XVIII и XIX века, события которых происходят в Лондоне.
Знакомим вас с нарративной географией и рассказываем, какие технологии использовались в исследовании, в какой части Лондона герои счастливее и как это меняется со временем.
https://telegra.ph/Strah-i-schaste-v-Londone-geografiya-ehmocij-03-11
Знакомим вас с нарративной географией и рассказываем, какие технологии использовались в исследовании, в какой части Лондона герои счастливее и как это меняется со временем.
https://telegra.ph/Strah-i-schaste-v-Londone-geografiya-ehmocij-03-11
Telegraph
Страх и счастье в Лондоне: география эмоций
Как связать географию и эмоции Исследователи Райан Хэйзер, Франко Моретти и Эрик Штайнер из Стэнфордского университета решили проверить, как выглядят эмоции из литературных произведений, если их перенести на карту города. Был проведен количественный анализ…
Как лайки влияют на наш мозг
Лайки появились совсем недавно, но уже стали неотъемлемой чертой общения в сети. Раньше психологи, антропологи и социологи пытались разобраться в сути явления с помощью опросов или других косвенных методов. Сегодня ученые получили возможность заглянуть прямо в мозг — как он воспринимает лайки, как видоизменяются и адаптируются сформировавшиеся в течение долгого времени механизмы к новому феномену социальной жизни.
Функциональная магнитно-резонансная томография (фМРТ) позволяет с высоким пространственным разрешением оценить активность разных участков головного мозга во время выполнения разных дел, в том числе в процессе общения. Сложно вести светскую беседу, находясь внутри МРТ-сканнера, но при изучении коммуникации в социальных сетях сегодня можно обойтись и без собеседника.
В ходе эксперимента 58 участникам предъявлялись фотографии из Инстаграма: собственные снимки и фото других участников. После просмотра каждой фотографии можно было нажатием кнопки обозначить лайк или просто переключиться на новую фотографию. Все это время регистрировалась активность мозга. Далее участникам предъявлялись их собственные фотографии из соцсетей с уже проставленными лайками от других людей.
Так исследователи выделили зоны мозга, активирующиеся только в тех случаях, когда человек лайкал фотографию, и области, активность которых проявляется при просмотре собственной фотографии с большим количеством лайков.
После наложения картинок исследователи выделили области мозга, задействованные в обоих случаях:
На сегодня в мозге человека достаточно хорошо изучена система «вознаграждения» (reward system) — в первую очередь в ходе экспериментов в сфере нейроэкономики. В таких экспериментах обычно моделируются ситуации с выигрышем или потерей денежных средств и регистрируется активность мозга в случае удачи.
Так же существует пул исследований, посвященных изучению эмоционального отклика в мозге человека в момент возникновения положительных эмоций в ходе общения с другими людьми. Одно из важнейших отличий в этих двух ситуациях: «исчисляемость» реакции в случае с деньгами, возможность выделить отдельные «кванты». В ходе общения гораздо сложнее выделить какой-то единый эквивалент и лайки как раз позволяют это сделать.
Исследователи сравнили активность мозга в эксперименте с результатами предыдущих исследований и оказалось, что задействованы обе системы.
Получается, наш мозг вполне всерьез воспринимает лайки. Это помогает объяснить, почему мы постоянно обновляем страницы социальных сетей и смотрим, как изменяется заветное число под фотографией или постом.
Ирина Зябрева
Лайки появились совсем недавно, но уже стали неотъемлемой чертой общения в сети. Раньше психологи, антропологи и социологи пытались разобраться в сути явления с помощью опросов или других косвенных методов. Сегодня ученые получили возможность заглянуть прямо в мозг — как он воспринимает лайки, как видоизменяются и адаптируются сформировавшиеся в течение долгого времени механизмы к новому феномену социальной жизни.
Функциональная магнитно-резонансная томография (фМРТ) позволяет с высоким пространственным разрешением оценить активность разных участков головного мозга во время выполнения разных дел, в том числе в процессе общения. Сложно вести светскую беседу, находясь внутри МРТ-сканнера, но при изучении коммуникации в социальных сетях сегодня можно обойтись и без собеседника.
В ходе эксперимента 58 участникам предъявлялись фотографии из Инстаграма: собственные снимки и фото других участников. После просмотра каждой фотографии можно было нажатием кнопки обозначить лайк или просто переключиться на новую фотографию. Все это время регистрировалась активность мозга. Далее участникам предъявлялись их собственные фотографии из соцсетей с уже проставленными лайками от других людей.
Так исследователи выделили зоны мозга, активирующиеся только в тех случаях, когда человек лайкал фотографию, и области, активность которых проявляется при просмотре собственной фотографии с большим количеством лайков.
После наложения картинок исследователи выделили области мозга, задействованные в обоих случаях:
На сегодня в мозге человека достаточно хорошо изучена система «вознаграждения» (reward system) — в первую очередь в ходе экспериментов в сфере нейроэкономики. В таких экспериментах обычно моделируются ситуации с выигрышем или потерей денежных средств и регистрируется активность мозга в случае удачи.
Так же существует пул исследований, посвященных изучению эмоционального отклика в мозге человека в момент возникновения положительных эмоций в ходе общения с другими людьми. Одно из важнейших отличий в этих двух ситуациях: «исчисляемость» реакции в случае с деньгами, возможность выделить отдельные «кванты». В ходе общения гораздо сложнее выделить какой-то единый эквивалент и лайки как раз позволяют это сделать.
Исследователи сравнили активность мозга в эксперименте с результатами предыдущих исследований и оказалось, что задействованы обе системы.
Получается, наш мозг вполне всерьез воспринимает лайки. Это помогает объяснить, почему мы постоянно обновляем страницы социальных сетей и смотрим, как изменяется заветное число под фотографией или постом.
Ирина Зябрева
Мы перешли к системе, в которой компьютеры все меньше контролируются человеком. Вместо того чтобы вручную писать алгоритмы, управляющие поведением компьютера, мы часто просим машину написать свои собственные инструкции — на основе имеющегося опыта и некоторой модели проблемы, которую нужно решить. Это называется машинным обучением.
Гуманитарии могут внести вклад в этот образовательный проект, потому что они уже знакомы с одной из главных задач машинного обучения — поиском закономерностей в изменчивом человеческом поведении.
Гуманитарные науки несут в себе разумный скептицизм и критическое отношение к количественным данным и подходам.
Однако скептицизм — не единственное, что могут предложить гуманитарии. Они могут показать, что проблема не в только машинном обучении или алгоритмах, но в самом сложной и непредсказуемой сущности человека, культуры и общества. Сотрудничая с технарями и вдумчиво анализируя количественные модели, гуманитарные исследователи могут действительно приблизить людей к пониманию того, как функционируют сложные механизмы культуры.
https://telegra.ph/Zachem-nuzhny-gumanitarii-v-ehpohu-mashinnogo-obucheniya-03-28
Гуманитарии могут внести вклад в этот образовательный проект, потому что они уже знакомы с одной из главных задач машинного обучения — поиском закономерностей в изменчивом человеческом поведении.
Гуманитарные науки несут в себе разумный скептицизм и критическое отношение к количественным данным и подходам.
Однако скептицизм — не единственное, что могут предложить гуманитарии. Они могут показать, что проблема не в только машинном обучении или алгоритмах, но в самом сложной и непредсказуемой сущности человека, культуры и общества. Сотрудничая с технарями и вдумчиво анализируя количественные модели, гуманитарные исследователи могут действительно приблизить людей к пониманию того, как функционируют сложные механизмы культуры.
https://telegra.ph/Zachem-nuzhny-gumanitarii-v-ehpohu-mashinnogo-obucheniya-03-28
Telegraph
Зачем нужны гуманитарии в эпоху машинного обучения?
В наше время нелегко быть сознательным гражданином. Нам говорят, что нужно быть осторожными с поисковыми системами, но и недоверие к медиа тоже может сделать нас легкой добычей для пропаганды. Дональд Трамп, например, объявляет любую критику в свой адрес…
Наблюдать за появлением нового языка в XXI веке — редкая возможность, и у нас она есть! В октябре 2011 года Apple добавила emoji как международную клавиатуру. С тех пор цифровой язык развился настолько, что сейчас половина комментариев и хэштегов в Instagram содержат эмодзи.
А если у смайликов есть своя клавиатура, значит это фактически новый искусственный язык, и, применяя методы машинного обучения и обработки естественного языка, можно понаблюдать за его семантикой и обнаружить любопытные скрытые закономерности. 😎💻💡
https://telegra.ph/CHto-v-smajlike-tebe-moem-03-30
А если у смайликов есть своя клавиатура, значит это фактически новый искусственный язык, и, применяя методы машинного обучения и обработки естественного языка, можно понаблюдать за его семантикой и обнаружить любопытные скрытые закономерности. 😎💻💡
https://telegra.ph/CHto-v-smajlike-tebe-moem-03-30
Telegraph
Что в смайлике тебе моем?
Наблюдать за появлением нового языка в двадцать первом веке — редкая возможность, и у нас она есть! В октябре 2011 года Apple добавила emoji как международную клавиатуру. С тех пор цифровой язык развился настолько, что сейчас половина комментариев и хэштегов…
«Системный Блокъ» запускает новую рубрику — интервью с учеными! Мы будем общаться с деятелями науки, искусства и культуры о роли цифровых и точных методов в их областях.
Наше первое интервью — с лингвистом и популяризатором науки Александром Пиперски.
https://sysblok.ru/interviews/cifra-na-sluzhbe-u-filologa/
Наше первое интервью — с лингвистом и популяризатором науки Александром Пиперски.
https://sysblok.ru/interviews/cifra-na-sluzhbe-u-filologa/
Системный Блокъ
Цифра на службе у филолога - Системный Блокъ
“Гумилёва считали?”: лингвист и популяризатор Александр Пиперски рассказывает, как открыл для себя количественные методы, что из этого получилось и зачем они нужны филологу-исследователю
В честь Дня космонавтики рассказываем о прекрасном образце data-сторителлинга — арт-проекте «Мы верим в космос».
https://telegra.ph/Prosto-kosmos-04-12
https://telegra.ph/Prosto-kosmos-04-12
Telegraph
Просто космос!
58 лет назад 12 апреля человек впервые полетел в космос. Но помимо этого события в истории изучения внеземного пространства много важных достижений — от первого искусственного спутника до орбитальной обсерватории, от посадки на Луну до фотоснимков Плутона.…
Первого мая режиссер и волшебник Уэс Андерсон отметил пятидесятилетний юбилей. Узнать фильм Уэса Андерсона несложно: идеально симметричные кадры, теплая палитра, удивительные детали, странные костюмы… Не кино, а иллюстрированная книга — даже главы есть. Этот «кукольный» сеттинг позволяет без страха поднимать болезненные вопросы: о семейных проблемах, поиске места в жизни, одиночестве, смерти.
К юбилею режиссера мы перечитали фильмографию Уэса Андерсона и cделали визуализацию субтитров полнометражных лент. Так, как ее сделал бы Уэс, конечно!
https://sysblok.ru/visual/o-chem-govorjat-geroi-filmov-ujesa-andersona/
К юбилею режиссера мы перечитали фильмографию Уэса Андерсона и cделали визуализацию субтитров полнометражных лент. Так, как ее сделал бы Уэс, конечно!
https://sysblok.ru/visual/o-chem-govorjat-geroi-filmov-ujesa-andersona/
Системный Блокъ
О чем говорят герои фильмов Уэса Андерсона? - Системный Блокъ
Первого мая режиссер и волшебник Уэс Андерсон отмечает пятидесятилетний юбилей. Перечитываем его фильмографию и делаем визуализацию. Так, как ее сделал бы Уэс, конечно!
Всю весну кипит битва вокруг статьи The Computational Case against Computational Literary Studies. ⚡️⚡️⚡️ Автор статьи всерьез замахнулась на «закрытие» цифровой филологии как научного направления. Отдельно в этой статье досталось исследователям гендера в литературе ♀♂📚. Мол компьютерные литературоведы так любят гендер только потому, что он дает им легкое и однозначное разделение на две понятные категории, которые потом можно статистически сравнивать.
Нам кажется, что автор передергивает. Цифровые исследования репрезентации мужчин и женщин в художественных текстах — не дань моде или удобству. Они могут дать объективные сведения не только о том, как устроена литература, но и о том, как в культуре отражены гендерные стереотипы и общественные процессы. А главное — как это все эволюционирует и куда движется.
Пример такого исследования — работа о трансформации гендера в англоязычной литературе от Теда Андервуда, Дэвида Баммана и Сабрины Ли. На материале 104 тысяч книг они показывают, например, как изображение гендера становится все менее стереотипным в описаниях: в XIX веке алгоритмы машинного обучения легко справляются с разбиением персонажей на мужчин и женщин по связанным с ними прилагательным, в первой половине XX века это удается хуже, а ближе к 2000 годам — полный провал.
С другой стороны, доля внимания, которые уделяют авторы (особенно авторы-мужчины!) женским персонажам, по-прежнему несправедливо мала. Даже в XXI веке — что-то около 30%.
Подробности по ссылке:
https://sysblok.ru/philology/gendernye-trudnosti-anglijskoj-literatury/
Нам кажется, что автор передергивает. Цифровые исследования репрезентации мужчин и женщин в художественных текстах — не дань моде или удобству. Они могут дать объективные сведения не только о том, как устроена литература, но и о том, как в культуре отражены гендерные стереотипы и общественные процессы. А главное — как это все эволюционирует и куда движется.
Пример такого исследования — работа о трансформации гендера в англоязычной литературе от Теда Андервуда, Дэвида Баммана и Сабрины Ли. На материале 104 тысяч книг они показывают, например, как изображение гендера становится все менее стереотипным в описаниях: в XIX веке алгоритмы машинного обучения легко справляются с разбиением персонажей на мужчин и женщин по связанным с ними прилагательным, в первой половине XX века это удается хуже, а ближе к 2000 годам — полный провал.
С другой стороны, доля внимания, которые уделяют авторы (особенно авторы-мужчины!) женским персонажам, по-прежнему несправедливо мала. Даже в XXI веке — что-то около 30%.
Подробности по ссылке:
https://sysblok.ru/philology/gendernye-trudnosti-anglijskoj-literatury/
Системный Блокъ
Гендерные трудности английской литературы - Системный Блокъ
За двести пятьдесят лет положение женщин в обществе изменилось, и эти изменения затронули не только реальную жизнь, но и книжное пространство. Как изменялось место женщины в литературе как автора и персонажа? Возможно ли определить пол героя по его описанию?…
Вчера умер Сергей Доренко — ведущий, «телекиллер» и толстый тролль. В 1999 году Доренко помог вывести Путина в президенты, поливая грязью Лужкова и Примакова. А в 2000-м неожиданно сыграл в камикадзе, разнеся в пух и прах самого Путина прямо в прайм-тайме Первого канала — за катастрофу «Курска».
Доренко — противоречивая фигура в истории российской журналистики. Он часто менял убеждения и, кажется, никогда не был на 100% серьезен. Но в одном Доренко не откажешь: это был человек смелый до безбашенности. Умел переть напролом и рубить сплеча, не подстилая соломки — и этим отличался от 95% журналистов России. Смерть ему тоже досталась под стать характеру: разрыв аорты за рулем мотоцикла. Настоящий «Беспечный ездок» русских медиа.
А мы решили еще раз вспомнить знаковые эфиры Сергея Доренко — те самые, которые принесли ему противоречивую славу телекиллера. Для этого мы взяли расшифровки программ и визуализировали их в виде облаков частотностей слов.
Вот репортаж про Примакова и его тазобедренный сустав, где самое частотное слово — «операция». Этим выпуском Доренко уничтожил одного из политических тяжеловесов 90-х. До выпуска Примаков выглядел весомым кандидатом в преемники Ельцина. После — беспомощным и бесперспективным стариком, этаким Брежневым 3.0.
Вот выпуск про Лужкова, его жену Елену Батурину, ее братьев и фирму Мабетекс. Пятно на репутации «старика Батурина» с тех пор так и не отмылось, не позволив ему мечтать о чем-то большем, чем кресло московского мэра.
Ну и, наконец, выпуск про гибель подлодки «Курск». Ключевые слова катастрофы: «Лодка», «Экипаж», «Курск» — и те, кого призвал за нее к ответу Доренко: «президент», «власть», «путин». Власть и Путин журналиста не простили — это был его последний телеэфир на федеральном ТВ.
И, конечно, фоном идет российская история рубежа 90-х — 2000-х. Скандал вокруг Скуратова, убийства и Чечня, Чечня, Чечня…
Доренко — противоречивая фигура в истории российской журналистики. Он часто менял убеждения и, кажется, никогда не был на 100% серьезен. Но в одном Доренко не откажешь: это был человек смелый до безбашенности. Умел переть напролом и рубить сплеча, не подстилая соломки — и этим отличался от 95% журналистов России. Смерть ему тоже досталась под стать характеру: разрыв аорты за рулем мотоцикла. Настоящий «Беспечный ездок» русских медиа.
А мы решили еще раз вспомнить знаковые эфиры Сергея Доренко — те самые, которые принесли ему противоречивую славу телекиллера. Для этого мы взяли расшифровки программ и визуализировали их в виде облаков частотностей слов.
Вот репортаж про Примакова и его тазобедренный сустав, где самое частотное слово — «операция». Этим выпуском Доренко уничтожил одного из политических тяжеловесов 90-х. До выпуска Примаков выглядел весомым кандидатом в преемники Ельцина. После — беспомощным и бесперспективным стариком, этаким Брежневым 3.0.
Вот выпуск про Лужкова, его жену Елену Батурину, ее братьев и фирму Мабетекс. Пятно на репутации «старика Батурина» с тех пор так и не отмылось, не позволив ему мечтать о чем-то большем, чем кресло московского мэра.
Ну и, наконец, выпуск про гибель подлодки «Курск». Ключевые слова катастрофы: «Лодка», «Экипаж», «Курск» — и те, кого призвал за нее к ответу Доренко: «президент», «власть», «путин». Власть и Путин журналиста не простили — это был его последний телеэфир на федеральном ТВ.
И, конечно, фоном идет российская история рубежа 90-х — 2000-х. Скандал вокруг Скуратова, убийства и Чечня, Чечня, Чечня…
Как оцифровать азулежу? Цифровая карта португальских изразцов
В солнечной и жаркой Португалии на стенах домов, дворцов, церквей и, в общем-то, почти чего угодно вы встретите не только штукатурку и бетон, но и национальное достояние каждого португальца — изразцы азулежу. Техника росписи маленьких керамических квадратиков была изначально принесена на Пиренейский полуостров во времена арабских завоеваний и осталась здесь на долгие годы. Пика распространенности азулежу достигли с началом массового промышленного производства в середине XIX века. Плитки перестали быть предметом роскоши, и ими начали украшать фасады домов.
Проект Mapping Our Tiles ставит своей целью собрать и классифицировать как можно больше (желательно, все) рисунки таких азулежу, а также места, где они встречаются. Дело в том, что большинство изразцов, украшающих церкви и дворцы, уже описаны и изучены искусствоведами и учеными, а домами обычных граждан никто не занимался.
На страничке проекта все предельно просто — вы можете выбрать любой понравившийся вам рисунок и посмотреть на карте, в каких городах добровольцы проекта заметили такой изразец — или его вариацию.
Авторы Mapping Out Tiles приглашают всех и каждого помочь им с наполнением базы, прислав фотографию какого-либо рисунка и адрес, где его можно найти. Это можно сделать как по почте, так и просто поставив хэштег в Инстаграме. Так что оказавшись в Португалии, берите в руки телефон и используйте Инстаграм с пользой! А пока можно просто насладиться красотой португальского изразца — Mapping Our Tiles
Нелли Бурцева
В солнечной и жаркой Португалии на стенах домов, дворцов, церквей и, в общем-то, почти чего угодно вы встретите не только штукатурку и бетон, но и национальное достояние каждого португальца — изразцы азулежу. Техника росписи маленьких керамических квадратиков была изначально принесена на Пиренейский полуостров во времена арабских завоеваний и осталась здесь на долгие годы. Пика распространенности азулежу достигли с началом массового промышленного производства в середине XIX века. Плитки перестали быть предметом роскоши, и ими начали украшать фасады домов.
Проект Mapping Our Tiles ставит своей целью собрать и классифицировать как можно больше (желательно, все) рисунки таких азулежу, а также места, где они встречаются. Дело в том, что большинство изразцов, украшающих церкви и дворцы, уже описаны и изучены искусствоведами и учеными, а домами обычных граждан никто не занимался.
На страничке проекта все предельно просто — вы можете выбрать любой понравившийся вам рисунок и посмотреть на карте, в каких городах добровольцы проекта заметили такой изразец — или его вариацию.
Авторы Mapping Out Tiles приглашают всех и каждого помочь им с наполнением базы, прислав фотографию какого-либо рисунка и адрес, где его можно найти. Это можно сделать как по почте, так и просто поставив хэштег в Инстаграме. Так что оказавшись в Португалии, берите в руки телефон и используйте Инстаграм с пользой! А пока можно просто насладиться красотой португальского изразца — Mapping Our Tiles
Нелли Бурцева
Как машинный перевод оценивает… машина?
Оценивать машинный перевод — сложно. Для такой оценки человек должен сопоставить адекватность, точность и естественность перевода, а это занимает много времени (недели и даже месяцы) и стоит довольно дорого. Для разработчиков систем МП это проблема — ведь им нужно ежедневно отслеживать изменения в системе и очень быстро отсеивать неудачные решения.
Так как же оценить качество перевода автоматически? Гипотеза такова: чем ближе МП к профессиональному человеческому, тем он лучше. В 2002 году команда из Научно-исследовательского центра IBM имени Томаса Дж. Уотсона создала собственную метрику точности — BLEU (BiLingual Evaluation Understudy), основная идея которой заключается в подсчете совпадений N-граммов в оцениваемом и эталонном переводах. Качество машинного перевода постепенно приближается к качеству перевода, выполненного человеком, и BLEU - маленький шаг для исследователей, но огромный скачок для всех переводчиков.
https://sysblok.ru/nlp/kak-mashinnyj-perevod-ocenivaet-mashina/
Оценивать машинный перевод — сложно. Для такой оценки человек должен сопоставить адекватность, точность и естественность перевода, а это занимает много времени (недели и даже месяцы) и стоит довольно дорого. Для разработчиков систем МП это проблема — ведь им нужно ежедневно отслеживать изменения в системе и очень быстро отсеивать неудачные решения.
Так как же оценить качество перевода автоматически? Гипотеза такова: чем ближе МП к профессиональному человеческому, тем он лучше. В 2002 году команда из Научно-исследовательского центра IBM имени Томаса Дж. Уотсона создала собственную метрику точности — BLEU (BiLingual Evaluation Understudy), основная идея которой заключается в подсчете совпадений N-граммов в оцениваемом и эталонном переводах. Качество машинного перевода постепенно приближается к качеству перевода, выполненного человеком, и BLEU - маленький шаг для исследователей, но огромный скачок для всех переводчиков.
https://sysblok.ru/nlp/kak-mashinnyj-perevod-ocenivaet-mashina/
Системный Блокъ
Как машинный перевод оценивает… машина? - Системный Блокъ
Если качество машинного перевода проверяет человек, то это долго и дорого. А если нужно быстро и дёшево?
Игра престолов: Финал
Этого ждали восемь лет.
Джордж Мартин сначала писал книги, потом адаптировал их для съемок, а потом стал писать сразу сценарий для сериала. На выживание героев делали ставки, но сегодня день, когда «ставки сделаны, ставок больше нет»: на HBO вышла последняя серия Игры престолов.
Мы решили вспомнить, как Игра престолов отражалась в инфографике: от семейных деревьев — до 50 оттенков серого в холодном мраке Вестероса и инструкции по изготовлению собственной теплой шкуры а-ля Джон Сноу! 🐲 🔥
ВНИМАНИЕ: текст содержит спойлеры о 8 сезоне. https://sysblok.ru/visual/igra-prestolov-grand-final/
Этого ждали восемь лет.
Джордж Мартин сначала писал книги, потом адаптировал их для съемок, а потом стал писать сразу сценарий для сериала. На выживание героев делали ставки, но сегодня день, когда «ставки сделаны, ставок больше нет»: на HBO вышла последняя серия Игры престолов.
Мы решили вспомнить, как Игра престолов отражалась в инфографике: от семейных деревьев — до 50 оттенков серого в холодном мраке Вестероса и инструкции по изготовлению собственной теплой шкуры а-ля Джон Сноу! 🐲 🔥
ВНИМАНИЕ: текст содержит спойлеры о 8 сезоне. https://sysblok.ru/visual/igra-prestolov-grand-final/
Системный Блокъ
Игра престолов: гранд финал - Системный Блокъ
От генеалогических деревьев Семи королевств — до 50 оттенков серого во мраке Вестероса: лучшие инфографики по Игре престолов к выходу последней серии сериала.
Лев Манович — пионер цифровых исследований культуры и новых медиа, король Instagram studies, провокатор и революционер.
«Системный Блокъ» поговорил с Мановичем о том, почему Тюмень сегодня интереснее Нью-Йорка, что ждет соцсети в будущем и почему Россия экспортирует страдание:
https://sysblok.ru/interviews/manovich/
«Системный Блокъ» поговорил с Мановичем о том, почему Тюмень сегодня интереснее Нью-Йорка, что ждет соцсети в будущем и почему Россия экспортирует страдание:
https://sysblok.ru/interviews/manovich/
Системный Блокъ
Гуманитарии должны прогнозировать культуру - Системный Блокъ
Лев Манович — о будущем соцсетей, смещении глобальных культурных центров и экспорте русского страдания
Московско-тартуская школа по цифровым методам в гуманитарных науках — это смесь хакатона, воркшопа и интенсивного научного семинара на 3-4 дня. В этом году школа пройдет в 4-й раз — а мы публикуем обзор интересных исследований с прошлых школ.
— Грамматика мотива: разработка компьютерных инструментов для автоматического выделения в тексте базовых «кирпичиков», из которых строится сюжет художественного произведения. Код. Слайды. Видеопрезентация.
— Историческая география в статистике языка. Когда в русском сближаются Москва и Петербург? В какие годы степь становится «более украинской»? Слайды.
— Сравнение характеристик отдельных частей художественного текста (упоминания персонажей, положительная или отрицательная окраска, диалоги) — и читательского поведения во время чтения. Данные логов Bookmate использовались для того, чтобы посмотреть, как и на что реагирует читатель. А еще тут есть сегментация разных пространств художественного текста с помощью дистрибутивной семантики. Слайды. Видеопрезентация.
— Цифровое исследование «Игры престолов»: цвета, социальные сети, семантическая кластеризация персонажей и мест. Код. Слайды.
Центр Digital Humanities НИУ ВШЭ приглашает исследователей принять участие в 4-й школе. Если у вас есть идея исследования по Digital Humanities, но вечно не хватает рук для ее осуществления — вам сюда. Приходите делать мастерскую вместе с нами!
— Грамматика мотива: разработка компьютерных инструментов для автоматического выделения в тексте базовых «кирпичиков», из которых строится сюжет художественного произведения. Код. Слайды. Видеопрезентация.
— Историческая география в статистике языка. Когда в русском сближаются Москва и Петербург? В какие годы степь становится «более украинской»? Слайды.
— Сравнение характеристик отдельных частей художественного текста (упоминания персонажей, положительная или отрицательная окраска, диалоги) — и читательского поведения во время чтения. Данные логов Bookmate использовались для того, чтобы посмотреть, как и на что реагирует читатель. А еще тут есть сегментация разных пространств художественного текста с помощью дистрибутивной семантики. Слайды. Видеопрезентация.
— Цифровое исследование «Игры престолов»: цвета, социальные сети, семантическая кластеризация персонажей и мест. Код. Слайды.
Центр Digital Humanities НИУ ВШЭ приглашает исследователей принять участие в 4-й школе. Если у вас есть идея исследования по Digital Humanities, но вечно не хватает рук для ее осуществления — вам сюда. Приходите делать мастерскую вместе с нами!
hum.hse.ru
IV Московско-тартуская DH-школа ждет ваших мастерских (call for tutorials)
Готовы провести мастерскую на IV Московско-тартуской школе по Digital Humanities в октябре 2019? Подавайте заявку до 23 мая включительно.
Мы публикуем перевод статьи профессора Аннет Маркхам о том, как антропологи и этнографы работают с цифровыми феноменами. Маркхам с 1980-х годов занимается исследованием поведения людей в цифровой среде и пишет об интернете как пространстве и способе существования, о сопротивлении «датафикации» человека и об ответственности ученого за будущее.
(статья публикуется в двух частях)
https://sysblok.ru/society/ethnography-in-the-digital-internet-era-1
https://sysblok.ru/society/ethnography-in-the-digital-internet-era-2/
(статья публикуется в двух частях)
https://sysblok.ru/society/ethnography-in-the-digital-internet-era-1
https://sysblok.ru/society/ethnography-in-the-digital-internet-era-2/