Роботы научились обыгрывать людей в го, но задача освоить человеческий язык, вести дискуссии и убеждать долгое время оставалась не по зубам искусственному интеллекту.
Недавно мы рассказывали о роботе, который дважды победил человека в дебатах. Теперь разберемся, как машина научилась быть убедительным оппонентом.
#nlp #sysblok
https://telegra.ph/ZHeleznye-argumenty-kak-ustroen-Project-Debator-11-05
Недавно мы рассказывали о роботе, который дважды победил человека в дебатах. Теперь разберемся, как машина научилась быть убедительным оппонентом.
#nlp #sysblok
https://telegra.ph/ZHeleznye-argumenty-kak-ustroen-Project-Debator-11-05
Telegraph
Железные аргументы: как устроен Project Debator
Недавно мы рассказывали о роботе, который дважды победил человека в дебатах. Теперь разберемся, как машина научилась быть убедительным оппонентом. В чём сложность? Роботы научились обыгрывать людей в го, но задача освоить человеческий язык, вести дискуссии…
Выходные — отличный повод прогуляться! Если вам не хочется бродить по городу бесцельно, можно воспользоваться Sight Safari — сервисом, который умеет прокладывать пешие маршруты так, чтобы пешеход обязательно увидел какую-нибудь местную достопримечательность.
Достопримечательности могут быть как известными на весь мир, как Медный Всадник, так и мемориальной доской, граффити или зениткой в парке. Алгоритм позволяет выбрать золотую середину между кратчайшим пешим маршрутом и насыщенным туром по всем близлежащим возможным интересным местам.
Сервис создан одним единственным человеком на основе геосервиса Open Street Map и абсолютно бесплатен. Только представьте, сколько крутых вещей позволяют сделать открытые данные и немного программирования!
#urban #sysblok
https://telegra.ph/Peshkom--s-umom-11-05
Достопримечательности могут быть как известными на весь мир, как Медный Всадник, так и мемориальной доской, граффити или зениткой в парке. Алгоритм позволяет выбрать золотую середину между кратчайшим пешим маршрутом и насыщенным туром по всем близлежащим возможным интересным местам.
Сервис создан одним единственным человеком на основе геосервиса Open Street Map и абсолютно бесплатен. Только представьте, сколько крутых вещей позволяют сделать открытые данные и немного программирования!
#urban #sysblok
https://telegra.ph/Peshkom--s-umom-11-05
Telegraph
Пешком — с умом
Суббота. Ранний вечер. Вы вышли из бара, где встречались с друзьями, и медленным шагом направились к метро или автобусу. Торопиться некуда, вам в другую сторону от всех остальных, местные переулки вы знаете плохо — самое время спросить дорогу у вашего навигатора…
Жуткие видения робота-психопата
Нейросети на пике хайпа считают чем-то вроде магии. Но на самом деле они, как и всякое машинное обучение, всего лишь алгоритм, который умеет обобщать данные. Именно поэтому так важно, ЧТО за данные поступают на вход... Отличный способ убедиться в этом — познакомиться с Норманом из Массачуссетского технологического института.
Норман — это нейросеть, порождающая текстовые подписи к картинкам. Только обучена она не на обычных данных, а на одном известном сабреддите, посвященном теме смерти, убийств, расчленёнки и прочим мрачным вещам. Назван Норман в честь героя фильма Хичкока «Психо» — маньяка Нормана Бейтса.
Психологическая травма, которую нанесли нейросети её жестокие создатели, видна невооруженным глазом. Для этого достаточно подвергнуть алгоритм старому доброму психологическому тесту Роршаха. Во время теста пациенту показывают чернильные кляксы и просят описать возникающие образы и ассоциации. Считается, что таким образом можно определять эмоциональное состояние и диагностировать некоторые психические отклонения.
Там, где обычный алгоритм видит «стаю птиц», Норман обнаруживает «казнь человека на электрическом стуле»; вместо «пары людей, стоящих рядом» — «разбившаяся на стройке беременная женщина», вместо «черно-белого фото бейсбольной перчатки» — прилюдный расстрел из пулемета, а вместо человека, держащего зонт под дождем — убийство мужчины «на глазах у его кричащей жены».
А наша самая любимая подпись от Нормана — «человека затягивает в миксер для муки». Нормальная нейросеть видит там маленькую птичку.
Посмотреть все подписи можно тут.
Нейросети на пике хайпа считают чем-то вроде магии. Но на самом деле они, как и всякое машинное обучение, всего лишь алгоритм, который умеет обобщать данные. Именно поэтому так важно, ЧТО за данные поступают на вход... Отличный способ убедиться в этом — познакомиться с Норманом из Массачуссетского технологического института.
Норман — это нейросеть, порождающая текстовые подписи к картинкам. Только обучена она не на обычных данных, а на одном известном сабреддите, посвященном теме смерти, убийств, расчленёнки и прочим мрачным вещам. Назван Норман в честь героя фильма Хичкока «Психо» — маньяка Нормана Бейтса.
Психологическая травма, которую нанесли нейросети её жестокие создатели, видна невооруженным глазом. Для этого достаточно подвергнуть алгоритм старому доброму психологическому тесту Роршаха. Во время теста пациенту показывают чернильные кляксы и просят описать возникающие образы и ассоциации. Считается, что таким образом можно определять эмоциональное состояние и диагностировать некоторые психические отклонения.
Там, где обычный алгоритм видит «стаю птиц», Норман обнаруживает «казнь человека на электрическом стуле»; вместо «пары людей, стоящих рядом» — «разбившаяся на стройке беременная женщина», вместо «черно-белого фото бейсбольной перчатки» — прилюдный расстрел из пулемета, а вместо человека, держащего зонт под дождем — убийство мужчины «на глазах у его кричащей жены».
А наша самая любимая подпись от Нормана — «человека затягивает в миксер для муки». Нормальная нейросеть видит там маленькую птичку.
Посмотреть все подписи можно тут.
Нейросеть-коп раскусит всех
В последние годы в Испании был зафиксирован рост преступлений, связанных с ложными обвинениями. Поскольку это явление создает лишнюю нагрузку на правоохранительные органы, с ним пытаются бороться самыми разными способами. Группа исследователей из Испании разработала для этой цели систему VeriPol, способную проанализировать заявление о преступлении и с высокой степенью точности определить, является ли оно правдой.
«В частности, мы создали VeriPol для краж, хищений, ограблений, сопряженных с насилием и запугиванием свидетелей, поскольку в последние годы возросло число ложных обвинений именно в данной категории преступлений», — уточняет Федерико Либераторе, один из исследователей.
VeriPol представляет собой нейросеть, которую обучают на двух корпусах заявлений о кражах — истинных и ложных. Она выявляет наиболее характерные для каждого из них особенности построения фразы. В 2015 году, например, системе предъявили 1122 заявления (534 истинных и 588 ложных) из уже закрытых дел — только тех, в которых либо преступник был задержан, либо заявитель признался во лжи.
Идея принадлежит инспектору Мигелю Камачо, специалисту в области математики и статистики. Еще в 2012 году он предположил, что искусственный интеллект можно использовать для автоматического выявления маркеров, указывающих на истинность или ложность утверждений. Хотя каждый считает свою ложь уникальной, на самом деле это не так — и нейросеть с легкостью найдет в ложных обвинениях соответствующие паттерны.
Правдивые показания зачастую изобилуют подробностями, тогда как лгун старается их избежать, чтобы потом в них не запутаться. Поэтому одним из наиболее ярких маркеров лжи VeriPol считает дату. Лгун скорее скажет, что преступление имело место «несколько дней назад», «в какой-то день» или «два или три дня назад», а не «вчера» или «в четверг». Заявление с большой долей вероятности оказывается ложью, если заявитель утверждает, что на него напали «сзади» или «со спины» — так он избавляет себя от необходимости описывать детали. Нейросеть выяснила, что выдуманные нападения чаще всего совершают люди «в черном» и что в ложных показаниях чаще, чем в правдивых, встречаются слова «надежный», «адвокат», «мобильный», «айфон», «компания» или «контракт».
VeriPol анализирует также наиболее популярные грамматические и синтаксические средства. Личные и указательные местоимения, а также глаголы «быть» и «находиться» чаще появляются в правдивых показаниях. В этом случае заявитель охотнее рассказывает о том, как произошло преступление, а также говорит о своем «взаимодействии» с преступником. В ложных свидетельствах, наоборот, преобладает неопределенность. Фразы с наречием «едва» — к примеру, «едва видел» или «едва помню», — да и отрицания вроде «не слышал», «не узнал», по статистике, часто указывают на ложь.
Конечно, все приведенные языковые средства только в определенном контексте могут указывать на вероятность лжи. Никто не обвинит человека, который правда не запомнил или не рассмотрел нападавшего. Поэтому VeriPol — это всего лишь один из инструментов в распоряжении правоохранительных органов. «Система напоминает старика-полицейского с колоссальным опытом работы, который просто помогает полиции, указывая, что ему кажется правдой, а что — ложью», — говорит исследователь Лара Кихано.
Проект стартовал в 2014 году, а летом 2017-го VeriPol протестировали сотрудники Национального полицейского корпуса Испании. Тогда было установлено, что система с 91-процентной точностью способна распознать ложь, тогда как эксперту это удается в 75% случаев.
Это первая подобная система, получившая от властей официальное разрешение на использование. В ближайшие месяцы VeriPol планируют внедрить на полицейских участках по всей Испании, потом ее будут адаптировать для других преступлений.
Почитать про исследование по-испански можно здесь.
В последние годы в Испании был зафиксирован рост преступлений, связанных с ложными обвинениями. Поскольку это явление создает лишнюю нагрузку на правоохранительные органы, с ним пытаются бороться самыми разными способами. Группа исследователей из Испании разработала для этой цели систему VeriPol, способную проанализировать заявление о преступлении и с высокой степенью точности определить, является ли оно правдой.
«В частности, мы создали VeriPol для краж, хищений, ограблений, сопряженных с насилием и запугиванием свидетелей, поскольку в последние годы возросло число ложных обвинений именно в данной категории преступлений», — уточняет Федерико Либераторе, один из исследователей.
VeriPol представляет собой нейросеть, которую обучают на двух корпусах заявлений о кражах — истинных и ложных. Она выявляет наиболее характерные для каждого из них особенности построения фразы. В 2015 году, например, системе предъявили 1122 заявления (534 истинных и 588 ложных) из уже закрытых дел — только тех, в которых либо преступник был задержан, либо заявитель признался во лжи.
Идея принадлежит инспектору Мигелю Камачо, специалисту в области математики и статистики. Еще в 2012 году он предположил, что искусственный интеллект можно использовать для автоматического выявления маркеров, указывающих на истинность или ложность утверждений. Хотя каждый считает свою ложь уникальной, на самом деле это не так — и нейросеть с легкостью найдет в ложных обвинениях соответствующие паттерны.
Правдивые показания зачастую изобилуют подробностями, тогда как лгун старается их избежать, чтобы потом в них не запутаться. Поэтому одним из наиболее ярких маркеров лжи VeriPol считает дату. Лгун скорее скажет, что преступление имело место «несколько дней назад», «в какой-то день» или «два или три дня назад», а не «вчера» или «в четверг». Заявление с большой долей вероятности оказывается ложью, если заявитель утверждает, что на него напали «сзади» или «со спины» — так он избавляет себя от необходимости описывать детали. Нейросеть выяснила, что выдуманные нападения чаще всего совершают люди «в черном» и что в ложных показаниях чаще, чем в правдивых, встречаются слова «надежный», «адвокат», «мобильный», «айфон», «компания» или «контракт».
VeriPol анализирует также наиболее популярные грамматические и синтаксические средства. Личные и указательные местоимения, а также глаголы «быть» и «находиться» чаще появляются в правдивых показаниях. В этом случае заявитель охотнее рассказывает о том, как произошло преступление, а также говорит о своем «взаимодействии» с преступником. В ложных свидетельствах, наоборот, преобладает неопределенность. Фразы с наречием «едва» — к примеру, «едва видел» или «едва помню», — да и отрицания вроде «не слышал», «не узнал», по статистике, часто указывают на ложь.
Конечно, все приведенные языковые средства только в определенном контексте могут указывать на вероятность лжи. Никто не обвинит человека, который правда не запомнил или не рассмотрел нападавшего. Поэтому VeriPol — это всего лишь один из инструментов в распоряжении правоохранительных органов. «Система напоминает старика-полицейского с колоссальным опытом работы, который просто помогает полиции, указывая, что ему кажется правдой, а что — ложью», — говорит исследователь Лара Кихано.
Проект стартовал в 2014 году, а летом 2017-го VeriPol протестировали сотрудники Национального полицейского корпуса Испании. Тогда было установлено, что система с 91-процентной точностью способна распознать ложь, тогда как эксперту это удается в 75% случаев.
Это первая подобная система, получившая от властей официальное разрешение на использование. В ближайшие месяцы VeriPol планируют внедрить на полицейских участках по всей Испании, потом ее будут адаптировать для других преступлений.
Почитать про исследование по-испански можно здесь.
Когда появилась машинная поэзия и в чем особенности стихов, созданных именно нейросетями? Чем такая поэзия отличается от авторской? Представляет ли она какую-нибудь ценность для литературоведения? И так ли легко определить, что написано человеком, а что — алгоритмом?
Ответы на эти и другие вопросы в нашем сегодняшнем лонгриде о нейросетевой поэзии и смерти автора.
#knowhow #neuropoetry #sysblok
https://telegra.ph/Nejroseti-i-smert-avtora-11-14
Ответы на эти и другие вопросы в нашем сегодняшнем лонгриде о нейросетевой поэзии и смерти автора.
#knowhow #neuropoetry #sysblok
https://telegra.ph/Nejroseti-i-smert-avtora-11-14
Telegraph
Нейросети и смерть автора
Если заходит разговор о нейросетевой генерации стихов, эрудированные люди сразу вспоминают множественные прецеденты машинной поэзии из прошлого. Все думают, что компьютер сочинял стихи уже тысячу лет (ну ладно, не тысячу, но такие опыты и правда ставились…
Вас обслуживает Искусственный Интеллект
В последние годы банковская отрасль особенно заинтересовалась продуктами искусственного интеллекта. Практически каждая большая консалтинговая компания уже провела и опубликовала исследование о будущем влиянии ИИ на банковский сектор, а на разработки в этой области направлено огромное количество инвестиций. Одновременно усиливаются и опасения, что новые технологии снизят спрос на человеческий труд.
Суть проста: если банк может позволить себе автоматизировать какой-то процесс, ему больше не нужно нанимать на эту должность людей.
Например, 10 лет назад с распространением информационных технологий профессия представителя компании стала менее востребованной, многие отделы закрылись. По тому же принципу банки теперь внедряют в сферу обслуживания продукты ИИ. По данным Consultancy.uk на 2017 год, 30,8% всех финансовых организаций используют искусственный интеллект при работе с клиентами.
Некоторые крупные банки разработали чат-ботов и виртуальных ассистентов на основе искусственного интеллекта. Например, J.P.Morgan Chase (первое место в США по общей сумме вкладов) c помощью ИИ отвечает на вопросы клиентов и прогнозирует их финансовые потребности. А виртуальный ассистент UBS (швейцарского инвестиционного банка, который в 2018 занял первое место в рейтинге лучших частных банков мира) работает по принципу Amazon Alexa. Скорее всего, именно эти алгоритмы займут рабочие места живых людей. Чем больше их применяют, тем больше они учатся, а значит, с каждым днем они все лучше обслуживают клиентов без помощи менеджеров.
Крупнейшие банки применяют системы искусственного интеллекта, чтобы выслеживать мошенников или операции по отмыванию денег. Это действительно работает: следователи тратят намного меньше времени на ложные положительные срабатывания (например, если клиент заходит в онлайн-банк с адресов из разных стран в течение дня — это подозрительно, и служба безопасности может заблокировать его аккаунт до выяснения обстоятельств). В этом смысле алгоритмы ИИ не столько позволяют сэкономить на рабочих местах, сколько дают следователям больше времени на детальное изучение настоящих преступлений.
Есть банки, которые используют ИИ в алгоритмической торговле (совершение сделок с помощью торговых роботов). Еще машинное обучение используется для персонализации обслуживания: клиентам предлагают услуги, приспособленные под их нужды..
Банки также используют ИИ в управлении рисками. Современные алгоритмы пока не способны принимать решения за людей, но искусственный интеллект упорядочивает сам процесс: снижает субъективность и улучшает конечный результат как для организаций, так и для клиентов, не лишая работников должности.
Так, рано или поздно внедрение ИИ в банковскую отрасль приведет к сокращению определенных позиций. Но это не значит, что систему ждет переворот, при котором сокращения будут массовыми. Искусственный интеллект может по-другому помочь отрасли: например, сняв с людей мелкие рутинные задачи, он позволяет эффективнее отслеживать действительно преступления по отмыванию денег. А передача умным чат-ботам типовых запросов дает возможность повысить качество клиентского обслуживания.
В последние годы банковская отрасль особенно заинтересовалась продуктами искусственного интеллекта. Практически каждая большая консалтинговая компания уже провела и опубликовала исследование о будущем влиянии ИИ на банковский сектор, а на разработки в этой области направлено огромное количество инвестиций. Одновременно усиливаются и опасения, что новые технологии снизят спрос на человеческий труд.
Суть проста: если банк может позволить себе автоматизировать какой-то процесс, ему больше не нужно нанимать на эту должность людей.
Например, 10 лет назад с распространением информационных технологий профессия представителя компании стала менее востребованной, многие отделы закрылись. По тому же принципу банки теперь внедряют в сферу обслуживания продукты ИИ. По данным Consultancy.uk на 2017 год, 30,8% всех финансовых организаций используют искусственный интеллект при работе с клиентами.
Некоторые крупные банки разработали чат-ботов и виртуальных ассистентов на основе искусственного интеллекта. Например, J.P.Morgan Chase (первое место в США по общей сумме вкладов) c помощью ИИ отвечает на вопросы клиентов и прогнозирует их финансовые потребности. А виртуальный ассистент UBS (швейцарского инвестиционного банка, который в 2018 занял первое место в рейтинге лучших частных банков мира) работает по принципу Amazon Alexa. Скорее всего, именно эти алгоритмы займут рабочие места живых людей. Чем больше их применяют, тем больше они учатся, а значит, с каждым днем они все лучше обслуживают клиентов без помощи менеджеров.
Крупнейшие банки применяют системы искусственного интеллекта, чтобы выслеживать мошенников или операции по отмыванию денег. Это действительно работает: следователи тратят намного меньше времени на ложные положительные срабатывания (например, если клиент заходит в онлайн-банк с адресов из разных стран в течение дня — это подозрительно, и служба безопасности может заблокировать его аккаунт до выяснения обстоятельств). В этом смысле алгоритмы ИИ не столько позволяют сэкономить на рабочих местах, сколько дают следователям больше времени на детальное изучение настоящих преступлений.
Есть банки, которые используют ИИ в алгоритмической торговле (совершение сделок с помощью торговых роботов). Еще машинное обучение используется для персонализации обслуживания: клиентам предлагают услуги, приспособленные под их нужды..
Банки также используют ИИ в управлении рисками. Современные алгоритмы пока не способны принимать решения за людей, но искусственный интеллект упорядочивает сам процесс: снижает субъективность и улучшает конечный результат как для организаций, так и для клиентов, не лишая работников должности.
Так, рано или поздно внедрение ИИ в банковскую отрасль приведет к сокращению определенных позиций. Но это не значит, что систему ждет переворот, при котором сокращения будут массовыми. Искусственный интеллект может по-другому помочь отрасли: например, сняв с людей мелкие рутинные задачи, он позволяет эффективнее отслеживать действительно преступления по отмыванию денег. А передача умным чат-ботам типовых запросов дает возможность повысить качество клиентского обслуживания.
Второе пришествие кокаина: наркостатистика в Google Books
Наркотики, как и кинозвезды, имеют свои моменты популярности — и забвения.
Как узнать, когда случился «звездный час» марихуаны? Конечно, с помощью анализа огромного корпуса текстов, протяженного во времени. Самый большой из доступных — Google Books (более 500 миллиардов слов). Используем интерфейс Google Ngram Viewer для анализа частотности употребления названий основных наркотиков.
Рубеж XIX — XX веков — эпоха кокаина. Это конец Викторианской эры, декаданс начала XX века, экзальтированные дамы увлекаются спиритизмом... Кокаин хвалят ярчайшие писатели и интеллектуалы: Жюль Верн, Эмиль Золя, Томас Эдисон, Генрик Ибсен, Зигмунд Фрейд. Даже главный герой эпохи, Шерлок Холмс, — открытый кокаинист.
Изобретенный тогда же героин долго считался безопасным средством от кашля и продавался без рецепта. Фармкомпании гребли прибыль, а правительства заподозрили неладное и начали запрещать его только к середине 1920-х, когда на героине сидела половина звезд джаза и толпы их поклонников. Переток от кокаиновой наркомании к героиновой отражается в текстах.
Традиционный морфий, на замену которому и пришел героин, становится сверхактуален во время Второй мировой — конечно, не как наркотик, а как обезболивающее.
А вскоре после войны наступает эпоха хиппи — и в 60-е мы наблюдаем настоящий наркотический взрыв. Особенно резко взлетает частотность марихуаны. Следом подтягиваются только что изобретенные синтетические наркотики — ЛСД и (чуть позже) амфетамины. Подскакивает и героин — теперь вместо джазменов на нем сидят рокеры, а вот дедовский кокаин уже не моден и уходит в тень. Его возрождение (и это отлично видно на графике!) случится к 80-м. Кокаин теперь — престижный наркотик для «белых воротничков». И вот уже нью-йоркские юристы в ультрадорогих пентхаусах делят дорожки белого порошка с помощью золотых кредиток, а поставляющая им наркотики латиноамериканская мафия переживает небывалый расцвет (см. игру GTA Vice City и прочую массовую культуру про американские 80-е).
Наркотики, как и кинозвезды, имеют свои моменты популярности — и забвения.
Как узнать, когда случился «звездный час» марихуаны? Конечно, с помощью анализа огромного корпуса текстов, протяженного во времени. Самый большой из доступных — Google Books (более 500 миллиардов слов). Используем интерфейс Google Ngram Viewer для анализа частотности употребления названий основных наркотиков.
Рубеж XIX — XX веков — эпоха кокаина. Это конец Викторианской эры, декаданс начала XX века, экзальтированные дамы увлекаются спиритизмом... Кокаин хвалят ярчайшие писатели и интеллектуалы: Жюль Верн, Эмиль Золя, Томас Эдисон, Генрик Ибсен, Зигмунд Фрейд. Даже главный герой эпохи, Шерлок Холмс, — открытый кокаинист.
Изобретенный тогда же героин долго считался безопасным средством от кашля и продавался без рецепта. Фармкомпании гребли прибыль, а правительства заподозрили неладное и начали запрещать его только к середине 1920-х, когда на героине сидела половина звезд джаза и толпы их поклонников. Переток от кокаиновой наркомании к героиновой отражается в текстах.
Традиционный морфий, на замену которому и пришел героин, становится сверхактуален во время Второй мировой — конечно, не как наркотик, а как обезболивающее.
А вскоре после войны наступает эпоха хиппи — и в 60-е мы наблюдаем настоящий наркотический взрыв. Особенно резко взлетает частотность марихуаны. Следом подтягиваются только что изобретенные синтетические наркотики — ЛСД и (чуть позже) амфетамины. Подскакивает и героин — теперь вместо джазменов на нем сидят рокеры, а вот дедовский кокаин уже не моден и уходит в тень. Его возрождение (и это отлично видно на графике!) случится к 80-м. Кокаин теперь — престижный наркотик для «белых воротничков». И вот уже нью-йоркские юристы в ультрадорогих пентхаусах делят дорожки белого порошка с помощью золотых кредиток, а поставляющая им наркотики латиноамериканская мафия переживает небывалый расцвет (см. игру GTA Vice City и прочую массовую культуру про американские 80-е).
Что читать современному лингвисту/филологу?
Мы уже рассказывали о каналах, которые будут интересны современным лингвистам и филологам и которые мы с удовольствием читаем сами. Во второй части нашего обзора — семь лингвистических каналов, один литературный и три переводческих.
— @glazslov — Глазарий языка
Все важное и неважное о русском языке и не только. Откуда в «Лиге плюща» взялся плющ? Когда в русском языке появилась современная терминология арифметики и геометрии? Сколько в немецком языке пословиц о колбасе? Как отогнать свинью на Кубани и овцу в Смоленске? Что такое «автожир» и «пейсмейкер»?
— @wordsofsnow — мамкина ленгвистка
Ненастоящая лингвистка Соня рассказывает разные интересные штуки про языки — про то, как заикаются на разных языках, про братскую судьбу русского «хер» и ивритского «зайн», про карго-Иисуса Миклухо Маклая и русские заимствования в папуасских языках and what not.
— @superprikladnayalinguistika — Супер прикладная лингвистика
Аспирантка Мюнстерского университета Аня пишет об экспериментальной лингвистике, современных методах анализа лингвистических данных и трендах в исследованиях. Если хотите узнать о когнитивной, компьютерной, судебной, клинической, эволюционной и ещё много какой лингвистике, вам сюда!
— @Lingvoed — Lingvoed
Преподаватель русского языка как иностранного задаёт непростые лингвистические загадки на знание самых разных языков, делится тонкостями своей профессии и рассказывает байки из преподавательской жизни.
— @franrusse — бонжур ёбта
Канал преподавательницы русского как иностранного и французского из Лиона. Истории из жизни, любопытные наблюдения о языке, экскурсы в страноведение и перлы учеников.
— @lingvovesti — Лингвовести: языки и лингвистика
Новости о языках, языковой политике и событиях из мира лингвистики, а также анонсы открытых познавательных мероприятий на эту тему в Санкт-Петербурге и Москве.
— @gzombify — Гзом
Канал о тонкостях и пунктирностях русского языка, грамматике и стилистике, работе редактора и работе мозга, заморских и уже не очень словах — затейливо, с внятной аргументацией и без занудства.
— @slowlearner — I'm Writing a Novel
Жизнь, мнения и сентиментальное путешествие Игоря Кириенкова. Гуманитарный нон-фикшн, филологический взгляд на кино, литературные премии и открытые дискуссии о книгах — в общем, всё, что находится в поле филологии, но вне фокуса.
— @breat_gritain — Сюрдоперевод
Канал о переводческих ляпах и о том, как с ними бороться, с примерами из реальной практики редактора переводов. И просто посмеяться, и набраться бесценного опыта.
— @interpreteratwork — interpreter at work
Канал о буднях устного переводчика. Просто представьте, что вам нужно сходу перевести текст, где встречаются отливка алюминия, накладные волосы, тукан, клапан для надувания секс-игрушки, жёлтая пресса, викторианский корсет, ксилофон и голенища.
— @mamlingvist — Tsundoku-sempai
Канал о переводах, локализации видеоигр и тяготах фриланса. Как работать с вымышленными вселенными, не видя их? Что такое аудиодескрипция? Переводчики — герои или негодяи, которые портят любимые фильмы?
Обзор подготовлен редакцией канала о культуре в век цифры «Системный Блокъ» @sysblok.
Мы уже рассказывали о каналах, которые будут интересны современным лингвистам и филологам и которые мы с удовольствием читаем сами. Во второй части нашего обзора — семь лингвистических каналов, один литературный и три переводческих.
— @glazslov — Глазарий языка
Все важное и неважное о русском языке и не только. Откуда в «Лиге плюща» взялся плющ? Когда в русском языке появилась современная терминология арифметики и геометрии? Сколько в немецком языке пословиц о колбасе? Как отогнать свинью на Кубани и овцу в Смоленске? Что такое «автожир» и «пейсмейкер»?
— @wordsofsnow — мамкина ленгвистка
Ненастоящая лингвистка Соня рассказывает разные интересные штуки про языки — про то, как заикаются на разных языках, про братскую судьбу русского «хер» и ивритского «зайн», про карго-Иисуса Миклухо Маклая и русские заимствования в папуасских языках and what not.
— @superprikladnayalinguistika — Супер прикладная лингвистика
Аспирантка Мюнстерского университета Аня пишет об экспериментальной лингвистике, современных методах анализа лингвистических данных и трендах в исследованиях. Если хотите узнать о когнитивной, компьютерной, судебной, клинической, эволюционной и ещё много какой лингвистике, вам сюда!
— @Lingvoed — Lingvoed
Преподаватель русского языка как иностранного задаёт непростые лингвистические загадки на знание самых разных языков, делится тонкостями своей профессии и рассказывает байки из преподавательской жизни.
— @franrusse — бонжур ёбта
Канал преподавательницы русского как иностранного и французского из Лиона. Истории из жизни, любопытные наблюдения о языке, экскурсы в страноведение и перлы учеников.
— @lingvovesti — Лингвовести: языки и лингвистика
Новости о языках, языковой политике и событиях из мира лингвистики, а также анонсы открытых познавательных мероприятий на эту тему в Санкт-Петербурге и Москве.
— @gzombify — Гзом
Канал о тонкостях и пунктирностях русского языка, грамматике и стилистике, работе редактора и работе мозга, заморских и уже не очень словах — затейливо, с внятной аргументацией и без занудства.
— @slowlearner — I'm Writing a Novel
Жизнь, мнения и сентиментальное путешествие Игоря Кириенкова. Гуманитарный нон-фикшн, филологический взгляд на кино, литературные премии и открытые дискуссии о книгах — в общем, всё, что находится в поле филологии, но вне фокуса.
— @breat_gritain — Сюрдоперевод
Канал о переводческих ляпах и о том, как с ними бороться, с примерами из реальной практики редактора переводов. И просто посмеяться, и набраться бесценного опыта.
— @interpreteratwork — interpreter at work
Канал о буднях устного переводчика. Просто представьте, что вам нужно сходу перевести текст, где встречаются отливка алюминия, накладные волосы, тукан, клапан для надувания секс-игрушки, жёлтая пресса, викторианский корсет, ксилофон и голенища.
— @mamlingvist — Tsundoku-sempai
Канал о переводах, локализации видеоигр и тяготах фриланса. Как работать с вымышленными вселенными, не видя их? Что такое аудиодескрипция? Переводчики — герои или негодяи, которые портят любимые фильмы?
Обзор подготовлен редакцией канала о культуре в век цифры «Системный Блокъ» @sysblok.
Telegram
Системный Блокъ
Что читать современному лингвисту/филологу?
Телеграм стал площадкой для нишевых сообществ с уникальным контентом. Мы будем рассказывать о каналах, которые читаем сами. В нашем первом обзоре — четыре канала о лингвистике, четыре канала о литературе и два…
Телеграм стал площадкой для нишевых сообществ с уникальным контентом. Мы будем рассказывать о каналах, которые читаем сами. В нашем первом обзоре — четыре канала о лингвистике, четыре канала о литературе и два…
Предиктивный ввод текста на клавиатуре мобильного телефона известен нам по крайней мере с 70-х годов. Наверное, большинство из нас знакомы с Т9 , «Text on 9 keys» — алгоритмом, который позволял ускорить набор текста на кнопочных телефонах.
Сегодня мы рассказываем о том, как работает Т9 и его преемник iTap, подсказывающий слова на современных мобильных устройствах с полноценной qwerty-клавиатурой.
#knowhow #nlp #sysblok
https://telegra.ph/Zemlya-emu-puhovik-Kak-rabotaet-T9-11-22
Сегодня мы рассказываем о том, как работает Т9 и его преемник iTap, подсказывающий слова на современных мобильных устройствах с полноценной qwerty-клавиатурой.
#knowhow #nlp #sysblok
https://telegra.ph/Zemlya-emu-puhovik-Kak-rabotaet-T9-11-22
Telegraph
Земля ему пуховик. Как работает Т9?
Т9 Технологии интеллектуального (предиктивного) ввода текста стали развиваться задолго до первых мобильных устройств. В 50-е годы XX века человек по имени Чжан Цзицзинь создал систему ассоциативных кластеров текста, чтобы облегчить себе работу. Он был наборщиком…
Специальные чат-боты для изучения иностранного языка завоевывают популярность во всем мире. Почему это работает?
Чат-бот — идеальный собеседник для обучения: перед ним не стыдно, с ним можно переписываться примерно как с приятелями в мессенджере, а еще он не устает. И не требует почасовой оплаты! Как говорится, what’s not to like?
#education #nlp #sysblok
https://telegra.ph/Ne-stydno-i-veselo-chem-horoshi-yazykovye-boty-11-22
Чат-бот — идеальный собеседник для обучения: перед ним не стыдно, с ним можно переписываться примерно как с приятелями в мессенджере, а еще он не устает. И не требует почасовой оплаты! Как говорится, what’s not to like?
#education #nlp #sysblok
https://telegra.ph/Ne-stydno-i-veselo-chem-horoshi-yazykovye-boty-11-22
Telegraph
Не стыдно и весело: чем хороши языковые боты
Кто хоть раз не проводил скучный вечер за троллингом голосового помощника Алисы? В режиме «болталки» Алиса пытается поддерживать беседу, генерировать остроумные ответы, играть в простые языковые игры — то есть, быть приятным собеседником. Но это работает…
Наверное, каждый хоть раз пробовал поболтать с яндексовской Алисой. Но знаете ли вы что-нибудь о ее предшественнице Элизе и о том, когда человек впервые смог поговорить с роботом?
Если нет, то скорее читайте нашу статью о бабушке современных чат-ботов!
#nlp #sysblok
https://telegra.ph/Rozhdenie-govoryashchih-mashin-11-22
Если нет, то скорее читайте нашу статью о бабушке современных чат-ботов!
#nlp #sysblok
https://telegra.ph/Rozhdenie-govoryashchih-mashin-11-22
Telegraph
Рождение говорящих машин
Человеку захотелось поговорить с роботом уже к середине прошлого века: в 1950 году Айзек Азимов выпускает сборник рассказов «Я, Робот» вместе с тремя законами робототехники, и в этом же году Алан Тьюринг публикует статью «Вычислительные машины и разум», где…
Нейровоскрешение великого битника
В 1951 году Джек Керуак закончил свой роман-путешествие «В дороге» (On the road), который по сути является автобиографическим и описывает дорожное путешествие двух друзей по США и Мексике. Технику письма, в которой создан этот роман, автор назвал «спонтанной/импровизационной прозой» и сравнил ее с джазовой музыкой подразумевая, что процесс написания чего-либо не должен полностью осознаваться автором, а должен исходить из впечатлений. Керуак свои работы писал следующим образом: он вставлял рулон бумаги в печатную машинку и просто стучал по клавишам, пока не наберется метра три текста в день.
В 2018 году Росс Гудвин, бывший писатель-призрак (ghostwriter) администрации президента Обамы и нынешний инженер в Google, решил повторить этот опыт с помощью компьютерных алгоритмов. Гудвин не первый год экспериментирует с порождением текстов: в 2014 году он превратил в роман доклад Сената США о пытках. А в своей магистерской диссертации Гудвин использовал данные камеры, компаса и часов, чтобы автоматически превращать прогулки по городу в тексты.
Теперь Гудвин решил усовершенствовать свой алгоритм и получить с его помощью дорожный роман в стиле Джека Керуака. Он отправился со своими друзьями в четырехдневное путешествие из Нью-Йорка в Новый Орлеан на своем «кадиллаке», который тоже является персонажем получившегося произведения.
На машину поставили GPS навигатор, камеру снаружи, микрофон внутри и часы, объединив все это в единую «систему наблюдения» за впечатлениями. Для печати текста в «кадиллак» загрузили двадцать рулонов бумаги, чего, по словам Гудвина, хватило бы на роман в один миллион слов.
Часы фиксировали время, камера — окружающую обстановку, микрофон — диалоги путешественников, и все это отправлялось на обработку в нейронную сеть LSTM, обученную на текстах писателей и данных геосервиса Foursquare. Результаты вышли не идеальными, это совсем не тот уровень на котором может писать человек, но похоже на первую поездку маленького ребенка. «Сейчас девять семнадцать утра и дом тяжелый», — таким вышло первое предложение романа.
На протяжении всего путешествия данные от разных датчиков генерировали предложения необычного содержания, например, координаты широты и долготы были напечатаны дословно: «35.415579526 N, −77.999721808 W, на высоте 154,68504432 футов над уровнем моря, на 0,0 миль в час». Главное отличие этой техники от того, как обычно пишутся романы (днями, месяцами и даже годами), состоит в том, что текст создаётся практически постоянно, без перерывов.
Создатель этого проекта считает, что эксперимент получился успешным и очень интересным, потому что это первое большое непрерывное произведение, написанное нейросетью с помощью технологий, которые ведут наблюдение и обрабатывают данные.
Анна Бушмина
О том, как создавался этот роман, подробнее можно узнать тут.
В 1951 году Джек Керуак закончил свой роман-путешествие «В дороге» (On the road), который по сути является автобиографическим и описывает дорожное путешествие двух друзей по США и Мексике. Технику письма, в которой создан этот роман, автор назвал «спонтанной/импровизационной прозой» и сравнил ее с джазовой музыкой подразумевая, что процесс написания чего-либо не должен полностью осознаваться автором, а должен исходить из впечатлений. Керуак свои работы писал следующим образом: он вставлял рулон бумаги в печатную машинку и просто стучал по клавишам, пока не наберется метра три текста в день.
В 2018 году Росс Гудвин, бывший писатель-призрак (ghostwriter) администрации президента Обамы и нынешний инженер в Google, решил повторить этот опыт с помощью компьютерных алгоритмов. Гудвин не первый год экспериментирует с порождением текстов: в 2014 году он превратил в роман доклад Сената США о пытках. А в своей магистерской диссертации Гудвин использовал данные камеры, компаса и часов, чтобы автоматически превращать прогулки по городу в тексты.
Теперь Гудвин решил усовершенствовать свой алгоритм и получить с его помощью дорожный роман в стиле Джека Керуака. Он отправился со своими друзьями в четырехдневное путешествие из Нью-Йорка в Новый Орлеан на своем «кадиллаке», который тоже является персонажем получившегося произведения.
На машину поставили GPS навигатор, камеру снаружи, микрофон внутри и часы, объединив все это в единую «систему наблюдения» за впечатлениями. Для печати текста в «кадиллак» загрузили двадцать рулонов бумаги, чего, по словам Гудвина, хватило бы на роман в один миллион слов.
Часы фиксировали время, камера — окружающую обстановку, микрофон — диалоги путешественников, и все это отправлялось на обработку в нейронную сеть LSTM, обученную на текстах писателей и данных геосервиса Foursquare. Результаты вышли не идеальными, это совсем не тот уровень на котором может писать человек, но похоже на первую поездку маленького ребенка. «Сейчас девять семнадцать утра и дом тяжелый», — таким вышло первое предложение романа.
На протяжении всего путешествия данные от разных датчиков генерировали предложения необычного содержания, например, координаты широты и долготы были напечатаны дословно: «35.415579526 N, −77.999721808 W, на высоте 154,68504432 футов над уровнем моря, на 0,0 миль в час». Главное отличие этой техники от того, как обычно пишутся романы (днями, месяцами и даже годами), состоит в том, что текст создаётся практически постоянно, без перерывов.
Создатель этого проекта считает, что эксперимент получился успешным и очень интересным, потому что это первое большое непрерывное произведение, написанное нейросетью с помощью технологий, которые ведут наблюдение и обрабатывают данные.
Анна Бушмина
О том, как создавался этот роман, подробнее можно узнать тут.
Пощады не будет: учителей меняют на роботов
Новые технологии меняют традиционную роль учителя. Скоро преподавание может стать более инклюзивным: вместо привычного лекционного формата педагоги смогут сфокусироваться на индивидуальной деятельности ученика, отслеживая его прогресс и успехи.
Недавно команда специалистов анализировала работу робота по имени «Ботти», который помогал вести онлайн-курс. «Ботти» искал в Твиттере запросы по хэштегу и ключевым словам курса — и включался в беседу. «Когда Ботти находил хэштег, он отвечал на запрос серией автоматических сообщений, предварительно созданных руководителями программы. Его ответы включали в себя не только простые рекомендации к курсу, но и высказывания, заставляющие читателя использовать изученный материал программы и включаться в дискуссию с ботом и другими студентами» — пишут исследователи.
По итогам анализа бот был признан профессионально пригодным. Он неплохо подсказывал ответы — и побуждал студентов общаться друг с другом. Как отмечено в статье, «использование учителя-робота оказалось весьма полезным в развитии взаимодействий среди студентов программы и, следовательно, в дальнейшем робот может выступать в качестве полноправного ассистента в образовательном процессе».
Есть ли у «Ботти» преимущества перед живым педагогом? Исследователи считают, что да — компьютер не раздражается, бесконечно терпелив и не нуждается в отдыхе. Учитель-робот выступает как «доброжелательный, неутомимый инструктор, который может отвечать на вопросы о курсе в любое время». Роботы всегда онлайн и всегда готов прийти на помощь. Кроме того, бот гораздо дешевле.
Так как организаторы онлайн-курсов часто используют в качестве помощников менее квалифицированных преподавателей, робот — даже не обладающий полноценной интеллектуальностью — станет отличной альтернативой. «Мы можем утверждать, что границы между ролью учителя и учителя-робота постепенно стираются», — таков вывод исследователей, проанализировавших опыт «Ботти».
Подробнее узнать о ботах-учителях можно тут.
Перевел Олий Курилов
Новые технологии меняют традиционную роль учителя. Скоро преподавание может стать более инклюзивным: вместо привычного лекционного формата педагоги смогут сфокусироваться на индивидуальной деятельности ученика, отслеживая его прогресс и успехи.
Недавно команда специалистов анализировала работу робота по имени «Ботти», который помогал вести онлайн-курс. «Ботти» искал в Твиттере запросы по хэштегу и ключевым словам курса — и включался в беседу. «Когда Ботти находил хэштег, он отвечал на запрос серией автоматических сообщений, предварительно созданных руководителями программы. Его ответы включали в себя не только простые рекомендации к курсу, но и высказывания, заставляющие читателя использовать изученный материал программы и включаться в дискуссию с ботом и другими студентами» — пишут исследователи.
По итогам анализа бот был признан профессионально пригодным. Он неплохо подсказывал ответы — и побуждал студентов общаться друг с другом. Как отмечено в статье, «использование учителя-робота оказалось весьма полезным в развитии взаимодействий среди студентов программы и, следовательно, в дальнейшем робот может выступать в качестве полноправного ассистента в образовательном процессе».
Есть ли у «Ботти» преимущества перед живым педагогом? Исследователи считают, что да — компьютер не раздражается, бесконечно терпелив и не нуждается в отдыхе. Учитель-робот выступает как «доброжелательный, неутомимый инструктор, который может отвечать на вопросы о курсе в любое время». Роботы всегда онлайн и всегда готов прийти на помощь. Кроме того, бот гораздо дешевле.
Так как организаторы онлайн-курсов часто используют в качестве помощников менее квалифицированных преподавателей, робот — даже не обладающий полноценной интеллектуальностью — станет отличной альтернативой. «Мы можем утверждать, что границы между ролью учителя и учителя-робота постепенно стираются», — таков вывод исследователей, проанализировавших опыт «Ботти».
Подробнее узнать о ботах-учителях можно тут.
Перевел Олий Курилов
За гранью разумного: нейросеть придумала кино
В 2016 году британский кинорежиссёр Оскар Шарп снял короткометражный фильм Sunspring, сценарий к которому написала нейросеть по имени Бенджамин.
Во время учёбы в нью-йоркской киношколе Шарп познакомился с Россом Гудвином, который прежде увлекался писательством, но на тот момент уже занимался обработкой языка и обучал нейросети. Тогда друзья и увлеклись идеей создания «искусственного интеллекта», который смог бы написать оригинальный текст. Вскоре Гудвину действительно удалось создать такую нейросеть. Для её обучения Гудвин выбрал сценарии sci-fi фильмов, лежащие в открытом доступе. В основном это была научная фантастика 80х — 90х годов.
Когда текст был готов, Шарп распределил роли между актёрами. Те стали добавлять свои интонации, мимику и жесты к набору слегка косноязычных и не всегда понятных предложений, порожденных нейросетью. Вскоре результат сотрудничества между искусственным интеллектом и человеком был представлен на лондонском кинофестивале «SCI-FI-LONDON».
Технически «Бенджамин» — это рекуррентная нейросеть с долгой краткосрочной памятью (Long short-term memory, LSTM). Такие сети часто используются для распознавания, обработки и порождения текста. Преимущество LSTM-сетей над более простыми методами генерации языка цепью Маркова заключается в том, что они лучше предсказывают целые параграфы, а не только цепочки из нескольких слов. Со временем Бенджамин даже научился подражать структуре сценария. Единственной сложностью для алгоритма остались имена персонажей. Он назвал своих героев H, H и C. Для ясности Оскар Шарп изменил одно из имён с H на H2.
Мария Тершукова
В 2016 году британский кинорежиссёр Оскар Шарп снял короткометражный фильм Sunspring, сценарий к которому написала нейросеть по имени Бенджамин.
Во время учёбы в нью-йоркской киношколе Шарп познакомился с Россом Гудвином, который прежде увлекался писательством, но на тот момент уже занимался обработкой языка и обучал нейросети. Тогда друзья и увлеклись идеей создания «искусственного интеллекта», который смог бы написать оригинальный текст. Вскоре Гудвину действительно удалось создать такую нейросеть. Для её обучения Гудвин выбрал сценарии sci-fi фильмов, лежащие в открытом доступе. В основном это была научная фантастика 80х — 90х годов.
Когда текст был готов, Шарп распределил роли между актёрами. Те стали добавлять свои интонации, мимику и жесты к набору слегка косноязычных и не всегда понятных предложений, порожденных нейросетью. Вскоре результат сотрудничества между искусственным интеллектом и человеком был представлен на лондонском кинофестивале «SCI-FI-LONDON».
Технически «Бенджамин» — это рекуррентная нейросеть с долгой краткосрочной памятью (Long short-term memory, LSTM). Такие сети часто используются для распознавания, обработки и порождения текста. Преимущество LSTM-сетей над более простыми методами генерации языка цепью Маркова заключается в том, что они лучше предсказывают целые параграфы, а не только цепочки из нескольких слов. Со временем Бенджамин даже научился подражать структуре сценария. Единственной сложностью для алгоритма остались имена персонажей. Он назвал своих героев H, H и C. Для ясности Оскар Шарп изменил одно из имён с H на H2.
Мария Тершукова
YouTube
Sunspring | A Sci-Fi Short Film Starring Thomas Middleditch
In the wake of Google's AI Go victory, filmmaker Oscar Sharp turned to his technologist collaborator Ross Goodwin to build a machine that could write screenplays. They created "Jetson" and fueled him with hundreds of sci-fi TV and movie scripts. Building…
Большой Брат узнает по походке
Китайские власти начали внедрение нового инструмента слежки, который определяет личность по походке. Даже если человек скрыл лицо от камеры, он будет опознан по пластике движений и очертаниям тела.
Система уже используется на улицах Пекина и Шанхая. По словам разработчиков из компании Watrix, алгоритм способен идентифицировать человека на расстоянии до 50 метров, даже если тот повернут к камере спиной и закрыл лицо.
«Анализ походки нельзя обмануть, если просто прихрамывать, сутулиться или намеренно косолапить. Мы анализируем очертания тела целиком», — говорит Хуан Юнчжэн, гендиректор Watrix.
Сейчас китайская полиция использует распознавание лиц, чтобы распознавать участников массовых акций и штрафовать пешеходов-нарушителей. Тотальная слежка за людьми организована в Синцзяне, где живут мусульмане-уйгуры. На этот регион приходится большая часть из 20 млн. установленных в Китае камер. Власти Синцзяна уже проявили интерес к новой технологии распознавания походки.
Китайские власти планируют объединить все камеры в единую сеть с центральной базой к 2020 году. Правительство КНР и частные инвесторы вкладывают большие средства в биометрические технологии, способные распознать человека на видео. Компания Watrix получил на разработку своего алгоритма распознавания походки около 100 млн. юаней (14,5 млн. долларов). Компании помогает Академия наук Китая.
Сама технология не нова: что-то похожее уже делали ученые в США, Великобритании и Японии. Исследователи из Университета Осаки ведут такие разработки с 2013 года вместе с японской полицией. Но пока никто еще не смог создать систему, работающую достаточно хорошо. Недавно закрылась израильская фирма FST Biometrics, которая так и не смогла коммерциализировать распознавание походки.
«Это сложнее, чем вся прочая биометрия, — говорит Марк Никсон, специалист по распознаванию походки из Университета Саутгемптона. — Нужно больше компьютерных мощностей, так как анализировать приходится не отдельную фотографию, а всю последовательность».
Китайская система извлекает из видеозаписи очертания фигуры человека и создает модель его походки. Пока она неспособна идентифицировать людей в реальном времени — видеозаписи необходимо загружать. Анализ часа видео может занимать до 10 минут. Точность системы — 94%, в этом она пока уступает распознаванию лиц.
Гендиректор Watrix говорит, что систему можно использовать не только в полиции. Например, она способна вовремя заметить человека, который упал и не поднимается. Алгоритм мог бы помочь в присмотре за детьми и престарелыми.
Однако пока основной клиент системы — правоохранительные органы. Учитывая масштабы слежки за гражданами в Китае, новая технология выглядит как еще один штрих в картине тоталитарной антиутопии.
С источником материала можно ознакомиться тут.
Китайские власти начали внедрение нового инструмента слежки, который определяет личность по походке. Даже если человек скрыл лицо от камеры, он будет опознан по пластике движений и очертаниям тела.
Система уже используется на улицах Пекина и Шанхая. По словам разработчиков из компании Watrix, алгоритм способен идентифицировать человека на расстоянии до 50 метров, даже если тот повернут к камере спиной и закрыл лицо.
«Анализ походки нельзя обмануть, если просто прихрамывать, сутулиться или намеренно косолапить. Мы анализируем очертания тела целиком», — говорит Хуан Юнчжэн, гендиректор Watrix.
Сейчас китайская полиция использует распознавание лиц, чтобы распознавать участников массовых акций и штрафовать пешеходов-нарушителей. Тотальная слежка за людьми организована в Синцзяне, где живут мусульмане-уйгуры. На этот регион приходится большая часть из 20 млн. установленных в Китае камер. Власти Синцзяна уже проявили интерес к новой технологии распознавания походки.
Китайские власти планируют объединить все камеры в единую сеть с центральной базой к 2020 году. Правительство КНР и частные инвесторы вкладывают большие средства в биометрические технологии, способные распознать человека на видео. Компания Watrix получил на разработку своего алгоритма распознавания походки около 100 млн. юаней (14,5 млн. долларов). Компании помогает Академия наук Китая.
Сама технология не нова: что-то похожее уже делали ученые в США, Великобритании и Японии. Исследователи из Университета Осаки ведут такие разработки с 2013 года вместе с японской полицией. Но пока никто еще не смог создать систему, работающую достаточно хорошо. Недавно закрылась израильская фирма FST Biometrics, которая так и не смогла коммерциализировать распознавание походки.
«Это сложнее, чем вся прочая биометрия, — говорит Марк Никсон, специалист по распознаванию походки из Университета Саутгемптона. — Нужно больше компьютерных мощностей, так как анализировать приходится не отдельную фотографию, а всю последовательность».
Китайская система извлекает из видеозаписи очертания фигуры человека и создает модель его походки. Пока она неспособна идентифицировать людей в реальном времени — видеозаписи необходимо загружать. Анализ часа видео может занимать до 10 минут. Точность системы — 94%, в этом она пока уступает распознаванию лиц.
Гендиректор Watrix говорит, что систему можно использовать не только в полиции. Например, она способна вовремя заметить человека, который упал и не поднимается. Алгоритм мог бы помочь в присмотре за детьми и престарелыми.
Однако пока основной клиент системы — правоохранительные органы. Учитывая масштабы слежки за гражданами в Китае, новая технология выглядит как еще один штрих в картине тоталитарной антиутопии.
С источником материала можно ознакомиться тут.
Будущее медицины в руках у искусственного интеллекта
За последние несколько лет сфера биологических наук серьезно расширилась — в большей части благодаря развитию таких дисциплин, как геномика, эпигеномика, метагеномика и метаболомика. Искусственный интеллект может вывести наше понимание биологии на новый уровень, с его помощью станет возможно обрабатывать все доступные нам знания и создавать прогнозы, важные в том числе для терапевтики.
По словам Уинстона Хайда, профессора биологии Шеффилдского университета, пока нет точной информации о каждом конкретном гене, что подтверждается неудачными попытками использования ингибитора BACE1, а также провалом клинических испытаний таких препаратов, как верубецестат и соланезумаб, для лечения болезни Альцгеймера. Это говорит и об ограниченности нашего понимания изучаемого заболевания, сводящей на нет и без того низкие шансы найти эффективное лекарство.
Воспроизводимость данных наряду с определением влияния отдельных генов в биологических цепочках является одной из серьезных проблем в этой сфере. Искусственный интеллект, благодаря своим возможностям совмещать данные целого генома и делать выводы о наиболее выгодных цепочках взаимодействий, может помочь найти новые методы лечения.
Использование ИИ приведет к прорывным открытиям не только в изучении болезни Альцгеймера, но и во всех отраслях науки, связанных с изучением мозга в принципе. В коре головного мозга находится порядка 18 миллиардов нейронных связей, но пока не хватает вычислительной мощности для их визуализации. Касуэлл Барри, главный научный сотрудник в области клеточной биологии в Университетском колледже Лондона, считает, что решение может быть найдено в имитации возможностей мозга обрабатывать информацию с помощью глубокого обучения. Этот тезис подтверждается стремительным развитием алгоритмов, распознающих закономерности, — они уже нашли свое применение в таких областях здравоохранения, как диагностирование рака.
Создание таким образом качественных моделей мозга возможно по крайней мере для зрительной системы. Тем не менее моделирование всего мозга является более трудной задачей. Исследования уже позволяют говорить об определенных успехах в симуляции нервной системы нематоды C. elegans, которая состоит всего из 302 нейронов, но мозг более крупных животных подвержен изменчивости, и одна модель не подойдет всем.
Как понять, достаточно ли хороши данные? ИИ может проанализировать их и дать рекомендации, но не вполне понятно, как именно он это делает. Можно ли контролировать его развитие и должны ли мы это делать? Когда речь идет о вопросах жизни и смерти, это вызывает разногласия.
Подобную деятельность уже можно наблюдать на примере ИИ, внедренного в соцсети. Скажем, Facebook показывает пользователю то, что, по его мнению, он хотел бы увидеть, и формирует новостную ленту только из тех материалов, которые не противоречат взглядам пользователя на жизнь. Если применить эту технологию в сфере медицины, подобная избирательность может привести к прорывным результатам.
Потенциал ИИ велик, и в будущем ему найдется применение за пределами клиник. Возможно, он позволит нам понять, как появляются воспоминания. Тем не менее пока ИИ не играет большой роли в связи с техническими ограничениями. На данный момент используется лишь 0,5% имеющейся информации. Доступность и качество данных все еще представляют проблему. Однако эта сфера будет развиваться, несмотря на скептическое отношение к ней.
Подробнее узнать о том, как ИИ помогает в изучении болезни Альцгеймера, можно тут.
Перевел Лев Ходос
За последние несколько лет сфера биологических наук серьезно расширилась — в большей части благодаря развитию таких дисциплин, как геномика, эпигеномика, метагеномика и метаболомика. Искусственный интеллект может вывести наше понимание биологии на новый уровень, с его помощью станет возможно обрабатывать все доступные нам знания и создавать прогнозы, важные в том числе для терапевтики.
По словам Уинстона Хайда, профессора биологии Шеффилдского университета, пока нет точной информации о каждом конкретном гене, что подтверждается неудачными попытками использования ингибитора BACE1, а также провалом клинических испытаний таких препаратов, как верубецестат и соланезумаб, для лечения болезни Альцгеймера. Это говорит и об ограниченности нашего понимания изучаемого заболевания, сводящей на нет и без того низкие шансы найти эффективное лекарство.
Воспроизводимость данных наряду с определением влияния отдельных генов в биологических цепочках является одной из серьезных проблем в этой сфере. Искусственный интеллект, благодаря своим возможностям совмещать данные целого генома и делать выводы о наиболее выгодных цепочках взаимодействий, может помочь найти новые методы лечения.
Использование ИИ приведет к прорывным открытиям не только в изучении болезни Альцгеймера, но и во всех отраслях науки, связанных с изучением мозга в принципе. В коре головного мозга находится порядка 18 миллиардов нейронных связей, но пока не хватает вычислительной мощности для их визуализации. Касуэлл Барри, главный научный сотрудник в области клеточной биологии в Университетском колледже Лондона, считает, что решение может быть найдено в имитации возможностей мозга обрабатывать информацию с помощью глубокого обучения. Этот тезис подтверждается стремительным развитием алгоритмов, распознающих закономерности, — они уже нашли свое применение в таких областях здравоохранения, как диагностирование рака.
Создание таким образом качественных моделей мозга возможно по крайней мере для зрительной системы. Тем не менее моделирование всего мозга является более трудной задачей. Исследования уже позволяют говорить об определенных успехах в симуляции нервной системы нематоды C. elegans, которая состоит всего из 302 нейронов, но мозг более крупных животных подвержен изменчивости, и одна модель не подойдет всем.
Как понять, достаточно ли хороши данные? ИИ может проанализировать их и дать рекомендации, но не вполне понятно, как именно он это делает. Можно ли контролировать его развитие и должны ли мы это делать? Когда речь идет о вопросах жизни и смерти, это вызывает разногласия.
Подобную деятельность уже можно наблюдать на примере ИИ, внедренного в соцсети. Скажем, Facebook показывает пользователю то, что, по его мнению, он хотел бы увидеть, и формирует новостную ленту только из тех материалов, которые не противоречат взглядам пользователя на жизнь. Если применить эту технологию в сфере медицины, подобная избирательность может привести к прорывным результатам.
Потенциал ИИ велик, и в будущем ему найдется применение за пределами клиник. Возможно, он позволит нам понять, как появляются воспоминания. Тем не менее пока ИИ не играет большой роли в связи с техническими ограничениями. На данный момент используется лишь 0,5% имеющейся информации. Доступность и качество данных все еще представляют проблему. Однако эта сфера будет развиваться, несмотря на скептическое отношение к ней.
Подробнее узнать о том, как ИИ помогает в изучении болезни Альцгеймера, можно тут.
Перевел Лев Ходос
Роботы-прорабы следят за людьми
Когда искусственному интеллекту доверяют снимать кино или писать стихи, это весело и не страшно. Другое дело — архитектура и строительство. Плохое кино — это 1-2 часа потерянного времени. Плохо спроектированный дом — это человеческая жизнь. Тем не менее, в строительстве есть немало задач, которые уже сегодня можно доверить умным алгоритмам.
Компьютеры хорошо умеют работать с типовыми решениями. Например, они могут сгенерировать все возможные варианты типовой застройки для конкретной местности. Такие программы облегчают архитектору подбор вариантов — и помогают выбрать оптимальный. Например, алгоритм подскажет, на какую сторону света должны выходить окна, чтобы сэкономить тепло.
Машины не спят, не устают и не берут взяток. Поэтому из них получаются хорошие контролеры и инспекторы. Уже сейчас автономные дроны регулярно облетают строительные площадки с инспекциями, становясь своего рода «искусственными прорабами». По прогнозам, в ближайшие годы строительная отрасль будет главным покупателем беспилотников.
Еще одна работа для искусственного интеллекта — расчет и оптимизация пространства внутри здания. Коворкинги применяют машинное обучение, чтобы предсказывать загрузку переговорных комнат и составлять оптимальные расписания. В офисах-опенспейсах алгоритмы с опорой на данные о сотрудниках оптимизируют рассадку людей. Из тысяч вариантов размещения сотрудников выбирается самый потенциально бесконфликтный.
По материалам Strelka Mag.
Когда искусственному интеллекту доверяют снимать кино или писать стихи, это весело и не страшно. Другое дело — архитектура и строительство. Плохое кино — это 1-2 часа потерянного времени. Плохо спроектированный дом — это человеческая жизнь. Тем не менее, в строительстве есть немало задач, которые уже сегодня можно доверить умным алгоритмам.
Компьютеры хорошо умеют работать с типовыми решениями. Например, они могут сгенерировать все возможные варианты типовой застройки для конкретной местности. Такие программы облегчают архитектору подбор вариантов — и помогают выбрать оптимальный. Например, алгоритм подскажет, на какую сторону света должны выходить окна, чтобы сэкономить тепло.
Машины не спят, не устают и не берут взяток. Поэтому из них получаются хорошие контролеры и инспекторы. Уже сейчас автономные дроны регулярно облетают строительные площадки с инспекциями, становясь своего рода «искусственными прорабами». По прогнозам, в ближайшие годы строительная отрасль будет главным покупателем беспилотников.
Еще одна работа для искусственного интеллекта — расчет и оптимизация пространства внутри здания. Коворкинги применяют машинное обучение, чтобы предсказывать загрузку переговорных комнат и составлять оптимальные расписания. В офисах-опенспейсах алгоритмы с опорой на данные о сотрудниках оптимизируют рассадку людей. Из тысяч вариантов размещения сотрудников выбирается самый потенциально бесконфликтный.
По материалам Strelka Mag.
Oт альбома XVII века до Evernote
Альбомы для заметок, своего рода ежедневники, появились еще в XVII веке, а к XXI эволюционировали в продвинутые цифровые тетради вроде Evernote.
Интересно, что могли бы сказать владельцы альбомов XVII века о таких сервисах для заметок. Возможно, они были бы восхищены их возможностями, но в то же время поражены тем, как мы спрятали под замок некоторые важнейшие тексты, ограничив возможность использовать полный потенциал системы.
https://telegra.ph/Ot-alboma-XVII-veka-do-Evernote-12-12
Альбомы для заметок, своего рода ежедневники, появились еще в XVII веке, а к XXI эволюционировали в продвинутые цифровые тетради вроде Evernote.
Интересно, что могли бы сказать владельцы альбомов XVII века о таких сервисах для заметок. Возможно, они были бы восхищены их возможностями, но в то же время поражены тем, как мы спрятали под замок некоторые важнейшие тексты, ограничив возможность использовать полный потенциал системы.
https://telegra.ph/Ot-alboma-XVII-veka-do-Evernote-12-12
Telegraph
От альбома XVII века до Evernote
Альбомы (commonplace books), появившиеся в XVII веке, представляли собой тетрадь для записи идей, цитат из книг, отрывков текста для статей и работ, диаграмм, эскизов — всего, что приходит на ум. Со временем эти записные книжки превратились в личные сборники…
Мы уже не раз писали об отдельных кейсах из области цифровой филологии. Сегодня мы подготовили для вас обобщающую статью о компьютерных методах и инструментах анализа текста — от визуализации его репрезентативных характеристик до тематического моделирования жанров и литературных форм.
https://telegra.ph/Ne-takie-uzh-i-liriki-kompyuternye-tehnologii-dlya-gumanitariev-12-12
https://telegra.ph/Ne-takie-uzh-i-liriki-kompyuternye-tehnologii-dlya-gumanitariev-12-12
Telegraph
Не такие уж и лирики: компьютерные технологии для гуманитариев
Технологии меняют естественные, социальные и гуманитарные науки — частично потому, что порождают диалог между дисциплинами. Гуманитарии обращаются к этому диалогу, когда появляется необходимость в цифровых инструментах для автоматизации решения привычных…
Инфографика и разнообразные визуализации обычно ассоциируются с современными технологиями, но на самом деле первые графические методы анализа и представления информации появились еще в XIX веке!
Как вам, например, идея по горячим следам визуализировать борьбу армии Наполеона и русской зимы?
https://telegra.ph/Nelegkij-put-armii-Napoleona-v-Rossii-12-14
Как вам, например, идея по горячим следам визуализировать борьбу армии Наполеона и русской зимы?
https://telegra.ph/Nelegkij-put-armii-Napoleona-v-Rossii-12-14
Telegraph
Нелегкий путь армии Наполеона в России
Шарль Жозеф Минар — французский инженер и пионер в области графических методов анализа и представления информации. Он был автором множества исторических и экономических карт. Самая известная работа Минара — визуализация вторжения Наполеона Бонапарта в Россию…
Физика элементарных частиц помогает археологам и реставраторам
Один из главных соборов Флоренции, Санта-Мария-дель-Фьоре, был построен в середине XV века ювелиром Филиппо Брунеллески. Для исследователей остаётся неясным, как человек, далёкий по роду своей деятельности от архитектуры, смог возвести столь долговечную конструкцию. Брунеллески предусмотрительно не оставил после себя подробных чертежей собора, чтобы соперники не смогли воспользоваться его секретами. Сегодня это существенно осложняет реконструкцию потрескавшегося купола, так как учёные не могут знать точно, использовал ли архитектор железные цепи при строительстве. В 1980-е годы была произведена попытка восстановления здания, но это только навредило ему.
Елена Гриндинрири из Лос-Аламосской национальной лаборатории, выросшая близ Флоренции, предложила свою помощь. Разгадать тайну конструкции собора ей поможет мюонное излучение. Эта технология впервые была использована в середине XX века для измерения горного туннеля в Австралии. Широкую известность технологии принёс нобелевский лауреат по физике Луис Альварес, пытавшийся вместе с археологами обнаружить тайные комнаты в египетских пирамидах.
Существует несколько методов использования мюонных частиц, все они строятся на принципе их взаимодействия с газом. Мюоны при столкновении с частицами газа испускают вспышку света, которую фиксируют специальные детекторы. Так ученые получают снимки, похожие на рентгеновские. Плотный материал поглощает частицы, создавая на снимке тень. Чем плотнее материал, тем более тёмную тень он будет отбрасывать.
Елена Гриндинрири использовала эту технологию в своей работе ещё в начале 2000-х. Узнав о проблеме реконструкции собора Санта-Мария-дель-Фьоре, она поняла, что мюонное излучение поможет учёным узнать, какой материал скрыт в конструкции здания. Летом 2015 года Гриндинрири вместе со студентами создала копию флорентийского собора у себя в университете и провела первое исследование. Затем она получила разрешение на установку детекторов в самом здании.
Сейчас Гриндинрири ждёт коллег из Пенсильванского университета, чтобы вместе завершить тестирование оборудования. Затем детекторы будут отправлены сотрудникам Флорентийского университета на повторную проверку. После этого их установят в соборе. Определив внутреннюю конструкцию купола, реставраторы будут искать оптимальный способ его укрепления.
Подробнее узнать об использовании мюонных частиц для решения проблемы реконструкции собора можно тут.
Мария Тершукова
Один из главных соборов Флоренции, Санта-Мария-дель-Фьоре, был построен в середине XV века ювелиром Филиппо Брунеллески. Для исследователей остаётся неясным, как человек, далёкий по роду своей деятельности от архитектуры, смог возвести столь долговечную конструкцию. Брунеллески предусмотрительно не оставил после себя подробных чертежей собора, чтобы соперники не смогли воспользоваться его секретами. Сегодня это существенно осложняет реконструкцию потрескавшегося купола, так как учёные не могут знать точно, использовал ли архитектор железные цепи при строительстве. В 1980-е годы была произведена попытка восстановления здания, но это только навредило ему.
Елена Гриндинрири из Лос-Аламосской национальной лаборатории, выросшая близ Флоренции, предложила свою помощь. Разгадать тайну конструкции собора ей поможет мюонное излучение. Эта технология впервые была использована в середине XX века для измерения горного туннеля в Австралии. Широкую известность технологии принёс нобелевский лауреат по физике Луис Альварес, пытавшийся вместе с археологами обнаружить тайные комнаты в египетских пирамидах.
Существует несколько методов использования мюонных частиц, все они строятся на принципе их взаимодействия с газом. Мюоны при столкновении с частицами газа испускают вспышку света, которую фиксируют специальные детекторы. Так ученые получают снимки, похожие на рентгеновские. Плотный материал поглощает частицы, создавая на снимке тень. Чем плотнее материал, тем более тёмную тень он будет отбрасывать.
Елена Гриндинрири использовала эту технологию в своей работе ещё в начале 2000-х. Узнав о проблеме реконструкции собора Санта-Мария-дель-Фьоре, она поняла, что мюонное излучение поможет учёным узнать, какой материал скрыт в конструкции здания. Летом 2015 года Гриндинрири вместе со студентами создала копию флорентийского собора у себя в университете и провела первое исследование. Затем она получила разрешение на установку детекторов в самом здании.
Сейчас Гриндинрири ждёт коллег из Пенсильванского университета, чтобы вместе завершить тестирование оборудования. Затем детекторы будут отправлены сотрудникам Флорентийского университета на повторную проверку. После этого их установят в соборе. Определив внутреннюю конструкцию купола, реставраторы будут искать оптимальный способ его укрепления.
Подробнее узнать об использовании мюонных частиц для решения проблемы реконструкции собора можно тут.
Мария Тершукова