Как лингвисты делают искусственный интеллект, а компьютер решает ЕГЭ
Второй выпуск подкаста Неопознанный Искусственный Интеллект — с Татьяной Шавриной
#podcasts
В студии подкаста Неопознанный Искусственный Интеллект — Татьяна Шаврина. Лингвист, программист, руководитель команды по обработке естественного языка и искусственному интеллекту в Сбере, соорганизатор AI Journey.
«Лингвистика для нас — центр всего. И программирование, и когнитивные науки, и гуманитарные вещи — все соединяются в ней».
О чем мы поговорили с Татьяной
• Как разработка искусственного интеллекта объединила лингвистику, программирование и когнитивные науки
• Что должен уметь «сильный ИИ» и как его построить
• Должен ли ИИ быть устроен как человеческий мозг
• Как должен быть устроен тест на интеллектуальность
• Чем растущий ребенок отличается от обучающейся нейросети
• Как нейросети решают ЕГЭ
• Как устроен русский SuperGLUE: головоломки для ИИ
• Что такое колониализм в ИИ
• Кого заменят роботы и какие статьи об ИИ стоит почитать
Хайлайты выпуска
1. Каковы критерии «сильного» ИИ
• Мультимодальность: он работает одновременно с информацией из разных источников — текстом, картинками, звуками, — и обрабатывает это все вместе.
• Мультидоменность: он одинаково хорошо работает в разных предметных областях и способен разбираться в новых.
• Адаптивность: он может сам приобретать новые навыки, причем на небольшом количестве примеров — на таком же, как это мог бы сделать человек, или даже меньше.
2. Как оценивают работу новых нейросетей и сравнивают их друг с другом
Когда выходит новая модель, ее оценивают по тому, как она справляется с решением benchmark’ов. Benchmark подразумевает, что у нас есть несколько типов заданий, у каждого из которых есть свой набор данных — в нем тренировочная выборка и тестовая. Тестовая выборка может быть открыта, а может быть скрыта. После оценки нейросеть добавляют в рейтинг, чтобы увидеть, где произошел прорыв, а где — просадка по качеству.
3. Как проявляется колониализм в цифровой среде
Происходящее в data science и вообще в интернет коммуникациях можно объяснить колониальной экономикой и политикой. Кто первый построил новую инфраструктуру, тот выкачивает все дорогостоящие данные, устанавливает свои правила и облагает остальных пользователей налогами.
Где нас слушать или читать
Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.
Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
Второй выпуск подкаста Неопознанный Искусственный Интеллект — с Татьяной Шавриной
#podcasts
В студии подкаста Неопознанный Искусственный Интеллект — Татьяна Шаврина. Лингвист, программист, руководитель команды по обработке естественного языка и искусственному интеллекту в Сбере, соорганизатор AI Journey.
«Лингвистика для нас — центр всего. И программирование, и когнитивные науки, и гуманитарные вещи — все соединяются в ней».
О чем мы поговорили с Татьяной
• Как разработка искусственного интеллекта объединила лингвистику, программирование и когнитивные науки
• Что должен уметь «сильный ИИ» и как его построить
• Должен ли ИИ быть устроен как человеческий мозг
• Как должен быть устроен тест на интеллектуальность
• Чем растущий ребенок отличается от обучающейся нейросети
• Как нейросети решают ЕГЭ
• Как устроен русский SuperGLUE: головоломки для ИИ
• Что такое колониализм в ИИ
• Кого заменят роботы и какие статьи об ИИ стоит почитать
Хайлайты выпуска
1. Каковы критерии «сильного» ИИ
• Мультимодальность: он работает одновременно с информацией из разных источников — текстом, картинками, звуками, — и обрабатывает это все вместе.
• Мультидоменность: он одинаково хорошо работает в разных предметных областях и способен разбираться в новых.
• Адаптивность: он может сам приобретать новые навыки, причем на небольшом количестве примеров — на таком же, как это мог бы сделать человек, или даже меньше.
2. Как оценивают работу новых нейросетей и сравнивают их друг с другом
Когда выходит новая модель, ее оценивают по тому, как она справляется с решением benchmark’ов. Benchmark подразумевает, что у нас есть несколько типов заданий, у каждого из которых есть свой набор данных — в нем тренировочная выборка и тестовая. Тестовая выборка может быть открыта, а может быть скрыта. После оценки нейросеть добавляют в рейтинг, чтобы увидеть, где произошел прорыв, а где — просадка по качеству.
3. Как проявляется колониализм в цифровой среде
Происходящее в data science и вообще в интернет коммуникациях можно объяснить колониальной экономикой и политикой. Кто первый построил новую инфраструктуру, тот выкачивает все дорогостоящие данные, устанавливает свои правила и облагает остальных пользователей налогами.
Где нас слушать или читать
Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.
Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
Как работает GPT-2 и в чем его особенности
#nlp #knowhow
GPT-2 — нейросеть, которая способна генерировать образцы синтетического текста с вполне логичным повествованием, если задать ей любое начало. Модель учитывает стиль и содержание заданного ей фрагмента и уже на их основании создает свое продолжение истории. На момент релиза в ней было рекордное число параметров — 1,5 млрд против обычных 100–300 млн.
История создания и особенности GPT-2
Первая версия GPT (Generative Pre-trained Transformer) от OpenAI появилась еще летом 2018 года. Ее обучали на выборке текстов из Wikipedia и литературных произведений. Однако выяснилось, что нейросеть быстрее учится понимать естественную речь на основе простых постов в интернете. Поэтому в 2019 году OpenAI обучили GPT на больших объемах текстов — 8 млн. страниц из интернета. Новая версия нейросети получила название GPT-2.
Особенность GPT-2 в том, что она сразу — без дообучения — показала отличные результаты, близкие к state-of-the-art. Сразу после обучения нейросеть уже готова сгенерировать текст со всеми логическими вставками: повторное упоминание имен героев, цитаты, отсылки, выдержка одного стиля на протяжении всего текста, связанное повествование.
Таким образом GPT-2 могла понять суть задания примерно как человек — просто по его виду: если есть пропуски — дописать их, задают вопрос — попытаться ответить и т. д.
Что умеет GPT-2
Помимо простого создания текстов, модель можно использовать для следующих целей:
1. Краткий пересказ текста или обобщение.
В качестве входных данных нужно подать не просто фрагмент, а целый текст, состоящий из хотя бы пары абзацев (но лучше — страниц). Если в конце добавить «TL;DR», модель выдаст краткое содержание рассказа.
2. Ответы на вопросы исходя из содержания текста.
На входе подается несколько примеров в виде «Вопрос-Ответ», в конце же дается реальный вопрос, на который нейросеть выдает по тому же макету ответ.
3. Перевод текстов.
Механизм работы с переводами похож на механизм работы с ответами на вопросы. Главное — подать модели правильное начало, то есть нужную структуру текста. В оригинале GPT-2 подавали фрагменты в виде «hello- = привет» и так далее, используя английский и французский. В итоге, когда в конце была фраза «cat = …», нейросеть, следуя логике, выдала «кошку».
О том, как обучали GPT-2 и почему OpenAI предоставили доступ к его полной версии только через год после создания — читайте в нашей статье: https://sysblok.ru/knowhow/kak-rabotaet-gpt-2-i-v-chem-ego-osobennosti/
Камилла Кубелекова, Владимир Селеверстов
#nlp #knowhow
GPT-2 — нейросеть, которая способна генерировать образцы синтетического текста с вполне логичным повествованием, если задать ей любое начало. Модель учитывает стиль и содержание заданного ей фрагмента и уже на их основании создает свое продолжение истории. На момент релиза в ней было рекордное число параметров — 1,5 млрд против обычных 100–300 млн.
История создания и особенности GPT-2
Первая версия GPT (Generative Pre-trained Transformer) от OpenAI появилась еще летом 2018 года. Ее обучали на выборке текстов из Wikipedia и литературных произведений. Однако выяснилось, что нейросеть быстрее учится понимать естественную речь на основе простых постов в интернете. Поэтому в 2019 году OpenAI обучили GPT на больших объемах текстов — 8 млн. страниц из интернета. Новая версия нейросети получила название GPT-2.
Особенность GPT-2 в том, что она сразу — без дообучения — показала отличные результаты, близкие к state-of-the-art. Сразу после обучения нейросеть уже готова сгенерировать текст со всеми логическими вставками: повторное упоминание имен героев, цитаты, отсылки, выдержка одного стиля на протяжении всего текста, связанное повествование.
Таким образом GPT-2 могла понять суть задания примерно как человек — просто по его виду: если есть пропуски — дописать их, задают вопрос — попытаться ответить и т. д.
Что умеет GPT-2
Помимо простого создания текстов, модель можно использовать для следующих целей:
1. Краткий пересказ текста или обобщение.
В качестве входных данных нужно подать не просто фрагмент, а целый текст, состоящий из хотя бы пары абзацев (но лучше — страниц). Если в конце добавить «TL;DR», модель выдаст краткое содержание рассказа.
2. Ответы на вопросы исходя из содержания текста.
На входе подается несколько примеров в виде «Вопрос-Ответ», в конце же дается реальный вопрос, на который нейросеть выдает по тому же макету ответ.
3. Перевод текстов.
Механизм работы с переводами похож на механизм работы с ответами на вопросы. Главное — подать модели правильное начало, то есть нужную структуру текста. В оригинале GPT-2 подавали фрагменты в виде «hello- = привет» и так далее, используя английский и французский. В итоге, когда в конце была фраза «cat = …», нейросеть, следуя логике, выдала «кошку».
О том, как обучали GPT-2 и почему OpenAI предоставили доступ к его полной версии только через год после создания — читайте в нашей статье: https://sysblok.ru/knowhow/kak-rabotaet-gpt-2-i-v-chem-ego-osobennosti/
Камилла Кубелекова, Владимир Селеверстов
Как обучать датасаентистов, играя в шляпу
Третий выпуск подкаста Неопознанный Искусственный Интеллект — с Виктором Кантором
#podcasts
В студии подкаста — Виктор Кантор. Виктор руководит Data Science в МТС и преподает машинное обучение. Виктор — соавтор популярной специализации по машинному обучению на Coursera, преподает в вузах и на офлайн-курсах по машинному обучению «Data Mining in Action».
Мы пригласили его в наш подкаст, чтобы обсудить преподавание Data Science, развитие технологий машинного обучения и, конечно, будущее искусственного интеллекта.
О чем мы поговорили с Виктором
• Как обучать крутых датасаентистов;
• Как распознать инфоцыган, продающих некачественное образование
• Чем отличаются Data Mining, машинное обучение и Data Science;
• Возможен ли сильный искусственный интеллект;
• Что мешает преодолеть «узость» ИИ и так ли универсален человеческий мозг;
• Как научить робота ловить рыбу и будем ли мы программировать на естественном языке;
• Как стать крутым преподавателем Data Science и чем помогает игра в шляпу;
• Как запускать космические корабли в далеком будущем;
• Кто самый крутой русский датасаентист и о чем говорить с искусственным интеллектом.
Хайлайты выпуска
1. Как развивать General Artificial Intelligence
Наука не развивается по плану: для того, чтобы развивать General Artificial Intelligence, не обязательно верить, что-то получится, и не обязательно знать заранее, что мы воспринимаем как GAI. Можно просто решать больше задач, которые сейчас кажутся неподъемными, и постепенно приходить в ту точку, когда то, что получится, люди назовут General Artificial Intelligence.
То есть постепенно мы будем закрывать все больше узких задач, и постепенно у нас будут появляться алгоритмы, которые будут такое количество узких задач решать, что нам уже не так принципиально будет, что все они такие узкие.
2. На каком языке мы общаемся с ИИ
Чтобы роботы выполняли наши задачи, нам нужно уметь формулировать их так, чтобы их можно было выполнить в точности. На естественном языке можно выразить любой, доступный человеку смысл, но и интерпретировать его можно по-разному. General AI, наверное, должен сам уметь что-то делать с недостаточно точно сформулированной задачей.
Однако узкие ИИ так не умеют, поэтому мы пока перебираем разные возможные языки общения. Один из языков общения — обучающая выборка, примеры. ИИ учится на них, а мы ему говорим, что надо оптимизировать. Другой язык общения — среда, которая позволяет ИИ действовать определенным образом и периодически выдает ему фидбек, вознаграждает за какие-то действия. Это называется Reinforcement Learning, или обучение с подкреплением.
3. Что важно для преподавателя в Data Science
Будучи преподавателем, главное, себя не обманывать — понимать, какой у тебя есть реальный опыт и стараться учить в рамках него, а не пытаться себя выдавать за того, кем ты не являешься.
К преподаванию мотивирует осознание того, что ты вроде бы приходишь просто лекцию читать, но если делаешь это действительно хорошо — получается, что на самом деле в будущем запускаешь корабли в космос. Потому что сформированные с твоей помощью крутые специалисты и будут менять наше будущее.
Где нас слушать или читать
Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.
Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
Третий выпуск подкаста Неопознанный Искусственный Интеллект — с Виктором Кантором
#podcasts
В студии подкаста — Виктор Кантор. Виктор руководит Data Science в МТС и преподает машинное обучение. Виктор — соавтор популярной специализации по машинному обучению на Coursera, преподает в вузах и на офлайн-курсах по машинному обучению «Data Mining in Action».
Мы пригласили его в наш подкаст, чтобы обсудить преподавание Data Science, развитие технологий машинного обучения и, конечно, будущее искусственного интеллекта.
О чем мы поговорили с Виктором
• Как обучать крутых датасаентистов;
• Как распознать инфоцыган, продающих некачественное образование
• Чем отличаются Data Mining, машинное обучение и Data Science;
• Возможен ли сильный искусственный интеллект;
• Что мешает преодолеть «узость» ИИ и так ли универсален человеческий мозг;
• Как научить робота ловить рыбу и будем ли мы программировать на естественном языке;
• Как стать крутым преподавателем Data Science и чем помогает игра в шляпу;
• Как запускать космические корабли в далеком будущем;
• Кто самый крутой русский датасаентист и о чем говорить с искусственным интеллектом.
Хайлайты выпуска
1. Как развивать General Artificial Intelligence
Наука не развивается по плану: для того, чтобы развивать General Artificial Intelligence, не обязательно верить, что-то получится, и не обязательно знать заранее, что мы воспринимаем как GAI. Можно просто решать больше задач, которые сейчас кажутся неподъемными, и постепенно приходить в ту точку, когда то, что получится, люди назовут General Artificial Intelligence.
То есть постепенно мы будем закрывать все больше узких задач, и постепенно у нас будут появляться алгоритмы, которые будут такое количество узких задач решать, что нам уже не так принципиально будет, что все они такие узкие.
2. На каком языке мы общаемся с ИИ
Чтобы роботы выполняли наши задачи, нам нужно уметь формулировать их так, чтобы их можно было выполнить в точности. На естественном языке можно выразить любой, доступный человеку смысл, но и интерпретировать его можно по-разному. General AI, наверное, должен сам уметь что-то делать с недостаточно точно сформулированной задачей.
Однако узкие ИИ так не умеют, поэтому мы пока перебираем разные возможные языки общения. Один из языков общения — обучающая выборка, примеры. ИИ учится на них, а мы ему говорим, что надо оптимизировать. Другой язык общения — среда, которая позволяет ИИ действовать определенным образом и периодически выдает ему фидбек, вознаграждает за какие-то действия. Это называется Reinforcement Learning, или обучение с подкреплением.
3. Что важно для преподавателя в Data Science
Будучи преподавателем, главное, себя не обманывать — понимать, какой у тебя есть реальный опыт и стараться учить в рамках него, а не пытаться себя выдавать за того, кем ты не являешься.
К преподаванию мотивирует осознание того, что ты вроде бы приходишь просто лекцию читать, но если делаешь это действительно хорошо — получается, что на самом деле в будущем запускаешь корабли в космос. Потому что сформированные с твоей помощью крутые специалисты и будут менять наше будущее.
Где нас слушать или читать
Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.
Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
Во что верят IT-евангелисты
#society
Твоя вера должна быть сильна: рассказываем, кто такой IT-евангелист, что он должен уметь и сколько может зарабатывать. Эта статья — первая в серии «Новый рынок труда», где мы обсуждаем профессии будущего.
IT-евангелизм — сочетание маркетинга и веры в технологии, которое помогает продвигать продукт. IT-евангелисты любят и понимают продукт, могут влюбить в него других, однако не стремятся создать его идеальный образ. Поэтому найм харизматичного сотрудника может сильно помочь компании в продвижении и развитии своего продукта.
Рынок IT-евангелизма
Профессия IT-евангелист (technology evangelist) распространена в Америке с конца 20 века. С развитием и распространение стартапов навыки евангелизма становятся обязательными для каждого члена IT-проекта. Диаграммы с количеством вакансий и размером зарплат в разных странах прикрепляем ниже.
В России IT-евангелизм распространяется с 2011 года, но до сих пор звучит экзотично. Евангелисты востребованы только для компаний мирового масштаба, а региональные проекты обходятся без них. Основатели порой сами выступают в роли евангелистов, ведь именно они и есть истинные верующие в свой продукт, способный помочь человечеству.
По-русски должность IT-евангелиста называется «эксперт по стратегическим технологиям». Самые известные — Георгий Бакунов (Яндекс), Петр Гоголоев (MyTona), Михаил Черномордиков, Андрей Ивашенцев и Дмитрий Сошников (Microsoft). Все они активно популяризируют как свои продукты, так и саму профессию IT-евангелист.
Первый IT-евангелист
Первым IT-евангелистом считается Гай Кавасаки — человек, который научил весь мир пользоваться мышью. Его нанял маркетолог Майк Бойх из Apple, который предложил концепцию «software evangelist», чтобы завоевать рынок софта.
В то время — 1980-ые года — Apple не входило даже в топ-5 IT-компаний. Компьютеры Apple II нашли свою нишу в игровой и образовательной сфере, а Apple III быстро ушел в небытие. Apple сложно было конкурировать в сфере продаж, поэтому они выбрали сферу идей.
Кавасаки распространяет новую идеологию Apple на всех сотрудников компании и разработчиков программ. Так, в 1984 году выходит Macintosh, который добивается успеха благодаря первому применению мыши, графического интерфейса, большого количества софта, а главное — рекламной кампании и первой презентации Macintosh от Стива Джобса. Конкурируя с IBM «на словах», яблочные евангелисты распространили Macintosh во все сферы жизни.
Гай Кавасаки написал множество книг по IT-евангелизму. В работе «The Macintosh way» он сравнивает путь IT-евангелиста с путем самурая. Такой путь можно назвать «Мак-до»: «Mac» от Macintosh и «До» от японского «путь». Работа описывает не психологию или философию, а практику жизни, которая позволит незнающему человеку достичь духовного совершенствования.
Советы от Гая Кавасаки о том, как надо читать проповеди о своем продукте, — в нашей статье: https://sysblok.ru/permhse/vo-chto-verjat-it-evangelisty/
Никита Маткин,
социально-гуманитарный факультет НИУ ВШЭ
#society
Твоя вера должна быть сильна: рассказываем, кто такой IT-евангелист, что он должен уметь и сколько может зарабатывать. Эта статья — первая в серии «Новый рынок труда», где мы обсуждаем профессии будущего.
IT-евангелизм — сочетание маркетинга и веры в технологии, которое помогает продвигать продукт. IT-евангелисты любят и понимают продукт, могут влюбить в него других, однако не стремятся создать его идеальный образ. Поэтому найм харизматичного сотрудника может сильно помочь компании в продвижении и развитии своего продукта.
Рынок IT-евангелизма
Профессия IT-евангелист (technology evangelist) распространена в Америке с конца 20 века. С развитием и распространение стартапов навыки евангелизма становятся обязательными для каждого члена IT-проекта. Диаграммы с количеством вакансий и размером зарплат в разных странах прикрепляем ниже.
В России IT-евангелизм распространяется с 2011 года, но до сих пор звучит экзотично. Евангелисты востребованы только для компаний мирового масштаба, а региональные проекты обходятся без них. Основатели порой сами выступают в роли евангелистов, ведь именно они и есть истинные верующие в свой продукт, способный помочь человечеству.
По-русски должность IT-евангелиста называется «эксперт по стратегическим технологиям». Самые известные — Георгий Бакунов (Яндекс), Петр Гоголоев (MyTona), Михаил Черномордиков, Андрей Ивашенцев и Дмитрий Сошников (Microsoft). Все они активно популяризируют как свои продукты, так и саму профессию IT-евангелист.
Первый IT-евангелист
Первым IT-евангелистом считается Гай Кавасаки — человек, который научил весь мир пользоваться мышью. Его нанял маркетолог Майк Бойх из Apple, который предложил концепцию «software evangelist», чтобы завоевать рынок софта.
В то время — 1980-ые года — Apple не входило даже в топ-5 IT-компаний. Компьютеры Apple II нашли свою нишу в игровой и образовательной сфере, а Apple III быстро ушел в небытие. Apple сложно было конкурировать в сфере продаж, поэтому они выбрали сферу идей.
Кавасаки распространяет новую идеологию Apple на всех сотрудников компании и разработчиков программ. Так, в 1984 году выходит Macintosh, который добивается успеха благодаря первому применению мыши, графического интерфейса, большого количества софта, а главное — рекламной кампании и первой презентации Macintosh от Стива Джобса. Конкурируя с IBM «на словах», яблочные евангелисты распространили Macintosh во все сферы жизни.
Гай Кавасаки написал множество книг по IT-евангелизму. В работе «The Macintosh way» он сравнивает путь IT-евангелиста с путем самурая. Такой путь можно назвать «Мак-до»: «Mac» от Macintosh и «До» от японского «путь». Работа описывает не психологию или философию, а практику жизни, которая позволит незнающему человеку достичь духовного совершенствования.
Советы от Гая Кавасаки о том, как надо читать проповеди о своем продукте, — в нашей статье: https://sysblok.ru/permhse/vo-chto-verjat-it-evangelisty/
Никита Маткин,
социально-гуманитарный факультет НИУ ВШЭ
2020 — год комиксов во Франции. По этому случаю Международный центр комиксов и изображений и Национальная библиотека Франции публикуют подборки, посвященные комиксам и их истории. В декабре Gallica делится с читателями праздничными этикетками с красочными эпизодами из комиксов. Опубликованные этикетки можно распечатать, чтобы украсить ими открытки или подарки.
Самые ранние комиксы серии — выпуски The New York Herald за 1904 год. В первом номере «Buster Brown in a peck of trouble again» герой открывает бутылку с шампанским и заливает им весь дом, после чего призывает остальных не открывать ничего, кроме книг и банковского счета. В рождественской истории «Buster Brown’s X-Mas» школьник крадёт у Санты мешок с подарками, чтобы на следующий день раздать их бедным детям.
А выпуск от 1906 года «Little Nemo in Slumberland» рассказывает историю сна маленького мальчика: принцесса загадывает встречу с Немо — летающая машина Санты взрывается в небе — подарки разлетаются по всему миру.
София Емец
#visualheritage
Самые ранние комиксы серии — выпуски The New York Herald за 1904 год. В первом номере «Buster Brown in a peck of trouble again» герой открывает бутылку с шампанским и заливает им весь дом, после чего призывает остальных не открывать ничего, кроме книг и банковского счета. В рождественской истории «Buster Brown’s X-Mas» школьник крадёт у Санты мешок с подарками, чтобы на следующий день раздать их бедным детям.
А выпуск от 1906 года «Little Nemo in Slumberland» рассказывает историю сна маленького мальчика: принцесса загадывает встречу с Немо — летающая машина Санты взрывается в небе — подарки разлетаются по всему миру.
София Емец
#visualheritage
Как строить искусственный интеллект и не погубить человеческую цивилизацию
Четвертый выпуск подкаста Неопознанный Искусственный Интеллект — с Константином Воронцовым
#podcasts
В студии — Константин Воронцов, профессор Физтеха и Вышки, доктор физ.-мат. наук, человек, который занимается анализом данных, машинным обучением и искусственным интеллектом с начала 90-х.
Мы пригласили Константина в наш подкаст, чтобы обсудить потребность цивилизации в сильном ИИ, потолок развития нейросетей и столкновение интересов датасаентистов и специалистов службы безопасности.
О чем мы поговорили с Константином
• В чем революция глубинного обучения;
• Водитель машины как гибридная система машинного обучения;
• Этап «братьев Райт» в глубинном обучении: смотрим, что взлетит;
• Кошмар службы инфобезопасности: обучение на реальных потоковых данных;
• Почему комар все еще умнее беспилотника;
• «Мы роем себе могилу»: чем опасна мечта о сильном ИИ;
• Можно ли сделать универсального помощника;
• Человек versus нейросеть: сколько примеров нужно для обучения нам самим;
• Когда мы уже начнем понимать, что происходит внутри нейросетей.
Хайлайты выпуска
1. На каком этапе развития машинного обучения мы сейчас находимся
Cо стороны может показаться, что развитие методов машинного обучения и deep learning'a происходит по одному сценарию: 1) собрали датасет, 2) применили нейросеть с несколько модифицированной структурой, 3) получили результат, 4) рассказали сообществу, насколько улучшились показатели.
Это может выглядеть как хаотичное экспериментаторство, но его ценность — в сборе метаинформации. В нашем случае о том, какие нейросетевые архитектуры в каких задачах оказались успешными. При этом нам также необходимо огромное количество отрицательных экспериментов. Этот этап — начальный для любой строгой науки, им шли и физика, и биология, и др.
2. По какому пути развития пойдет машинное обучение
Обучаемые системы перейдут от обучения на статичных и предобработанных данных к обучению на разнородных непредобработанных потоковых данных. Уже есть алгоритмы, которые хорошо приспособлены для работы с потоками данных — это градиентные методы.
Дата-аналитики больше не будут переносить данные в удобную среду, а будут сидеть в живых продакшн-системах со специальной безопасной средой для экспериментирования с новыми моделями. Так как службы безопасности не готовы подпускать к данным своих компаний ученых со стороны, учеными будут становиться сами сотрудники.
3. В чем предназначение ИИ
Предназначение искусственного интеллекта — это автоматизация, выполнение рутинной работы. Тогда человек будет творить, заниматься смыслами, придумывать цели, идеи и видение, а все рутинные задачи будет выполнять его персональный ИИ-помощник.
Для создания такого автоматического секретаря широкого профиля у нас уже все есть — надо расширять датасеты, работать с мультимодальными данными, обеспечивать их полноту и решать много отдельных задач, после чего собирать множество решений в одно. Однако надо посчитать, не окажется ли это слишком дорого и энергетически затратно, а потому — нерентабельно.
Где нас слушать или читать
Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.
Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
Четвертый выпуск подкаста Неопознанный Искусственный Интеллект — с Константином Воронцовым
#podcasts
В студии — Константин Воронцов, профессор Физтеха и Вышки, доктор физ.-мат. наук, человек, который занимается анализом данных, машинным обучением и искусственным интеллектом с начала 90-х.
Мы пригласили Константина в наш подкаст, чтобы обсудить потребность цивилизации в сильном ИИ, потолок развития нейросетей и столкновение интересов датасаентистов и специалистов службы безопасности.
О чем мы поговорили с Константином
• В чем революция глубинного обучения;
• Водитель машины как гибридная система машинного обучения;
• Этап «братьев Райт» в глубинном обучении: смотрим, что взлетит;
• Кошмар службы инфобезопасности: обучение на реальных потоковых данных;
• Почему комар все еще умнее беспилотника;
• «Мы роем себе могилу»: чем опасна мечта о сильном ИИ;
• Можно ли сделать универсального помощника;
• Человек versus нейросеть: сколько примеров нужно для обучения нам самим;
• Когда мы уже начнем понимать, что происходит внутри нейросетей.
Хайлайты выпуска
1. На каком этапе развития машинного обучения мы сейчас находимся
Cо стороны может показаться, что развитие методов машинного обучения и deep learning'a происходит по одному сценарию: 1) собрали датасет, 2) применили нейросеть с несколько модифицированной структурой, 3) получили результат, 4) рассказали сообществу, насколько улучшились показатели.
Это может выглядеть как хаотичное экспериментаторство, но его ценность — в сборе метаинформации. В нашем случае о том, какие нейросетевые архитектуры в каких задачах оказались успешными. При этом нам также необходимо огромное количество отрицательных экспериментов. Этот этап — начальный для любой строгой науки, им шли и физика, и биология, и др.
2. По какому пути развития пойдет машинное обучение
Обучаемые системы перейдут от обучения на статичных и предобработанных данных к обучению на разнородных непредобработанных потоковых данных. Уже есть алгоритмы, которые хорошо приспособлены для работы с потоками данных — это градиентные методы.
Дата-аналитики больше не будут переносить данные в удобную среду, а будут сидеть в живых продакшн-системах со специальной безопасной средой для экспериментирования с новыми моделями. Так как службы безопасности не готовы подпускать к данным своих компаний ученых со стороны, учеными будут становиться сами сотрудники.
3. В чем предназначение ИИ
Предназначение искусственного интеллекта — это автоматизация, выполнение рутинной работы. Тогда человек будет творить, заниматься смыслами, придумывать цели, идеи и видение, а все рутинные задачи будет выполнять его персональный ИИ-помощник.
Для создания такого автоматического секретаря широкого профиля у нас уже все есть — надо расширять датасеты, работать с мультимодальными данными, обеспечивать их полноту и решать много отдельных задач, после чего собирать множество решений в одно. Однако надо посчитать, не окажется ли это слишком дорого и энергетически затратно, а потому — нерентабельно.
Где нас слушать или читать
Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.
Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
Как звучат личные истории в цифровом архиве — интервью с Линор Горалик, основательницей проекта Postpost. Media
#interview #digitalmemory
В XXI веке память по-прежнему играет важную роль в нашей жизни, однако формы ее архивации изменяются. Фотографии теперь хранятся в телефоне, а не фотоальбомах; личные мысли — в заметках гаджетов и цифровых дневниках, а не в блокнотах.
Начинает проявляться феномен «отложенного опыта»: на концертах, экскурсиях и в путешествиях мы чаще всего смотрим на мир через экран телефона, пытаясь поймать нужный момент для фото или видео. Но есть и другая сторона: теперь важным можно делиться.
О том, какие истории звучат в проекте PostPost. Media и немного об их авторах — в интервью с писательницей Линор Горалик создательницей и главным редактором проекта.
О чем мы поговорили с Линор
• Что такое память в XXI веке;
• Стираются ли воспоминания из памяти быстрее, если их записывать;
• Какова миссия Postpost. Media;
• Почему важно рассказывать истории;
• Как выбираются темы к историям;
• Можно ли рассказать историю анонимно;
• Является ли проект цифровым дневником разных эпох.
https://sysblok.ru/interviews/kak-zvuchat-lichnye-istorii-v-cifrovom-arhive/
Дарья Масленко, Даниил Скоринкин
#interview #digitalmemory
В XXI веке память по-прежнему играет важную роль в нашей жизни, однако формы ее архивации изменяются. Фотографии теперь хранятся в телефоне, а не фотоальбомах; личные мысли — в заметках гаджетов и цифровых дневниках, а не в блокнотах.
Начинает проявляться феномен «отложенного опыта»: на концертах, экскурсиях и в путешествиях мы чаще всего смотрим на мир через экран телефона, пытаясь поймать нужный момент для фото или видео. Но есть и другая сторона: теперь важным можно делиться.
О том, какие истории звучат в проекте PostPost. Media и немного об их авторах — в интервью с писательницей Линор Горалик создательницей и главным редактором проекта.
О чем мы поговорили с Линор
• Что такое память в XXI веке;
• Стираются ли воспоминания из памяти быстрее, если их записывать;
• Какова миссия Postpost. Media;
• Почему важно рассказывать истории;
• Как выбираются темы к историям;
• Можно ли рассказать историю анонимно;
• Является ли проект цифровым дневником разных эпох.
https://sysblok.ru/interviews/kak-zvuchat-lichnye-istorii-v-cifrovom-arhive/
Дарья Масленко, Даниил Скоринкин
«Системный Блокъ» 2020: лучшие посты
#best
В этой подборке — лучшие материалы «Системного Блока» за 2020 год. В этот раз мы разбили их по номинациям.
Пранк года
Отставной козы продюсер: генерируем названия книг Дарьи Донцовой
В этой статье воссоздан творческий процесс создания заглавий к «ироническим детективам» Донцовой с помощью Python. Хотя алгоритмы нехитрые, воспроизвести логику порождения заглавий удалось хорошо: человек легко может спутать настоящие названия с выдуманными. Мы проверяли.
Исследование года
Разделить цену победы: кого, откуда и когда призывали в годы ВОВ?
История Великой Отечественной через историю призыва. Мы исследовали более 26.5 млн архивных карточек из базы записей о перемещениях солдат в журналах военно-пересыльных пунктов. В статье показываем, насколько отличался военный призыв в разных регионах Советского Союза, и пытаемся объяснить это с опорой на исторические факты.
Интервью года
Системный Блокъ на самоизоляции
В этом интервью с участниками проекта «Системный Блокъ» мы рассказали, как карантин изменил нашу жизнь и что нового мы узнали о себе на самоизоляции. Например, наш урбанист Оля, встречалась с друзьями в Zoom на кулинарных пятницах, а главред Даня путешествовал по району до самой дальней мусорки.
Data-история года
Кого учили иезуиты?
Орден иезуитов был передовым отрядом католической церкви в деле сопротивления Реформации. Иезуиты создали сеть школ и университетов по всей Европе, выпускники которых вели работу по возвращению «заблудших душ» в лоно Католической церкви. Рассказываем и показываем, что можно узнать, если создать и проанализировать базу данных студентов, которых обучал орден иезуитов, и визуализировать эти данные.
Йоу года
Русский рэп через тематическое моделирование. О чем читает русскоговорящая хип-хоп сцена?
Словосочетание «русский рэпер» — связано со множеством стереотипов. Представьте себе русского рэпера. Что вы видите? Человека в спортивках, окруженного «своими пацанами», или, может, татуированного быка на гелике с золотой цепью в палец толщиной? Разбираемся, кто такие русские рэперы, и о чем они читают на самом деле.
Digital-филология года
Двухсерийное исследование поэзии Маяковского методами корпусной лингвистики. В первой части исследования при помощи Sketch Engine изучаем лирического героя Маяковского до и после революции. Вторая часть исследования посвящена образу России в творчестве Маяковского, а также тому, как поэт Революции оказался несоветским поэтом.
Краудсорсинговая история года
В лес за большими данными: как ваши фотки белок и грибов помогут науке
Информатика биоразнообразия — новая область науки, которой помогают тысячи добровольцев. Чтобы помочь науке — достаточно смартфона. Рассказываем о том, как устроен краудсорсинг биологических данных и как в нем поучаствовать.
Цифровая инвентаризация года
Что не скрывает Конгресс США?
Погружаемся в цифровые коллекции Библиотеки Конгресса США — одного из крупнейших хранилищ человеческого знания. В Библиотеке Конгресса насчитывается 170 млн единиц хранения, включая 24 млн книг, 74 млн рукописей, 15 млн фотографий и 4 млн аудиозаписей. Сколько коллекций Библиотеки Конгресса оцифровано и доступно каждому пользователю интернета?
Социальный датавиз года
Открытые данные ФСИН: число осужденных в России растёт только по наркопреступлениям
Согласно данным ФСИН, с 2005 года в 2,5 раза увеличилось число преступлений, связанных с распространением наркотиков. И наоборот, число осужденных за другие преступления — изнасилования, кражи, вымогательство, грабежи и разбой, — упало более чем вдвое. Действительно ли на общем фоне снижения преступности полиция стала ловить в 2,5 раза больше наркоторговцев?
Лучшая визуализация неравенства
Невидимые кинозвезды: как Голливуд не замечает женщин-режиссеров
10 лет назад «Оскар» за лучшую режиссуру впервые получила женщина — Кэтрин Бигелоу с фильмом «Повелитель бури». Мы провели исследование, проследив динамику упоминаний женщин-режиссеров в статьях популярных киножурналов.
#best
В этой подборке — лучшие материалы «Системного Блока» за 2020 год. В этот раз мы разбили их по номинациям.
Пранк года
Отставной козы продюсер: генерируем названия книг Дарьи Донцовой
В этой статье воссоздан творческий процесс создания заглавий к «ироническим детективам» Донцовой с помощью Python. Хотя алгоритмы нехитрые, воспроизвести логику порождения заглавий удалось хорошо: человек легко может спутать настоящие названия с выдуманными. Мы проверяли.
Исследование года
Разделить цену победы: кого, откуда и когда призывали в годы ВОВ?
История Великой Отечественной через историю призыва. Мы исследовали более 26.5 млн архивных карточек из базы записей о перемещениях солдат в журналах военно-пересыльных пунктов. В статье показываем, насколько отличался военный призыв в разных регионах Советского Союза, и пытаемся объяснить это с опорой на исторические факты.
Интервью года
Системный Блокъ на самоизоляции
В этом интервью с участниками проекта «Системный Блокъ» мы рассказали, как карантин изменил нашу жизнь и что нового мы узнали о себе на самоизоляции. Например, наш урбанист Оля, встречалась с друзьями в Zoom на кулинарных пятницах, а главред Даня путешествовал по району до самой дальней мусорки.
Data-история года
Кого учили иезуиты?
Орден иезуитов был передовым отрядом католической церкви в деле сопротивления Реформации. Иезуиты создали сеть школ и университетов по всей Европе, выпускники которых вели работу по возвращению «заблудших душ» в лоно Католической церкви. Рассказываем и показываем, что можно узнать, если создать и проанализировать базу данных студентов, которых обучал орден иезуитов, и визуализировать эти данные.
Йоу года
Русский рэп через тематическое моделирование. О чем читает русскоговорящая хип-хоп сцена?
Словосочетание «русский рэпер» — связано со множеством стереотипов. Представьте себе русского рэпера. Что вы видите? Человека в спортивках, окруженного «своими пацанами», или, может, татуированного быка на гелике с золотой цепью в палец толщиной? Разбираемся, кто такие русские рэперы, и о чем они читают на самом деле.
Digital-филология года
Двухсерийное исследование поэзии Маяковского методами корпусной лингвистики. В первой части исследования при помощи Sketch Engine изучаем лирического героя Маяковского до и после революции. Вторая часть исследования посвящена образу России в творчестве Маяковского, а также тому, как поэт Революции оказался несоветским поэтом.
Краудсорсинговая история года
В лес за большими данными: как ваши фотки белок и грибов помогут науке
Информатика биоразнообразия — новая область науки, которой помогают тысячи добровольцев. Чтобы помочь науке — достаточно смартфона. Рассказываем о том, как устроен краудсорсинг биологических данных и как в нем поучаствовать.
Цифровая инвентаризация года
Что не скрывает Конгресс США?
Погружаемся в цифровые коллекции Библиотеки Конгресса США — одного из крупнейших хранилищ человеческого знания. В Библиотеке Конгресса насчитывается 170 млн единиц хранения, включая 24 млн книг, 74 млн рукописей, 15 млн фотографий и 4 млн аудиозаписей. Сколько коллекций Библиотеки Конгресса оцифровано и доступно каждому пользователю интернета?
Социальный датавиз года
Открытые данные ФСИН: число осужденных в России растёт только по наркопреступлениям
Согласно данным ФСИН, с 2005 года в 2,5 раза увеличилось число преступлений, связанных с распространением наркотиков. И наоборот, число осужденных за другие преступления — изнасилования, кражи, вымогательство, грабежи и разбой, — упало более чем вдвое. Действительно ли на общем фоне снижения преступности полиция стала ловить в 2,5 раза больше наркоторговцев?
Лучшая визуализация неравенства
Невидимые кинозвезды: как Голливуд не замечает женщин-режиссеров
10 лет назад «Оскар» за лучшую режиссуру впервые получила женщина — Кэтрин Бигелоу с фильмом «Повелитель бури». Мы провели исследование, проследив динамику упоминаний женщин-режиссеров в статьях популярных киножурналов.
Разработка искусственного интеллекта: какие цели уже достигнуты
#futurology
В 1972 году ученые составили список из 12 задач, которые нужно решить для создания искусственного интеллекта в ближайшие десятилетия. Сейчас, сорок пять лет спустя, мы можем оценить, что из казавшегося тогда важным и сложным, было решено, а что так и осталось актуальной задачей разработки искусственного интеллекта.
На наш взгляд, на данный момент достигнуты 6 из 12 поставленных целей:
✔️ 1. Создание шахматных программ.
✔️ 2. Машинное творчество в области музыки, поэзии, живописи.
◻️ 3. Создание программ, выдерживающих тест Тьюринга.
◻️ 4. Машинное доказательство теорем.
◻️ 5. Создание программ индуктивного вывода.
✔️ 6. Создание вопросно-ответных систем (в том числе систем автоматического реферирования).
✔️ 7. Автоматический перевод.
✔️ 8. Распознавание и синтез речи.
◻️ 9. Автоматическая проверка правильности программ.
✔️ 10. Автоматическое вождение автомобилей.
◻️ 11. Создание роботов-сборщиков, роботов-строителей.
◻️ 12. Создание робота-планетохода для автономной работы в новых условиях.
В посте рассмотрим самые спорные моменты.
Машинное творчество в области музыки, поэзии, живописи
Формально говоря — да. Фактически говоря — нет.
Компьютеры умеют рисовать картины, сочинять стихи и музыку. Ради справедливости нужно сказать, что это так было уже в 1970-х годах. Разница с тем временем касается в первую очередь стоимости периферических устройств.
45 лет назад можно было написать программу, которая создаст мелодию, но трудно было эту мелодию воспроизвести. Компьютер мог написать картину, но трудно было эту картину перенести из памяти в физический мир: принтер был слишком дорогим.
Сейчас с периферией проблем нет, а часто она даже не нужна: общедоступность устройств сделала мир таким, что распечатывать созданное компьютером изображение не нужно, легче посмотреть его на экране смартфона.
Однако, если речь идет про настоящее творчество, сопоставимое с творчеством поэтов и художников, то искусственному интеллекту похвастаться нечем. Что стихи, что картины в исполнении компьютера — это компиляции, воспроизведение, косплей. Придумывать новое микросхемы пока не в состоянии.
Хотя в наше время оказались востребованы именно имитации, и компьютер в этом преуспел. Время и устройство нашли друг друга. Инженерам достаточно того, что стихи рифмуются, а музыка похожа на то, что писал в свое время Бах. Вряд ли кто-то заинтересован в принципиальном прогрессе в этой области. Так что засчитаем искусственному интеллекту балл.
Создание программ, выдерживающих тест Тьюринга
Снова и да и нет.
С одной стороны, чат-боты с того времени сделали огромный шаг вперед. В 1970-е годы «компьютеры, которые общаются с человеком» на практике означало «компьютеры, которые в своей памяти держат все варианты диалоговых ситуаций». То есть для хорошей программы-болталки нужно было вручную описать все возможные вопросы и все возможные ответы на них. При минимальном погружении в тему становится очевидно, что это просто невозможно: число возможных речевых ситуаций бесконечно.
Теперь так никто не делает. Нашёлся другой путь: глубокое обучение. Нейросеть умеет находить в предоставленных ей данных скрытые закономерности, которые позволяют выбирать нужный вариант при ответе на вопрос человека. Существуют такие программы, которые действительно умеют имитировать общение с человеком, поддерживать осмысленный диалог на протяжении обмена несколькими репликами. Всё это стоит занести разработчикам искусственного интеллекта в актив.
В то же время все сообщения о том, что тест Тьюринга пройден — просто кликбейт. В чистом виде тест не пройден. А если бы даже он был пройден, это не означало бы, что в построении интеллектуальных систем произошел принципиальный прорыв. Это была бы еще одна имитация — на этот раз на уровне общения.
Комментарии ко всем остальным задачам — в нашей статье: https://sysblok.ru/futurology/dostigla-li-svoih-celej-razrabotka-iskusstvennogo-intellekta/
Борис Орехов
#futurology
В 1972 году ученые составили список из 12 задач, которые нужно решить для создания искусственного интеллекта в ближайшие десятилетия. Сейчас, сорок пять лет спустя, мы можем оценить, что из казавшегося тогда важным и сложным, было решено, а что так и осталось актуальной задачей разработки искусственного интеллекта.
На наш взгляд, на данный момент достигнуты 6 из 12 поставленных целей:
✔️ 1. Создание шахматных программ.
✔️ 2. Машинное творчество в области музыки, поэзии, живописи.
◻️ 3. Создание программ, выдерживающих тест Тьюринга.
◻️ 4. Машинное доказательство теорем.
◻️ 5. Создание программ индуктивного вывода.
✔️ 6. Создание вопросно-ответных систем (в том числе систем автоматического реферирования).
✔️ 7. Автоматический перевод.
✔️ 8. Распознавание и синтез речи.
◻️ 9. Автоматическая проверка правильности программ.
✔️ 10. Автоматическое вождение автомобилей.
◻️ 11. Создание роботов-сборщиков, роботов-строителей.
◻️ 12. Создание робота-планетохода для автономной работы в новых условиях.
В посте рассмотрим самые спорные моменты.
Машинное творчество в области музыки, поэзии, живописи
Формально говоря — да. Фактически говоря — нет.
Компьютеры умеют рисовать картины, сочинять стихи и музыку. Ради справедливости нужно сказать, что это так было уже в 1970-х годах. Разница с тем временем касается в первую очередь стоимости периферических устройств.
45 лет назад можно было написать программу, которая создаст мелодию, но трудно было эту мелодию воспроизвести. Компьютер мог написать картину, но трудно было эту картину перенести из памяти в физический мир: принтер был слишком дорогим.
Сейчас с периферией проблем нет, а часто она даже не нужна: общедоступность устройств сделала мир таким, что распечатывать созданное компьютером изображение не нужно, легче посмотреть его на экране смартфона.
Однако, если речь идет про настоящее творчество, сопоставимое с творчеством поэтов и художников, то искусственному интеллекту похвастаться нечем. Что стихи, что картины в исполнении компьютера — это компиляции, воспроизведение, косплей. Придумывать новое микросхемы пока не в состоянии.
Хотя в наше время оказались востребованы именно имитации, и компьютер в этом преуспел. Время и устройство нашли друг друга. Инженерам достаточно того, что стихи рифмуются, а музыка похожа на то, что писал в свое время Бах. Вряд ли кто-то заинтересован в принципиальном прогрессе в этой области. Так что засчитаем искусственному интеллекту балл.
Создание программ, выдерживающих тест Тьюринга
Снова и да и нет.
С одной стороны, чат-боты с того времени сделали огромный шаг вперед. В 1970-е годы «компьютеры, которые общаются с человеком» на практике означало «компьютеры, которые в своей памяти держат все варианты диалоговых ситуаций». То есть для хорошей программы-болталки нужно было вручную описать все возможные вопросы и все возможные ответы на них. При минимальном погружении в тему становится очевидно, что это просто невозможно: число возможных речевых ситуаций бесконечно.
Теперь так никто не делает. Нашёлся другой путь: глубокое обучение. Нейросеть умеет находить в предоставленных ей данных скрытые закономерности, которые позволяют выбирать нужный вариант при ответе на вопрос человека. Существуют такие программы, которые действительно умеют имитировать общение с человеком, поддерживать осмысленный диалог на протяжении обмена несколькими репликами. Всё это стоит занести разработчикам искусственного интеллекта в актив.
В то же время все сообщения о том, что тест Тьюринга пройден — просто кликбейт. В чистом виде тест не пройден. А если бы даже он был пройден, это не означало бы, что в построении интеллектуальных систем произошел принципиальный прорыв. Это была бы еще одна имитация — на этот раз на уровне общения.
Комментарии ко всем остальным задачам — в нашей статье: https://sysblok.ru/futurology/dostigla-li-svoih-celej-razrabotka-iskusstvennogo-intellekta/
Борис Орехов
Редакционное расстояние: что это и где используется
#knowhow #glossary
Чаще всего редакционное расстояние (edit distance) применяется в компьютерной лингвистике и биоинформатике. В этих областях нередко возникают задачи, когда надо понять, насколько две строки формально близки. То есть редакционные расстояния говорят не о смысловой близости слов или предложений, а только о близости их формы.
Как вычислить редакционное расстояние
Чтобы узнать редакционное расстояние между двумя строками, нужно посчитать минимальное количество посимвольных операций, которые нужно сделать, чтобы превратить первую строку во вторую. Таких операций всего четыре:
• удаление
• вставка
• замена
• перестановка соседних символов.
В операции может участвовать только один символ в строке. Количество операций — это и есть редакционное расстояние между двумя строками. Простейший пример: чтобы превратить «сон» в «слон», нужно произвести одну операцию: вставить букву «л» после «с».
Виды редакционных расстояний
Есть несколько основных редакционных расстояний. Основное отличие между ними — набор операций, который разрешено использовать. Расстояние Хэмминга разрешает только замены. Расстояние Джаро-Винклера — только перестановки.
Одно из самых известных редакционных расстояний — расстояние Левенштейна, которое разрешает все операции, кроме перестановки.
Попробуем посчитать расстояние Левенштейна между словами «карета» и «ракета». Чтобы превратить карету в ракету, нужно:
1) поменять первую букву — «к» на «р», после этой операции штраф равен 1, и у нас есть слово «какета»
2) поменять третью букву — «р» на «к», после этой операции штраф равен 2, и мы получили нужное слово «ракета».
Расстояние Левенштейна между словами «карета» и «ракета» равно двум.
А расстояние Дамерау-Левенштейна разрешает все четыре операции: замену, вставку, удаление и перестановку соседних символов.
Иногда измеряют пословное расстояние Левенштейна — при таком подходе за единицу принимается не один символ, а одно слово. Тогда между предложениями «Я люблю лингвистику» и «Я люблю компьютерную лингвистику» расстояние будет равно 1, а не 14, как было бы в случае посимвольных операций.
Мы также можем давать разный штраф за разные операции. Например, решить, что мы очень не любим замены символов и давать за них не 1, а 2 балла. В этом случае говорят, что операции имеют разный вес, и называют полученный результат взвешенным расстоянием Левенштейна.
Где применяют редакционное расстояние
В компьютерной лингвистике возникает множество задач, где нужно посчитать формальную меру близости между строками: например, для проверки орфографии, или для сравнения, насколько похожи два предложения. Первые системы автоматической проверки орфографии фактически сводились к подсчету редакционного расстояния Левенштейна или Дамерау-Левенштейна с использованием сложной системы штрафов. Система шла от слова к слову и проверяла, есть ли такое слово в словаре, а когда встречала слово, которого нет в словаре, то пыталась заменить его на наиболее близкое по редакционному расстоянию слово из словаря. Сейчас расстояние Левенштейна редко используется как единственный признак близости, но очень часто как один из.
В биоинформатике редакционные расстояния используются для определения похожести друг на друга разных участков ДНК или РНК, которые в таком случае представляются как последовательность, состоящая из A, G, C, U и T — это первые буквы четырех азотистых основания, которые могут входить в состав ДНК или РНК: аденин, гуанин и цитозин, урацил и тимин.
Бывают и неочевидные применения, например, определение, на что больше похожа буква на нечеткой фотографии текста, на «Л» или «П». В таком случае буквы представляют как стоящие друг над другом строки, состоящие из черных и белых пикселей.
https://sysblok.ru/knowhow/chto-takoe-redakcionnoe-rasstojanie/
https://sysblok.ru/glossary/rasstojanie-levenshtejna/
Ася Ройтберг
#knowhow #glossary
Чаще всего редакционное расстояние (edit distance) применяется в компьютерной лингвистике и биоинформатике. В этих областях нередко возникают задачи, когда надо понять, насколько две строки формально близки. То есть редакционные расстояния говорят не о смысловой близости слов или предложений, а только о близости их формы.
Как вычислить редакционное расстояние
Чтобы узнать редакционное расстояние между двумя строками, нужно посчитать минимальное количество посимвольных операций, которые нужно сделать, чтобы превратить первую строку во вторую. Таких операций всего четыре:
• удаление
• вставка
• замена
• перестановка соседних символов.
В операции может участвовать только один символ в строке. Количество операций — это и есть редакционное расстояние между двумя строками. Простейший пример: чтобы превратить «сон» в «слон», нужно произвести одну операцию: вставить букву «л» после «с».
Виды редакционных расстояний
Есть несколько основных редакционных расстояний. Основное отличие между ними — набор операций, который разрешено использовать. Расстояние Хэмминга разрешает только замены. Расстояние Джаро-Винклера — только перестановки.
Одно из самых известных редакционных расстояний — расстояние Левенштейна, которое разрешает все операции, кроме перестановки.
Попробуем посчитать расстояние Левенштейна между словами «карета» и «ракета». Чтобы превратить карету в ракету, нужно:
1) поменять первую букву — «к» на «р», после этой операции штраф равен 1, и у нас есть слово «какета»
2) поменять третью букву — «р» на «к», после этой операции штраф равен 2, и мы получили нужное слово «ракета».
Расстояние Левенштейна между словами «карета» и «ракета» равно двум.
А расстояние Дамерау-Левенштейна разрешает все четыре операции: замену, вставку, удаление и перестановку соседних символов.
Иногда измеряют пословное расстояние Левенштейна — при таком подходе за единицу принимается не один символ, а одно слово. Тогда между предложениями «Я люблю лингвистику» и «Я люблю компьютерную лингвистику» расстояние будет равно 1, а не 14, как было бы в случае посимвольных операций.
Мы также можем давать разный штраф за разные операции. Например, решить, что мы очень не любим замены символов и давать за них не 1, а 2 балла. В этом случае говорят, что операции имеют разный вес, и называют полученный результат взвешенным расстоянием Левенштейна.
Где применяют редакционное расстояние
В компьютерной лингвистике возникает множество задач, где нужно посчитать формальную меру близости между строками: например, для проверки орфографии, или для сравнения, насколько похожи два предложения. Первые системы автоматической проверки орфографии фактически сводились к подсчету редакционного расстояния Левенштейна или Дамерау-Левенштейна с использованием сложной системы штрафов. Система шла от слова к слову и проверяла, есть ли такое слово в словаре, а когда встречала слово, которого нет в словаре, то пыталась заменить его на наиболее близкое по редакционному расстоянию слово из словаря. Сейчас расстояние Левенштейна редко используется как единственный признак близости, но очень часто как один из.
В биоинформатике редакционные расстояния используются для определения похожести друг на друга разных участков ДНК или РНК, которые в таком случае представляются как последовательность, состоящая из A, G, C, U и T — это первые буквы четырех азотистых основания, которые могут входить в состав ДНК или РНК: аденин, гуанин и цитозин, урацил и тимин.
Бывают и неочевидные применения, например, определение, на что больше похожа буква на нечеткой фотографии текста, на «Л» или «П». В таком случае буквы представляют как стоящие друг над другом строки, состоящие из черных и белых пикселей.
https://sysblok.ru/knowhow/chto-takoe-redakcionnoe-rasstojanie/
https://sysblok.ru/glossary/rasstojanie-levenshtejna/
Ася Ройтберг
Взгляд на ИИ из Кремниевой долины
Пятый выпуск подкаста Неопознанный Искусственный Интеллект — с Николаем Любимовым.
#podcasts
Николай сменил работу в Яндексе на ИИ-стартап в Кремниевой долине. Мы узнали у Николая, почему разметка данных — узкое горлышко в развитии ИИ и горячая тема для стартапов, как обстоят дела с самопрограммирующимися нейросетями и когда роботы начнут основывать коммерческие компании без людей.
В этом выпуске:
00:57 — О госте
02:29 — Почему диплернинг называется диплернингом
03:44 — «Узкое горлышко» разметки данных в современном ИИ
07:00 — Современный ИИ глазами стартапера из Кремниевой долины
14:35 — ИИ без «железного человека» и «звездных войн»: как ставить задачу четко
23:02 — ИИ для беспилотников: на чем обучать?
26:03 — Должен ли сильный ИИ говорить по-человечески?
35:44 — Фантазируем о мире, в котором победил ИИ
40:49 — Умерла ли «старая школа» ИИ
51:20 — Можно ли прийти к ИИ через моделирование мозга: нейрофизиология и антропоморфность
53:05 — Самоорганизующийся ИИ и самопрограммирующиеся нейросети
Хайлайты выпуска
1. Почему разметка — горячая тема
Интеллектуальность современных систем машинного обучения сильно связана с «интеллектуальностью» данных, на которых они обучались. Поэтому часто разработка умных нейросетей упирается в простой человеческий труд по разметке и сортировке данных.
Этот труд можно сделать быстрее с помощью … опять-таки машинного обучения. Например, можно не просто размечать данные, а постоянно оценивать, какие примеры нужнее всего, какие дадут наибольший прирост в качестве вашей модели. Разработка таких систем «активного обучения» — горячая тема в современном Data Science.
2. Симуляция реальности — как путь к более мощному искусственному интеллекту
Робота-помощника можно аккуратно приучать к существованию в сложной среде. Чтобы среда постепенно приближалась по сложности к реальному миру. Например, для начала — внутри персонального компьютера.
Разрешить такому роботу читать, копировать и записывать файлы — и пусть учится принимать разнообразные команды. Постепенно расширяя их спектр. Но «надо аккуратно, чтобы он не взломал Пентагон сразу».
3. Чего ждать от будущего
Прорыв произойдет, когда роботы научатся выполнять большие составные задачи, разбивая их на подзадачи и самостоятельно находя пути к решению. Например, когда робот сможет выполнять роль младшего разработчика: прочитать задание на естественном языке, понять, какую программу написать, какие данные запросить, как эта программа будет взаимодействовать с уже имеющимися системами внутри и вне компании и т.п. Важна именно способность такого робота оперировать в большой и сложной среде вокруг него, ничего не разрушая.
А закончится все тем, что «появятся peopleless-компания, которые основаны искусственным интеллектом».
Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.
Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
Пятый выпуск подкаста Неопознанный Искусственный Интеллект — с Николаем Любимовым.
#podcasts
Николай сменил работу в Яндексе на ИИ-стартап в Кремниевой долине. Мы узнали у Николая, почему разметка данных — узкое горлышко в развитии ИИ и горячая тема для стартапов, как обстоят дела с самопрограммирующимися нейросетями и когда роботы начнут основывать коммерческие компании без людей.
В этом выпуске:
00:57 — О госте
02:29 — Почему диплернинг называется диплернингом
03:44 — «Узкое горлышко» разметки данных в современном ИИ
07:00 — Современный ИИ глазами стартапера из Кремниевой долины
14:35 — ИИ без «железного человека» и «звездных войн»: как ставить задачу четко
23:02 — ИИ для беспилотников: на чем обучать?
26:03 — Должен ли сильный ИИ говорить по-человечески?
35:44 — Фантазируем о мире, в котором победил ИИ
40:49 — Умерла ли «старая школа» ИИ
51:20 — Можно ли прийти к ИИ через моделирование мозга: нейрофизиология и антропоморфность
53:05 — Самоорганизующийся ИИ и самопрограммирующиеся нейросети
Хайлайты выпуска
1. Почему разметка — горячая тема
Интеллектуальность современных систем машинного обучения сильно связана с «интеллектуальностью» данных, на которых они обучались. Поэтому часто разработка умных нейросетей упирается в простой человеческий труд по разметке и сортировке данных.
Этот труд можно сделать быстрее с помощью … опять-таки машинного обучения. Например, можно не просто размечать данные, а постоянно оценивать, какие примеры нужнее всего, какие дадут наибольший прирост в качестве вашей модели. Разработка таких систем «активного обучения» — горячая тема в современном Data Science.
2. Симуляция реальности — как путь к более мощному искусственному интеллекту
Робота-помощника можно аккуратно приучать к существованию в сложной среде. Чтобы среда постепенно приближалась по сложности к реальному миру. Например, для начала — внутри персонального компьютера.
Разрешить такому роботу читать, копировать и записывать файлы — и пусть учится принимать разнообразные команды. Постепенно расширяя их спектр. Но «надо аккуратно, чтобы он не взломал Пентагон сразу».
3. Чего ждать от будущего
Прорыв произойдет, когда роботы научатся выполнять большие составные задачи, разбивая их на подзадачи и самостоятельно находя пути к решению. Например, когда робот сможет выполнять роль младшего разработчика: прочитать задание на естественном языке, понять, какую программу написать, какие данные запросить, как эта программа будет взаимодействовать с уже имеющимися системами внутри и вне компании и т.п. Важна именно способность такого робота оперировать в большой и сложной среде вокруг него, ничего не разрушая.
А закончится все тем, что «появятся peopleless-компания, которые основаны искусственным интеллектом».
Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.
Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
«Нет!» регулированию просветительской деятельности
Госдума готовится принять законопроект, который позволит правительству поставить просветительскую деятельность под свой полный контроль. Это значит, что любой пост, видео или подкаст о новых исследованиях, идеях ученых и их работе должен будет соответствовать требованиям государства. Каждое научно-популярное издание, (видео)блог или книга подпадают под этот законопроект.
Почему этот законопроект вреден и опасен? 😡
— Во-первых, это сильно затруднит работу популяризаторов. Многие предпочтут вовсе отказаться от просветительской работы, если им потребуется согласовывать содержание своих лекций, видео и книг.
—Во-вторых, максимально широкие формулировки позволяют считать просветительской деятельностью что угодно, а в ее рамках запрещается давать «недостоверные сведения об исторических, о национальных, религиозных и культурных традициях народов». Правда, непонятно, какие именно сведения будут считаться недостоверными и кто будет это решать.
— В-третьих, пояснительная записка к законопроекту рассказывает об угрозе «антироссийской пропаганды» среди школьников и студентов, а также о «подрыве конституционного строя». Обычно такая риторика означает одно: закон будет применяться для репрессий против тех, кто не лоялен власти.
Что думают ученые? 🧐
Михаил Гельфанд, биоинформатик, доктор биологических наук: «Закон глуп и безграмотен. Его последовательное применение невозможно, а избирательное подвешивает угрозу наказания над любым, занимающимся просветительской деятельностью — от лекторов и организаторов мероприятий до библиотек и клубов, ставших площадками этих мероприятий»
«Системный Блокъ» попросил прокомментировать законопроект известного популяризатора науки, лингвиста, кандидата филологических наук, лауреата премии «Просветитель» Александра Пиперски. Он считает, что закон может демотивировать многих активных просветителей. Полную версию интервью с Александром Пиперски смотрите ниже.
И что делать? 🤔
Уже 21 января законопроект будут рассматривать во втором чтении. Если вы по-прежнему хотите читать «Системный Блокъ» (и другие научно-популярные издания), смотреть лекции ведущих ученых и читать их книги, подпишите петицию против поправок о просветительской деятельности.
Госдума готовится принять законопроект, который позволит правительству поставить просветительскую деятельность под свой полный контроль. Это значит, что любой пост, видео или подкаст о новых исследованиях, идеях ученых и их работе должен будет соответствовать требованиям государства. Каждое научно-популярное издание, (видео)блог или книга подпадают под этот законопроект.
Почему этот законопроект вреден и опасен? 😡
— Во-первых, это сильно затруднит работу популяризаторов. Многие предпочтут вовсе отказаться от просветительской работы, если им потребуется согласовывать содержание своих лекций, видео и книг.
—Во-вторых, максимально широкие формулировки позволяют считать просветительской деятельностью что угодно, а в ее рамках запрещается давать «недостоверные сведения об исторических, о национальных, религиозных и культурных традициях народов». Правда, непонятно, какие именно сведения будут считаться недостоверными и кто будет это решать.
— В-третьих, пояснительная записка к законопроекту рассказывает об угрозе «антироссийской пропаганды» среди школьников и студентов, а также о «подрыве конституционного строя». Обычно такая риторика означает одно: закон будет применяться для репрессий против тех, кто не лоялен власти.
Что думают ученые? 🧐
Михаил Гельфанд, биоинформатик, доктор биологических наук: «Закон глуп и безграмотен. Его последовательное применение невозможно, а избирательное подвешивает угрозу наказания над любым, занимающимся просветительской деятельностью — от лекторов и организаторов мероприятий до библиотек и клубов, ставших площадками этих мероприятий»
«Системный Блокъ» попросил прокомментировать законопроект известного популяризатора науки, лингвиста, кандидата филологических наук, лауреата премии «Просветитель» Александра Пиперски. Он считает, что закон может демотивировать многих активных просветителей. Полную версию интервью с Александром Пиперски смотрите ниже.
И что делать? 🤔
Уже 21 января законопроект будут рассматривать во втором чтении. Если вы по-прежнему хотите читать «Системный Блокъ» (и другие научно-популярные издания), смотреть лекции ведущих ученых и читать их книги, подпишите петицию против поправок о просветительской деятельности.
YouTube
"Или половину посадят, или будет пшик": обсуждаем поправки о просветителях с Александром Пиперски
Что не так с современным машинным обучением?
Шестой выпуск подкаста Неопознанный Искусственный Интеллект — с Дмитрием Ветровым
#podcasts
Почему современное машинное обучение стоит «примерно на уровне естественных наук XVIII века»? Могут ли нейросети начать закреплять внутри себя выученные знания? Почему опасно игнорировать необъяснимые «странности» нейросетей? В новом выпуске подкаста «Неопознанный искусственный интеллект» мы поговорили с Дмитрием Ветровым — профессором-исследователем НИУ ВШЭ, заведующий Центром глубинного обучения и байесовских методов.
В этом выпуске:
01:32 — Что такое байесовские методы и зачем они в машинном обучении
07:45 — Машинное обучение как «недонаука»: современное состояние ИИ
10:18 — Вредят ли корпорации поиску новых методов машинного обучения
12:29 — GPT-3, мультидоменный ИИ, «сильный» ИИ
18:29 — Когда можно доверить ИИ судьбоносные решения
20:57 — Смена технологической парадигмы в разработке ИИ
22:28 — Стоит ли помнить про онтологии и возможны ли гибриды нейросетей и символьного ИИ
25:19 — Как открыть «черный ящик»: проблема интерпретируемости нейросетей
28:06 — Пересадка из Яндекс.Такси в Яндекс.Толоку: разметка данных для машинного обучения
31:08 — Должен ли ИИ быть похож на мозг, а его разработчики — следовать за открытиями нейрофизиологов?
33:33 — Чем заменить тест Тьюринга.
40:42 — Блиц: самые крутые книжки и самые эпичные провалы в области ИИ
3 самые крутые книжки по мнению Дмитрия
1. Christopher M. Bishop — Pattern Recognition and Machine Learning
2. Kevin P. Murphy — Machine Learning: A Probabilistic Perspective
3. David J. C. MacKay — Information Theory, Inference and Learning Algorithms
Хайлайты выпуска
Если классическую статистику можно сравнить с классической физикой, то байесовские методы — своеобразная квантовая механика в области машинного обучения и матстатистики.
Хотя нейросети работают хорошо, есть большая проблема — сложно теоретически обосновать их работу. Нейросетевые модели содержат миллионы параметров, а обучаются по выборкам размером в десятки или сотни тысяч объектов. Размер обучающей выборки меньше, чем число весов нейронной сети. Классическая статистика здесь неприменима. А вот байесовская может помочь.
Когда нейросеть обучилась на какой-то выборке до предела и доля ошибок перестает падать, внутри нейросети продолжают происходить интересные процессы. Их можно назвать "консолидацией": уже выученная информация переупаковывается в более эффективном виде. Нейросеть как бы пытается упростить выученные закономерности, выразив их менее сложным образом.
Где слушать?
Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.
Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
Шестой выпуск подкаста Неопознанный Искусственный Интеллект — с Дмитрием Ветровым
#podcasts
Почему современное машинное обучение стоит «примерно на уровне естественных наук XVIII века»? Могут ли нейросети начать закреплять внутри себя выученные знания? Почему опасно игнорировать необъяснимые «странности» нейросетей? В новом выпуске подкаста «Неопознанный искусственный интеллект» мы поговорили с Дмитрием Ветровым — профессором-исследователем НИУ ВШЭ, заведующий Центром глубинного обучения и байесовских методов.
В этом выпуске:
01:32 — Что такое байесовские методы и зачем они в машинном обучении
07:45 — Машинное обучение как «недонаука»: современное состояние ИИ
10:18 — Вредят ли корпорации поиску новых методов машинного обучения
12:29 — GPT-3, мультидоменный ИИ, «сильный» ИИ
18:29 — Когда можно доверить ИИ судьбоносные решения
20:57 — Смена технологической парадигмы в разработке ИИ
22:28 — Стоит ли помнить про онтологии и возможны ли гибриды нейросетей и символьного ИИ
25:19 — Как открыть «черный ящик»: проблема интерпретируемости нейросетей
28:06 — Пересадка из Яндекс.Такси в Яндекс.Толоку: разметка данных для машинного обучения
31:08 — Должен ли ИИ быть похож на мозг, а его разработчики — следовать за открытиями нейрофизиологов?
33:33 — Чем заменить тест Тьюринга.
40:42 — Блиц: самые крутые книжки и самые эпичные провалы в области ИИ
3 самые крутые книжки по мнению Дмитрия
1. Christopher M. Bishop — Pattern Recognition and Machine Learning
2. Kevin P. Murphy — Machine Learning: A Probabilistic Perspective
3. David J. C. MacKay — Information Theory, Inference and Learning Algorithms
Хайлайты выпуска
Если классическую статистику можно сравнить с классической физикой, то байесовские методы — своеобразная квантовая механика в области машинного обучения и матстатистики.
Хотя нейросети работают хорошо, есть большая проблема — сложно теоретически обосновать их работу. Нейросетевые модели содержат миллионы параметров, а обучаются по выборкам размером в десятки или сотни тысяч объектов. Размер обучающей выборки меньше, чем число весов нейронной сети. Классическая статистика здесь неприменима. А вот байесовская может помочь.
Когда нейросеть обучилась на какой-то выборке до предела и доля ошибок перестает падать, внутри нейросети продолжают происходить интересные процессы. Их можно назвать "консолидацией": уже выученная информация переупаковывается в более эффективном виде. Нейросеть как бы пытается упростить выученные закономерности, выразив их менее сложным образом.
Где слушать?
Слушайте выпуск на Яндекс. Музыке, Apple Podcasts, Google Podcasts или в подкастах ВК.
Расшифровка и дополнительные материалы — на странице подкаста на сайте «Системного Блока».
Математика протестов: тест о штрафах и задержаниях митингующих в России
Новая серия протестов по всей России стала рекордной по числу задержаний и уровню полицейского насилия. В первый же день митингов счетчик задержанных от ОВД-Инфо перевалил за четырехзначное число — и продолжал расти.
Мы изучили статистику ОВД-Инфо как по последним акциям, так и по протестной активности в предыдущие годы. В этом тесте:
— Полицейские рекорды протестной волны
— Свежая статистика по штрафам
— История ковидных ограничений протестной активности
— География протестов и региональные особенности
Узнайте, насколько хорошо вы представляете размах протестов и реакции на них
https://sysblok.ru/test/matematika-protestov/
Новая серия протестов по всей России стала рекордной по числу задержаний и уровню полицейского насилия. В первый же день митингов счетчик задержанных от ОВД-Инфо перевалил за четырехзначное число — и продолжал расти.
Мы изучили статистику ОВД-Инфо как по последним акциям, так и по протестной активности в предыдущие годы. В этом тесте:
— Полицейские рекорды протестной волны
— Свежая статистика по штрафам
— История ковидных ограничений протестной активности
— География протестов и региональные особенности
Узнайте, насколько хорошо вы представляете размах протестов и реакции на них
https://sysblok.ru/test/matematika-protestov/
Определяем дату написания картины онлайн
#knowhow #research
Когда цифровизация стала глобальным трендом, в открытом доступе появились тематические датасеты, которые состоят из десятков тысяч картин различных авторов и эпох. Работая с такими датасетами, можно генерировать дополнительные метаданные — в нашем случаем это возраст изображений, тем самым автоматизируя работу искусствоведов.
Возможность определять возраст или стиль изображений полезна не только искусствоведам и коллекционерам. С помощью этого инструмента можно изучать тенденции современного искусства и выявлять закономерности, которые позволяют понять, к стилю какой из эпох более всего склонен автор.
Задача и стратегии ее решения
Ключевая фигура в решении задачи — сверточная нейронная сеть для выделения признаков на изображениях. Рассматривались архитектуры ResNet18 и VGG-19, однако последняя дала лучшие результаты.
Если не углубляться в теоретические основы глубокого обучения, то сверточные сети можно описать как алгоритм последовательного сжатия изображений, который способен выделять их ключевые особенности на разных уровнях абстракции (подробнее можно почитать на хабре).
Примененив сверточную сеть с обрезанными полносвязными слоями, мы вычисляем матрицу Грама, а также применяем классификацию или регрессию. В нашем случае в роли модели классификатора выступает SVM.
Матрица Грама является специальным представлением изображения — это матрица попарных скалярных произведения численного значения пикселей. Её использование позволяет конвертировать преобразованную сверточной сетью картину в формат, удобный для определения стиля. Матрица Грама сглаживает пространственную структуру, позволяя получить больше информации о текстуре изображения, чем о присутствующих на ней конкретных объектах.
В итоге оказалось, что наилучший MSE даёт VGG-19, а лучшее значение F1-меры достигается той же сетью с батч-нормализацией. Использование F1 в данной задаче обусловлено отсутствием в выбранном датасете баланса классов, каждый из которых представлял собой временной промежуток в 50 лет. Применение этой метрики позволяет более объективно оценить качество моделей.
Результаты и их интерпретация
Использование матрицы Грама позволило почти в два раза улучшить качество моделей на представленном датасете. Для многих классов ошибочных классификаций совсем немного.
Однако использование информации о стиле для определения временного отрезка гарантированно работает только для эпохи премодерна, которой характерно последовательное совершенствование техник изобразительного искусства.
Наш небольшой эксперимент показал, что задача определения возраста картины может быть решена посредством использования методов искусственного интеллекта. Следующий этап — увеличение количества данных, усложнение модели, масштабирование задачи на XX и XXI века, а также увеличение количества временных промежутков.
Код проекта можно найти на github.
Модель работает онлайн — протестировать можно здесь.
https://sysblok.ru/knowhow/opredeljaem-datu-napisanija-kartiny-onlajn-bez-registracii-i-sms/
Дарья Петрова, Вадим Порватов, Валерий Покровский
#knowhow #research
Когда цифровизация стала глобальным трендом, в открытом доступе появились тематические датасеты, которые состоят из десятков тысяч картин различных авторов и эпох. Работая с такими датасетами, можно генерировать дополнительные метаданные — в нашем случаем это возраст изображений, тем самым автоматизируя работу искусствоведов.
Возможность определять возраст или стиль изображений полезна не только искусствоведам и коллекционерам. С помощью этого инструмента можно изучать тенденции современного искусства и выявлять закономерности, которые позволяют понять, к стилю какой из эпох более всего склонен автор.
Задача и стратегии ее решения
Ключевая фигура в решении задачи — сверточная нейронная сеть для выделения признаков на изображениях. Рассматривались архитектуры ResNet18 и VGG-19, однако последняя дала лучшие результаты.
Если не углубляться в теоретические основы глубокого обучения, то сверточные сети можно описать как алгоритм последовательного сжатия изображений, который способен выделять их ключевые особенности на разных уровнях абстракции (подробнее можно почитать на хабре).
Примененив сверточную сеть с обрезанными полносвязными слоями, мы вычисляем матрицу Грама, а также применяем классификацию или регрессию. В нашем случае в роли модели классификатора выступает SVM.
Матрица Грама является специальным представлением изображения — это матрица попарных скалярных произведения численного значения пикселей. Её использование позволяет конвертировать преобразованную сверточной сетью картину в формат, удобный для определения стиля. Матрица Грама сглаживает пространственную структуру, позволяя получить больше информации о текстуре изображения, чем о присутствующих на ней конкретных объектах.
В итоге оказалось, что наилучший MSE даёт VGG-19, а лучшее значение F1-меры достигается той же сетью с батч-нормализацией. Использование F1 в данной задаче обусловлено отсутствием в выбранном датасете баланса классов, каждый из которых представлял собой временной промежуток в 50 лет. Применение этой метрики позволяет более объективно оценить качество моделей.
Результаты и их интерпретация
Использование матрицы Грама позволило почти в два раза улучшить качество моделей на представленном датасете. Для многих классов ошибочных классификаций совсем немного.
Однако использование информации о стиле для определения временного отрезка гарантированно работает только для эпохи премодерна, которой характерно последовательное совершенствование техник изобразительного искусства.
Наш небольшой эксперимент показал, что задача определения возраста картины может быть решена посредством использования методов искусственного интеллекта. Следующий этап — увеличение количества данных, усложнение модели, масштабирование задачи на XX и XXI века, а также увеличение количества временных промежутков.
Код проекта можно найти на github.
Модель работает онлайн — протестировать можно здесь.
https://sysblok.ru/knowhow/opredeljaem-datu-napisanija-kartiny-onlajn-bez-registracii-i-sms/
Дарья Петрова, Вадим Порватов, Валерий Покровский
Посты о смерти: оценить нельзя игнорировать
#digitalmemory #society
Все видели мемы «Проспал дистанционку» с траурной свечкой, «Здоровья погибшим» и «Press F to pay respect»? Кому-то они покажутся циничными, но пользователи могут использовать черный юмор из-за фрустрации и непонимания, как реагировать на трагические новости.
Лайк публикациям о смерти выражает скорбь или неуважение? Нужно ли делиться горем с подписчиками? Когда уместны траурные посты? Эксперт по цифровому этикету Ольга Лукинова отмечает, что эти вопросы вызывают бурные дискуссии, потому что негласные правила выражения негативных эмоций и реагирования на печальные события еще не успели сформироваться.
Исследователь Анна Вагнер выделяет три основные проблемы digital death в сетевом этикете:
— нормы выражения скорби в соцсетях,
— содержание и форма траурных постов,
— реакция и взаимодействие с такими публикациями.
Проблема откровенности
Частное выражение скорби в связи с утратой близкого человека постепенно становится обыденным явлением. Социальные сети предоставляют возможность сделать из аккаунта умершего памятную страницу (подробнее об идее digital afterlife).
Однако, истории в Instagram блогера Екатерины Диденко, в которых она подробно освещала обстоятельства смерти своего мужа и двоих друзей от испарений сухого льда на вечеринке в честь дня рождения, вызвали волну гнева. Ольга Лукинова выделяет две основные причины недовольства в подобных случаях:
— излишняя откровенность и неуместное вовлечение аудитории в переживание негативного опыта,
— подозрения в циничном пиаре и желании вызвать хайп.
Трагедия принесла Диденко 600 тыс. новых подписчиков. Тем не менее, стоит обратить внимание на этичность не только действий блогера, но и реакции зрителей. Поскольку нет универсальных правил скорби в сети, Екатерина не могла их нарушить, а значит, негативные комментарии попросту бессмысленны. Более того, пользователи, которые их оставляют, сами проявляют неуважение к чужому горю и личным границам.
Большой палец решает
В цифровой среде большой палец вверх или вниз — простейший способ выразить свое отношение к чему-либо. Правда, во многих соцсетях дизлайк отсутствует, и пользователь делает выбор, ставить ли палец вверх или проигнорировать сообщение.
Слишком простые реакции на сообщения о трагических событиях вызывают много вопросов. Означает ли лайк под некрологом сочувствие или радость уходу из жизни этого человека? Означает ли дизлайк грусть из-за смерти или неприязнь к усопшему? Ольга Лукинова в своем телеграм-канале «Цифровой этикет» провела опрос, который показал: 78% респондентов считают палец вверх или сердечко позитивной реакцией, неуместной в постах о смерти.
Альтернативы лайку
Facebook расширил выбор реакций на пост, добавив эмоции грусти, злости, удивления, смеха в качестве альтернативы лайку. Разные реакции есть и в историях в Instagram, но публикации в профиле по-прежнему можно оценить только символом сердечка.
Иногда пользователи под скорбными постами пишут в комментариях краткое «R.I.P.», что означает «покойся с миром», или просто букву F — эта реакция стала своеобразным мемом после выхода в 2014 году игры «Call of Duty: Advanced Warfare», где фигурировала фраза «Press F to pay respects» («Нажмите F, чтобы отдать дань уважения»).
Отношение к лаконичным реакциям разнится. Одни считают, что это удобно и что даже краткая поддержка имеет значение, другие — что плачущего смайлика недостаточно, поэтому следует либо промолчать, либо написать содержательный и осмысленный комментарий.
Важно помнить, что траурный этикет в сети пока не сформировался, а потому каждый действует так, как считает нужным. Три принципа, которых следует придерживаться всем уже сейчас, — не нарушать чьих-либо личных границ в цифровой среде, не осуждать чужие способы переживания утраты, уважать умерших и пострадавших людей, о которых идет речь.
Больше подробностей и примеров — в нашей статье: https://sysblok.ru/digitalmemory/posty-o-smerti-ocenit-nelzja-ignorirovat/
Ирина Родионова
#digitalmemory #society
Все видели мемы «Проспал дистанционку» с траурной свечкой, «Здоровья погибшим» и «Press F to pay respect»? Кому-то они покажутся циничными, но пользователи могут использовать черный юмор из-за фрустрации и непонимания, как реагировать на трагические новости.
Лайк публикациям о смерти выражает скорбь или неуважение? Нужно ли делиться горем с подписчиками? Когда уместны траурные посты? Эксперт по цифровому этикету Ольга Лукинова отмечает, что эти вопросы вызывают бурные дискуссии, потому что негласные правила выражения негативных эмоций и реагирования на печальные события еще не успели сформироваться.
Исследователь Анна Вагнер выделяет три основные проблемы digital death в сетевом этикете:
— нормы выражения скорби в соцсетях,
— содержание и форма траурных постов,
— реакция и взаимодействие с такими публикациями.
Проблема откровенности
Частное выражение скорби в связи с утратой близкого человека постепенно становится обыденным явлением. Социальные сети предоставляют возможность сделать из аккаунта умершего памятную страницу (подробнее об идее digital afterlife).
Однако, истории в Instagram блогера Екатерины Диденко, в которых она подробно освещала обстоятельства смерти своего мужа и двоих друзей от испарений сухого льда на вечеринке в честь дня рождения, вызвали волну гнева. Ольга Лукинова выделяет две основные причины недовольства в подобных случаях:
— излишняя откровенность и неуместное вовлечение аудитории в переживание негативного опыта,
— подозрения в циничном пиаре и желании вызвать хайп.
Трагедия принесла Диденко 600 тыс. новых подписчиков. Тем не менее, стоит обратить внимание на этичность не только действий блогера, но и реакции зрителей. Поскольку нет универсальных правил скорби в сети, Екатерина не могла их нарушить, а значит, негативные комментарии попросту бессмысленны. Более того, пользователи, которые их оставляют, сами проявляют неуважение к чужому горю и личным границам.
Большой палец решает
В цифровой среде большой палец вверх или вниз — простейший способ выразить свое отношение к чему-либо. Правда, во многих соцсетях дизлайк отсутствует, и пользователь делает выбор, ставить ли палец вверх или проигнорировать сообщение.
Слишком простые реакции на сообщения о трагических событиях вызывают много вопросов. Означает ли лайк под некрологом сочувствие или радость уходу из жизни этого человека? Означает ли дизлайк грусть из-за смерти или неприязнь к усопшему? Ольга Лукинова в своем телеграм-канале «Цифровой этикет» провела опрос, который показал: 78% респондентов считают палец вверх или сердечко позитивной реакцией, неуместной в постах о смерти.
Альтернативы лайку
Facebook расширил выбор реакций на пост, добавив эмоции грусти, злости, удивления, смеха в качестве альтернативы лайку. Разные реакции есть и в историях в Instagram, но публикации в профиле по-прежнему можно оценить только символом сердечка.
Иногда пользователи под скорбными постами пишут в комментариях краткое «R.I.P.», что означает «покойся с миром», или просто букву F — эта реакция стала своеобразным мемом после выхода в 2014 году игры «Call of Duty: Advanced Warfare», где фигурировала фраза «Press F to pay respects» («Нажмите F, чтобы отдать дань уважения»).
Отношение к лаконичным реакциям разнится. Одни считают, что это удобно и что даже краткая поддержка имеет значение, другие — что плачущего смайлика недостаточно, поэтому следует либо промолчать, либо написать содержательный и осмысленный комментарий.
Важно помнить, что траурный этикет в сети пока не сформировался, а потому каждый действует так, как считает нужным. Три принципа, которых следует придерживаться всем уже сейчас, — не нарушать чьих-либо личных границ в цифровой среде, не осуждать чужие способы переживания утраты, уважать умерших и пострадавших людей, о которых идет речь.
Больше подробностей и примеров — в нашей статье: https://sysblok.ru/digitalmemory/posty-o-smerti-ocenit-nelzja-ignorirovat/
Ирина Родионова