Попробуем оживить этот канал! Торжественно клянусь, что он не превратится в хроники ChatGPT, (но будет много на эту тему, да).
Сегодня — подкаст «Книжный чел» с Гришей Мастридером:
https://www.youtube.com/watch?v=bu1-omo296s
Первый раз мы с ним очень интересно поговорили в 2019 году, сейчас настало время повторить (но не повториться!). Заимствования, ударение в слове «кринж», изменения в языке, ну и ChatGPT, конечно.
Сегодня — подкаст «Книжный чел» с Гришей Мастридером:
https://www.youtube.com/watch?v=bu1-omo296s
Первый раз мы с ним очень интересно поговорили в 2019 году, сейчас настало время повторить (но не повториться!). Заимствования, ударение в слове «кринж», изменения в языке, ну и ChatGPT, конечно.
YouTube
Александр Пиперски: ChatGPT и русский язык. Книжный чел #99
Курс "Цифровой креатор": https://academy.mustreader.com/creatorcourse2023
Образовательный эфир "Креатор": https://www.youtube.com/live/4x2Od9LjEaw?feature=share
Телеграм-рассылка «Цифровой креатор»: https://yangx.top/Digital_Creator_Bot
Целый час мы с лауреатом…
Образовательный эфир "Креатор": https://www.youtube.com/live/4x2Od9LjEaw?feature=share
Телеграм-рассылка «Цифровой креатор»: https://yangx.top/Digital_Creator_Bot
Целый час мы с лауреатом…
БЕЗУМНЫЙ ЗООПАРК
Что общего между голубем и телёнком? Общее между ними — это дельфин.
Пророк Иона, по-древнееврейски yōwnāh, провёл трое суток в желудке большой рыбы, dāḡ gāḏōwl. Мы привыкли считать, что это формально говоря не рыба, а кит, но про её точную видовую принадлежность учёные разных специальностей спорят уже много веков: может, какой-то кит, может, белая акула (как из «Челюстей»), а может, это вообще выдумка. Но по-турецки именем Ионы названо то крупное животное, которое по-настоящему часто встречается в Средиземном море, — дельфин: yunus balığı, буквально ‘Ионина рыба’, а обычно просто yunus, буквально ‘Иона’. Всё бы хорошо, но имя пророка yōwnāh по-древнееврейски значит ‘голубь’.
Древнегреческий дельфин — δελφίς — содержит индоевропейский корень *gʷelbʰ-. Однокоренное ему русское слово — это жёлоб, а δελφίς — это буквально ‘желобной’: он живородящий, то есть рождает своих детёнышей из жёлоба. А в германских языках от того же корня происходит название детёныша — англ. calf, нем. Kalb ‘телёнок’
Что общего между голубем и телёнком? Общее между ними — это дельфин.
Пророк Иона, по-древнееврейски yōwnāh, провёл трое суток в желудке большой рыбы, dāḡ gāḏōwl. Мы привыкли считать, что это формально говоря не рыба, а кит, но про её точную видовую принадлежность учёные разных специальностей спорят уже много веков: может, какой-то кит, может, белая акула (как из «Челюстей»), а может, это вообще выдумка. Но по-турецки именем Ионы названо то крупное животное, которое по-настоящему часто встречается в Средиземном море, — дельфин: yunus balığı, буквально ‘Ионина рыба’, а обычно просто yunus, буквально ‘Иона’. Всё бы хорошо, но имя пророка yōwnāh по-древнееврейски значит ‘голубь’.
Древнегреческий дельфин — δελφίς — содержит индоевропейский корень *gʷelbʰ-. Однокоренное ему русское слово — это жёлоб, а δελφίς — это буквально ‘желобной’: он живородящий, то есть рождает своих детёнышей из жёлоба. А в германских языках от того же корня происходит название детёныша — англ. calf, нем. Kalb ‘телёнок’
Часто говорят, что в русском языке сложно обратиться к незнакомому человеку. Валерий Ефремов в 2009 году писал, что происходит «экспансия просторечных форм обращения к незнакомым людям типа мужчина, женщина и — с некоторыми оговорками — молодой человек. <…> К сожалению, современный речевой этикет, в отличие от достаточно жестко структурированного дореволюционного, не имеет полноценного и удобного для любой ситуации оклика незнакомого человека».
В последней фразе, мне кажется, очень удачно употреблено слово оклик: полезно отличать выделяющее обращение (оклик), когда надо привлечь внимание человека, от поддерживающего обращения, когда ты уже разговариваешь с человеком и при этом как-то его называешь. Кажется, что по-русски в последние годы в ситуации оклика незнакомого человека мужчина / женщина и молодой человек / девушка уверенно закрепились (во всяком случае, я в них ничего дурного и ненейтрального не вижу), а вот стандартных поддерживающих обращений к незнакомым не существует: просто разговариваешь с ними чаще всего на вы, реже на ты, говоришь спасибо и пожалуйста без обращения, и всё. Обращение брат очень социально специфично, а слова типа командир я даже не уверен, что слышал вживую.
По-немецки, кажется, нет ни оклика, ни поддерживающего обращения. Функцию оклика выступает Hallo! или Entschuldigung! ‘извините!’.
По-турецки оклики и поддерживающие обращения в целом совпадают: в обеих функциях используются термины родства — abi ‘старший брат’ для мужчины лет до 60, amca ‘·дядя по отцу’ или baba ‘отец’ для мужчины постарше; abla ‘старшая сестра’ для женщины лет до 60, teyze ‘тётя по матери’ для женщины постарше.
А по-английски плохо с окликом, зато удивительное разнообразие поддерживающих обращений: за 12 часов, что я сегодня успел провести в Англии, меня назвали pal, mate, sir и buddy (в не очень длинных репликах типа Sorry, pal и Cheers, buddy). А в прошлом году, когда мы ездили на остров Мэн, коллеги женского пола с удивлением отмечали, что их называют love.
Вот такая маленькая не очень репрезентативная типология.
В последней фразе, мне кажется, очень удачно употреблено слово оклик: полезно отличать выделяющее обращение (оклик), когда надо привлечь внимание человека, от поддерживающего обращения, когда ты уже разговариваешь с человеком и при этом как-то его называешь. Кажется, что по-русски в последние годы в ситуации оклика незнакомого человека мужчина / женщина и молодой человек / девушка уверенно закрепились (во всяком случае, я в них ничего дурного и ненейтрального не вижу), а вот стандартных поддерживающих обращений к незнакомым не существует: просто разговариваешь с ними чаще всего на вы, реже на ты, говоришь спасибо и пожалуйста без обращения, и всё. Обращение брат очень социально специфично, а слова типа командир я даже не уверен, что слышал вживую.
По-немецки, кажется, нет ни оклика, ни поддерживающего обращения. Функцию оклика выступает Hallo! или Entschuldigung! ‘извините!’.
По-турецки оклики и поддерживающие обращения в целом совпадают: в обеих функциях используются термины родства — abi ‘старший брат’ для мужчины лет до 60, amca ‘·дядя по отцу’ или baba ‘отец’ для мужчины постарше; abla ‘старшая сестра’ для женщины лет до 60, teyze ‘тётя по матери’ для женщины постарше.
А по-английски плохо с окликом, зато удивительное разнообразие поддерживающих обращений: за 12 часов, что я сегодня успел провести в Англии, меня назвали pal, mate, sir и buddy (в не очень длинных репликах типа Sorry, pal и Cheers, buddy). А в прошлом году, когда мы ездили на остров Мэн, коллеги женского пола с удивлением отмечали, что их называют love.
Вот такая маленькая не очень репрезентативная типология.
СТИЛОМЕТРИЯ И ЖИЗНЬ (часть 1)
На сайте Kyiv Post 16 августа была опубликована статья Алексея Боровского (Олексій Боровський) «Is Jailed Alexei Navalny Really Writing All of His Public Messages?», в которой компьютерными методами анализируются посты Алексея Навального. Исследователь приходит к выводу, что тюремные посты Навального больше похожи на тексты, написанные Георгием Албуровым*, чем на тексты самого Навального, которые тот писал на свободе. Другие кандидаты на роль автора, которых рассматривает Боровский, — это Леонид Волков*, Мария Певчих*, Любовь Соболь* и Иван Жданов*. Более подробная версия должна быть опубликована в августе в украинском журнале, название которого пока не сообщается.
Александр Плющев* и Татьяна Фельгенгауэр* для своего Breakfast Show! взяли обстоятельные комментарии об этом исследовании у Георгия Албурова* и компьютерного лингвиста Даниила Скоринкина. Албуров* отрицает своё авторство, а Скоринкин задаёт несколько важных вопросов к методологии и изложению результатов и анонсирует, что в ближайшие дни Системный Блокъ попробует воспроизвести исследование. Вот вкратце ключевые сложности, которые видит Даниил Скоринкин:
— неизвестно, на каком в точности наборе текстов проводилось исследование;
— методы определения авторства хорошо работают на длинных текстах, но нет уверенности, что собранных Боровским текстов достаточно для надёжных выводов;
— есть погрешности в опубликованной таблице с расстояниями между авторами.
Подробный критический разбор с мини-репликацией почти сразу же сделала Александра Ершова. Системный Блокъ собирает корпус текстов Навального и потенциальных кандидатов на авторство его текстов (там есть и авторы, которых Боровский не рассматривал: Юлия Навальная и Руслан Шаведдинов*). Я с нетерпением жду результатов работы коллег.
А пока что позволю себе отметить четыре проблемных пункта, которые лично мне кажутся важными. Они касаются не только постов Навального, но и вообще стилометрии и публичного восприятия исследований в области компьютерной лингвистики.
1. Магия цифр. «Key: Number > 0, it is the same text; Number < 1, the same author composed the texts; Number > 1.5, different authors composed the texts» — так написано под таблицей с числами в исходной статье. К сожалению, совершенно неясно, что значат эти числа: какая конкретно метрика используется (у классической дельты Берроуза есть десятки вариантов), частоты каких слов считаются и т. д. и т. п. (об этом же пишет и Александра Ершова) — но на широкую публику любые цифры производят сильное впечатление. Хочется надеяться, что в будущей журнальной публикации будут раскрыты все подробности.
2. Сходство или вероятность? Большинство современных стилометрических исследований не отвечает на вопрос, с какой вероятностью тексты были написаны одним автором. Обычно строится таблица с расстояниями, как в статье Алексея Боровского, а затем она преобразуется в дерево, на котором более похожие тексты располагаются ближе друг к другу — и чаще всего оказывается, что рядом на дереве висят тексты одного автора. Такое дерево можно увидеть, например, в статье Системного Блока про стилометрию; в докладе Штефани Эверт и соавторов на с. 3–4 есть целых три таких дерева, где авторство распределяется идеально. Но, как говорится в том же докладе сразу после деревьев, их статистическая значимость — это отдельный вопрос, которым исследователи редко задаются. В нашем случае ещё важнее то, что расстояния — это неинтерпретируемые числа, а деревья — их визуализации, но мы совершенно не понимаем, с какой вероятностью два текста, оказавшиеся рядом на дереве, действительно написаны одним автором: это 30%? 90%? 99,9999%?
(продолжение: часть 2)
* Физические лица, признанные иностранными агентами.
На сайте Kyiv Post 16 августа была опубликована статья Алексея Боровского (Олексій Боровський) «Is Jailed Alexei Navalny Really Writing All of His Public Messages?», в которой компьютерными методами анализируются посты Алексея Навального. Исследователь приходит к выводу, что тюремные посты Навального больше похожи на тексты, написанные Георгием Албуровым*, чем на тексты самого Навального, которые тот писал на свободе. Другие кандидаты на роль автора, которых рассматривает Боровский, — это Леонид Волков*, Мария Певчих*, Любовь Соболь* и Иван Жданов*. Более подробная версия должна быть опубликована в августе в украинском журнале, название которого пока не сообщается.
Александр Плющев* и Татьяна Фельгенгауэр* для своего Breakfast Show! взяли обстоятельные комментарии об этом исследовании у Георгия Албурова* и компьютерного лингвиста Даниила Скоринкина. Албуров* отрицает своё авторство, а Скоринкин задаёт несколько важных вопросов к методологии и изложению результатов и анонсирует, что в ближайшие дни Системный Блокъ попробует воспроизвести исследование. Вот вкратце ключевые сложности, которые видит Даниил Скоринкин:
— неизвестно, на каком в точности наборе текстов проводилось исследование;
— методы определения авторства хорошо работают на длинных текстах, но нет уверенности, что собранных Боровским текстов достаточно для надёжных выводов;
— есть погрешности в опубликованной таблице с расстояниями между авторами.
Подробный критический разбор с мини-репликацией почти сразу же сделала Александра Ершова. Системный Блокъ собирает корпус текстов Навального и потенциальных кандидатов на авторство его текстов (там есть и авторы, которых Боровский не рассматривал: Юлия Навальная и Руслан Шаведдинов*). Я с нетерпением жду результатов работы коллег.
А пока что позволю себе отметить четыре проблемных пункта, которые лично мне кажутся важными. Они касаются не только постов Навального, но и вообще стилометрии и публичного восприятия исследований в области компьютерной лингвистики.
1. Магия цифр. «Key: Number > 0, it is the same text; Number < 1, the same author composed the texts; Number > 1.5, different authors composed the texts» — так написано под таблицей с числами в исходной статье. К сожалению, совершенно неясно, что значат эти числа: какая конкретно метрика используется (у классической дельты Берроуза есть десятки вариантов), частоты каких слов считаются и т. д. и т. п. (об этом же пишет и Александра Ершова) — но на широкую публику любые цифры производят сильное впечатление. Хочется надеяться, что в будущей журнальной публикации будут раскрыты все подробности.
2. Сходство или вероятность? Большинство современных стилометрических исследований не отвечает на вопрос, с какой вероятностью тексты были написаны одним автором. Обычно строится таблица с расстояниями, как в статье Алексея Боровского, а затем она преобразуется в дерево, на котором более похожие тексты располагаются ближе друг к другу — и чаще всего оказывается, что рядом на дереве висят тексты одного автора. Такое дерево можно увидеть, например, в статье Системного Блока про стилометрию; в докладе Штефани Эверт и соавторов на с. 3–4 есть целых три таких дерева, где авторство распределяется идеально. Но, как говорится в том же докладе сразу после деревьев, их статистическая значимость — это отдельный вопрос, которым исследователи редко задаются. В нашем случае ещё важнее то, что расстояния — это неинтерпретируемые числа, а деревья — их визуализации, но мы совершенно не понимаем, с какой вероятностью два текста, оказавшиеся рядом на дереве, действительно написаны одним автором: это 30%? 90%? 99,9999%?
(продолжение: часть 2)
* Физические лица, признанные иностранными агентами.
СТИЛОМЕТРИЯ И ЖИЗНЬ (часть 2)
(начало: часть 1)
3. Вера в могущество науки преувеличена. «Хочется просто поставить точку в этом странном разгоне <…>, — говорит Татьяна Фельгенгауэр*, — хочется как-то раз и навсегда сказать: „Ребят, вот есть авторитетный научный разбор, закончили“». Мне бы тоже хотелось верить в то, что стилометрия может предложить авторитетный научный разбор, но увы: объективные успехи стилометрии сильно преувеличены. В статьях о стилометрии обычно рассматриваются искусственные случаи, в которых ответ известен заранее: примерно как рассказывает Даниил Скоринкин в своём интервью, возьмём три романа Толстого, три романа Достоевского, а ещё про один роман, про который мы знаем, кто его написал, пусть машина определит. Машина и определяет, но нового знания мы не получаем.
Когда речь заходит о новом знании, обычно вспоминают одни и те же истории. Так, никакой рассказ о стилометрии не обходится без Federalist Papers конца XVIII века. Это 77 статей, авторство которых принадлежит трём американским отцам-основателям, но про 12 текстов неизвестно в точности, кто их написал. В 1963 году Фредерик Мостеллер и Дэвид Уоллес посчитали частоты слов в этих статьях и заявили, что автором спорных текстов был Джеймс Мэдисон (кстати, возращаясь к пункту 2: Мостеллер и Уоллес как раз формулировали свои результаты в терминах вероятностей, в отличие от более новых стилометристов). Этот результат пользуется большим уважением, но так никогда и не был подтверждён извне — а вообще-то очень хотелось бы, чтобы, например, нашлись черновики Мэдисона и стало понятно, что метод правда работает. А самый известный и чуть ли не единственный случай с внешним подтверждением стилометрии — это Роберт Гэлбрейт, в котором Патрик Юола в 2013 году сумел распознать Джоан Роулинг.
4. Реальность сложнее стилометрии. Стилометрическое исследование обычно исходит из того, что текст написал какой-то автор. В случае Роберта Гэлбрейта это так и было — да, роман «Зов кукушки» взяла и написала Роулинг. Но с текстами Навального ситуация может быть более сложной: возможно, часть текстов из тюрьмы написана им, а часть — не им; возможно, что публикаторы вносят в них сильную правку; возможны и разные другие сценарии. Это вполне обычная практика в политической жизни: «Навальный это политик и институт. понятно что у него есть команда и она в том числе делает соцсети. что такого-то», — пишет Даниил Скоринкин. Это игра без правил, в которой стилометрия бессильна.
Но, конечно, критика и сомнения не делают статью Боровского менее интересной и важной. Может быть, главная ценность исследования даже не в ответе, а в том, что автор попробовал применить стилометрию к этому вопросу. А ещё есть надежда, что когда-нибудь мы узнаем подлинную историю текстов Навального из тюрьмы — и вдруг работа Боровского или кого-то, кто решить воспроизвести её, станет ещё одним классическим примером стилометрии, подтверждённой внешними данными.
* Физические лица, признанные иностранными агентами.
(начало: часть 1)
3. Вера в могущество науки преувеличена. «Хочется просто поставить точку в этом странном разгоне <…>, — говорит Татьяна Фельгенгауэр*, — хочется как-то раз и навсегда сказать: „Ребят, вот есть авторитетный научный разбор, закончили“». Мне бы тоже хотелось верить в то, что стилометрия может предложить авторитетный научный разбор, но увы: объективные успехи стилометрии сильно преувеличены. В статьях о стилометрии обычно рассматриваются искусственные случаи, в которых ответ известен заранее: примерно как рассказывает Даниил Скоринкин в своём интервью, возьмём три романа Толстого, три романа Достоевского, а ещё про один роман, про который мы знаем, кто его написал, пусть машина определит. Машина и определяет, но нового знания мы не получаем.
Когда речь заходит о новом знании, обычно вспоминают одни и те же истории. Так, никакой рассказ о стилометрии не обходится без Federalist Papers конца XVIII века. Это 77 статей, авторство которых принадлежит трём американским отцам-основателям, но про 12 текстов неизвестно в точности, кто их написал. В 1963 году Фредерик Мостеллер и Дэвид Уоллес посчитали частоты слов в этих статьях и заявили, что автором спорных текстов был Джеймс Мэдисон (кстати, возращаясь к пункту 2: Мостеллер и Уоллес как раз формулировали свои результаты в терминах вероятностей, в отличие от более новых стилометристов). Этот результат пользуется большим уважением, но так никогда и не был подтверждён извне — а вообще-то очень хотелось бы, чтобы, например, нашлись черновики Мэдисона и стало понятно, что метод правда работает. А самый известный и чуть ли не единственный случай с внешним подтверждением стилометрии — это Роберт Гэлбрейт, в котором Патрик Юола в 2013 году сумел распознать Джоан Роулинг.
4. Реальность сложнее стилометрии. Стилометрическое исследование обычно исходит из того, что текст написал какой-то автор. В случае Роберта Гэлбрейта это так и было — да, роман «Зов кукушки» взяла и написала Роулинг. Но с текстами Навального ситуация может быть более сложной: возможно, часть текстов из тюрьмы написана им, а часть — не им; возможно, что публикаторы вносят в них сильную правку; возможны и разные другие сценарии. Это вполне обычная практика в политической жизни: «Навальный это политик и институт. понятно что у него есть команда и она в том числе делает соцсети. что такого-то», — пишет Даниил Скоринкин. Это игра без правил, в которой стилометрия бессильна.
Но, конечно, критика и сомнения не делают статью Боровского менее интересной и важной. Может быть, главная ценность исследования даже не в ответе, а в том, что автор попробовал применить стилометрию к этому вопросу. А ещё есть надежда, что когда-нибудь мы узнаем подлинную историю текстов Навального из тюрьмы — и вдруг работа Боровского или кого-то, кто решить воспроизвести её, станет ещё одним классическим примером стилометрии, подтверждённой внешними данными.
* Физические лица, признанные иностранными агентами.
Неожиданные значения совершенного и несовершенного вида: фраза «так нельзя сказать» — про грамматику, а «так нельзя говорить» — про этику.
(Как обычно, лучший источник знаний о русском глагольном виде — мелкие огрехи иностранцев, хорошо говорящих по-русски.)
(Как обычно, лучший источник знаний о русском глагольном виде — мелкие огрехи иностранцев, хорошо говорящих по-русски.)
Жемчужины Национального корпуса русского языка: оказывается, антиваксеры (ну, по крайней мере один антиваксер Николай Федоровский) 100 лет назад называли своих противников прививкоманы.
Прививочники, вернее прививкоманы, ухитряются и по поводу чумного заболевания д-ра Падлевского свалить с больной головы на здоровую.
Прививкоманы особенно хвалятся «антидифтеритными» прививками. Как в старину считалось преступлением обойтись без кровопускания, хотя бы даже при остром малокровии или чахотке, так теперь протежируется тот же взгляд относительно сыворотки.
и ещё 5 таких примеров.
Прививочники, вернее прививкоманы, ухитряются и по поводу чумного заболевания д-ра Падлевского свалить с больной головы на здоровую.
Прививкоманы особенно хвалятся «антидифтеритными» прививками. Как в старину считалось преступлением обойтись без кровопускания, хотя бы даже при остром малокровии или чахотке, так теперь протежируется тот же взгляд относительно сыворотки.
и ещё 5 таких примеров.
На правах (само)рекламы.
Каждый год, готовя задачи для конкурса «Русский медвежонок», мы старательно пишем решения задач, долго спорим про них, выверяем — иногда даже получаются небольшие исследования. Эти решения вместе с задачами публикуются в сборниках, которые раньше очень трудно было достать: они распространялись по школам и среди победителей конкурса; можно было написать куда-то в Киров и их заказать, но это очень сложно, и лично я бы такой квест точно не преодолел. А теперь эти сборники доступны просто на Озоне: что-то продаётся и по отдельности, но выгоднее покупать комплектами по 4–5 штук. Там на них сейчас ещё и распродажа: вместо 340–390₽ за комплект всего 250–291₽!
→ перейти к сборникам «Русского медвежонка» на Озоне
Каждый год, готовя задачи для конкурса «Русский медвежонок», мы старательно пишем решения задач, долго спорим про них, выверяем — иногда даже получаются небольшие исследования. Эти решения вместе с задачами публикуются в сборниках, которые раньше очень трудно было достать: они распространялись по школам и среди победителей конкурса; можно было написать куда-то в Киров и их заказать, но это очень сложно, и лично я бы такой квест точно не преодолел. А теперь эти сборники доступны просто на Озоне: что-то продаётся и по отдельности, но выгоднее покупать комплектами по 4–5 штук. Там на них сейчас ещё и распродажа: вместо 340–390₽ за комплект всего 250–291₽!
→ перейти к сборникам «Русского медвежонка» на Озоне
Языковое разнообразие — это хорошо, но иногда хочешь почитать диссертацию про кыргызские вспомогательные глаголы, а она раз и оказывается по-японски………
Красивая карта про азиатские системы числительных. Ясно, что к ней можно и нужно придираться: она нарисована из индийской перспективы и имплицитно предполагает, что во всех странах, кроме Индии, один язык (особенно в Папуа — Новой Гвинее, ага), но как приближение вполне интересна.
(источник)
(источник)
Коллеги из «Системного Блока» (@sysblok) составили интересную подборку телеграм-каналов про лингвистику, любезно включив в неё в том числе и мой канал. Себя они скромно поставили на последнее место, но это, по-моему, как раз типичное «last but not least» — за те пять лет, что «Системный Блокъ» существует, он стал важнейшим источником полезной и доступной информации для всех, кто заинтересован в цифровых гуманитарных науках и компьютерной лингвистике. Подписывайтесь и на них, и на другие упомянутые здесь каналы!
Forwarded from Системный Блокъ
Подборка лингвистических каналов от издания «Системный Блокъ»
Погружение культуры в цифру началось с языка. И сегодня, в эпоху ChatGPT и нейропоэзии, пространство текстов остается главным двигателем цифровой революции. Подготовили для вас подборку каналов о словах и языке.
— @UznalSlovo — Узнал новое слово
Знаете, что такое конечка, мелтсы или шеверюшка? Лингвист и автор словарей Борис Иомдин ежедневно рассказывает об одном слове русского языка, которое он узнал в этот день, а читатели голосуют, известно ли им такое слово, и обсуждают его значения. Затем автор публикует «облака» новых слов со статистикой их известности.
— @waurda — О словах и не только
Что чаще делают от зависти — краснеют, чернеют или зеленеют? Как называли антиваксеров 100 лет назад? Как завоевать Константинополь с помощью гугл-транслейта? Лингвист и популяризатор науки Александр Пиперски предлагает лингвистические задачки, делится этимологическими изысканиями, социокультурными маргиналиями и наблюдениями о фонетических феноменах.
— @portalgramotaru — Грамота.ру
Ставить ли запятую во фразе «женись на ком хочешь»? Откуда взялось выражение «как пить дать»? Помимо привычных разборов сложных случаев правописания и лингвистических казусов, в канале «Грамоты.ру» есть подборки свежих исследований специалистов по языкам, находки в классике русской поэзии и рассказы о современных технологиях в лингвистике.
— @TDvTG — Тотальный диктант
Здесь, как ни странно, никто не предлагает писать под диктовку. И канал не ограничивается информацией только об акции, которая проходит раз в год. Здесь можно разобрать сложные случаи правописания, больше узнать о современной литературе и авторах текстов Тотального диктанта, а еще посмотреть полезные лекции. В общем, подготовиться и узнать много нового!
— @Lingvoed — Лингвоед
Почему разным языкам мира так сложно даются нейтральные названия для половых органов? Как Набоков готовил яйца? Лингвист и специалист по интернет-коммуникации Валерий Шульгинов загадывает лингвистические загадки, даёт этимологические выкладки, делится фрагментами своих лекций и статей, приглашает на встречи, посвящённые в том числе IT в лингвистике.
— @greatetymology — Этимология каждый день
Почему квартира по-английски плоская (flat) и что общего между планетами и планктоном? На канале Игоря Осмоловского можно поразгадывать этимологические загадки и узнать много неожиданного о привычных словах, например, что Петроград и Ташкент — это одно и то же, а «мент» означает не «мой единственный надёжный товарищ», а «плащ, накидка».
— @ealdenglisc — История английского языка
Канал лингвиста-энтузиаста Таира Кубаниязова будет интересен не только любителям истории языка в целом, истории английского языка и Англии, но и фанатам компаративистики и этимологических изысканий. Если тот факт, что very (очень) родственное слову «вера» в русском языке, не оставляет вас равнодушными, вы найдёте здесь много интересного.
— @istoki_slova — Восстание редуцированных
Популяризатор лингвистики и сторонница «доказательной филологии» Светлана Гурьянова опровергает мифы о русском языке и рассказывает о его истории. Правда ли, что «слоняться» — от слова «слон», а «урод» — тот, кто стоит «у рода»? Знаете ли вы, что нелюбимое многими сокращение «Питер» использовали еще Пушкин и Грибоедов? Если вы страдаете от лингвистического пуризма, то вам сюда.
— @sysblok — Системный Блокъ
Как устроено ударение в 160 тысячах любительских стихов? Как работают онлайн-тесты оценки вашего словарного запаса? Почему если бы не лингвист А. А. Зализняк, мы бы не смогли ничего «заяндексить»? Здесь вы не пропустите ни один громкий сюжет из современных цифровых исследований языка и культуры.
Погружение культуры в цифру началось с языка. И сегодня, в эпоху ChatGPT и нейропоэзии, пространство текстов остается главным двигателем цифровой революции. Подготовили для вас подборку каналов о словах и языке.
— @UznalSlovo — Узнал новое слово
Знаете, что такое конечка, мелтсы или шеверюшка? Лингвист и автор словарей Борис Иомдин ежедневно рассказывает об одном слове русского языка, которое он узнал в этот день, а читатели голосуют, известно ли им такое слово, и обсуждают его значения. Затем автор публикует «облака» новых слов со статистикой их известности.
— @waurda — О словах и не только
Что чаще делают от зависти — краснеют, чернеют или зеленеют? Как называли антиваксеров 100 лет назад? Как завоевать Константинополь с помощью гугл-транслейта? Лингвист и популяризатор науки Александр Пиперски предлагает лингвистические задачки, делится этимологическими изысканиями, социокультурными маргиналиями и наблюдениями о фонетических феноменах.
— @portalgramotaru — Грамота.ру
Ставить ли запятую во фразе «женись на ком хочешь»? Откуда взялось выражение «как пить дать»? Помимо привычных разборов сложных случаев правописания и лингвистических казусов, в канале «Грамоты.ру» есть подборки свежих исследований специалистов по языкам, находки в классике русской поэзии и рассказы о современных технологиях в лингвистике.
— @TDvTG — Тотальный диктант
Здесь, как ни странно, никто не предлагает писать под диктовку. И канал не ограничивается информацией только об акции, которая проходит раз в год. Здесь можно разобрать сложные случаи правописания, больше узнать о современной литературе и авторах текстов Тотального диктанта, а еще посмотреть полезные лекции. В общем, подготовиться и узнать много нового!
— @Lingvoed — Лингвоед
Почему разным языкам мира так сложно даются нейтральные названия для половых органов? Как Набоков готовил яйца? Лингвист и специалист по интернет-коммуникации Валерий Шульгинов загадывает лингвистические загадки, даёт этимологические выкладки, делится фрагментами своих лекций и статей, приглашает на встречи, посвящённые в том числе IT в лингвистике.
— @greatetymology — Этимология каждый день
Почему квартира по-английски плоская (flat) и что общего между планетами и планктоном? На канале Игоря Осмоловского можно поразгадывать этимологические загадки и узнать много неожиданного о привычных словах, например, что Петроград и Ташкент — это одно и то же, а «мент» означает не «мой единственный надёжный товарищ», а «плащ, накидка».
— @ealdenglisc — История английского языка
Канал лингвиста-энтузиаста Таира Кубаниязова будет интересен не только любителям истории языка в целом, истории английского языка и Англии, но и фанатам компаративистики и этимологических изысканий. Если тот факт, что very (очень) родственное слову «вера» в русском языке, не оставляет вас равнодушными, вы найдёте здесь много интересного.
— @istoki_slova — Восстание редуцированных
Популяризатор лингвистики и сторонница «доказательной филологии» Светлана Гурьянова опровергает мифы о русском языке и рассказывает о его истории. Правда ли, что «слоняться» — от слова «слон», а «урод» — тот, кто стоит «у рода»? Знаете ли вы, что нелюбимое многими сокращение «Питер» использовали еще Пушкин и Грибоедов? Если вы страдаете от лингвистического пуризма, то вам сюда.
— @sysblok — Системный Блокъ
Как устроено ударение в 160 тысячах любительских стихов? Как работают онлайн-тесты оценки вашего словарного запаса? Почему если бы не лингвист А. А. Зализняк, мы бы не смогли ничего «заяндексить»? Здесь вы не пропустите ни один громкий сюжет из современных цифровых исследований языка и культуры.
Сегодня у меня была бессонница: я проснулся в 4 часа ночи, сидел за компьютером до 7 утра, а потом всё же лёг спать обратно и проснулся в 11 часов дня.
Но точно ли 04:00 — это ещё ночь, а не утро? А вдруг 11:00 — это утро, а не день? Давайте искать в Национальном корпусе русского языка (1, 2).
Вариативность сильнее 90/10 есть в пяти случаях:
– 3 часа ночи (76%) / 3 часа утра (24%)
– 4 часа утра (81%) / 4 часа ночи (19%)
– 11 часов утра (84%) / 11 часов дня (16%)
– 5 часов вечера (69%) / 5 часов дня (31%)
– 11 часов вечера (78%) / 11 часов ночи (22%)
Вроде бы более базовые день и ночь короче утра и вечера: ночь — 4 часа, утро — 8 часов, день — 5 часов, вечер — 7 часов.
Картинку я и правда делал ночью/утром, но этот пост вообще-то основан на пока не опубликованной магистерской диссертации Анастасии Пучковой 2019 года. Кроме таких же корпусных выводов про части суток, там есть и эксперимент с заполнением пропуска:
– Я сегодня проснулся в 3 …: 33% утра, 67% ночи
– Я сегодня лёг спать в 3 …: 9% утра, 91% ночи
Но точно ли 04:00 — это ещё ночь, а не утро? А вдруг 11:00 — это утро, а не день? Давайте искать в Национальном корпусе русского языка (1, 2).
Вариативность сильнее 90/10 есть в пяти случаях:
– 3 часа ночи (76%) / 3 часа утра (24%)
– 4 часа утра (81%) / 4 часа ночи (19%)
– 11 часов утра (84%) / 11 часов дня (16%)
– 5 часов вечера (69%) / 5 часов дня (31%)
– 11 часов вечера (78%) / 11 часов ночи (22%)
Вроде бы более базовые день и ночь короче утра и вечера: ночь — 4 часа, утро — 8 часов, день — 5 часов, вечер — 7 часов.
Картинку я и правда делал ночью/утром, но этот пост вообще-то основан на пока не опубликованной магистерской диссертации Анастасии Пучковой 2019 года. Кроме таких же корпусных выводов про части суток, там есть и эксперимент с заполнением пропуска:
– Я сегодня проснулся в 3 …: 33% утра, 67% ночи
– Я сегодня лёг спать в 3 …: 9% утра, 91% ночи
Пару месяцев назад Егор Михайлов опубликовал на Афише материал «Маргарита Симоньян или ChatGPT? Сложный тест», в котором посмеивается над стилем новых (и старых переизданных) рассказов Симоньян из сборника «Водоворот». Мне сразу вспомнился похожий тест «Машинный перевод или Платонов», который ходил по интернету лет 8 назад. Интересно, что такие сравнения человека с машиной допускают любую интерпретацию — в случае с Платоновым мало кто ставил под сомнение его достоинства как прозаика, а тест про Симоньян явно должен произвести на читателя впечатление «Ну, раз машина так же может, то ничего ценного в этих рассказах нет». Мне вот всегда хочется знать про такие тесты, сколько отбора и подготовки за ними стоит — как среди машинных предложений, так и среди человеческих; это был бы ценный количественный показатель — но скорее для научного исследования, чем для весёлого теста.
Кончилось всё это, впрочем, тем, что я прочитал рассказы Маргариты Симоньян. Ну и что я могу сказать — рассказы-то хорошие: сюжетные повороты неожиданные, стиль приятный и запоминающийся (ну, иногда действительно слишком много красивостей, но с кем не бывает), (само)ирония и пафос в разумном сочетании. После прочтения рассказов я справился с тестом на Афише на 8 из 9 и мне сказали «Здравствуйте, Маргарита Симоновна!».
В рассказе «Бачишь, кума, це нигр!» много ценного с социолингвистической точки зрения — примеры кубанской балачки, которые выглядят вполне аутентично, и рассуждения про то, какая степень диалектности допустима на прямой линии с Путиным (спойлер: почти никакая).
Я допускаю, что могу быть предвзят, потому что Симоньян с нескрываемой любовью описывает жизнь на сочинском побережье, с которым у меня тоже связано много тёплых воспоминаний — но мой взгляд не настолько изнутри, разумеется. «Сандро из Чегема» я, побывав в Сочи и вокруг, тоже перечитал с гораздо большей увлечённостью.
А если вы ещё не плюнули в экран и не отписались от моего канала к этому абзацу (а ведь мне даже не проплатили пост!), то давайте устроим опрос по одной фразе из этих рассказов. Похожий опрос недавно делала Евгения Холодова, вот и сравним. Угадывать, как написала Маргарита Симоньян, не требуется; выбирайте, как написали и сказали бы вы. Про «дядь Вачика» скоро напишу отдельный пост — не волнуйтесь, там уже будет меньше литературных восторогов.
Кончилось всё это, впрочем, тем, что я прочитал рассказы Маргариты Симоньян. Ну и что я могу сказать — рассказы-то хорошие: сюжетные повороты неожиданные, стиль приятный и запоминающийся (ну, иногда действительно слишком много красивостей, но с кем не бывает), (само)ирония и пафос в разумном сочетании. После прочтения рассказов я справился с тестом на Афише на 8 из 9 и мне сказали «Здравствуйте, Маргарита Симоновна!».
В рассказе «Бачишь, кума, це нигр!» много ценного с социолингвистической точки зрения — примеры кубанской балачки, которые выглядят вполне аутентично, и рассуждения про то, какая степень диалектности допустима на прямой линии с Путиным (спойлер: почти никакая).
Я допускаю, что могу быть предвзят, потому что Симоньян с нескрываемой любовью описывает жизнь на сочинском побережье, с которым у меня тоже связано много тёплых воспоминаний — но мой взгляд не настолько изнутри, разумеется. «Сандро из Чегема» я, побывав в Сочи и вокруг, тоже перечитал с гораздо большей увлечённостью.
А если вы ещё не плюнули в экран и не отписались от моего канала к этому абзацу (а ведь мне даже не проплатили пост!), то давайте устроим опрос по одной фразе из этих рассказов. Похожий опрос недавно делала Евгения Холодова, вот и сравним. Угадывать, как написала Маргарита Симоньян, не требуется; выбирайте, как написали и сказали бы вы. Про «дядь Вачика» скоро напишу отдельный пост — не волнуйтесь, там уже будет меньше литературных восторогов.
«Дядь Вачик подцепил осу заскорузлым ………… ногтем»
Anonymous Poll
8%
отрАщенным
71%
отрОщенным
17%
отращЁнным
5%
отрощЁнным
В предыдущем опросе упоминался дядь Вачик. В той же книге фигурируют дядь Рыжий, дядь Алик, дядь Майдрес, дядь Мигран, дядь Грант, дядь Хачик, тёть Зуза — и одинокий дядя Петя с окончанием. Это, конечно, не самый смелый эксперимент — так делают; но многие авторы решаются писать дядь и тёть только в функции обращения, а тут эти слова становятся несклоняемыми и односложными во всех падежах.
Нельзя не признать, что строгие правила русской орфографии сильно мешают передавать живую речь: попробуй-ка не напиши непроизносимое й в слове коктейль или непроизносимое и в слове специальный. Да впрочем, грамотный человек чаще всего и не задумывается, что он говорит спе[ца́]льный: он же просто помнит написание этого слова как готовый визуальный образ.
А вот кому приходится задумываться, так это поэтам, если они пишут классическим или близким к классическому стихом, в котором важен счёт слогов. Самый смелый экспериментатор в этой сфере — Юлий Гуголев (которого я горячо рекомендую не только как источник языкового материала, но и как замечательного поэта). Его орудие — это апостроф. Вот примеры, которые я выписал из его стихов:
Нельзя не признать, что строгие правила русской орфографии сильно мешают передавать живую речь: попробуй-ка не напиши непроизносимое й в слове коктейль или непроизносимое и в слове специальный. Да впрочем, грамотный человек чаще всего и не задумывается, что он говорит спе[ца́]льный: он же просто помнит написание этого слова как готовый визуальный образ.
А вот кому приходится задумываться, так это поэтам, если они пишут классическим или близким к классическому стихом, в котором важен счёт слогов. Самый смелый экспериментатор в этой сфере — Юлий Гуголев (которого я горячо рекомендую не только как источник языкового материала, но и как замечательного поэта). Его орудие — это апостроф. Вот примеры, которые я выписал из его стихов:
Мож’т, кого другого ждут…Лично мне у Гуголева нравится почти каждый апостроф: сразу думаешь, как же тонко он слышит и не стесняется этого. Лично я с детства с нетерпением жду, когда уже велят писать некотрый и будут ставить двойки тем, кто пишет некоторый. Слово прям, как и прост, давно уже так пишут. А как ж’ это можно примечательно тем, что писать ж вообще-то разрешено, но обычно оно возникает только после гласного, а тут выпадению слога способствует положение перед гласным.
В Германии ходил я на флёмаркт,
В Америке бывал я на ярд-сейлах,
но там иначе, отстранённей как-т’,
— среди вещей поломанных и целых…
а вот все-т’ки погоды такой, я смотрю, раньше не было…
Как ж’ это можно – все время молиться
и – в то же время – жить, притворясь!
лишь справедливости, —
как Всевол’д Николаич.
Мы с тобой, шахидка,
в следу’щем поедем.
и сиял его фот’аппарат
среди фото- и видеокамер.
Запахи умеют тоже плавать,
Некот’рые – очень далеко…
Но сам-то где я с’час стою
купцом, продавцем и менялой?
А шайка наша – деды и отцы.
Какие ж все-т’ки взрослые – лжецы!
геотэг – не то чтоб прям’ «Бутырки»,
но – категорически «за МКАД».
Он что-т’такое ляпнул про Коран,
Всевышнего и, заодно, Пророка.
но чувствую, что в черепе моем
обосновался, как б’т’ск’ать, Кондратий.
Н’вот взять хоть тех, чью пламенную речь
я грешным делом почитаю чушью
кому, когда и сколько могут дать,
нам все-т’ки не дано предугадать.
Мне все-т’ки интересно, восемьсот
отсыплют сразу или порционно?
А можно как-н’дь выговор? … А штраф?
У Анфис’ Владимировны при́говор суров