СТИЛОМЕТРИЯ И ЖИЗНЬ (часть 2)
(начало: часть 1)
3. Вера в могущество науки преувеличена. «Хочется просто поставить точку в этом странном разгоне <…>, — говорит Татьяна Фельгенгауэр*, — хочется как-то раз и навсегда сказать: „Ребят, вот есть авторитетный научный разбор, закончили“». Мне бы тоже хотелось верить в то, что стилометрия может предложить авторитетный научный разбор, но увы: объективные успехи стилометрии сильно преувеличены. В статьях о стилометрии обычно рассматриваются искусственные случаи, в которых ответ известен заранее: примерно как рассказывает Даниил Скоринкин в своём интервью, возьмём три романа Толстого, три романа Достоевского, а ещё про один роман, про который мы знаем, кто его написал, пусть машина определит. Машина и определяет, но нового знания мы не получаем.
Когда речь заходит о новом знании, обычно вспоминают одни и те же истории. Так, никакой рассказ о стилометрии не обходится без Federalist Papers конца XVIII века. Это 77 статей, авторство которых принадлежит трём американским отцам-основателям, но про 12 текстов неизвестно в точности, кто их написал. В 1963 году Фредерик Мостеллер и Дэвид Уоллес посчитали частоты слов в этих статьях и заявили, что автором спорных текстов был Джеймс Мэдисон (кстати, возращаясь к пункту 2: Мостеллер и Уоллес как раз формулировали свои результаты в терминах вероятностей, в отличие от более новых стилометристов). Этот результат пользуется большим уважением, но так никогда и не был подтверждён извне — а вообще-то очень хотелось бы, чтобы, например, нашлись черновики Мэдисона и стало понятно, что метод правда работает. А самый известный и чуть ли не единственный случай с внешним подтверждением стилометрии — это Роберт Гэлбрейт, в котором Патрик Юола в 2013 году сумел распознать Джоан Роулинг.
4. Реальность сложнее стилометрии. Стилометрическое исследование обычно исходит из того, что текст написал какой-то автор. В случае Роберта Гэлбрейта это так и было — да, роман «Зов кукушки» взяла и написала Роулинг. Но с текстами Навального ситуация может быть более сложной: возможно, часть текстов из тюрьмы написана им, а часть — не им; возможно, что публикаторы вносят в них сильную правку; возможны и разные другие сценарии. Это вполне обычная практика в политической жизни: «Навальный это политик и институт. понятно что у него есть команда и она в том числе делает соцсети. что такого-то», — пишет Даниил Скоринкин. Это игра без правил, в которой стилометрия бессильна.
Но, конечно, критика и сомнения не делают статью Боровского менее интересной и важной. Может быть, главная ценность исследования даже не в ответе, а в том, что автор попробовал применить стилометрию к этому вопросу. А ещё есть надежда, что когда-нибудь мы узнаем подлинную историю текстов Навального из тюрьмы — и вдруг работа Боровского или кого-то, кто решить воспроизвести её, станет ещё одним классическим примером стилометрии, подтверждённой внешними данными.
* Физические лица, признанные иностранными агентами.
(начало: часть 1)
3. Вера в могущество науки преувеличена. «Хочется просто поставить точку в этом странном разгоне <…>, — говорит Татьяна Фельгенгауэр*, — хочется как-то раз и навсегда сказать: „Ребят, вот есть авторитетный научный разбор, закончили“». Мне бы тоже хотелось верить в то, что стилометрия может предложить авторитетный научный разбор, но увы: объективные успехи стилометрии сильно преувеличены. В статьях о стилометрии обычно рассматриваются искусственные случаи, в которых ответ известен заранее: примерно как рассказывает Даниил Скоринкин в своём интервью, возьмём три романа Толстого, три романа Достоевского, а ещё про один роман, про который мы знаем, кто его написал, пусть машина определит. Машина и определяет, но нового знания мы не получаем.
Когда речь заходит о новом знании, обычно вспоминают одни и те же истории. Так, никакой рассказ о стилометрии не обходится без Federalist Papers конца XVIII века. Это 77 статей, авторство которых принадлежит трём американским отцам-основателям, но про 12 текстов неизвестно в точности, кто их написал. В 1963 году Фредерик Мостеллер и Дэвид Уоллес посчитали частоты слов в этих статьях и заявили, что автором спорных текстов был Джеймс Мэдисон (кстати, возращаясь к пункту 2: Мостеллер и Уоллес как раз формулировали свои результаты в терминах вероятностей, в отличие от более новых стилометристов). Этот результат пользуется большим уважением, но так никогда и не был подтверждён извне — а вообще-то очень хотелось бы, чтобы, например, нашлись черновики Мэдисона и стало понятно, что метод правда работает. А самый известный и чуть ли не единственный случай с внешним подтверждением стилометрии — это Роберт Гэлбрейт, в котором Патрик Юола в 2013 году сумел распознать Джоан Роулинг.
4. Реальность сложнее стилометрии. Стилометрическое исследование обычно исходит из того, что текст написал какой-то автор. В случае Роберта Гэлбрейта это так и было — да, роман «Зов кукушки» взяла и написала Роулинг. Но с текстами Навального ситуация может быть более сложной: возможно, часть текстов из тюрьмы написана им, а часть — не им; возможно, что публикаторы вносят в них сильную правку; возможны и разные другие сценарии. Это вполне обычная практика в политической жизни: «Навальный это политик и институт. понятно что у него есть команда и она в том числе делает соцсети. что такого-то», — пишет Даниил Скоринкин. Это игра без правил, в которой стилометрия бессильна.
Но, конечно, критика и сомнения не делают статью Боровского менее интересной и важной. Может быть, главная ценность исследования даже не в ответе, а в том, что автор попробовал применить стилометрию к этому вопросу. А ещё есть надежда, что когда-нибудь мы узнаем подлинную историю текстов Навального из тюрьмы — и вдруг работа Боровского или кого-то, кто решить воспроизвести её, станет ещё одним классическим примером стилометрии, подтверждённой внешними данными.
* Физические лица, признанные иностранными агентами.
Неожиданные значения совершенного и несовершенного вида: фраза «так нельзя сказать» — про грамматику, а «так нельзя говорить» — про этику.
(Как обычно, лучший источник знаний о русском глагольном виде — мелкие огрехи иностранцев, хорошо говорящих по-русски.)
(Как обычно, лучший источник знаний о русском глагольном виде — мелкие огрехи иностранцев, хорошо говорящих по-русски.)
Жемчужины Национального корпуса русского языка: оказывается, антиваксеры (ну, по крайней мере один антиваксер Николай Федоровский) 100 лет назад называли своих противников прививкоманы.
Прививочники, вернее прививкоманы, ухитряются и по поводу чумного заболевания д-ра Падлевского свалить с больной головы на здоровую.
Прививкоманы особенно хвалятся «антидифтеритными» прививками. Как в старину считалось преступлением обойтись без кровопускания, хотя бы даже при остром малокровии или чахотке, так теперь протежируется тот же взгляд относительно сыворотки.
и ещё 5 таких примеров.
Прививочники, вернее прививкоманы, ухитряются и по поводу чумного заболевания д-ра Падлевского свалить с больной головы на здоровую.
Прививкоманы особенно хвалятся «антидифтеритными» прививками. Как в старину считалось преступлением обойтись без кровопускания, хотя бы даже при остром малокровии или чахотке, так теперь протежируется тот же взгляд относительно сыворотки.
и ещё 5 таких примеров.
На правах (само)рекламы.
Каждый год, готовя задачи для конкурса «Русский медвежонок», мы старательно пишем решения задач, долго спорим про них, выверяем — иногда даже получаются небольшие исследования. Эти решения вместе с задачами публикуются в сборниках, которые раньше очень трудно было достать: они распространялись по школам и среди победителей конкурса; можно было написать куда-то в Киров и их заказать, но это очень сложно, и лично я бы такой квест точно не преодолел. А теперь эти сборники доступны просто на Озоне: что-то продаётся и по отдельности, но выгоднее покупать комплектами по 4–5 штук. Там на них сейчас ещё и распродажа: вместо 340–390₽ за комплект всего 250–291₽!
→ перейти к сборникам «Русского медвежонка» на Озоне
Каждый год, готовя задачи для конкурса «Русский медвежонок», мы старательно пишем решения задач, долго спорим про них, выверяем — иногда даже получаются небольшие исследования. Эти решения вместе с задачами публикуются в сборниках, которые раньше очень трудно было достать: они распространялись по школам и среди победителей конкурса; можно было написать куда-то в Киров и их заказать, но это очень сложно, и лично я бы такой квест точно не преодолел. А теперь эти сборники доступны просто на Озоне: что-то продаётся и по отдельности, но выгоднее покупать комплектами по 4–5 штук. Там на них сейчас ещё и распродажа: вместо 340–390₽ за комплект всего 250–291₽!
→ перейти к сборникам «Русского медвежонка» на Озоне
Языковое разнообразие — это хорошо, но иногда хочешь почитать диссертацию про кыргызские вспомогательные глаголы, а она раз и оказывается по-японски………
Красивая карта про азиатские системы числительных. Ясно, что к ней можно и нужно придираться: она нарисована из индийской перспективы и имплицитно предполагает, что во всех странах, кроме Индии, один язык (особенно в Папуа — Новой Гвинее, ага), но как приближение вполне интересна.
(источник)
(источник)
Коллеги из «Системного Блока» (@sysblok) составили интересную подборку телеграм-каналов про лингвистику, любезно включив в неё в том числе и мой канал. Себя они скромно поставили на последнее место, но это, по-моему, как раз типичное «last but not least» — за те пять лет, что «Системный Блокъ» существует, он стал важнейшим источником полезной и доступной информации для всех, кто заинтересован в цифровых гуманитарных науках и компьютерной лингвистике. Подписывайтесь и на них, и на другие упомянутые здесь каналы!
Forwarded from Системный Блокъ
Подборка лингвистических каналов от издания «Системный Блокъ»
Погружение культуры в цифру началось с языка. И сегодня, в эпоху ChatGPT и нейропоэзии, пространство текстов остается главным двигателем цифровой революции. Подготовили для вас подборку каналов о словах и языке.
— @UznalSlovo — Узнал новое слово
Знаете, что такое конечка, мелтсы или шеверюшка? Лингвист и автор словарей Борис Иомдин ежедневно рассказывает об одном слове русского языка, которое он узнал в этот день, а читатели голосуют, известно ли им такое слово, и обсуждают его значения. Затем автор публикует «облака» новых слов со статистикой их известности.
— @waurda — О словах и не только
Что чаще делают от зависти — краснеют, чернеют или зеленеют? Как называли антиваксеров 100 лет назад? Как завоевать Константинополь с помощью гугл-транслейта? Лингвист и популяризатор науки Александр Пиперски предлагает лингвистические задачки, делится этимологическими изысканиями, социокультурными маргиналиями и наблюдениями о фонетических феноменах.
— @portalgramotaru — Грамота.ру
Ставить ли запятую во фразе «женись на ком хочешь»? Откуда взялось выражение «как пить дать»? Помимо привычных разборов сложных случаев правописания и лингвистических казусов, в канале «Грамоты.ру» есть подборки свежих исследований специалистов по языкам, находки в классике русской поэзии и рассказы о современных технологиях в лингвистике.
— @TDvTG — Тотальный диктант
Здесь, как ни странно, никто не предлагает писать под диктовку. И канал не ограничивается информацией только об акции, которая проходит раз в год. Здесь можно разобрать сложные случаи правописания, больше узнать о современной литературе и авторах текстов Тотального диктанта, а еще посмотреть полезные лекции. В общем, подготовиться и узнать много нового!
— @Lingvoed — Лингвоед
Почему разным языкам мира так сложно даются нейтральные названия для половых органов? Как Набоков готовил яйца? Лингвист и специалист по интернет-коммуникации Валерий Шульгинов загадывает лингвистические загадки, даёт этимологические выкладки, делится фрагментами своих лекций и статей, приглашает на встречи, посвящённые в том числе IT в лингвистике.
— @greatetymology — Этимология каждый день
Почему квартира по-английски плоская (flat) и что общего между планетами и планктоном? На канале Игоря Осмоловского можно поразгадывать этимологические загадки и узнать много неожиданного о привычных словах, например, что Петроград и Ташкент — это одно и то же, а «мент» означает не «мой единственный надёжный товарищ», а «плащ, накидка».
— @ealdenglisc — История английского языка
Канал лингвиста-энтузиаста Таира Кубаниязова будет интересен не только любителям истории языка в целом, истории английского языка и Англии, но и фанатам компаративистики и этимологических изысканий. Если тот факт, что very (очень) родственное слову «вера» в русском языке, не оставляет вас равнодушными, вы найдёте здесь много интересного.
— @istoki_slova — Восстание редуцированных
Популяризатор лингвистики и сторонница «доказательной филологии» Светлана Гурьянова опровергает мифы о русском языке и рассказывает о его истории. Правда ли, что «слоняться» — от слова «слон», а «урод» — тот, кто стоит «у рода»? Знаете ли вы, что нелюбимое многими сокращение «Питер» использовали еще Пушкин и Грибоедов? Если вы страдаете от лингвистического пуризма, то вам сюда.
— @sysblok — Системный Блокъ
Как устроено ударение в 160 тысячах любительских стихов? Как работают онлайн-тесты оценки вашего словарного запаса? Почему если бы не лингвист А. А. Зализняк, мы бы не смогли ничего «заяндексить»? Здесь вы не пропустите ни один громкий сюжет из современных цифровых исследований языка и культуры.
Погружение культуры в цифру началось с языка. И сегодня, в эпоху ChatGPT и нейропоэзии, пространство текстов остается главным двигателем цифровой революции. Подготовили для вас подборку каналов о словах и языке.
— @UznalSlovo — Узнал новое слово
Знаете, что такое конечка, мелтсы или шеверюшка? Лингвист и автор словарей Борис Иомдин ежедневно рассказывает об одном слове русского языка, которое он узнал в этот день, а читатели голосуют, известно ли им такое слово, и обсуждают его значения. Затем автор публикует «облака» новых слов со статистикой их известности.
— @waurda — О словах и не только
Что чаще делают от зависти — краснеют, чернеют или зеленеют? Как называли антиваксеров 100 лет назад? Как завоевать Константинополь с помощью гугл-транслейта? Лингвист и популяризатор науки Александр Пиперски предлагает лингвистические задачки, делится этимологическими изысканиями, социокультурными маргиналиями и наблюдениями о фонетических феноменах.
— @portalgramotaru — Грамота.ру
Ставить ли запятую во фразе «женись на ком хочешь»? Откуда взялось выражение «как пить дать»? Помимо привычных разборов сложных случаев правописания и лингвистических казусов, в канале «Грамоты.ру» есть подборки свежих исследований специалистов по языкам, находки в классике русской поэзии и рассказы о современных технологиях в лингвистике.
— @TDvTG — Тотальный диктант
Здесь, как ни странно, никто не предлагает писать под диктовку. И канал не ограничивается информацией только об акции, которая проходит раз в год. Здесь можно разобрать сложные случаи правописания, больше узнать о современной литературе и авторах текстов Тотального диктанта, а еще посмотреть полезные лекции. В общем, подготовиться и узнать много нового!
— @Lingvoed — Лингвоед
Почему разным языкам мира так сложно даются нейтральные названия для половых органов? Как Набоков готовил яйца? Лингвист и специалист по интернет-коммуникации Валерий Шульгинов загадывает лингвистические загадки, даёт этимологические выкладки, делится фрагментами своих лекций и статей, приглашает на встречи, посвящённые в том числе IT в лингвистике.
— @greatetymology — Этимология каждый день
Почему квартира по-английски плоская (flat) и что общего между планетами и планктоном? На канале Игоря Осмоловского можно поразгадывать этимологические загадки и узнать много неожиданного о привычных словах, например, что Петроград и Ташкент — это одно и то же, а «мент» означает не «мой единственный надёжный товарищ», а «плащ, накидка».
— @ealdenglisc — История английского языка
Канал лингвиста-энтузиаста Таира Кубаниязова будет интересен не только любителям истории языка в целом, истории английского языка и Англии, но и фанатам компаративистики и этимологических изысканий. Если тот факт, что very (очень) родственное слову «вера» в русском языке, не оставляет вас равнодушными, вы найдёте здесь много интересного.
— @istoki_slova — Восстание редуцированных
Популяризатор лингвистики и сторонница «доказательной филологии» Светлана Гурьянова опровергает мифы о русском языке и рассказывает о его истории. Правда ли, что «слоняться» — от слова «слон», а «урод» — тот, кто стоит «у рода»? Знаете ли вы, что нелюбимое многими сокращение «Питер» использовали еще Пушкин и Грибоедов? Если вы страдаете от лингвистического пуризма, то вам сюда.
— @sysblok — Системный Блокъ
Как устроено ударение в 160 тысячах любительских стихов? Как работают онлайн-тесты оценки вашего словарного запаса? Почему если бы не лингвист А. А. Зализняк, мы бы не смогли ничего «заяндексить»? Здесь вы не пропустите ни один громкий сюжет из современных цифровых исследований языка и культуры.
Сегодня у меня была бессонница: я проснулся в 4 часа ночи, сидел за компьютером до 7 утра, а потом всё же лёг спать обратно и проснулся в 11 часов дня.
Но точно ли 04:00 — это ещё ночь, а не утро? А вдруг 11:00 — это утро, а не день? Давайте искать в Национальном корпусе русского языка (1, 2).
Вариативность сильнее 90/10 есть в пяти случаях:
– 3 часа ночи (76%) / 3 часа утра (24%)
– 4 часа утра (81%) / 4 часа ночи (19%)
– 11 часов утра (84%) / 11 часов дня (16%)
– 5 часов вечера (69%) / 5 часов дня (31%)
– 11 часов вечера (78%) / 11 часов ночи (22%)
Вроде бы более базовые день и ночь короче утра и вечера: ночь — 4 часа, утро — 8 часов, день — 5 часов, вечер — 7 часов.
Картинку я и правда делал ночью/утром, но этот пост вообще-то основан на пока не опубликованной магистерской диссертации Анастасии Пучковой 2019 года. Кроме таких же корпусных выводов про части суток, там есть и эксперимент с заполнением пропуска:
– Я сегодня проснулся в 3 …: 33% утра, 67% ночи
– Я сегодня лёг спать в 3 …: 9% утра, 91% ночи
Но точно ли 04:00 — это ещё ночь, а не утро? А вдруг 11:00 — это утро, а не день? Давайте искать в Национальном корпусе русского языка (1, 2).
Вариативность сильнее 90/10 есть в пяти случаях:
– 3 часа ночи (76%) / 3 часа утра (24%)
– 4 часа утра (81%) / 4 часа ночи (19%)
– 11 часов утра (84%) / 11 часов дня (16%)
– 5 часов вечера (69%) / 5 часов дня (31%)
– 11 часов вечера (78%) / 11 часов ночи (22%)
Вроде бы более базовые день и ночь короче утра и вечера: ночь — 4 часа, утро — 8 часов, день — 5 часов, вечер — 7 часов.
Картинку я и правда делал ночью/утром, но этот пост вообще-то основан на пока не опубликованной магистерской диссертации Анастасии Пучковой 2019 года. Кроме таких же корпусных выводов про части суток, там есть и эксперимент с заполнением пропуска:
– Я сегодня проснулся в 3 …: 33% утра, 67% ночи
– Я сегодня лёг спать в 3 …: 9% утра, 91% ночи
Пару месяцев назад Егор Михайлов опубликовал на Афише материал «Маргарита Симоньян или ChatGPT? Сложный тест», в котором посмеивается над стилем новых (и старых переизданных) рассказов Симоньян из сборника «Водоворот». Мне сразу вспомнился похожий тест «Машинный перевод или Платонов», который ходил по интернету лет 8 назад. Интересно, что такие сравнения человека с машиной допускают любую интерпретацию — в случае с Платоновым мало кто ставил под сомнение его достоинства как прозаика, а тест про Симоньян явно должен произвести на читателя впечатление «Ну, раз машина так же может, то ничего ценного в этих рассказах нет». Мне вот всегда хочется знать про такие тесты, сколько отбора и подготовки за ними стоит — как среди машинных предложений, так и среди человеческих; это был бы ценный количественный показатель — но скорее для научного исследования, чем для весёлого теста.
Кончилось всё это, впрочем, тем, что я прочитал рассказы Маргариты Симоньян. Ну и что я могу сказать — рассказы-то хорошие: сюжетные повороты неожиданные, стиль приятный и запоминающийся (ну, иногда действительно слишком много красивостей, но с кем не бывает), (само)ирония и пафос в разумном сочетании. После прочтения рассказов я справился с тестом на Афише на 8 из 9 и мне сказали «Здравствуйте, Маргарита Симоновна!».
В рассказе «Бачишь, кума, це нигр!» много ценного с социолингвистической точки зрения — примеры кубанской балачки, которые выглядят вполне аутентично, и рассуждения про то, какая степень диалектности допустима на прямой линии с Путиным (спойлер: почти никакая).
Я допускаю, что могу быть предвзят, потому что Симоньян с нескрываемой любовью описывает жизнь на сочинском побережье, с которым у меня тоже связано много тёплых воспоминаний — но мой взгляд не настолько изнутри, разумеется. «Сандро из Чегема» я, побывав в Сочи и вокруг, тоже перечитал с гораздо большей увлечённостью.
А если вы ещё не плюнули в экран и не отписались от моего канала к этому абзацу (а ведь мне даже не проплатили пост!), то давайте устроим опрос по одной фразе из этих рассказов. Похожий опрос недавно делала Евгения Холодова, вот и сравним. Угадывать, как написала Маргарита Симоньян, не требуется; выбирайте, как написали и сказали бы вы. Про «дядь Вачика» скоро напишу отдельный пост — не волнуйтесь, там уже будет меньше литературных восторогов.
Кончилось всё это, впрочем, тем, что я прочитал рассказы Маргариты Симоньян. Ну и что я могу сказать — рассказы-то хорошие: сюжетные повороты неожиданные, стиль приятный и запоминающийся (ну, иногда действительно слишком много красивостей, но с кем не бывает), (само)ирония и пафос в разумном сочетании. После прочтения рассказов я справился с тестом на Афише на 8 из 9 и мне сказали «Здравствуйте, Маргарита Симоновна!».
В рассказе «Бачишь, кума, це нигр!» много ценного с социолингвистической точки зрения — примеры кубанской балачки, которые выглядят вполне аутентично, и рассуждения про то, какая степень диалектности допустима на прямой линии с Путиным (спойлер: почти никакая).
Я допускаю, что могу быть предвзят, потому что Симоньян с нескрываемой любовью описывает жизнь на сочинском побережье, с которым у меня тоже связано много тёплых воспоминаний — но мой взгляд не настолько изнутри, разумеется. «Сандро из Чегема» я, побывав в Сочи и вокруг, тоже перечитал с гораздо большей увлечённостью.
А если вы ещё не плюнули в экран и не отписались от моего канала к этому абзацу (а ведь мне даже не проплатили пост!), то давайте устроим опрос по одной фразе из этих рассказов. Похожий опрос недавно делала Евгения Холодова, вот и сравним. Угадывать, как написала Маргарита Симоньян, не требуется; выбирайте, как написали и сказали бы вы. Про «дядь Вачика» скоро напишу отдельный пост — не волнуйтесь, там уже будет меньше литературных восторогов.
«Дядь Вачик подцепил осу заскорузлым ………… ногтем»
Anonymous Poll
8%
отрАщенным
71%
отрОщенным
17%
отращЁнным
5%
отрощЁнным
В предыдущем опросе упоминался дядь Вачик. В той же книге фигурируют дядь Рыжий, дядь Алик, дядь Майдрес, дядь Мигран, дядь Грант, дядь Хачик, тёть Зуза — и одинокий дядя Петя с окончанием. Это, конечно, не самый смелый эксперимент — так делают; но многие авторы решаются писать дядь и тёть только в функции обращения, а тут эти слова становятся несклоняемыми и односложными во всех падежах.
Нельзя не признать, что строгие правила русской орфографии сильно мешают передавать живую речь: попробуй-ка не напиши непроизносимое й в слове коктейль или непроизносимое и в слове специальный. Да впрочем, грамотный человек чаще всего и не задумывается, что он говорит спе[ца́]льный: он же просто помнит написание этого слова как готовый визуальный образ.
А вот кому приходится задумываться, так это поэтам, если они пишут классическим или близким к классическому стихом, в котором важен счёт слогов. Самый смелый экспериментатор в этой сфере — Юлий Гуголев (которого я горячо рекомендую не только как источник языкового материала, но и как замечательного поэта). Его орудие — это апостроф. Вот примеры, которые я выписал из его стихов:
Нельзя не признать, что строгие правила русской орфографии сильно мешают передавать живую речь: попробуй-ка не напиши непроизносимое й в слове коктейль или непроизносимое и в слове специальный. Да впрочем, грамотный человек чаще всего и не задумывается, что он говорит спе[ца́]льный: он же просто помнит написание этого слова как готовый визуальный образ.
А вот кому приходится задумываться, так это поэтам, если они пишут классическим или близким к классическому стихом, в котором важен счёт слогов. Самый смелый экспериментатор в этой сфере — Юлий Гуголев (которого я горячо рекомендую не только как источник языкового материала, но и как замечательного поэта). Его орудие — это апостроф. Вот примеры, которые я выписал из его стихов:
Мож’т, кого другого ждут…Лично мне у Гуголева нравится почти каждый апостроф: сразу думаешь, как же тонко он слышит и не стесняется этого. Лично я с детства с нетерпением жду, когда уже велят писать некотрый и будут ставить двойки тем, кто пишет некоторый. Слово прям, как и прост, давно уже так пишут. А как ж’ это можно примечательно тем, что писать ж вообще-то разрешено, но обычно оно возникает только после гласного, а тут выпадению слога способствует положение перед гласным.
В Германии ходил я на флёмаркт,
В Америке бывал я на ярд-сейлах,
но там иначе, отстранённей как-т’,
— среди вещей поломанных и целых…
а вот все-т’ки погоды такой, я смотрю, раньше не было…
Как ж’ это можно – все время молиться
и – в то же время – жить, притворясь!
лишь справедливости, —
как Всевол’д Николаич.
Мы с тобой, шахидка,
в следу’щем поедем.
и сиял его фот’аппарат
среди фото- и видеокамер.
Запахи умеют тоже плавать,
Некот’рые – очень далеко…
Но сам-то где я с’час стою
купцом, продавцем и менялой?
А шайка наша – деды и отцы.
Какие ж все-т’ки взрослые – лжецы!
геотэг – не то чтоб прям’ «Бутырки»,
но – категорически «за МКАД».
Он что-т’такое ляпнул про Коран,
Всевышнего и, заодно, Пророка.
но чувствую, что в черепе моем
обосновался, как б’т’ск’ать, Кондратий.
Н’вот взять хоть тех, чью пламенную речь
я грешным делом почитаю чушью
кому, когда и сколько могут дать,
нам все-т’ки не дано предугадать.
Мне все-т’ки интересно, восемьсот
отсыплют сразу или порционно?
А можно как-н’дь выговор? … А штраф?
У Анфис’ Владимировны при́говор суров
О СЛОНАХ И НЕ ТОЛЬКО
Пытался разобраться в этимологии слова слоняться — есть там слон или нет слона.
Фасмер возводит слоняться к тому же корню, что и прислоняться, но семантический переход выглядит не слишком убедительно. Впрочем, в «Словаре русского языка XI–XVII вв.» есть два примера на слоняться — XVI и XVII в. соответственно. Слоны тогда были ещё не очень популярны там, где говорили по-русски, так что не удивлюсь, если исконно этимологической связи со слоном действительно нет и это что-то типа «ставить себя в разные места», а уже потом это слово переосмыслилось.
Очень тонко про взаимодействия разных слов с корнем -слон- пишет этнограф С. В. Максимов в своих «Крылатых словах» (1890):
******************************************
Слоняться в смысле бездельничать; водить слонов — ничего не делать, даром теряя время, один толковник пустился объяснять случаем из времен Екатерины. Слонов, приведенных царице от персидского шаха, «целые дни водили по Петербургу на показ народу, а за ними целые толпы, преимущественно молодежи, побросавшей всякой занятие, ходили разиня от изумления рот». Для Петербурга такое объяснение может быть и понятно, и вполне заслуженное, но дело в том, что исстари поется в одной песне не слон сло̀нится (см. слоняется) — грузно идет, неуклюжий; — валит тяжелой походкой, а в сборнике былин Кирши Данилова, при описании богатырского лука, говорится, что у него «полосы были булатные, а жилы слоны̀ сохатные». Отсюда Даль имел полное основание заключить, что не одно лишь животное жарких стран называлось слоном, но что под этим именем разумелось встарь вообще тяжелое или большое животное, которое «сло̀ном слоняется» по лесам, хотя бы подобно тому же сохатому сибирскому лосю наших лесов (а сохатый он за то, что рога у него широкие, вилообразные, т. е. развилистые или с рассохою). Но и в последнем выражении «сло̀ном слоняться» все-таки слона не видно из-за обычного родному языку приема выражений подобных, например, нижеследующим: поедом ест, поколотом бьется, живмя живет, ревмя ревет, бегом бежит, потребовавших деепричастий для поддержки с целью усиления впечатлений и значения.
******************************************
Пожалев о том, что в современных этимологических словарях никто не напишет «Для Петербурга такое объяснение может быть и понятно», вернёмся к слону: его этимология тоже неясна. Первая из приводимых Фасмером версий гласит, что это искусственное образование от того же при-слон-иться, потому что слон якобы спит, прислоняясь к дереву. Впрочем, сближение с тюркским львом (турецкое aslan) выглядит понадёжнее, хотя тут смущает различие в значении (да, известно, что верблюд — это по происхождению греческий ‘слон’, но вообще-то идея, что название любого экзотического животного может заимствоваться в название любого другого экзотического животного — это ящик Пандоры), да и с фонетикой там есть о чём подумать.
В общем, ни насчёт слоняться, ни насчёт слона я точных ответов дать не могу, но поделюсь тремя прекрасными словами, на которые я наткнулся в ходе этих штудий:
— слонява (XVI век): нет, это не про слона, а про соль: ‘засоленная почва, солончак’;
— слоновщик (XVII век): ‘тот, кто присматривает, ухаживает за слонами, погонщик слонов’ — кроме крановщика вспомнился гуртовщик мыши, а у Ушакова есть волковщик ‘рабочий на волке’ (это не живой волк, а машина).
— слононачальник: есть в церковнославянском тексте Третьей книги Маккавейской; хорошее слово для скороговорок.
Ну и как же без цитирования и благодарности, переходящей в рекламу: обсуждение слова слоняться началось в разговоре с Элей Новопашенной, которая, между прочим, ведёт отличный канал про Берлин.
Пытался разобраться в этимологии слова слоняться — есть там слон или нет слона.
Фасмер возводит слоняться к тому же корню, что и прислоняться, но семантический переход выглядит не слишком убедительно. Впрочем, в «Словаре русского языка XI–XVII вв.» есть два примера на слоняться — XVI и XVII в. соответственно. Слоны тогда были ещё не очень популярны там, где говорили по-русски, так что не удивлюсь, если исконно этимологической связи со слоном действительно нет и это что-то типа «ставить себя в разные места», а уже потом это слово переосмыслилось.
Очень тонко про взаимодействия разных слов с корнем -слон- пишет этнограф С. В. Максимов в своих «Крылатых словах» (1890):
******************************************
Слоняться в смысле бездельничать; водить слонов — ничего не делать, даром теряя время, один толковник пустился объяснять случаем из времен Екатерины. Слонов, приведенных царице от персидского шаха, «целые дни водили по Петербургу на показ народу, а за ними целые толпы, преимущественно молодежи, побросавшей всякой занятие, ходили разиня от изумления рот». Для Петербурга такое объяснение может быть и понятно, и вполне заслуженное, но дело в том, что исстари поется в одной песне не слон сло̀нится (см. слоняется) — грузно идет, неуклюжий; — валит тяжелой походкой, а в сборнике былин Кирши Данилова, при описании богатырского лука, говорится, что у него «полосы были булатные, а жилы слоны̀ сохатные». Отсюда Даль имел полное основание заключить, что не одно лишь животное жарких стран называлось слоном, но что под этим именем разумелось встарь вообще тяжелое или большое животное, которое «сло̀ном слоняется» по лесам, хотя бы подобно тому же сохатому сибирскому лосю наших лесов (а сохатый он за то, что рога у него широкие, вилообразные, т. е. развилистые или с рассохою). Но и в последнем выражении «сло̀ном слоняться» все-таки слона не видно из-за обычного родному языку приема выражений подобных, например, нижеследующим: поедом ест, поколотом бьется, живмя живет, ревмя ревет, бегом бежит, потребовавших деепричастий для поддержки с целью усиления впечатлений и значения.
******************************************
Пожалев о том, что в современных этимологических словарях никто не напишет «Для Петербурга такое объяснение может быть и понятно», вернёмся к слону: его этимология тоже неясна. Первая из приводимых Фасмером версий гласит, что это искусственное образование от того же при-слон-иться, потому что слон якобы спит, прислоняясь к дереву. Впрочем, сближение с тюркским львом (турецкое aslan) выглядит понадёжнее, хотя тут смущает различие в значении (да, известно, что верблюд — это по происхождению греческий ‘слон’, но вообще-то идея, что название любого экзотического животного может заимствоваться в название любого другого экзотического животного — это ящик Пандоры), да и с фонетикой там есть о чём подумать.
В общем, ни насчёт слоняться, ни насчёт слона я точных ответов дать не могу, но поделюсь тремя прекрасными словами, на которые я наткнулся в ходе этих штудий:
— слонява (XVI век): нет, это не про слона, а про соль: ‘засоленная почва, солончак’;
— слоновщик (XVII век): ‘тот, кто присматривает, ухаживает за слонами, погонщик слонов’ — кроме крановщика вспомнился гуртовщик мыши, а у Ушакова есть волковщик ‘рабочий на волке’ (это не живой волк, а машина).
— слононачальник: есть в церковнославянском тексте Третьей книги Маккавейской; хорошее слово для скороговорок.
Ну и как же без цитирования и благодарности, переходящей в рекламу: обсуждение слова слоняться началось в разговоре с Элей Новопашенной, которая, между прочим, ведёт отличный канал про Берлин.
🪨 📄 ✂️
По-русски камень, ножницы, бумага. По-английски rock, paper, scissors. А что ещё бывает в языках мира? Вооружимся Википедией и составим карту.
В мою очень несбалансированную выборку попали 54 языка, в которых эта игра называется тремя ключевыми словами в каком-то порядке:
– RPS (КБН): 26 языков (48%)
– RSP (КНБ): 20 языков (37%)
– SRP (НКБ): 3 языка (5%) — немецкий, корейский, монгольский
– PSR (БНК): 2 языка (4%) — эсперанто, сицилийский
– PRS (БКН): 2 языка (4%) — польский, сербский
– SPR (НБК): 1 язык (2%) — тайский
Порядок не просто заимствуется вместе с игрой, но зависит от ритмических факторов: ср. kámen, nůžky, papír по-чешски и kameň, papier, nožnice по-словацки (ударение везде на 1-м слоге, значит, словацкие ножницы могут быть только последними). В некоторых языках есть вариативность: в британском английском бывает paper, scissors, stone, то есть редкий порядок PSR; по-сербски и польски, кажется, бывает камень на первом месте, и тогда это скучный RPS.
По-итальянски чаще говорят не sasso, carta, forbici, а morra cinese ‘китайская морра (старинная игра на пальцах)’. По-вьетнамски — oẳn tù tì, что происходит от one-two-three.
Ах да, можно же ещё долго спорить, цу-е-фа там в конце или раз-два-три, но в любом случае по-русски в камень-ножницы-бумага что-то-там в сумме 11 слогов. А вот экономные шведы обходятся 4 слогами: sten, sax, på-se 'камень, ножницы, пакет' и выбрасывают уже на -se в слове påse — из чего, кстати, следует, что двусложное слово обязано быть последним.
По-русски камень, ножницы, бумага. По-английски rock, paper, scissors. А что ещё бывает в языках мира? Вооружимся Википедией и составим карту.
В мою очень несбалансированную выборку попали 54 языка, в которых эта игра называется тремя ключевыми словами в каком-то порядке:
– RPS (КБН): 26 языков (48%)
– RSP (КНБ): 20 языков (37%)
– SRP (НКБ): 3 языка (5%) — немецкий, корейский, монгольский
– PSR (БНК): 2 языка (4%) — эсперанто, сицилийский
– PRS (БКН): 2 языка (4%) — польский, сербский
– SPR (НБК): 1 язык (2%) — тайский
Порядок не просто заимствуется вместе с игрой, но зависит от ритмических факторов: ср. kámen, nůžky, papír по-чешски и kameň, papier, nožnice по-словацки (ударение везде на 1-м слоге, значит, словацкие ножницы могут быть только последними). В некоторых языках есть вариативность: в британском английском бывает paper, scissors, stone, то есть редкий порядок PSR; по-сербски и польски, кажется, бывает камень на первом месте, и тогда это скучный RPS.
По-итальянски чаще говорят не sasso, carta, forbici, а morra cinese ‘китайская морра (старинная игра на пальцах)’. По-вьетнамски — oẳn tù tì, что происходит от one-two-three.
Ах да, можно же ещё долго спорить, цу-е-фа там в конце или раз-два-три, но в любом случае по-русски в камень-ножницы-бумага что-то-там в сумме 11 слогов. А вот экономные шведы обходятся 4 слогами: sten, sax, på-se 'камень, ножницы, пакет' и выбрасывают уже на -se в слове påse — из чего, кстати, следует, что двусложное слово обязано быть последним.
Запустилась долгожданная новая версия «Грамоты.ру»! Официальный пресс-релиз ниже, а я от себя отмечу, что это шаг на пути к тому, о чём я давно мечтаю — к открытым словарям в идеологии linked data. Примерно про это же — про проект Национального словарного фонда — есть рассказ Марии Каленчук. Отдельно приятно, что теперь общедоступен (и высоко выдаётся в результатах поиска, что тоже немаловажно) самый новый и лучший орфоэпические словарь Каленчук—Касаткин—Касаткина. Ну и много другого интересно, например интервью с Владимиром Плунгяном про корпусную лингвистику. Ой, кстати, про корпусную лингвистику или о корпусной лингвистике? Поиск по справочной службе тоже стал удобнее, и многократно данный ответ на этот вопрос можно легко узнать — правда, он мне не нравится, но с этой претензией к моей письменной речи я уже смирился 😉
***
Перезапуск портала «Грамота.ру»
Сегодня, в День словаря, который отмечается в России в день рождения Владимира Ивановича Даля, состоялся запуск обновленной Грамоты.
Портал был создан в 2000 году и сразу стал одним из самых популярных источников информации о русском языке. За 23 года справочная служба Грамоты подготовила около 300 тысяч ответов на вопросы пользователей. И пришла пора обновиться!
Что же появилось нового?
✏️ Теперь на сайте есть единая мощная система поиска, которая построена с применением технологий машинного обучения.
✏️ Еще одним новшеством стал Метасловарь, который объединил материалы из разных словарей русского языка. Информация представлена в форме карточки слова, где для удобства пользователя собраны все данные о нём: написание, ударение, толкование. В каждой карточке есть таблицы с формами слова, а само слово озвучено при помощи технологии синтеза речи платформы SaluteSpeech.
✏️ Появился раздел «Учебник» — удобный помощник в изучении русского языка для учителей и учащихся: здесь собраны основные правила орфографии и пунктуации, каждое из которых содержит упражнение.
✏️ Теперь у Грамоты есть собственное медиа — это раздел «Журнал», где регулярно публикуются новости, статьи, связанные с русским языком и рассчитанные на самую широкую аудиторию. Научно-популярные тексты о жизни русского языка, правилах и нормах, языковой политике, технологиях, о новостях науки готовит редакция Грамоты вместе с ведущими российскими экспертами.
Заходите на обновленный сайт gramota.ru и делитесь впечатлениями на канале Грамота.ру!
***
Перезапуск портала «Грамота.ру»
Сегодня, в День словаря, который отмечается в России в день рождения Владимира Ивановича Даля, состоялся запуск обновленной Грамоты.
Портал был создан в 2000 году и сразу стал одним из самых популярных источников информации о русском языке. За 23 года справочная служба Грамоты подготовила около 300 тысяч ответов на вопросы пользователей. И пришла пора обновиться!
Что же появилось нового?
✏️ Теперь на сайте есть единая мощная система поиска, которая построена с применением технологий машинного обучения.
✏️ Еще одним новшеством стал Метасловарь, который объединил материалы из разных словарей русского языка. Информация представлена в форме карточки слова, где для удобства пользователя собраны все данные о нём: написание, ударение, толкование. В каждой карточке есть таблицы с формами слова, а само слово озвучено при помощи технологии синтеза речи платформы SaluteSpeech.
✏️ Появился раздел «Учебник» — удобный помощник в изучении русского языка для учителей и учащихся: здесь собраны основные правила орфографии и пунктуации, каждое из которых содержит упражнение.
✏️ Теперь у Грамоты есть собственное медиа — это раздел «Журнал», где регулярно публикуются новости, статьи, связанные с русским языком и рассчитанные на самую широкую аудиторию. Научно-популярные тексты о жизни русского языка, правилах и нормах, языковой политике, технологиях, о новостях науки готовит редакция Грамоты вместе с ведущими российскими экспертами.
Заходите на обновленный сайт gramota.ru и делитесь впечатлениями на канале Грамота.ру!
gramota.ru
Грамота.ру
Портал о русском языке, включающий словари и справочники, справочную службу с ответами экспертов, учебник с упражнениями, а также журнал о русском языке
Приходите во вторник, 20:00 МСК на благотворительную онлайн-лекцию про ударение! Ожидается краткий обзор древнерусского ударения, занимательно-душные квизы по орфоэпическому словарю и дрозофила, которая слабее зебры, но слабей слона! Регистрация — по ссылке.
Forwarded from Системный Блокъ
«По ком звОнит твОрог»: благотворительная лекция про русское ударение от лауреата «Просветителя»
Лингвист Александр Пиперски и «Системный Блокъ» проводят благотворительную лекцию для фонда «Жизненный путь». Фонд помогает людям с ментальными особенностями жить вне ПНИ, а мы помогаем фонду и его подопечным перезимовать. Вы тоже можете помочь.
Лекция Александра Пиперски пройдет 28 ноября и будет посвящена тонкостям русского ударения — сложнейшей системы, которая ставит в тупик иностранцев. Мы — носители языка — почти не думаем о том, насколько русское ударение сложное, интересное и непостоянное. Разве что иногда ворчим на слово звОнит (и зря). Вот что говорит о предстоящей лекции сам Александр Пиперски:
Если вы говорите «красивEе», вас обвинят в необразованности. Если вы говорите «осУжденный», вы, вероятно, работаете в прокуратуре. Если вы ловко ставите ударение то на окончание, то на корень, то на предлог, говоря «рукА», «рУку» и «зА руку», вы, скорее всего, носитель русского языка и даже не задумываетесь об этом — а иностранцу пришлось бы помучиться.
В этой лекции мы обсудим:
– как ударение различает людей в обществе;
– как вышло, что древнерусская система постановки ударения была простой и логичной, а в современном русском языке всё стало гораздо сложнее;
– что может рассказать об ударении электронный корпус русской поэзии и правда ли Пушкин писал «ты пищу в нём себе варИшь», потому что не мог подобрать нормальную рифму к «зришь» (спойлер: неправда)».
📍28 ноября ⏰ 20:00 по Москве, онлайн. Записаться на лекцию и помочь подопечным фонда не оказаться снова в ПНИ можно здесь
#ЩедрыйВторник
Лингвист Александр Пиперски и «Системный Блокъ» проводят благотворительную лекцию для фонда «Жизненный путь». Фонд помогает людям с ментальными особенностями жить вне ПНИ, а мы помогаем фонду и его подопечным перезимовать. Вы тоже можете помочь.
Лекция Александра Пиперски пройдет 28 ноября и будет посвящена тонкостям русского ударения — сложнейшей системы, которая ставит в тупик иностранцев. Мы — носители языка — почти не думаем о том, насколько русское ударение сложное, интересное и непостоянное. Разве что иногда ворчим на слово звОнит (и зря). Вот что говорит о предстоящей лекции сам Александр Пиперски:
Если вы говорите «красивEе», вас обвинят в необразованности. Если вы говорите «осУжденный», вы, вероятно, работаете в прокуратуре. Если вы ловко ставите ударение то на окончание, то на корень, то на предлог, говоря «рукА», «рУку» и «зА руку», вы, скорее всего, носитель русского языка и даже не задумываетесь об этом — а иностранцу пришлось бы помучиться.
В этой лекции мы обсудим:
– как ударение различает людей в обществе;
– как вышло, что древнерусская система постановки ударения была простой и логичной, а в современном русском языке всё стало гораздо сложнее;
– что может рассказать об ударении электронный корпус русской поэзии и правда ли Пушкин писал «ты пищу в нём себе варИшь», потому что не мог подобрать нормальную рифму к «зришь» (спойлер: неправда)».
📍28 ноября ⏰ 20:00 по Москве, онлайн. Записаться на лекцию и помочь подопечным фонда не оказаться снова в ПНИ можно здесь
#ЩедрыйВторник
95 лет Хомскому! По этому случаю — юбилейная статья Якова Георгиевича Тестельца.
https://www.kommersant.ru/doc/6367420
https://www.kommersant.ru/doc/6367420
Коммерсантъ
Революция Ноама Хомского
Самому влиятельному лингвисту последних шести десятилетий исполняется 95 лет
Разговаривал сегодня с одним сербом. Он мне сказал, что лингвистика — хорошая наука, многое в жизни объясняет. Вот, например, рад — это ‘работа’, а радост — ‘радость’. А значит, нема радости без рада, нет радости без работы.
Реально полезная наука, да.
Реально полезная наука, да.
Практические проблемы омонимии: невозможно написать Get well soon человеку, про которого известно, что он травмировался, упав в колодец.