О словах и не только
4.06K subscribers
76 photos
1 video
2 files
88 links
Александр Пиперски: лингвистические заметки

@apiperski
加入频道
В России в кого ни ткни, всех зовут Александр, а бывают же страны, где имена разные. Как бы это посчитать?

Возьмём большой набор данных для разных стран — имена футболистов с Transfermarkt. Очевидно, что это не про имена вообще, а про имена молодых мужчин, но пренебрежём этим перекосом ради удобства и сопоставимости и посчитаем индекс Симпсона: какова вероятность, что имена у двух случайно взятых игроков из одной страны совпадут. Чем она выше, тем меньше разнообразие? А если разделить 1 на индекс Симпсона, то получим условное количество имён для данной страны: если вероятность совпадения 0,01, то родители как бы выбирают из 100 равновероятных имён; а если 0,02, то как бы из 50 и т. п.

Выше всего разнообразие имён в Западной Европе и в Турции: там самое частотное имя не набирает и 3%. Северная Европа, Западная Африка и Южная Америка где-то посередине, а в Южной и Восточной Европе царит однообразие. Ясно, что где-то просто больше плавильный котёл национальностей, а где-то меньше, но такие сильные расхождения только этим не объяснить: значит, всё-таки есть культурные различия в практиках именования.

И, конечно же, интересно просто почитать тройки лидирующих имён (если 3-е место делят несколько имён, привожу их все): в 8 странах из 23 в топе есть Иван, а в 6 странах — Александр. Лидерство Патрика в Германии и Антони во Франции для меня было неожиданным. А вам что-нибудь бросается в глаза в этой таблице?
Замечательная новость вчерашнего дня: Международный математический союз присудил премию Лилавати в области популяризации математики Николаю Андрееву. Многие из вас наверняка знают сайт «Математические этюды» и книгу «Математическая составляющая», в которой есть две статьи про лингвистику: В. А. Успенского и автора этого канала. Конечно, «Математическая составляющая» — книга из числа тех, что лучше держать в руках, чем смотреть в интернете: она сделана с невероятной красотой и вкусом. Мои любимые главы — про конический фужер, картографические проекции и созвездия, а вам наверняка придётся по душе что-то своё. А ещё я очень люблю модели, которые делает Николай Андреев и его команда: они позволяют в прямом смысле этого слова пощупать математику — вот, например, головоломка про теорему Пифагора. На сайте фигурки расположены так, что я сейчас справился очень быстро, но когда это физическая головоломка, я почему-то каждый раз застреваю надолго.

Видео с церемонии вручения премии Лилавати доступно здесь, а можно и отдельно посмотреть ролик про Николая Андреева и философию его работы. Кстати, премию Лилавати спонсирует компания InfoSys, которая в 2016 году была основным спонсором и организатором XIV Международной олимпиады по лингвистике в Майсуре (Индия).
В январе этого года я ходил на женский волейбольный матч между московским «Динамо» и «Тюрк Хава Йоллары» из Стамбула. «Динамо» выиграло, а я, сидя на трибуне, задумался: что же, интересно, значит название их соперниц? Так и не посмотрел.

Кто бы мог подумать, что полгода спустя у меня такого вопроса уже не будет и в понедельник, 11 июля, в 19:00 МСК я буду читать лекцию про турецкий язык. Как видите, я не скрываю, что взгляд на турецкий язык у меня м-м-м довольно свежий, но надеюсь, что это не страшно.

Вот некоторые темы, которые мы обсудим:
— что такое «Тюрк Хава Йоллары» (ну это вы уже поняли и мысленно перевели на английский) и почему на их эмблеме написано «спор кулюбю», а не «спорт клуб» (отчитаюсь за каждую букву!);
— правда ли турки думают по-другому, чем мы, потому что у них другой порядок слов (спойлер: весьма вероятно);
— как этот порядок слов связан с количеством падежей (спойлер: падежей будет только больше);
— что общего между турецким винительным падежом и русской одушевлённостью (спойлер: страшное слово DOM);
— можно ли ввести новый алфавит за два месяца и к чему это приводит (спойлер: в целом всё супер, хотя из моей фамилии получается ПЫПЕРСКЫ).

Zoom (идентификатор: 822 1634 9548, код: 836230)

Лекция проходит в рамках благотворительного марафона за пожертвования на участие команды России в Международной олимпиаде по лингвистике (подробнее). Карты для пожертвований: ВТБ 4893 4705 1775 6562 (Анастасия Пучкова); Сбер 2202 2002 8577 1372 (Антон Сомин).
Когда школьники начинают заниматься лингвистикой, они часто спрашивают: «А кем я буду работать?». Раньше я начинал ответ на этот вопрос с того, что в Макдональдсе никто из знакомых мне лингвистов не работает; сейчас это заявление стало ещё более неоспоримым, но вообще обычно после разговоров про то, что можно заниматься наукой и преподавать иностранные языки, я прихожу к компьютерной лингвистике, и это сразу всех радует: ясно же, что где компьютер, там деньги.

Да, перспектива заманчивая, но возникает вопрос: а насколько похожа современная компьютерная лингвистика на то, как её показывают школьникам? После того, как я сегодня прочитал лекцию про это на сборах Азиатско-Тихоокеанской лингвистической олимпиады, меня в чате спросили, не думаю ли, что я отвращаю слушателей от занятий лингвистикой. Надеюсь, что нет: проблематизировать надо, а предупреждён значит вооружён.

Для тех, кого интересует эта тема, прилагаю презентацию; а можно просто получить удовольствие от подборки задач по компьютерной лингвистике, которая эту презентацию сопровождает.
Как завоевать Константинополь, имея в своём распоряжении только гугл-транслейт
Кажется, раньше не упоминавшийся пример энантиосемии (это когда одно и то же слово может иметь прямо противоположные значения):

развязать узелразвязать войну

развязать X
— сделать так, чтобы X прекратил существование
развязать X — сделать так, чтобы X начал существование
КОСВЕННЫЕ ФЕМИНИТИВЫ

Очень интересный кейс к дискуссии о феминитивах. Я случайно наткнулся на старый сайт кафедры общего языкознания СПбГУ. То, что там написано, давно не актуально, но обратите внимание на строку «Зам. заведующей кафедрой». Лично я бы так не написал, хотя после «Заведующей кафедрой» это вполне логично. Получается, что выбор рода здесь выражает выбор между конкретно-референтным пониманием (заместитель вот именного данной конкретной заведующей) и генерическим (родовым: должность такая, а кого замещать — неважно).

С грамматикой заместителей вообще есть о чём подумать: вот МакГонагалл — Deputy Headmistress при Дамблдоре, но из наличия Deputy Headmistress не следует, что в школе есть Headmistress. Из наличия заместителя заведующей следует, что есть именно заведующая, а из наличия заместителя заведующего не следует ничего.
ОДИН ТАМ*

В современном русском языке есть новое неопределенное местоимение один там:

(1) приехать домой зайти на фикбук и увидеть уведомления об изменених в тексте одного там фанфика и вот я уже питаю скорее всего ложные надежды на то что он однажды будет опубликован..

(2) щас пересматриваю свой урок для подростков, который вела в июне, чтоб вспомнить одну там тему

Основное значение один там — это слабая определенность (конкретный объект, известный говорящему, но неизвестный слушающему). Это же и одно из значений слова один, но, видимо, один слишком многозначно, поэтому его понадобилось усилить словом там.

Ещё более явный аналог один там — местоимение кое-какой. Правда, по данным Национального корпуса русского языка его частотность за последние 50 лет упала почти до нуля. Это, если честно, меня не удивляет, а больше удивляет, что в языках мира вообще встречаются местоимения слабой определенности: говорить «я знаю какой, но не скажу» — это же довольно по-хамски. Эта хамскость в разговорном русском языке иногда снимается местоимениями неизвестности на -то:

(3а) Я вчера зашёл к букинисту, купил кое-какую книгу.
(3б) Я вчера зашёл к букинисту, купил какую-то книгу.

Говорящий, конечно, знает, какую книгу он купил, но в (3б) он помогает слушающему сохранить лицо, делая вид, что всё не так однозначно и точной информации нет ни у кого. У меня есть (не знаю, насколько достоверное) ощущение, что слово какой-то в таких смягчающих контекстах обязательно редуцируется: надо говорить Я купил ку-т книгу, а не какую-то книгу, при том что во фразе с подлежащим в 3-м лице возможна разная полнота произнесения: Он купил какую-то/ку-т книгу. Это же — одна из функций неопределенного артикля в западноевропейских языках.

Но бывает развитие значения, которое делает местоимение слабой определенности нехамским: «я знаю какой, но не скажу не потому, что вам не надо знать, а потому что вы и так знаете»; говоря языком Роулинг, «-Who-Should-Not-Be-Named»:

(4) (над фотографией в довольно откровенном купальнике) Раскрываем одну там тему

(5) Ждём одно там обращение.

Здесь, наоборот, это местоимение оказывается по функции близким к определенному артиклю.

Вообще, очень интересно следить за возникновением новых местоименных слов: один там, чтобы что?, где территориально?. Прямо как на марафоне, волнуешься, кто из них дойдет до финиша и грамматикализуется как следует, а кто блеснёт на старте, но затем сойдёт с дистанции.

* Пост написан на основе наблюдения, сделанного Александрой Борисенко.
КОРПУСНАЯ ЛИНГВИСТИКА И РЕАЛЬНЫЙ МИР

Для некоторых расчётов я тут скачал 200 тысяч русскоязычных твитов за сегодня и 200 тысяч твитов за вчера. Во вчерашних твитах заметно чаще, чем сегодня, встречаются слова спать, гл, мэнд, спокойной, ночи, снов, лавров, доброй, сладких, аватаршоу. В сегодняшних твитах заметно чаще, чем вчера, встречаются слова байх, даа, байгаа, гэдэг, дээ, байна, гэсэн, чинь, гэж и некоторые другие.

Ну, естественно, я полез разбираться. Оказалось, что вчерашние твиты скачивались начиная с тех, что написаны в 23:59 UTC, и дошли назад примерно до 18:00 UTC, то есть все эти спокойной и сладких — это то, что люди писали с 21:00 МСК до 03:00 МСК. А сегодняшние тексты — это, соответственно, с 10:00 до 14:00 UTC, то есть с 13:00 до 17:00 МСК, а ночные ещё не подоспели. Сегодняшняя популярность монгольских слов имеет ту же природу: твиттер, похоже, вообще не знает про монгольский язык и записывает его в русский, но вчерашний промежуток времени захватил ночь в Улан-Баторе (с 02:00 до 08:00), когда монголы спали, а сегодня у них было самое время потвитить — с 18:00 до 22:00, поэтому монгольских постов гораздо больше.

Почему-то одно из самых приятных чувств, которые я получаю от занятий корпусной лингвистикой, — это когда удаётся найти какой-нибудь такой дурацкий перекос.

P.S. Раньше ещё можно было переводить в гугл-транслейте длинные сочетания гласных с монгольского и получать всякие странные переводы. Сейчас это так не работает, но зато я перевёл те слова, которые перечислил выше, и получил:

быть, быть, быть, быть, быть, быть, быть, быть

Не вникаю в вопрос о том, насколько это осмысленные переводы, но тоже весьма поэтично.
СИММЕТРИЯ

Я начал утро с чтения споров о том, надо ли говорить «кыргызский» или «киргизский». Набор аргументов вполне обычный для дискуссии «вы называете нас не так, как мы! — всегда называли и будем называть!»: колониализм, а я ничего такого не имею в виду, уважайте другую страну, а почему мне кто-то должен указывать и т. д. Но это один из тех редких случаев, когда есть собственно лингвистическое соображение: в русском языке не бывает сочетаний «кы» и «гы». Окончательным этот аргумент, естественно, не является; но аналогичный довод возникает и в спорах про Türkiye, потому что буквы ü нет в английском алфавите, а вот, например, отказываться писать два «н» в слове «Таллинн» на таком основании сложнее.

Но в данном случае интереснее всего симметрия, с которой два языка не могут назвать друг друга:
— по-русски нет сочетаний «кы» и «гы»;
— по-к[ыи]рг[ыи]зски слова не могут начинаться на «р», поэтому Россия будет «Орусия», а русский язык — «орусча». (В словаре есть две страницы заимствований типа «романтизм» и «рыцарь», но это всё не то, конечно.)

Вообще, иногда полезно представлять себе альтернативную историю, в которой русские люди возмущаются гласным «о» в слове «орусча» или гласным «y» в шведском слове «Ryssland»: сразу понимаешь, почему все эти споры абсурдны с точки зрения фонетики и грамматики, но важны с точки зрения социолингвистики.
ЗАЯВЛЕНИЕ

По-турецки «обращаться с заявлением» — başvurmak, «заявление» — başvuru. Эти слова образованы от baş ‘голова’ и vurmak ‘бить’, то есть это буквально «бить челом» и «челобитная». Жаль, что такие слова — лёгкий хлеб для составителей этимологических словарей: написал себе «от чело + бить, первое упоминание тогда-то», а культурную историю, кто у кого калькировал, когда и почему, можно и не прослеживать; а наверняка же там много интересного.

Если посмотреть тюркские языки России, то по-башкирски и по-татарски, где я бы ожидал обнаружить что-то похожее, нашлось только арабское заимствование ғариза / гариза. По-чувашски — заявлени; красивее всего, как обычно, осваиваются русские заимствования по-якутски: сайабылыанньа: [з] и [в] заменяются на [с] и [б], на месте ударного гласного — дифтонг, а все гласные, в том числе и ударный, под влиянием первого слога за- становятся задними.
Лингвистическая задачка
"Отец наорал на сына, потому что он был пьян"
-- кто из двоих был пьян -- отец или сын?
(Иван Сильвестров)

Предположим, что две ситуации (пьяный — отец, пьяный — сын) равновероятны. Тогда можно сказать, что наше предложение может обозначать и одно, и другое с вероятностью 50%: ведь «он» может отсылать как к отцу, так и к сыну.

Но задумаемся вот ещё о чём: а как ещё можно было бы описать эти ситуации? Если пьяный — сын, можно было бы сказать «тот», а не «он»; кроме того, можно было бы сказать «за то, что» вместо «потому что». Если предполагать, что все эти варианты равновероятны, окажется, что ситуацию «пьяный — сын» можно описать четырьмя равновероятными способами, а ситуацию «пьяный — отец» только одним. В итоге получается распределение как на картинке.

А теперь вернёмся к исходному вопросу. Мы услышали фразу «Отец наорал на сына, потому что он был пьян», то есть попали в зелёную область. Обратите внимание, что 80% зелёной области приходится на ситуацию «пьяный — отец», а не на ситуацию «пьяный — сын». Это значит, что первая интерпретация имеет вероятность 80%, а вторая — 20%.

Естественно, здесь очень много упрощающих предположений и не учтено много вариантов описания этих двух ситуаций. Но этот нехитрый пример позволяет понять, что знание языка — это во многом умение достраивать ненаблюдаемое и оперировать условными вероятностями. Для иностранца, который начал учить русский язык, ответ будет «50 : 50»; а вот носитель языка бессознательно проделывает все эти рассуждения или их часть — и в итоге у него получается ответ «80 : 20», а уровень понимания оказывается выше.
ПОРТА

Эксперты: недавний визит и лекции Екатерины Шульман в Казахстане были совершены с одобрения Акорды и преследовал цель нативного пиара для руководства республики.

Из этого поста я узнал, что Акорда — это президентский дворец в Астане. Таких переносов по смежности «резиденция руководства страны → руководство страны» не так уж много: Белый дом, Кремль, Елисейский дворец. Даже Даунинг-стрит, кажется, редко так употребляется по-русски (возможно, потому, что непонятно, какой род использовать в предложениях типа «Даунинг-стрит заявил(а)»). Но есть по крайней мере один случай, когда такой перенос зашёл ещё дальше: «вход в резиденцию руководства страны → руководство страны → страна» — Оттоманская Порта (от итальянского porta ‘ворота’) в значении ‘Османская империя’.

Конечно, трудно понять по текстам, когда имеется в виду руководство страны, а когда страна в целом, но видно, что Оттоманская Порта часто встречается не только рядом с названиями руководства других стран (о … вероятном союзе между Директорией и Оттоманской Портой — Е. Тарле), но и в ряду других названий стран:

Под сими словами сочинитель разумеет преглупую свою французскую оду, на случай мира между Россиею и Оттоманскою Портою сочиненную (В. Капнист)

Отсюда ее войны на юге, борьба с Оттоманской Портой, с Польшей и невольная война с Швецией (Г. Чулков)
ЕДА

Этот канал уже можно переименовывать в «Хроники любительской тюркологии», но остановиться сложно, так что продолжаю в том же духе.

Турецкое слово gıda (читается «гыда́») происходит от арабского ḡiḏāʾ и значит ‘еда’. И, заметьте, очень похоже на русское слово еда — которое, конечно, же, от глагола есть. Но стоп, а как оно от этого глагола образовано и когда? С нулевым суффиксом по какой-то странной, чуть ли не уникальной модели? Да и в словаре XI–XVII веков ѣда впервые свидетельствуется только в XVII веке (ѣдъ был и раньше, но вот чтобы ѣда…). В общем, есть подозрение, что что-то арабо-тюрко-персидское в образовании этого русского слова сыграло роль, хотя строго доказать это сложно.
OVER-RELIANCE ON ENGLISH HINDERS COGNITIVE SCIENCE

Сенсация! The cognitive sciences have been dominated by English-speaking researchers studying other English speakers. Естественно, вышедшая вчера статья Blasí, Henricj, Adamou, Kemmerer & Majid на эту тему тоже написана тоже по-английски.

Но, как бы то ни было, статья очень интересная, рекомендую. Во-первых, мне кажется отличной практикой снабжать статью таким вот саммари с картинками; а во-вторых, там много ценных ссылок на разные исследования.

Я, например, поделюсь тем, что узнал, что в состоятельных канзасских семьях дети за первые 4 года жизни слышат в 3,5 раза — на 30 миллионов слов — больше, чем в бедных (и это называется The 30 Million Word Gap), а отношение «похвала:ругань» в репликах к детям у состоятельных канзасцев в 14 раз выше, чем у бедных.

Надеюсь, и вы для себя найдёте что-нибудь интересное. А, да, и третье достоинство забыл: в статье Blasí et al. в информации об авторах есть не только мейлы, но и ссылки на Твиттеры, впервые такое вижу.
На чемпионате мира по футболу не играют в одной группе команды с одного континента, если это не Европа: нет матчей типа Уругвай — Эквадор. А могло ли получиться не так? Оказывается, могло — а за то, что не получилось, спасибо Боре Милутиновичу.

Жеребьёвка происходила 1 апреля, и было известно, что на турнире будет 13 сборных из Европы (одна ещё не определилась: Уэльс или Украина), 5 — из Азии, 5 — из Африки, 4 — из Южной Америки, 3 — из Северной Америки. Ещё одно место должно было быть разыграно между Азией и Южной Америкой (Австралия — Перу) и одно — между Северной Америкой и Океанией (Коста-Рика — Новая Зеландия).

Требуется, чтобы в группе было не больше 2 команд из Европы и не больше 1 команды из любой другой конфедерации. Если раскидать 32 команды по группам случайно, ограничения были бы соблюдены с вероятностью 0,15% (по итогам 1 000 000 симуляций).

Но команды разделены на 4 корзины по силе (с поправкой: Катар — в первой корзине, 3 неизвестных сборных — в четвёртой). В каждую группу попадает по команде из каждой корзины. Если распределять случайно, но с учётом корзин, вероятность успеха увеличивается не сильно: 0,22%. Нужен более продвинутый алгоритм.

Алгоритм был такой: по очереди вытягиваются сборные из первой корзины, потом из второй и так далее, и команда помещается в первую по алфавиту группу, где она ничего не нарушит. Но и тут успех отнюдь не гарантирован: его вероятность 38,2%.

Но если достать первым из четвёртой корзины сложный шарик «Австралия / Перу», который не сочетается с Азией и с Южной Америкой, вероятность успеха становится 45,3%. И Бора Милутинович, который тянул команды из этой корзины, сделал именно это: надеюсь, благодаря везению, а не охлаждённому шарику 😉 Из двух возможных групп — D и F — Австралия / Перу по алфавиту попадает в D. Угрозу представлял Эквадор: пролежи он почти до конца, ему могли бы остаться только группы с Бразилией и с Уругваем. Но и тут Бора не подвёл: он достаёт Эквадор сразу после Австралии / Перу, пока свободных мест ещё много, и всё получается идеально.
На Элементах вышла моя задача про письменность языка малаялам. Даже если вы не хотите решать задачу, рекомендую послесловие — про то, как пальмовые листья, пишущие машинки и компьютеры в разные стороны меняли малаяльское письмо.
Готовлюсь читать лекцию про эволюцию языка, ищу в интернете какие-нибудь свежие цитаты про то, что а-а-а русский язык гибнет. По запросу в гугле "молодёжь портит русский язык" три верхние цитаты — это «Александр Пиперски рассказал о том, что происходит с русским языком и почему молодежи не стоит бояться испортить великий и могучий», «Портит ли молодежь русский язык? И как меняются языковые привычки? Об изменениях в речи рассказал Игорь Игоревич Исаев» и «Ирина Левонтина считает, что это совершенно нормальное и естественное явление». В общем, ничего не знаю про русский язык, но интернет эти ваши лингвисты испортили до чрезвычайности.
Заимствования из английского языка чаще всего приходят к нам через письмо, но при этом мы стремимся отражать произношение: например, мы пишем копирайтинг, а не копивритинг. Точность этого отражения может быть разной: например, в слове копирайтинг мы заменяем английские [r] и [ŋ] на [р] и [нг] (а с оглушением в именительном падеже даже получается [нк]) — но всё-таки мы стараемся.

Чтобы передавать произношение, полезно знать, как слова произносятся. Но иногда при заимствовании мы ориентируемся на базовые правила чтения, не зная, что они нарушаются в отдельных словах:

– правило «читай ea как [iː ]» — так из sweater [swɛtə] получается свитер;
– правило «читай ch как [tʃ]» — так из Chicago [ʃɪkɑː.ɡəʊ] получается Чикаго.

Одна из самых частых точек расхождения английского происхождения с русским заимствованием — это конечные сочетания «ударный гласный + se».

Русский язык обычно заимствует их с -з: релиз, лендлиз, абъюз. Но английское произношение в этом месте совершенно непредсказуемо: некоторые такие слова имеют [z], а некоторые — [s]. В частности, с [s] произносятся release, Lend-Lease и существительное abuse. А, например, происходящие из похожих греческих источников слова phrase и base звучат по-разному: с [z] и [s] соответственно. Как ни удивительно, противопоставление [z] и [s] довольно стабильно и мало варьирует в разных вариантах английского языка — разве что в британском английском [z] чуть больше.

Иногда в русском языке появляются дублеты: Кофе Хауз, но доктор Хаус из английского [haʊs]. Бывают такие пары и в английском: чаще всего существительное с глухим, а глагол — со звонким, например use и abuse. Но это не универсальное правило: release, например, звучит с [s] вне зависимости от части речи.

Знание о том, что -se после гласного читается как [z], полезно на начальном этапе изучения английского, потому что таких слов больше, и среди них есть высокочастотные: these, because, those, please. Но на более продвинутом этапе изучения оказывается, что это просто свойство каждого отдельного слова.

Вот списки слов на «ударный гласный + se» из числа 20 000 самых частотных английских слов с указанием на произношение последнего звука. Наверняка вы узнаете из них сколько-то интересных слов на [s] или с вариантами (я, составляя эти списки, узнал довольно много).

[z]: these, because, those, please, cause, lose, whose, choose — chose, disease, otherwise, rose, rise — rose, raise, surprise, exercise, phase, cheese, suppose, noise, nose, wise, refuse, enterprise, ease, praise, phrase, cruise, pose, advise, expertise, likewise, Louise, pause, clause, propose, expose, oppose, arise — arose, impose, disclose, applause, hose, disguise, prose, accuse, confuse, demise, comprise, fuse, muse, tease, dispose, despise, revise, guise, compose.
+ имена собственные на -ese (Chinese, Japanese, Portuguese и т. д.)

[s]: house (+ lighthouse, farmhouse, …), case (+ suitcase, staircase, …), release, increase, base (+ database), loose, chase, mouse, dose, decrease, lease, precise, cease, spouse, goose — geese, grease, obese, moose, overdose, Reese, concise, crease

[z] / [s]: use ([z] глаг. / [s] сущ.), close ([z] ‘закрывать, закрытие’ / [s] ‘близкий, тупик’), abuse ([z] глаг. / [s] сущ.), excuse ([z] глаг. / [s] сущ.), erase ([z] UK / [s] US), Syracuse ([z] UK / [s] US), Denise, misuse ([z] глаг. / [s] сущ.), vase ([z] UK / [s] US), diagnose ([z] UK / [s] US), reuse ([z] глаг. / [s] сущ.), blouse ([z] UK / [s] US)

К числу слов с [s], наверное, на всякий случай стоит добавить слова с безударным гласным перед -se:

purpose, promise, purchase, paradise, premise, practise, treatise.

Естественно, некоторая вариативность возможна и в словах из этих списков, а некоторые пометы могут быть оспорены, но тем не менее. Самым удивительным для меня стал комментарий в Wiktionary про vase: There is some tendency in American English to use the pronunciation /vɑz/ for more expensive and/or elegant items, and /veɪs/ for more everyday ones.

P.S. Повод для этого поста — разъяснение Полины Офимкиной про мягкий знак в слове абьюз