Forwarded from Liberal Arts Montenegro
И снова про Зимний сезон Пляжного университета 🐙
Постарались сделать информацию о программе максимально удобной - теперь она и на карточках.
Отдельно мы напишем о каждом преподавателе и курсе и о других подробностях - следите за нашими новостями🔄
📝Записаться
👀Посмотреть на сайте
📧 [email protected]
Постарались сделать информацию о программе максимально удобной - теперь она и на карточках.
Отдельно мы напишем о каждом преподавателе и курсе и о других подробностях - следите за нашими новостями🔄
📝Записаться
👀Посмотреть на сайте
📧 [email protected]
Новости из мира инклюзивных местоимений: женщина пришла в магазин с 4-летней дочерью и сказала «Нам, пожалуйста, два лотерейных билета». Не продали из-за слова «нам» вместо «мне»: несовершеннолетним нельзя.
Впервые встречаю по-русски такое положительное употребление слова «сумасшедший» без существительного. К формам типа «сумасшедший гол» вопросов нет, а это какая-то новая калька с английского crazy.
Forwarded from Матч ТВ
Продолжая спартаковскую тему: очень здравый пост бывшего вратаря Артёма Реброва про изучение иностранных языков.
https://www.sports.ru/football/blogs/3282078.html
https://www.sports.ru/football/blogs/3282078.html
Sports.ru
«Началась депрессия: «Неужели я такой тупой?» Ребров с нуля заговорил на английском после 35, а теперь еще учит испанский
Вы тоже сможете.
О словах и не только
Продолжая спартаковскую тему: очень здравый пост бывшего вратаря Артёма Реброва про изучение иностранных языков. https://www.sports.ru/football/blogs/3282078.html
Развлекаюсь с распознавателем акцента в английском от BoldVoice. Опыты показывают, что когда я читаю естественно-монотонно, во мне признают русского человека, а когда пытаюсь читать с выражением, то немца.
Boldvoice
BoldVoice Accent Oracle
Let the Accent Oracle identify your non-native English accent with precision! The BoldVoice Accent Oracle is the most accurate AI-powered accent detection tool available. Try our free accent checker to analyze your English pronunciation and discover your…
Читал Википедию про реформу орфографии 1918 года, наткнулся на такой скриншот с подписью. Отличный тест для корректоров: сколько секунд нужно, чтобы увидеть упомянутые в подписи три слова. Я этот тест провалил: три раза перечитал, очень устал, но всё равно нашёл только два слова.
В этом квадрате отмечен левый верхний угол. А по-английски — top left corner, с другим порядком прилагательных. Оказывается, это различие есть не только между русским и английским: западнославянские языки предпочитают порядок левый верхний, южнославянские — верхний левый, а восточнославянские, в том числе и русский, находятся посередине между ними, но всё же тяготеют к левому верхнему.
На графике — статистика по всем четырём углам (левый/правый верхний/нижний) по самым большим корпусам этих языков, которые есть в Sketch Engine — от болгарского, где почти всегда горният ляв ъгъл, до словацкого, где почти всегда ľavý horný roh.
Английский ещё дальше болгарского: там 1:26 в пользу top/bottom left/right. Но слово top односложное, а bottom — двусложное. Более длинные слова в сочетаниях однородных членов имеют тенденцию идти позже, поэтому top left и top right побеждают со счётом 1:34, а bottom left и bottom right всего лишь 1:18, то есть сказать left/right bottom всё же лучше, чем left/right top.
На графике — статистика по всем четырём углам (левый/правый верхний/нижний) по самым большим корпусам этих языков, которые есть в Sketch Engine — от болгарского, где почти всегда горният ляв ъгъл, до словацкого, где почти всегда ľavý horný roh.
Английский ещё дальше болгарского: там 1:26 в пользу top/bottom left/right. Но слово top односложное, а bottom — двусложное. Более длинные слова в сочетаниях однородных членов имеют тенденцию идти позже, поэтому top left и top right побеждают со счётом 1:34, а bottom left и bottom right всего лишь 1:18, то есть сказать left/right bottom всё же лучше, чем left/right top.
Как наличие явно выраженных показателей принадлежности меняет значение словосочетания, хорошо видно по-турецки (этому меня три года назад научил Илья Грунтов):
kadın doktor ‘женщина доктор’ — женщина-врач
kadın doktoru ‘женщина доктор-её’ — врач-гинеколог
kadının doktoru ‘женщины доктор-её’ — врач (этой конкретной) женщины
А сегодня я заметил, что в английском есть случай, где различие в показателях принадлежности даёт прямо противоположные значения:
Carlos Alcaraz’s win — победа Карлоса Алькараса
Carlos Alcaraz win — победа над Карлосом Алькарасом
kadın doktor ‘женщина доктор’ — женщина-врач
kadın doktoru ‘женщина доктор-её’ — врач-гинеколог
kadının doktoru ‘женщины доктор-её’ — врач (этой конкретной) женщины
А сегодня я заметил, что в английском есть случай, где различие в показателях принадлежности даёт прямо противоположные значения:
Carlos Alcaraz’s win — победа Карлоса Алькараса
Carlos Alcaraz win — победа над Карлосом Алькарасом
24 января были опубликованы задания Humanity's Last Exam — набора нетривиальных задач из разных областей знания, предназначенных для тестирования мыслительных способностей больших языковых моделей. В отличие от более простых тестов, здесь ни одна модель не справляется более чем с 10 процентами заданий. Датасет снабжён предупреждением, что его нельзя использовать для обучения моделей; посмотрим, как это будет соблюдаться, но создатели утверждают, что сколько-то заданий оставили скрытыми, чтобы продолжать тестировать на них без опасения, что модели просто выучили ответы.
Отдельные примеры заданий можно посмотреть на сайте, а полный датасет доступен на Hugging Face. Я не удержался и прочитал все 45 входящих в него заданий по лингвистике: там много семитологии (от одного автора), задания на знание истории индоевропейских языков (хинди и панджаби, английский, русский), вопросы по разным лингвистическим теориям, в том числе по таким, которые я впервые слышу, и многое другое.
Публиковать вопросы открыто, наверное, не стоит, но, может быть, в русском пересказе и не так страшно, так что позволю себе процитировать самый изящный, на мой взгляд, вопрос: «На какую цифру похож слоговой знак ро из японской хираганы, который выглядит так: ろ?» ChatGPT мне радостно ответил, что на 6. Ещё есть отличный вопрос, в котором даётся древнегреческий текст, но одно слово заменено на форму из другой эпохи греческого языка и надо найти это место. Может быть, эта задача мне нравится, потому что с одним из двух её заданий нейросеть в моей голове справилась :)
Самым популярным лингвистом в этом датасете оказался не кто иной как Андрей Анатольевич Зализняк. По его работам там целых три задачи (а, например, Хомский упомянут лишь в одной): Владислав Порицкий зашифровал до неузнаваемости старую лингвистическую задачу на баскский, Дмитрий Звонкин интересуется порядком древнерусских энклитик, а я сочинил вопрос про древнерусское ударение — хотя и не упомянул Зализняка в решении, а зря.
Как оказывается, ударение вообще очень благодатная тема для того, чтобы издеваться над нейросетями: там есть ещё одна задача про русское ударение, есть японский, иврит, арабский. А я недавно пробовал просить у ChatGPT сербские слова с ударениями нужных мне типов, но было бесполезно.
И да, никогда ещё я не был 396-м автором статьи.
Отдельные примеры заданий можно посмотреть на сайте, а полный датасет доступен на Hugging Face. Я не удержался и прочитал все 45 входящих в него заданий по лингвистике: там много семитологии (от одного автора), задания на знание истории индоевропейских языков (хинди и панджаби, английский, русский), вопросы по разным лингвистическим теориям, в том числе по таким, которые я впервые слышу, и многое другое.
Публиковать вопросы открыто, наверное, не стоит, но, может быть, в русском пересказе и не так страшно, так что позволю себе процитировать самый изящный, на мой взгляд, вопрос: «На какую цифру похож слоговой знак ро из японской хираганы, который выглядит так: ろ?» ChatGPT мне радостно ответил, что на 6. Ещё есть отличный вопрос, в котором даётся древнегреческий текст, но одно слово заменено на форму из другой эпохи греческого языка и надо найти это место. Может быть, эта задача мне нравится, потому что с одним из двух её заданий нейросеть в моей голове справилась :)
Самым популярным лингвистом в этом датасете оказался не кто иной как Андрей Анатольевич Зализняк. По его работам там целых три задачи (а, например, Хомский упомянут лишь в одной): Владислав Порицкий зашифровал до неузнаваемости старую лингвистическую задачу на баскский, Дмитрий Звонкин интересуется порядком древнерусских энклитик, а я сочинил вопрос про древнерусское ударение — хотя и не упомянул Зализняка в решении, а зря.
Как оказывается, ударение вообще очень благодатная тема для того, чтобы издеваться над нейросетями: там есть ещё одна задача про русское ударение, есть японский, иврит, арабский. А я недавно пробовал просить у ChatGPT сербские слова с ударениями нужных мне типов, но было бесполезно.
И да, никогда ещё я не был 396-м автором статьи.
Я тут потупил в Твиттер, и мне принесло пост про то, как Зеленский не поступил в МГИМО. Сканы кружочков от дырокола даже слева нарисовали. Но удивительно не то, что люди поленились заполнить ведомость якобы того времени от руки и решили, что шрифта Courier хватит для эффекта древности, а то, что для них Федеральное государственное автономное образовательное учреждение высшего образования — это такое нормальное официальное название, ну всегда было, в 1995 году тоже...
Завтра, в среду, 5 февраля, в 20:00 МСК читаю традиционную лекцию про лингвистические итоги года в Центре «Архэ». Добро пожаловать!
https://arhe.msk.ru/?p=145941
https://arhe.msk.ru/?p=145941
С каким ударением вы произносите «... — Новая Гвинея»?
Anonymous Poll
26%
ПАпуа
8%
ПапУа
65%
ПапуА
1%
Ещё как-то, напишу в комментариях
К этому прекрасному мему добавим, что в английские словари добавляют — но не фото, а рисунки. Или уже и фото бывают? А вот видео Мерриам-Уэбстера про эти рисунки.