Х_Т ©
2.06K subscribers
38 photos
1 video
39 links
Личный уютный бложек, входить на свой страх и риск. Упарываемся по Ядерной химии и Ловленду, читаем Веббера вслух и моем руки. Обсуждаем нейросетки и статистику с математикой. Пифагору слава!
加入频道
Продолжаем исследовать "на сейчас"

На прошлой неделе мы нашли шибболет по которому можно определить национальность того, кто писал этот пост. Но в первом исследовании было не так уж много подопытных. "На сегодня" их всего 6 подтвержденных. Так давайте проверим еще немного блогеров! Готовы? Тогда добро пожаловать в короткую заметку по ссылке ниже. Там нас ждет Шарий и еще два таинственных блогера, у которых мы нашли "на сейчас". И поверьте, вы будете удивлены!

https://telegra.ph/Proverka-metoda-na-SHarii-i-drugih-blogerah-09-17

#аналитика #математика #статистика
Статистика языка

Сегодня предлагаю выпить за граммы! Нет, не те, а за биграммы и триграммы! Что это такое? На самом деле мы уже разбирались в этом вопросе, но не использовали этот термин. Сейчас мы исправим это досадное упущение и рассмотрим данный метод анализа еще раз.

Один из часто используемых инструментов – подсчет частоты слов. Он нужен для того, чтобы понять, какие слова наиболее популярны в языке и как они связаны друг с другом. Например, если мы возьмем простенькую фразу: «А я вот сегодня на сейчас пошел в магазин и купил яблоки», то сможем посчитать, сколько раз встречается каждое слово, и узнать, что понятие «я» в коротком отрывке встречается два раза («я пошел» и «я купил»), а слово «сейчас» – один раз.

Также статистика, применительно к языку, позволяет анализировать биграммы и триграммы. Почти как в детективе, где нужно вычислить, кто с кем и когда общался: биграмма - это два слова, которые идут друг за другом, а триграмма - соответственно, три слова подряд. Анализ биграмм и триграмм позволяет нам понять, какие слова часто используются вместе.

Оба анализа, вернее, результаты таких исследований, позволяют предсказывать следующее слово в предложении. Например, если мы возьмем текст «Сегодня я пошел в магазин и купил…», то на основе того, какие слова часто используются вместе, можно предположить следующее слово. К примеру, «яблоки», как в тексте выше: размышляя над тем, что именно можно купить в магазине, мы будем перебирать явно не глаголы, а «яблоки» статистически являются примером часто употребляемых слов.

Так статистика помогает лучше понимать алгоритмы и правила языка и использовать его более эффективно. Инструменты статистики могут быть полезны для автоматического перевода, создания языковых моделей и машинного обучения.

#математика #статистика #лингвистика
Частотные диаграммы

Вот так выглядит частотная диаграмма для блогера. Какого? Пока секрет! Давайте попробуем отгадать в комментариях, а я пока немного поясню как эта картинка получается.

Для начала мы нормализуем все слова, то есть приводим их в именительный падеж единственного числа для всяких существительных, и в неопределенную форму несовершенного вида глаголы. Это нужно, чтобы считать смыслы, а не формы: одел или оделся, не так уж важно, но по этому слову мы поймем, что блог скорее всего про моду, например.

Вторым заходом мы чистим с помощью стоп-листа от незначащих слов. В первую очередь это союзы, предлоги и прочие бессмысленные слова, которые связывают другие слова. Например, одно из самых частотных слов - союз и. Примерно та же ситуация и с предлогами, которые обходят по популярности многие слова со смыслом.

И вот когда мы все почистили - можем выводить на экран диаграмму. Слева видим количество слов в тексте, то есть частоту, а снизу сами слова. Высота каждого ряда показывает точное значение этих слов. И вот теперь на экране 20 самых популярных! Если кого-то заинтересует код, который такую простенькую манипуляцию над данными проводит, то не стесняйтесь и пишите в ЛС или в комментарии. Кстати, сейчас вы уже можете называть себя лингвистами!

Какой следующий шаг? Такой же анализ биграмм и триграмм! Кидайте варианты блогеров на проверку, постараемся всем помочь!

#математика #статистика #лингвистика
Звуки нахрюка

Опять в среде военблогеров забурлило, что готовится новый удар по Курской области. Снова подготовил по этой важной теме разбор. Посмотрим вместе что нас ожидает, если Сырский все же не испугается мощи русского оружия и кинет ВСУ в атаку. Приятного чтения.

https://telegra.ph/Nahryuk-na-Kursk-20-ili-net-09-24

#аналитика #лонгрид #прогноз
Израиль и РФ

Сейчас на Ближнем Востоке разворачиваются интересные события, и я решил не оставаться в стороне и заделаться в эксперты-арабисты. Им больше платят на этой неделе. Поэтому держите лонгрид на актуальную тему. Переходим по ссылочке, читаем и учимся анализировать.

https://telegra.ph/Pochemu-RF-ne-voyuet-kak-Izrail-10-01

#аналитика #лонгрид #Россия #Израиль
Пара слов о горизонте, Угледаре и оперативном просторе

Давно хотел рассказать зачем использую карту высот и чем она так важна. Наконец, дошли руки. И не просто дошли, а на примере Угледара. Заметка не очень длинная, но очень важная. Угледар добавил, так как выше в комментариях подписчики очень просили это сделать. А я очень люблю радовать своих подписчиков! Оставляйте новые темы для следующих постов в комментариях, не стесняйтесь.

https://telegra.ph/Vazhen-li-Ugledar-ili-net-10-02

#математика #геометрия #горизонт #аналитика
Google, Yandex, два числа

В России выпал снег, а значит самое время для чего-то внезапного. А что может быть внезапнее, чем материал по потерям? Огромный лонгрид с кучей картинок, который посвящен анализу запросов в Google по потерям. Это не подсчет некрологов, а гораздо более глубокий анализ данных. Точных цифр мы пока не получим, но первый шаг к самому точному анализу мы сделаем. Приятного чтения!

https://telegra.ph/Ukrainskie-poteri-cherez-prizmu-zaprosov-v-Google-10-15

#математика #статистика #Google #Yandex #GoogleTrends #лонгрид #аналитика #Украина
В продолжение к предыдущему посту.

В комментариях здраво заметили, что вовлеченность украинцев может быть выше по разным причинам. Таким образом, нужно цифры нормировать. Я этого в первый подход не сделал, каюсь, но сейчас я исправлюсь. Прикрепляю картинку и ссылку, где снова с помощью Google Trends сравним вовлеченность, но уже в целом по СВО, а не по отдельным ее вопросам.

В первую очередь я объясню, почему на картинке 4 графика. Думаю, не секрет, что СВО на Украине воспринимается как русско-украинская война, по этой причине одним запросом невозможно полностью оценить данную тему. Приходится раздельно делать "украинский" запрос и отдельно "российский". А потом суммировать: желтый с красным и синий с зеленым.

Таким образом очевидно соотношение 1 к 4, то есть в РФ вовлечены не меньше, чем на Украине. Соотношение населения между странами как раз в диапазоне от 1 к 3.5 до 1 к 6, смотря что брать за источник информации.

Перед нами простой промежуточный вывод: вовлеченность в тематику СВО в обоих странах примерно одинакова, с учетом разницы в размерах.

В то же время россиян интересуют больше просто новости, а украинцев потери. Как я уже говорил в предыдущем материале, разница в индексе заинтересованности в 30 раз (как считался этот индекс, можете прочитать сами). Отрицать этот факт – полная глупость. Таким образом можно сделать вывод, что потери для украинцев гораздо более больная тема. Данная ситуация может быть только в одном случае – украинцев погибает больше. При чем сильно больше, учитывая разницу между индексами в 30 раз. Тем не менее, как я уже говорил, зависимость этого индекса от потерь не изучена совсем и у меня большие сомнения, что она 1 к 1. Но я все же склонен считать, что даже в абсолютных цифрах потери Украины должны быть больше.

Окончательный вывод: те, кто говорил, что россияне меньше интересуются СВО, так как у них война не у ворот, оказались неправы. На душу населения интерес в обоих странах одинаков. Таким образом тема потерь для украинцев выше. Объяснить это можно только одним фактом – у Украины потери выше.

#математика #статистика #Google #GoogleTrends #аналитика #Украина
Когда же закончится это вот всё?

Давайте отвлечемся от IT трендов и почитаем простую советскую аналитику по текущим событиям. Там МВФ разродились ухудшением прогноза по срокам СВО. Теперь нам с вами стоит разобрать этот кейс. Но у нас будет фундаментальный подход к расчетам, а не как у "экспертов МВФ" легкий флирт с цифрами. Здесь это вам не там! Тут люди умеют обращаться с информацией. Поэтому заварите кофе покрепче и приготовьтесь к новому лонгриду.

https://telegra.ph/Kogda-zakonchitsya-SVO-vojna-na-Ukraine-CHast-1-10-21

Линк на новость от МВФ

#аналитика #МВФ #экономика #Украина #новости #лонгрид
Когда закончится? Часть 1.1

Удивительно, но сегодня Александр Лукашенко внезапно заявил (или нет?), что "Путину необходимы гарантии, что после установления перемирия Запад не начнет «перевооружать» Украину". Вот ещё одна деталь в пазл, о котором я рассказывал в предыдущей статье. В комментариях мне некоторые личности пытались доказать, что с начала СВО прошло уже почти три года и цели поменялись. Сегодня я хочу спросить данных товарищей:

- Ну что, поменялись цели? Или все же анализ оказался достаточно релевантным?

Конечно, каждый решает сам, кого слушать и во что верить. Можно это трактовать, как отсутствие Украины в НАТО или нет? На мой взгляд вполне можно. Требования не поменялись. А я пока возвращаюсь к написанию второй части, там будет много нового и интересного.

#аналитика #новости
Определяем кто нам друзья

Да простят меня подписчики за такую дерзость, но уж очень мне захотелось ответить на комментарий по поводу Сербии. Ответом стал этот лонгрид. Историю я люблю, а Сербия - это та страна, в которой я мечтаю побывать. Возможно, сложится в эту зиму, но не будем загадывать. Будем читать следующий пост, в котором я немного накидал своих мыслей по поводу братства двух народов.

https://telegra.ph/Bratskie-narody-Rossiya-i-Serbiya-10-24

#история #лонгрид #обзор #аналитика
Минутка юмора

Мы стали забывать, что когда-то на этом канале были шутки, которые генерировали нейросетки. Стали какими-то слишком серьезными. И чтобы разбавить эту атмосферу серьезности, я открыл новый паблик, где будем смеяться над не очень смышлеными либералами, которые иногда протекают в наш уютный паблик.

Мы обучили нейросетку всем глупостям из Instagram и Xwitter, которые можно прочитать от солнечных людей. И теперь ТрансХрюшки будут радовать нас этими глупостями.

https://yangx.top/ArtTransPig

#юмор #нейросети #ИИ
В или НА

Как все помнят, у нас познавательный телеграм канал. И настало время сегодня раз и навсегда решить вопрос, какой из предлогов использовать правильно: В или НА.

Но если кто-то подумал, что это пост про Украину, то стоит охладиться. Это гораздо важнее какой-то Украины, к тому же через пять лет такого государства может больше и не быть. Тогда в чём вопрос?

Пост В нашем телеграм-канале
Пост НА нашем телеграм-канале

Как правильно? Призываем лингвистов в комментарии, а все остальные голосуем:

🍞 - Пост В телеграм-канале
🥑 - Пост НА телеграм-канале

Не проходи мимо! Важен каждый голос!

#Россия #лингвистика #РусскийЯзык
Please open Telegram to view this post
VIEW IN TELEGRAM
Новая эра республиканцев

На прошедших выборах Дональд Трамп одержал убедительную победу. Республиканцы не только укрепили свои позиции в Сенате, получив большинство, но и, с высокой долей вероятности, возглавят Палату представителей. Этот результат сосредоточит полноту власти в руках Трампа и создаст уникальную политическую ситуацию в США.

Многие эксперты и комментаторы, касаясь Трампа, зачастую используют термин "маргинал", но это выражение совершенно не отражает действительность. Трамп не является изолированным политическим актором. В отличие от маргинальных партий, таких как ADG в Германии или "Национальное объединение" Марин Ле Пен во Франции, которые действуют вне мейнстрима, Трамп обладает значительной поддержкой и влиятельными союзниками внутри республиканской партии.

В последние годы мы стали свидетелями того, как "трамписты" – приверженцы Трампа, становятся заметной частью политической структуры. Это было очевидно, когда Майка Джонса назначили в 2023 года спикером Палаты представителей, когда они своевременно избрали своих представителей на различных уровнях. Трамп, хотя и воспринимается некоторыми как радикал, все же остается ключевой фигурой, с которой охотно вступают в союз разные фракции внутри республиканской партии. Это говорит о том, что его влияние продолжает расти, а поддержка выходит далеко за пределы обычных партийных рамок.

С учетом полученного контроля над обеими палатами Конгресса, республиканцы под руководством Трампа могут осуществить свои планы в полном объеме. Мы можем ожидать значительных изменений в законодательстве, политику экономического характера, а также возможные политические реформы, которые ранее казались невозможными. В ближайшее время постараемся разобрать, что же влечет эта победа для нас всех. Но первое, что хотелось бы заметить - новый президент в США вступит в должность только в январе, по этой причине у Джо Байдена есть еще возможность "подложить свинью" Донни, если вы понимаете о чем я.

#США #выборы #статистика #обзор