[Русская версия]
A wise man came across our feedback bot @wartearsbot to state that there's an assumption in our model that leads to a significant overestimation.Being hell of IPSOs and propagandists, we naturally decided to take this into consideration and to correct our model to have more accurate estimates.
The erroneous assumption is that different indicators (number of requests, probability of finding a person on request, etc.) for prisoners and for the dead are independent. This, of course, is not the case: only in a few isolated cases can the same person be recorded as both captured and killed: almost all such cases are victims of the HIMARS attack on the Volnovakhovskaya colony 120 (Olenivka) on July 29, 2022.
Correcting and improving the model, as well as preparing the publication on this is going to take some time. We don't want to release data we consider unreliable, so no estimates this week.
We already made one correction for officers right before the first publication in October. After that, inside name of the current model is "2nd version". Now we are preparing a significantly improved "3rd version" with no assumption that being dead and being captured are independent characteristics.
What is interesting: no matter how hard we try, we still cannot reduce the estimate of the number of dead AFU fighters even to the boldest estimates of the BBC, NYT, and CIT multiplied by two. That is, even the most conservative estimates of the losses of AFU are many times higher than the most daring estimates of the losses of RF Armed Forces from propagandists. (For our English-speaking readers: there was a short discussion in Telegram channels that culminated in pointing that this for sure is the demonstration of firepower disparity, and similar reasoning is behind firepower being re-introduced as one of the key dynamics in the US' FM 3-0 manual).
Once again we want to thank the attentive reader and his review.
A wise man came across our feedback bot @wartearsbot to state that there's an assumption in our model that leads to a significant overestimation.Being hell of IPSOs and propagandists, we naturally decided to take this into consideration and to correct our model to have more accurate estimates.
The erroneous assumption is that different indicators (number of requests, probability of finding a person on request, etc.) for prisoners and for the dead are independent. This, of course, is not the case: only in a few isolated cases can the same person be recorded as both captured and killed: almost all such cases are victims of the HIMARS attack on the Volnovakhovskaya colony 120 (Olenivka) on July 29, 2022.
Correcting and improving the model, as well as preparing the publication on this is going to take some time. We don't want to release data we consider unreliable, so no estimates this week.
We already made one correction for officers right before the first publication in October. After that, inside name of the current model is "2nd version". Now we are preparing a significantly improved "3rd version" with no assumption that being dead and being captured are independent characteristics.
What is interesting: no matter how hard we try, we still cannot reduce the estimate of the number of dead AFU fighters even to the boldest estimates of the BBC, NYT, and CIT multiplied by two. That is, even the most conservative estimates of the losses of AFU are many times higher than the most daring estimates of the losses of RF Armed Forces from propagandists. (For our English-speaking readers: there was a short discussion in Telegram channels that culminated in pointing that this for sure is the demonstration of firepower disparity, and similar reasoning is behind firepower being re-introduced as one of the key dynamics in the US' FM 3-0 manual).
Once again we want to thank the attentive reader and his review.
WarTears познавательный: независимые вероятности, которые мы упомянули, - это математический термин из теории вероятностей (раздела математики): два случайных события являются независимыми, если наступление одного из них не изменит вероятность другого. Есть и строгое определение: события независимы, если вероятность того, что они оба произойдут в точности равна произведению вероятностей каждого из них в отдельности.
Простой пример: если мы будем бросать монетку и игральную кость, то что бы ни выпало на монетке - вероятность выкинуть 6 на кости будет всегда 1/6, и наоборот: что бы ни показала кость - орел на монетке будет всегда выпадать в половине случаев. (Это, конечно, в идеальном математическом мире, где карты не краплены, кубики без свинца и монетки не подточенные).
А вот другой пример, но уже зависимых вероятностей: как известно, вероятность, что на улице встретится крокодил - 50/50 (либо встретишь, либо нет). А в хорошем зоопарке крокодил есть почти всегда. Значит, по определению, если человеку крокодилы попадаются очень часто, то, крайне вероятно, он - штатный сотрудник зоопарка.
Простой пример: если мы будем бросать монетку и игральную кость, то что бы ни выпало на монетке - вероятность выкинуть 6 на кости будет всегда 1/6, и наоборот: что бы ни показала кость - орел на монетке будет всегда выпадать в половине случаев. (Это, конечно, в идеальном математическом мире, где карты не краплены, кубики без свинца и монетки не подточенные).
А вот другой пример, но уже зависимых вероятностей: как известно, вероятность, что на улице встретится крокодил - 50/50 (либо встретишь, либо нет). А в хорошем зоопарке крокодил есть почти всегда. Значит, по определению, если человеку крокодилы попадаются очень часто, то, крайне вероятно, он - штатный сотрудник зоопарка.
По вчерашнему обмену 101 на 101 имеем сообщить, что (помимо сержанта запретного "Азова", который на сайте проекта "НемеZида" почему-то записан как "гражданский") отметили интересную особенность - украинская сторона активно возвращает радиотелефонистов, связистов и даже ПВОшников из числа пограничников Мариуполя.
Полный список с еще несколькими сержантами "Азова", морпехами 36 бригады и так до 101 - на нашем сайте.
Полный список с еще несколькими сержантами "Азова", морпехами 36 бригады и так до 101 - на нашем сайте.
Вчера мы переключились на новую реализацию телеграм-бота. Адрес бота - @wartearsbot - остался прежним.
Надеемся, новый бот позволит существенно увеличить скорость приема и обработки заявок. При этом все старые заявки остались на месте - и мы продолжаем их обрабатывать.
Несколько неожиданным стал объем работы. Если применить американский подход, но измерять не в футбольных полях, а в Пушкиных, то получается, что объем исходного кода немного превзошел Пиковую даму.
Надеемся, новый бот позволит существенно увеличить скорость приема и обработки заявок. При этом все старые заявки остались на месте - и мы продолжаем их обрабатывать.
Несколько неожиданным стал объем работы. Если применить американский подход, но измерять не в футбольных полях, а в Пушкиных, то получается, что объем исходного кода немного превзошел Пиковую даму.
Сегодня исполнился год с начала специальной военной операции. Девять лет назад, примерно в этих же числах начались сначала протесты в целом ряде регионов Украины, а потом и боевые действия.
Мы не старались специально (ну, почти - ускорились буквально позавчера), но именно сегодня мы преодолели рубеж в 10 000 подтвержденных записей о погибших бойцах ВФУ.
Одновременно число заявок на поиск от родственников также преодолело 10 000, хотя это чисто случайное совпадение.
Мы не старались специально (ну, почти - ускорились буквально позавчера), но именно сегодня мы преодолели рубеж в 10 000 подтвержденных записей о погибших бойцах ВФУ.
Одновременно число заявок на поиск от родственников также преодолело 10 000, хотя это чисто случайное совпадение.
Мы понимаем, что некоторая непрозрачность нашей базы рождает ряд вопросов. Мы работаем над раскрытием части данных - по крайней мере, по подтвержденным невозвратным потерям.
А в это время проект "Ватфор", давший, собственно, старт нашему, ищет таланты.
А в это время проект "Ватфор", давший, собственно, старт нашему, ищет таланты.
[English version]
Сегодня мы публикуем исправленную версию математической модели потерь ВФУ (модель v3.0).
Основная причина: был обнаружен недочет в прежней модели.
Изменения:
- теперь мы по-другому оцениваем число пленных, верность предположения косвенно подтверждается тем, что они стали ближе к данным, опубликованным другими источниками;
- мы исправили и дополнили алгоритм оценки числа погибших;
- оценка общего числа бойцов ВФУ при этом осталась прежней (почему это так - в статье у нас на сайте).
Сегодня мы публикуем исправленную версию математической модели потерь ВФУ (модель v3.0).
Основная причина: был обнаружен недочет в прежней модели.
Изменения:
- теперь мы по-другому оцениваем число пленных, верность предположения косвенно подтверждается тем, что они стали ближе к данным, опубликованным другими источниками;
- мы исправили и дополнили алгоритм оценки числа погибших;
- оценка общего числа бойцов ВФУ при этом осталась прежней (почему это так - в статье у нас на сайте).
[Русская версия]
Today we are publishing a corrected version of the math model of AFU losses (model v3.0).
Main reason: a defect was found in the previous model.
Changes:
- now we estimate the number of prisoners differently, the assumption is correct which is indirectly confirmed by the fact that the estimations have become closer to the data published by other sources;
- we corrected and supplemented the algorithm for estimating the number of dead;
- the estimation of the total number of AFU fighters remained the same (why it is so - read on in the article on our website).
Today we are publishing a corrected version of the math model of AFU losses (model v3.0).
Main reason: a defect was found in the previous model.
Changes:
- now we estimate the number of prisoners differently, the assumption is correct which is indirectly confirmed by the fact that the estimations have become closer to the data published by other sources;
- we corrected and supplemented the algorithm for estimating the number of dead;
- the estimation of the total number of AFU fighters remained the same (why it is so - read on in the article on our website).
Есть время разбрасывать камни, и есть время их собирать.
20 января мы сделали прогноз на основе наблюдений.
Давайте разбираться, что мы видим полтора месяца спустя, 3 марта:
▪️Оценка активной численности оказалась занижена примерно на 70 тыс. на начало марта. Это связано с проблемой в нашей модели, которую мы вчера исправили и опубликовали рассказ, как, что и почему. Однако вывод о том, что Киев пытается поддерживать некоторую численность ВФУ на определенном уровне в силе - изменилась оценка этого уровня.
▪️В отличие от “ступеньки” 1-5 января, в феврале мы наблюдали постепенный ввод пополнений в зону боевых действий - примерно с 5 по 23 февраля - после чего рост численности ВФУ, включая погибших и пленных, прекратился.
▪️Пополнение составило 21-24 тыс. человек. Это существенно меньше январских 50 тыс., и - здесь мы делаем одно осторожное предположение - может свидетельствовать о проблемах с мобилизацией.
▪️После 23 февраля рост численности ВФУ прекратился, что, вероятно, говорит об исчерпании резервов, подготовленных именно для пополнения действующих частей.
▪️Как мы и предполагали, наступательные действия российской армии замедлились. Исключением стало только успешное продвижение ЧВК “Вагнер” в Артемовске (Бахмуте).
На основе этих соображений мы попробуем сделать очередной прогноз:
▪️Скорее всего, недавние пополнения оказались вынужденными, то есть ими затыкали дыры в существующих частях, а не вводили новые части из резерва.
▪️Вполне вероятно, что Киев готовит несколько бригад для наступления и не задействует их непосредственно в боевых действиях. Эти бригады не видны в нашей модели, потому что не участвуют в боевых действиях.
▪️В зависимости от численности этих бригад можно будет более уверенно говорить о мобилизационных возможностях Киева, в том числе о - возможностях подготовки новых частей. Сейчас мы видим лишь поддержание существующей численности.
Итог: дать прогноз на ближайшее время крайне трудно, потому что одновременно сходятся несколько тенденций:
- явно вынужденный ввод пополнений ВФУ;
- крайне тяжелая для Киева ситуация в Артемовске (Бахмуте), падение которого может открыть дорогу на Славянск и Краматорск;
- вероятная подготовка резервов ВФУ вне зоны боевых действий;
- активность на границе с Приднестровьем.
Поэтому сформулируем так: в ближайшие 3-6 недель мы ожидаем прохождение точки бифуркации, после которой, как минимум, на одном из направлений ситуация в корне будет отличаться от текущей (а у нас на руках будут данные о том, что происходит).
20 января мы сделали прогноз на основе наблюдений.
Давайте разбираться, что мы видим полтора месяца спустя, 3 марта:
▪️Оценка активной численности оказалась занижена примерно на 70 тыс. на начало марта. Это связано с проблемой в нашей модели, которую мы вчера исправили и опубликовали рассказ, как, что и почему. Однако вывод о том, что Киев пытается поддерживать некоторую численность ВФУ на определенном уровне в силе - изменилась оценка этого уровня.
▪️В отличие от “ступеньки” 1-5 января, в феврале мы наблюдали постепенный ввод пополнений в зону боевых действий - примерно с 5 по 23 февраля - после чего рост численности ВФУ, включая погибших и пленных, прекратился.
▪️Пополнение составило 21-24 тыс. человек. Это существенно меньше январских 50 тыс., и - здесь мы делаем одно осторожное предположение - может свидетельствовать о проблемах с мобилизацией.
▪️После 23 февраля рост численности ВФУ прекратился, что, вероятно, говорит об исчерпании резервов, подготовленных именно для пополнения действующих частей.
▪️Как мы и предполагали, наступательные действия российской армии замедлились. Исключением стало только успешное продвижение ЧВК “Вагнер” в Артемовске (Бахмуте).
На основе этих соображений мы попробуем сделать очередной прогноз:
▪️Скорее всего, недавние пополнения оказались вынужденными, то есть ими затыкали дыры в существующих частях, а не вводили новые части из резерва.
▪️Вполне вероятно, что Киев готовит несколько бригад для наступления и не задействует их непосредственно в боевых действиях. Эти бригады не видны в нашей модели, потому что не участвуют в боевых действиях.
▪️В зависимости от численности этих бригад можно будет более уверенно говорить о мобилизационных возможностях Киева, в том числе о - возможностях подготовки новых частей. Сейчас мы видим лишь поддержание существующей численности.
Итог: дать прогноз на ближайшее время крайне трудно, потому что одновременно сходятся несколько тенденций:
- явно вынужденный ввод пополнений ВФУ;
- крайне тяжелая для Киева ситуация в Артемовске (Бахмуте), падение которого может открыть дорогу на Славянск и Краматорск;
- вероятная подготовка резервов ВФУ вне зоны боевых действий;
- активность на границе с Приднестровьем.
Поэтому сформулируем так: в ближайшие 3-6 недель мы ожидаем прохождение точки бифуркации, после которой, как минимум, на одном из направлений ситуация в корне будет отличаться от текущей (а у нас на руках будут данные о том, что происходит).
Ряд каналов рассказывает о новосоздающихся и уже созданных бригадах ВСУ. Мы их пока не видим, поэтому не будем водить вилами по мутной воде, а поговорим о том, что мы таки видим. Создание новых бригад - дело для ВСУ не новое, опыт есть. В первые если не дни, то недели специальной военной операции в Черкассах была создана 115-ая отдельная механизированная бригада. В начале лета бригада настолько успешно обороняла Северодонецк и Лисичанск, что ближе к концу того же самого лета находилась уже в Донецкой области в районе Опытного (100 км по прямой).
Любопытно тут то, что по потерям видно: в бригаду набирали (и вводили дополнительно) людей с боевым опытом АТО/ООС из действующих войсковых частей и разбавляли мобилизованными - причем, не из Черкасской области, а из других - Волынской, Ровенской, Полтавской, Хмельницкой, Черновицкой, Одесской, Киевской и даже Львовской.
Руководство бригады, по нашим данным, не очень спешит предоставить информацию о потерях родственникам, а также нам известны только 2 случая обмена военнослужащих 115 бригады. Вот данные войсковой части о потерях "героической боевой единицы" (в рамках анонсированной программы постепенного раскрытия данных нашей базы. То же мы сделали для 93 ОМБр - список погибших, пленных и пропавших в ходе боевых действий военнослужащих "Холодного Яра" - у нас на сайте).
Любопытно тут то, что по потерям видно: в бригаду набирали (и вводили дополнительно) людей с боевым опытом АТО/ООС из действующих войсковых частей и разбавляли мобилизованными - причем, не из Черкасской области, а из других - Волынской, Ровенской, Полтавской, Хмельницкой, Черновицкой, Одесской, Киевской и даже Львовской.
Руководство бригады, по нашим данным, не очень спешит предоставить информацию о потерях родственникам, а также нам известны только 2 случая обмена военнослужащих 115 бригады. Вот данные войсковой части о потерях "героической боевой единицы" (в рамках анонсированной программы постепенного раскрытия данных нашей базы. То же мы сделали для 93 ОМБр - список погибших, пленных и пропавших в ходе боевых действий военнослужащих "Холодного Яра" - у нас на сайте).
В дополнение к утренней публикации: как ВФУ организуют оборону Артемовска до последнего украинца (и не только украинца).
Чуть меньше месяца назад мы публиковали список частей в городе. А сегодня Поддубный написал, что численность противника в Артемовске составляет 10-12 тыс. человек. Это примерно 3-4 бригады.
Поэтому мы еще раз заглянули в свои источники и увидели следующее:
▪️Удерживать город до последнего украинца бросили свежесформированную киевскую 241 ОБрТрО, которой еще месяц назад в городе не было;
▪️Ровно с теми же целями в городе остались чеченские и грузинские отряды;
▪️Если Киеву не удастся вывести войска, то в окружении, вероятно, окажется 93 ОМБр "Холодный Яр". Менее вероятно, подразделения 60 ОМБр, 63 ОМБр и 3 ОШБр - они охраняют южный фланг и, скорее всего, могут быть выведены в последнюю очередь;
▪️Возможно, эти регулярные бригады "спасут", поменяв с находящейся прямо на входе в "бутылочное горлышко" 109 ОБрТрО (формально - бригада ТрО Донецкой области);
▪️Интересно, что весь выход из Артемовска перегорожен цепочкой из "особенных" частей - упомянутая выше 3 ОШБр (новая инкарнация запрещенного в России полка "Азов"), 5 ОШБр (под командованием Яковенко, который до этого руководил не менее экстремистским батальоном "Айдар") и "Нормандская бригада" (состоит из "не наемников, а добровльцев", про часть из которых собрали информацию в проекте @foreigncombatants). Мы не эксперты, но выглядит так, что именно они будут (из различного стрелкового оружия) в ближайшие дни поддерживать высокий моральный дух обороняющихся.
Итого, мы полагаем что в Артемовске останется сборная солянка из отрядов наёмников, одна или две бригады ТрО и, возможно, какие-то части кадровых механизированных бригад. Всего, с учетом потерь, ожидаем, что при текущем развитии событий в плен может попасть примерно 3 тыс. человек.
Чуть меньше месяца назад мы публиковали список частей в городе. А сегодня Поддубный написал, что численность противника в Артемовске составляет 10-12 тыс. человек. Это примерно 3-4 бригады.
Поэтому мы еще раз заглянули в свои источники и увидели следующее:
▪️Удерживать город до последнего украинца бросили свежесформированную киевскую 241 ОБрТрО, которой еще месяц назад в городе не было;
▪️Ровно с теми же целями в городе остались чеченские и грузинские отряды;
▪️Если Киеву не удастся вывести войска, то в окружении, вероятно, окажется 93 ОМБр "Холодный Яр". Менее вероятно, подразделения 60 ОМБр, 63 ОМБр и 3 ОШБр - они охраняют южный фланг и, скорее всего, могут быть выведены в последнюю очередь;
▪️Возможно, эти регулярные бригады "спасут", поменяв с находящейся прямо на входе в "бутылочное горлышко" 109 ОБрТрО (формально - бригада ТрО Донецкой области);
▪️Интересно, что весь выход из Артемовска перегорожен цепочкой из "особенных" частей - упомянутая выше 3 ОШБр (новая инкарнация запрещенного в России полка "Азов"), 5 ОШБр (под командованием Яковенко, который до этого руководил не менее экстремистским батальоном "Айдар") и "Нормандская бригада" (состоит из "не наемников, а добровльцев", про часть из которых собрали информацию в проекте @foreigncombatants). Мы не эксперты, но выглядит так, что именно они будут (из различного стрелкового оружия) в ближайшие дни поддерживать высокий моральный дух обороняющихся.
Итого, мы полагаем что в Артемовске останется сборная солянка из отрядов наёмников, одна или две бригады ТрО и, возможно, какие-то части кадровых механизированных бригад. Всего, с учетом потерь, ожидаем, что при текущем развитии событий в плен может попасть примерно 3 тыс. человек.
По сообщениям украинских СМИ, въезд в Артемовск для волонтеров закрыли с 13 февраля. Через несколько недель 93 ОМБр "Холодный Яр" сообщила о гибели "волонтера" Яны Рыхлицкой (первый скриншот).
Сегодня же МО Украины превратило этого "волонтера" в "парамедика" в твиттере (второй скриншот). Мы, было, подумали что это - вторая Тайра, но история оказалась прозаичнее.
В сети нашлось видео трехмесячной давности с работой полевого госпиталя 93 ОМБр в Артемовске (Бахмуте). В информации о гибели констатируется, что Теплицкая поступила на службу в ВФУ в мае 2022 и работала штатным медиком бригады "Холодный Яр".
Констатируем:
▪️Волонтерами называют не только помощников-снабженцев, но и просто всех, кто вступил в ВФУ добровольно, а не по мобилизации;
▪️По состоянию на 3 марта 2023, день гибели, бригада "Холодный Яр" по-прежнему находилась в Артемовске (Бахмуте) или ближайших окрестностях, как мы вчера уже писали. Бригада медийная, поэтому ее вывод мы увидим по прекращению сообщений о потерях в ней.
Сегодня же МО Украины превратило этого "волонтера" в "парамедика" в твиттере (второй скриншот). Мы, было, подумали что это - вторая Тайра, но история оказалась прозаичнее.
В сети нашлось видео трехмесячной давности с работой полевого госпиталя 93 ОМБр в Артемовске (Бахмуте). В информации о гибели констатируется, что Теплицкая поступила на службу в ВФУ в мае 2022 и работала штатным медиком бригады "Холодный Яр".
Констатируем:
▪️Волонтерами называют не только помощников-снабженцев, но и просто всех, кто вступил в ВФУ добровольно, а не по мобилизации;
▪️По состоянию на 3 марта 2023, день гибели, бригада "Холодный Яр" по-прежнему находилась в Артемовске (Бахмуте) или ближайших окрестностях, как мы вчера уже писали. Бригада медийная, поэтому ее вывод мы увидим по прекращению сообщений о потерях в ней.
Вместе с друзьями проанализировали видео с расстрелом пленного с помощью алгоритмов хэширования лиц, получили следующие результаты:
▪️Фото Тимофея Шадуры, выложенное МО Украины, похоже на фото человека из видео на 47-48% (оценки разными алгоритмами)
▪️Фото Александра Мациевича, которое, по сообщению военкоров, выложил Юрий Бутусов, совпадает на 66-68%
▪️Мы проверили все доступные нам базы бойцов ВФУ, и не смогли найти ни одного похожего человека. Это ни о чём не говорит, но, например, сержанта Панасенко таким способом мы нашли.
Для контекста:
▪️Мы смогли найти трёх украинцев, которые точно не могли быть на видео, но чьи фото давали совпадения на уровне на 55-60%
▪️"Улучшенные" фото, такие как опубликовал Даниил Безсонов, хуже подходят для распознавания потому, что улучшающие алгоритмы фактически додумывают информацию, отсутствующую на оригинальных снимках. Это касается вообще всех случаев, не только конкретного.
▪️По опыту схожесть двух фотографий менее 65% говорит о том, что на них - разные люди. Менее 70% - что может быть один и тот же человек, но не факт.
Итого:
▪️МО Украины опубликовали заведомо ложную информацию;
▪️На данный момент ни про одну фотографию из опубликованных в разных источниках нельзя уверенно сказать, что на ней тот же человек, что и на видео казни. Но полностью исключать версию от Юрия Бутусова по имеющимся данным нельзя;
▪️Находим вероятным, что никто из публиковавших не имеет достоверной информации о погибшем. Либо не хочет её публиковать - но это уже другая история.
Ещё раз хотим поблагодарить наших друзей.
▪️Фото Тимофея Шадуры, выложенное МО Украины, похоже на фото человека из видео на 47-48% (оценки разными алгоритмами)
▪️Фото Александра Мациевича, которое, по сообщению военкоров, выложил Юрий Бутусов, совпадает на 66-68%
▪️Мы проверили все доступные нам базы бойцов ВФУ, и не смогли найти ни одного похожего человека. Это ни о чём не говорит, но, например, сержанта Панасенко таким способом мы нашли.
Для контекста:
▪️Мы смогли найти трёх украинцев, которые точно не могли быть на видео, но чьи фото давали совпадения на уровне на 55-60%
▪️"Улучшенные" фото, такие как опубликовал Даниил Безсонов, хуже подходят для распознавания потому, что улучшающие алгоритмы фактически додумывают информацию, отсутствующую на оригинальных снимках. Это касается вообще всех случаев, не только конкретного.
▪️По опыту схожесть двух фотографий менее 65% говорит о том, что на них - разные люди. Менее 70% - что может быть один и тот же человек, но не факт.
Итого:
▪️МО Украины опубликовали заведомо ложную информацию;
▪️На данный момент ни про одну фотографию из опубликованных в разных источниках нельзя уверенно сказать, что на ней тот же человек, что и на видео казни. Но полностью исключать версию от Юрия Бутусова по имеющимся данным нельзя;
▪️Находим вероятным, что никто из публиковавших не имеет достоверной информации о погибшем. Либо не хочет её публиковать - но это уже другая история.
Ещё раз хотим поблагодарить наших друзей.
Пока мы ещё не закончили обрабатывать списки вчерашнего обмена. Поэтому Вартирс познавательный: хэширование лиц. Мы вчера упомянули такую штуку, и сейчас хотим чуть-чуть рассказать, что это и как примерно оно работает простыми словами.
Итак, сначала что такое "хэширование". Это - операция, которая на вход берёт что-то (что угодно - изображение, текст, видео, звук - зависит только от конкретного алгоритма), а на выходе выдаёт число или набор чисел. Причём хэширование стараются сделать так, что бы для разных по смыслу объектов оно давало разные числа, а для одинаковых - одинаковые.
Пример: допустим вы ищите какое-то понятие в многотомной энциклопедии. Обычно в первом же томе, а то и на корешках идут подсказки вида "А-К - Том 1, Л-С - Том 2, Т -Я - Том 3", то есть зная первую букву слова мы получаем номер тома. Вот это сопоставление любого слова номеру тома и есть один из простейших примеров хэширования.
Иногда, для более сложных задач, удобно на выходе получать не одно, а несколько чисел, но подход от этого не меняется. Не углубляясь в детали скажем, что с точки зрения разделов математики, занимающихся этими хэш-функциями, одно число - есть просто частный случай набора из чисел, который почему-то решили составить всего лишь из одного числа.
Что можно делать с такими значениями? Оказывается, можно не только искать, в какой том вошло то или иное слово, но и считать "расстояние" между словами. Да, расстояние будет измеряться в томах, но, опять же, с точки зрения математики, это будет вполне себе единица измерения расстояния (все вспомнили про попугаев? так вот и они тоже - вполне себе единица измерения! особенно если выбрать эталонный образец)
Теперь самое сложное: хэширование лиц. Оказывается лица на фотографиях ровно так же можно превратить в набор чисел, по которым потом производить поиск.
Например, если взять несколько точек - мочки ушей, конец носа, конец подбородка, окончания бровей, уголки глаз, уголки рта - и измерить относительные расстояния между ними, то можно получить список чисел. Самое интересное, что для одного и того же человека на разных фотографиях эти расстояния будут сохраняться (попробуйте сдвинуть внутренний уголок глаза хотя бы на сантиметр!). Примерно так и работает один из вариантов хэширования лица, который превращает фотографию в набор чисел. На самом деле всё сложнее, и часто используются нейросети и всякие другие приёмы, но общий подход остаётся таким же.
После этого можно взять большую базу фотографий, для каждой посчитать все эти расстояния и сложить в базу данных.
Когда же потребуется определить человека на фотографии - получить эти же числа снова и дальше уже искать самый похожий набор чисел из известных. А эта операция - поиск ближайшего набора чисел - уже реализована и работает крайне быстро в практически всех современных базах данных.
Но можно и просто сравнивать неизвестные фотографии и оценивать, насколько многопопугаев томов между ними. Чем больше томов - тем меньше вероятность того, что на них - один и тот же человек. Расстояние при этом всегда можно перевести в проценты - проценты от максимально возможного.
Итак, сначала что такое "хэширование". Это - операция, которая на вход берёт что-то (что угодно - изображение, текст, видео, звук - зависит только от конкретного алгоритма), а на выходе выдаёт число или набор чисел. Причём хэширование стараются сделать так, что бы для разных по смыслу объектов оно давало разные числа, а для одинаковых - одинаковые.
Пример: допустим вы ищите какое-то понятие в многотомной энциклопедии. Обычно в первом же томе, а то и на корешках идут подсказки вида "А-К - Том 1, Л-С - Том 2, Т -Я - Том 3", то есть зная первую букву слова мы получаем номер тома. Вот это сопоставление любого слова номеру тома и есть один из простейших примеров хэширования.
Иногда, для более сложных задач, удобно на выходе получать не одно, а несколько чисел, но подход от этого не меняется. Не углубляясь в детали скажем, что с точки зрения разделов математики, занимающихся этими хэш-функциями, одно число - есть просто частный случай набора из чисел, который почему-то решили составить всего лишь из одного числа.
Что можно делать с такими значениями? Оказывается, можно не только искать, в какой том вошло то или иное слово, но и считать "расстояние" между словами. Да, расстояние будет измеряться в томах, но, опять же, с точки зрения математики, это будет вполне себе единица измерения расстояния (все вспомнили про попугаев? так вот и они тоже - вполне себе единица измерения! особенно если выбрать эталонный образец)
Теперь самое сложное: хэширование лиц. Оказывается лица на фотографиях ровно так же можно превратить в набор чисел, по которым потом производить поиск.
Например, если взять несколько точек - мочки ушей, конец носа, конец подбородка, окончания бровей, уголки глаз, уголки рта - и измерить относительные расстояния между ними, то можно получить список чисел. Самое интересное, что для одного и того же человека на разных фотографиях эти расстояния будут сохраняться (попробуйте сдвинуть внутренний уголок глаза хотя бы на сантиметр!). Примерно так и работает один из вариантов хэширования лица, который превращает фотографию в набор чисел. На самом деле всё сложнее, и часто используются нейросети и всякие другие приёмы, но общий подход остаётся таким же.
После этого можно взять большую базу фотографий, для каждой посчитать все эти расстояния и сложить в базу данных.
Когда же потребуется определить человека на фотографии - получить эти же числа снова и дальше уже искать самый похожий набор чисел из известных. А эта операция - поиск ближайшего набора чисел - уже реализована и работает крайне быстро в практически всех современных базах данных.
Но можно и просто сравнивать неизвестные фотографии и оценивать, насколько много
Мы до сих пор обрабатываем списки обмена, состоявшегося 7 марта. И чем дольше мы это делаем, тем более странными выглядят данные по нему. Настолько, что нам может понадобиться еще несколько дней, чтобы закончить работу.
Пока лишь скажем, что завтрашние наши оценки будут искажены - число убитых будет занижено примерно на 5% (это составляет 10 000 человек), а число пленных, наоборот, будет завышено на эти 5% (для пленных это 500 человек). Так получается из-за того, что модель v3 завязана на количество людей в обменах, о которых мы знали из других источников, а на данный момент мы технически считаем, что никого из обмена мы не знали, хотя это не так - но об этом мы хотим рассказать по порядку.
Список из 90 человек, которых не обменяли, мы тоже проверяем и тоже опубликуем.
Пока лишь скажем, что завтрашние наши оценки будут искажены - число убитых будет занижено примерно на 5% (это составляет 10 000 человек), а число пленных, наоборот, будет завышено на эти 5% (для пленных это 500 человек). Так получается из-за того, что модель v3 завязана на количество людей в обменах, о которых мы знали из других источников, а на данный момент мы технически считаем, что никого из обмена мы не знали, хотя это не так - но об этом мы хотим рассказать по порядку.
Список из 90 человек, которых не обменяли, мы тоже проверяем и тоже опубликуем.
Три дня назад мы проверяли "кандидатов в расстрелянные" и упомянули, что Юрий Бутусов нашел человека, чья фотография на 68% схожа со снимком погибшего. Мы отметили, что этого явно недостаточно для того, что бы уверенно утверждать, что погиб именно этот человек.
Сегодня же мы случайно нашли другого человека, чья фотография схожа с расстрелянным ровно на те же 68%. Им оказался Прокопов Николай Николаевич, пропавший не позднее начала августа 2022 года. А пластырь и ушиб... их и в мирной жизни можно за пару минут получить.
Сегодня же мы случайно нашли другого человека, чья фотография схожа с расстрелянным ровно на те же 68%. Им оказался Прокопов Николай Николаевич, пропавший не позднее начала августа 2022 года. А пластырь и ушиб... их и в мирной жизни можно за пару минут получить.
Десять дней назад мы отметили рост оценки численности ВФУ за период с 5 по 23 февраля на 21-24 тыс. человек. В дополнение к этому, после недельного перерыва, с 1 по 11 марта математическая модель показала прирост ВФУ еще на 25 тыс. человек. Пополнение, как и в феврале, "размазано" во времени, что, скорее всего, свидетельствует о доукомплектовании существующих частей из зоны боевых действий, а не вводе новых.
Всего за февраль и первую половину марта было введено 45-50 тыс. человек, что примерно равно пополнению 1-5 января. На этом моменте мы спрашиваем себя: возможно ли, что именно этот темп - 50 тыс. человек за полтора месяца или же примерно 30-35 тыс. человек в месяц - является максимально возможным темпом пополнения ВФУ?
На основе обработанных данных мы - пока - не можем говорить о распределении пополнений по конкретным частям, однако соображения о доукомплектовании выше означали бы пропорциональность потерям.
Всего за февраль и первую половину марта было введено 45-50 тыс. человек, что примерно равно пополнению 1-5 января. На этом моменте мы спрашиваем себя: возможно ли, что именно этот темп - 50 тыс. человек за полтора месяца или же примерно 30-35 тыс. человек в месяц - является максимально возможным темпом пополнения ВФУ?
На основе обработанных данных мы - пока - не можем говорить о распределении пополнений по конкретным частям, однако соображения о доукомплектовании выше означали бы пропорциональность потерям.