Forwarded from RTVI
Правительство повторяет как мантру, что экономика в России выстояла под гнетом санкций и лишь растет, однако люди в стране наблюдают ускоряющуюся инфляцию и регулярно падающий курс рубля.
Спецкор RTVI Анастасия Целых в рамках спецпроекта RTVI «Четыре всадника Апокалипсиса» проанализировала экономические итоги 2023 года, важнейшими из которых стали продовольственная инфляция, девальвация национальной валюты и формирующийся пузырь на кредитном рынке, с которым ЦБ пытается бороться путем увеличения ключевой ставки и ужесточения льготной ипотеки.
Все это происходит потому, что российская экономика перешла на военные рельсы — она растет преимущественно за счет оборонной промышленности. Низкий уровень безработицы, о котором с гордостью говорят чиновники, — это следствие дефицита кадров. Он, в свою очередь, подстегивает рост зарплат, так как компании вынуждены держаться за дефицитный ресурс. При этом вливание значительных объемов денег в зарплаты влияет на конечный рост цен на товары.
Ожидать значительного улучшения финансового положения россиян в наступающем 2024 году не приходится. Если правительству не удастся усмирить инфляцию, реальные доходы населения будут расти скромно или не будут вообще, сходятся во мнении опрошенные RTVI экономисты
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤🔥1🔥1💯1
Короче, Strava — это такая соцсеть для спортсменов, где все бегают, прыгают, крутят педали и делятся этим с миром. Недавно они замутили крутую фичу — карту активности пользователей по всему миру. Красиво, наглядно, но есть одно но...
Аналитик по имени Нейтан Рузер —фамилия-то какая говорящая!* — изучил эту карту и офигел. Оказалось, по ней легко вычислить не только расположение военных баз в Афганистане, но и маршруты патрулей. Представляете, бежит себе солдат по базе, а противник уже на карте его видит.
Не то чтобы базы были секретными, Гугл их и так всем показал. Но Strava добавил детализации: теперь видно, как люди там перемещаются и как часто они это делают. Вот так и работает OSINT. Информация вроде невинная, но для военных — головная боль. Кстати военные уже сталкивались с подобным. Помните "Покемон Го"? Так вот, солдатам его запретили, чтобы их не выследили по Пикачу.
В общем история учит: хочешь сохранить секрет — не свети его в интернете. Подробнее о том, как работает тепловая карта Strava, можно почитать здесь. Кстати, исследователи говорят, что по ней можно вычислить не только расположение базы, но и домашние адреса пользователей...
* Ruse в переводе с английского — "хитрость", "обман", "военный трюк"
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4😁1
Datawrapper — это такой сервис, с помощью которого можно делать интерактивные карты без программирования. Выбрал тип карты, добавил данные — и сервис сделает все как надо.
Но есть нюанс: в Datawrapper нужно использовать точное написание регионов, чтобы он мог их распознать. Причем чаще всего на английском. А названия регионов в Росстате (да и много где еще) не совпадает с встроенными в Datawrapper.
Конечно, можно долго и мучительно сопоставлять все вручную. Но есть удобная формула, которая поможет сделать всё за пару минут:
=INDEX($A$1:$C$100,MATCH(G2,$A$1:$A$100,0),2)
Функция MATCH ищет в столбце A1:A100 значение региона из ячейки C16. Последний аргумент функции 0 - означает поиск точного (а не приблизительного) соответствия.
Функция INDEX выбирает из диапазона A1:С100 значение, которое находится на пересечении заданной строки и второго столбца (последний аргумент 2).
Вуаля, данные готовы!
* Данные на прикрепленной картинке не реальные, они для примера :)
Please open Telegram to view this post
VIEW IN TELEGRAM
50🔥5👏1
Forwarded from RTVI
150 000 руб. — именно столько нужно получать семье из трех человек в среднем по России, чтобы причислить себя к среднему классу. Максимальный доход требуется на Чукотке — 394 тыс. руб., обнаружил RTVI, подсчитав ожидаемый уровень доходов среднего класса в регионах. Минимальный — в Белгородской и Пензенской областях — по 127 тыс. руб.
Высокие зарплаты участников военных действий дают им возможность считаться средним классом в 81 из 89 регионов, выяснил RTVI, сравнив ожидаемый уровень доходов среднего класса с минимальной зарплатой контрактников. Бойцы не дотягивают до уровня среднего класса только в регионах с высоким прожиточным минимумом — в основном это Сибирь и Дальний Восток.
Впрочем, кто сможет в реальности воспользоваться этим социальным лифтом, остается неясным. Многие участники военной операции отправились на фронт, чтобы избавиться от долгов и купить жилье, рассказала RTVI к.э.н., доцент Финансового университета Ольга Борисова. Эти траты не дают им закрепиться в среднем классе.
Однажды государство перестанет тратить деньги на военную операцию, указывает к.э.н., доцент, старший научный сотрудник Института социальной политики НИУ ВШЭ Василий Аникин: «Те, кто вовремя поймут, куда нужно тратить деньги — прежде всего не на машины и шмотки, а на образование — те выиграют в долгосроке. Их дети потом тоже от этого выиграют»
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
166👍3🔥3👏1
Когда по твоим новостям делают мемы — значит месяц прожит не зря. Ловите топ текстов за то время, пока тут не было постов
😀 С сайта МВД пропали данные о числе приехавших в Россию мигрантов. Эти данные могли скрыть после теракта в «Крокусе».
😩 Лишь в шести регионах России люди могут купить на зарплату хотя бы 1 кв. м. жилья. Среди них — Ненецкий автономный округ, Магаданская область и ХМАО
🥲 «Народные» акционеры заводов, которые перешли в госсобственность из-за пересмотра приватизации 90-х, лишаются своих ценных бумаг. Таких людей — тысячи. Эксперты полагают, что такие изъятия подрывают основы экономики.
😒 Пенсионный фонд не получает страховые взносы от каждого четвертого трудоспособного россиянина, обнаружил RTVI, изучив статистику Социального фонда России и Росстата. Грозит ли нынешним 35-летним старость без пенсии?
P.S. За пикчу спасибо Лентачу, а за аналитику и графики к тексту про квадратные метры — Александру Петрову
P.S. За пикчу спасибо Лентачу, а за аналитику и графики к тексту про квадратные метры — Александру Петрову
Please open Telegram to view this post
VIEW IN TELEGRAM
382👍3❤2🔥1👏1🏆1
Израильский предприниматель из Казахстана (а также основатель Яндекса) Аркадий Волож неожиданно для всех (и себя самого) попал в список Forbes "125 самых богатых миллиардеров из России". Ну и для кого, спрашивается, биографию переписывали
Вообще в рейтинге 2024 года много любопытного:
👨🏫 во-первых, число российских миллиардеров — тех, кто заработал более $1 млрд — восстановилось до уровня, который был до начала боевых действий на Украине (в России даже стало больше на двух миллиардеров);
😳 во-вторых, список пополнили сразу 19 новичков (из самых перспективных — Иван Таврин, который всего за год удачно приобрел Avito, HeadHunter и Melon Fashion Group);
👹 в-третьих, средний возраст миллиардера — 58 лет, а тех, кому до 40 — всего трое: Павел Дуров, Дмитрий Бухман и Саид Гуцериев;
☺️ в-четвертых, из списка исключили сразу восемь миллиардеров, среди которых — те, чьи активы вернули государству из-за претензий к приватизации 90-х и те, кто отказался от российского гражданства.
Например, так своей позиции лишился экс-владелец Соликамского магниевого завода Петр Кондрашев. А Воложа несмотря на все усилия почему-то оставили
Вообще в рейтинге 2024 года много любопытного:
Например, так своей позиции лишился экс-владелец Соликамского магниевого завода Петр Кондрашев. А Воложа несмотря на все усилия почему-то оставили
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3👍2🤡2
Мой браузер уже не выдерживает такого количества вкладок, поэтому завожу новую рубрику
Задротские (и абсолютно бесплатные) книжки про анализ данных. Сегодня подборка про язык R
🤗 R для всех нас: введение без статистики
Внутри — ускоренный курс по R и краткий обзор среды программирования RStudio. А также советы, как создавать информативные визуализации, оптимизировать создание отчетов и разрабатывать интерактивные веб-сайты — независимо от того, являетесь ли вы опытным пользователем R или никогда не писали ни строчки кода
👹 Современная визуализация данных с помощью R (от автора с задорной фамилией Кабакофф)
Эта книга поможет создавать самые популярные визуализации — от быстрых и грубых набросков до готовых к публикации графиков. Книга во многом про графический пакет ggplot2
🐾 Причинно-следственные связи в R
Эта книга хороша как для академических исследователей, так и для специалистов по обработке данных (ну и журналистов). Многие методы универсальны: причинно-следственные связи полезно понимать, как отвечая на вопросы о природе рака, так и на вопросы об источнике клика
🐾 R для науки о данных
В этой книге вы найдете практические навыки работы с данными. Как химик учится чистить пробирки и наводить порядок в лаборатории, так и вы научитесь чистить данные и строить графики, а также многое другое
🤗 Курс исследовательского анализа данных
Эта книга об исследовательском анализе данных, о том, как посмотреть на данные, чтобы понять, о чем они говорят. Она посвящена простой арифметике и наглядному визуалу
Задротские (и абсолютно бесплатные) книжки про анализ данных. Сегодня подборка про язык R
Внутри — ускоренный курс по R и краткий обзор среды программирования RStudio. А также советы, как создавать информативные визуализации, оптимизировать создание отчетов и разрабатывать интерактивные веб-сайты — независимо от того, являетесь ли вы опытным пользователем R или никогда не писали ни строчки кода
Эта книга поможет создавать самые популярные визуализации — от быстрых и грубых набросков до готовых к публикации графиков. Книга во многом про графический пакет ggplot2
Эта книга хороша как для академических исследователей, так и для специалистов по обработке данных (ну и журналистов). Многие методы универсальны: причинно-следственные связи полезно понимать, как отвечая на вопросы о природе рака, так и на вопросы об источнике клика
В этой книге вы найдете практические навыки работы с данными. Как химик учится чистить пробирки и наводить порядок в лаборатории, так и вы научитесь чистить данные и строить графики, а также многое другое
Эта книга об исследовательском анализе данных, о том, как посмотреть на данные, чтобы понять, о чем они говорят. Она посвящена простой арифметике и наглядному визуалу
Please open Telegram to view this post
VIEW IN TELEGRAM
R for the Rest of Us: A Statistics-Free Introduction
128❤6🔥3👍2
Как перевести таблицы в PDF в Excel или Google Sheets
Недавно я работала над текстом о том, на что россияне жалуются президенту. Каждый месяц на сайте управления по работе с обращениями граждан публикуют обзор. Там рассказывают, какие темы волнуют граждан больше всего и к каким госорганам у них накопились серьезные вопросы.
Сами обзоры громоздкие: около 100 страниц, большая часть — огромные таблицы с мелким шрифтом и множеством цифр. Сложностей добавляет и тот факт, что всё в формате PDF — а значит взять и проанализировать сходу не получится.
На этот случай есть два полезных инструмента:
😭 I love PDF — это бесплатный сервис, который умеет делать почти всё с PDF-файлами. Начиная от снятия защиты и сравнения двух почти одинаковых доков, заканчивая переводом в xlsx-формат.
😩 Tabula — еще один сервис, который умеет извлекать данные в электронную таблицу CSV или Microsoft Excel, используя простой и удобный интерфейс. В целом всё наглядно и просто, но если есть сложности — вот видео
Недавно я работала над текстом о том, на что россияне жалуются президенту. Каждый месяц на сайте управления по работе с обращениями граждан публикуют обзор. Там рассказывают, какие темы волнуют граждан больше всего и к каким госорганам у них накопились серьезные вопросы.
Сами обзоры громоздкие: около 100 страниц, большая часть — огромные таблицы с мелким шрифтом и множеством цифр. Сложностей добавляет и тот факт, что всё в формате PDF — а значит взять и проанализировать сходу не получится.
На этот случай есть два полезных инструмента:
Please open Telegram to view this post
VIEW IN TELEGRAM
iLovePDF - Онлайн инструменты для PDF
iLovePDF | Онлайн PDF инструменты для любителей PDF
iLovePDF это полностью бесплатный и простой в использовании онлайн-сервис для работы с PDF-файлами. Слияние PDF, Разбивка PDF, сжатие PDF, office в PDF, PDF в JPG и многое другое!
50👍5
Врываюсь в эфир с историей о том, как одно уважаемое издание не совладало с цифрами Росстата (и как на это не попасться остальным)
Судя по инфографике, общий анализ крови подорожал почти на 500%, слабительное и УЗИ на 200%. В Росстате мне это прокомментили лаконично — «какой-то бред».
На Федстате четко видно, что за год анализ крови вырос на 7%, слабительное на 70% (много, но явно не 200), узи — на 10%.
Почему так вышло?
Росстат публикует цены на товары и услуги в огромных таблицах — каждый месяц на новом листе. Но вот категории товаров зачастую не совпадают (подробно писала об этом тут).
Вот и получается, что если не сверил категории, то в одном и том же столбце на разных листах могут быть разные товары.
В нашем случае получилось так: там где за 23-й год был анализ крови (в районе 400 рублей), за 24-й — пребывание пациента в круглосуточном стационаре (в районе 2000).
Всем пис и фактчекинг🫡
Судя по инфографике, общий анализ крови подорожал почти на 500%, слабительное и УЗИ на 200%. В Росстате мне это прокомментили лаконично — «какой-то бред».
На Федстате четко видно, что за год анализ крови вырос на 7%, слабительное на 70% (много, но явно не 200), узи — на 10%.
Почему так вышло?
Росстат публикует цены на товары и услуги в огромных таблицах — каждый месяц на новом листе. Но вот категории товаров зачастую не совпадают (подробно писала об этом тут).
Вот и получается, что если не сверил категории, то в одном и том же столбце на разных листах могут быть разные товары.
В нашем случае получилось так: там где за 23-й год был анализ крови (в районе 400 рублей), за 24-й — пребывание пациента в круглосуточном стационаре (в районе 2000).
Всем пис и фактчекинг
Please open Telegram to view this post
VIEW IN TELEGRAM
151🔥4❤3
Второе особенно взорвало мозг — пришлось разобраться в хитрой схеме с псевдоакциями, криптой и десятками компаний в офшорах, которую придумали люди с опытом в управлении крупной финансовой пирамидой.
Если ещё не видели — ловите:
В середине 2024 года, когда российские компании начали публиковать финансовые отчёты, мы наткнулись на ООО «Банкнота». Чистая прибыль компании за год составила 3,4 трлн рублей, что вывело её в тройку крупнейших компаний России — после «Роснефти» и «Газпрома». Однако владельца «Банкноты» не найти в списках Forbes — выяснилось, что компания зарегистрирована на номинала, ранее судимого за кражу колбасы и водки.
Вот уже 10 лет создатели малоизвестного приложения собирают деньги с российских пенсионеров. Они обещают, что проект вот-вот порвет в клочья WhatsApp, и тогда его купит крупная компания вроде Google, а вкладчики получат тысячи процентов прибыли. На деле же деньги уходят в офшоры, а доход можно получить только за счёт привлечения новых «инвесторов». Как минимум 40 тысяч россиян поверили в эти сказки и приобрели ничем не обеспеченные токены на десятки млрд рублей
Please open Telegram to view this post
VIEW IN TELEGRAM
Главные новости в России и мире - RTVI
Самая прибыльная компания России, о которой вы никогда не слышали
По итогам 2004 года третье в России по чистой прибыли заняло ООО “Банкнота”. Спустя год после его создания никаких физических следов от него не осталось. Как выяснил RTVI, компания зарегистрирована на номинала, неоднократно судимого за кражи. О том, как появилась…
❤7⚡2🔥2
Forwarded from RTVI
В ноябре 2024 года против неустановленных руководителей и сотрудников московской компании «Сбер Холдинг» возбудили уголовное дело о мошенничестве в особо крупном размере. Организация, не связанная с настоящим Сбером, использовала бренд, чтобы привлекать деньги россиян, обещая им высокую прибыль. Однако вместо выплат клиенты остались ни с чем.
Компания возникла несколько лет назад на базе зарегистрированного еще в 1999 году ООО, которое занималось торговлей алкоголем. Используя долголетнюю «выдержку» и схожие со настоящим Сбербанком бизнес-девизы, «Сбер Холдинг» активно продавал эту легенду доверчивым клиентам.
Как говорилось на сайте компании, за 20 лет работы она обслужила 19 тысяч клиентов и обеспечила им совокупный доход в 3,5 млрд рублей. Сегодня с уверенностью можно сказать, что все это ложь.
Директором компании сначала значилась осужденная в 2008 году за наркотики женщина, а затем — уроженец Брянской области, чей номер сегодня принадлежит женщине из Самары. Сотрудники компании использовали фальшивые имена и фотографии со стоков. Кроме того, в активе «Сбер Холдинга» имелся офшор, на сайте которого упоминалась организация «Конкорд» (чаще всего звучит в привязке с ЧВК «Вагнер» и Евгением Пригожиным).
Как выяснил RTVI, с 2022 года за руководителями «Сбер Холдинга» охотятся судебные приставы, пытаясь взыскать 1,5 млрд рублей. Но тщетно — установить местонахождение должника и его имущества невозможно
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Где искать кейсы об оспаривании антироссийских санкций
Недавно я разбиралась, как российские миллиардеры оспаривают санкции ЕС, США и других стран — и заодно, как они пытаются исчезнуть из списков Forbes, которые часто становятся основанием для санкций.
Решила поделиться источниками по основным юрисдикциям:
- Европейский союз
- Великобритания
- Канада
- США
Правда есть тут нюансы. Иногда вместо имен в таких делах указывают инициалы, которые не совпадают с реальными. Например, бывшая супруга Фридмана в судебной базе ЕС фигурировала как QF. Но в самом судебном акте было указано:
В общем пользуйтесь! Ну а что получилось по итогу, можно посмотреть здесь:
- «Конфликт серьезно подорвал капиталы»: кто пропал из списков богатейших россиян за три года СВО
- Каждое второе решение — положительное: как российские миллиардеры и их семьи избавляются от западных санкций
Недавно я разбиралась, как российские миллиардеры оспаривают санкции ЕС, США и других стран — и заодно, как они пытаются исчезнуть из списков Forbes, которые часто становятся основанием для санкций.
Решила поделиться источниками по основным юрисдикциям:
- Европейский союз
- Великобритания
- Канада
- США
Правда есть тут нюансы. Иногда вместо имен в таких делах указывают инициалы, которые не совпадают с реальными. Например, бывшая супруга Фридмана в судебной базе ЕС фигурировала как QF. Но в самом судебном акте было указано:
В 1989 году она вышла замуж за Михаила Фридмана, с которым развелась в 2005 году.
В общем пользуйтесь! Ну а что получилось по итогу, можно посмотреть здесь:
- «Конфликт серьезно подорвал капиталы»: кто пропал из списков богатейших россиян за три года СВО
- Каждое второе решение — положительное: как российские миллиардеры и их семьи избавляются от западных санкций
🔥5❤3👍2👏2
Как вытаскивать данные с самых упрямых сайтов: 4 продвинутых метода веб-скрейпинга
Дата-журналист Саймон Виллисон провёл на конференции NICAR 2025 крутой воркшоп про новейшие методы веб-скрейпинга.
Собрала самое главное:
1. Git-скрейпинг
Автоматически следим за изменениями на сайте и сохраняем историю в GitHub через GitHub Actions. Полезно для отслеживания цен, публикаций госданных и статистики.
2. JavaScript + shot-scraper
Запускаем JavaScript прямо в браузере или через командную строку (shot-scraper). Полезно при автоматизации сбора данных с сайтов, устойчивых к классическим методам парсинга. А еще для бесконечной прокрутки — как в Twitter.
3. Нейросети для извлечения структурированных данных
GPT-4o и Gemini отлично извлекают структурированную информацию из плохо размеченных сайтов — например, пдфки и даже изображения. Новая фишка — поддержка схем данных.
4. Видео-скрейпинг
Когда сайт ну совсем не даёт собирать данные, делаем захват экрана, загружаем видео в Google AI Studio и получаем таблицу. Работает даже с самыми защищёнными ресурсами.
Саймон также придумал как безопасно раздавать API-ключи участникам воркшопов через страницу с зашифрованным сообщением. Попробовать можно тут: tools.simonwillison.net/encrypt (пароль: "demo").
#дата_журналистика #скрейпинг #полезное
Дата-журналист Саймон Виллисон провёл на конференции NICAR 2025 крутой воркшоп про новейшие методы веб-скрейпинга.
Собрала самое главное:
1. Git-скрейпинг
Автоматически следим за изменениями на сайте и сохраняем историю в GitHub через GitHub Actions. Полезно для отслеживания цен, публикаций госданных и статистики.
2. JavaScript + shot-scraper
Запускаем JavaScript прямо в браузере или через командную строку (shot-scraper). Полезно при автоматизации сбора данных с сайтов, устойчивых к классическим методам парсинга. А еще для бесконечной прокрутки — как в Twitter.
3. Нейросети для извлечения структурированных данных
GPT-4o и Gemini отлично извлекают структурированную информацию из плохо размеченных сайтов — например, пдфки и даже изображения. Новая фишка — поддержка схем данных.
4. Видео-скрейпинг
Когда сайт ну совсем не даёт собирать данные, делаем захват экрана, загружаем видео в Google AI Studio и получаем таблицу. Работает даже с самыми защищёнными ресурсами.
Саймон также придумал как безопасно раздавать API-ключи участникам воркшопов через страницу с зашифрованным сообщением. Попробовать можно тут: tools.simonwillison.net/encrypt (пароль: "demo").
#дата_журналистика #скрейпинг #полезное
Simon Willison’s Weblog
Simon Willison on git-scraping
34 posts tagged ‘git-scraping’. Git scraping is a technique where data is scraped from an external source into a Git repository in order to record changes to that data over time.
50❤3❤🔥2👨💻1
Как ProPublica натравила нейронку на тысячи американских грантов. Промт
Помните, как Дональд Трамп урезал федеральные расходы на науку до минимума за 35 лет? Одним из идеологов той кампании стал техасский сенатор-республиканец Тед Круз.
Недавно Круз «проверил» траты администрации Байдена и насчитал 3400 грантов, которые пропагандируют неомарксизм и идеалогию дайвёрсити и инклюзивности. По его подсчётам, на это «безобразие» ушло более $2 млрд.
В ProPublica скачали опубликованную базу и прогнали её через нейросеть — просто чтобы понять, чем руководствовался сенатор. Курьёз: в список попал, например, проект о миграции мяты по континентам. Позже выяснилось, что грант «заподозрили» из-за слов diversify (о биоразнообразии) и female (в контексте женщины-учёной).
Что сделали журналисты?
1. Поручили ИИ «притвориться» расследователем: искать «опасные» слова в описаниях грантов и оставлять поле пустым, если нет уверенности. Так минимизировали галлюцинации.
2. Ручная проверка: редакторы прошли по вычищенной базе, подтвердили каждую деталь, обзвонили всех фигурантов и ведомства — классический факт-чек.
Вот что получилось в итоге, а вот и обещанный промт (переведено само собой нейронкой):
Помните, как Дональд Трамп урезал федеральные расходы на науку до минимума за 35 лет? Одним из идеологов той кампании стал техасский сенатор-республиканец Тед Круз.
Недавно Круз «проверил» траты администрации Байдена и насчитал 3400 грантов, которые пропагандируют неомарксизм и идеалогию дайвёрсити и инклюзивности. По его подсчётам, на это «безобразие» ушло более $2 млрд.
В ProPublica скачали опубликованную базу и прогнали её через нейросеть — просто чтобы понять, чем руководствовался сенатор. Курьёз: в список попал, например, проект о миграции мяты по континентам. Позже выяснилось, что грант «заподозрили» из-за слов diversify (о биоразнообразии) и female (в контексте женщины-учёной).
Что сделали журналисты?
1. Поручили ИИ «притвориться» расследователем: искать «опасные» слова в описаниях грантов и оставлять поле пустым, если нет уверенности. Так минимизировали галлюцинации.
2. Ручная проверка: редакторы прошли по вычищенной базе, подтвердили каждую деталь, обзвонили всех фигурантов и ведомства — классический факт-чек.
Вот что получилось в итоге, а вот и обещанный промт (переведено само собой нейронкой):
Контекст: Мы будем показывать вам гранты Национального научного фонда (NSF), которые предложено отменить, потому что, по мнению офиса сенатора-республиканца Теда Круза, они содержат темы «пробуждённой» (woke) идеологии; разнообразия, справедливости и инклюзии (DEI); либо неомарксистской идеологии. Мы хотим проанализировать описания этих грантов и выяснить, встречаются ли в них термины или темы, которые можно считать «woke» или относящимися к DEI. Ваша задача — определить, присутствуют ли такие темы в тексте, и сообщить мне о находках. Извлекайте информацию только из гранта NSF, если он действительно содержит требуемые данные.
--
Как журналист-расследователь, я ожидаю от вас следующую информацию
--
woke_description: Короткое описание (максимум один абзац) того, почему этот грант выделен как продвигающий «woke»-идеологию, разнообразие, справедливость и инклюзию (DEI) или продвинутую неомарксистскую «борьбу классов». Оставьте поле пустым, если это неясно.
why_flagged: Посмотрите на поля «STATUS», «SOCIAL JUSTICE CATEGORY», «RACE CATEGORY», «GENDER CATEGORY» и «ENVIRONMENTAL JUSTICE CATEGORY». Если какое-то из них заполнено, значит автор документа счёл, что грант продвигает идеологию DEI именно в этом аспекте. Проанализируйте поле «AWARD DESCRIPTIONS» и постарайтесь понять, почему автор мог отметить грант таким образом. Напишите подробно и понятно, по одному объяснению на каждый тип и грант.
citation_for_flag: Извлеките очень короткую цитату из поля «AWARD DESCRIPTIONS», подтверждающую данные из «why_flagged».
ProPublica
How ProPublica Uses AI Responsibly in Its Investigations
When our reporters prompted a large language model to help identify “woke” themes in a database of grants, AI helped them tell a vital accountability story about science funding and Ted Cruz.
50❤6🤩2🔥1🏆1
Forwarded from доказательный ⎵ пробел
Профессор ЦЕУ Габор Бекеш продолжает радовать нас открытыми курсами в области анализа данных (об одном из них мы писали ранее). Совсем недавно в свет вышел Курс «Анализ данных с использованием ИИ» (Doing Data Analysis with AI) , который предназначен для студентов с базовыми знаниями в области анализа данных, эконометрики и количественных методов. Курс учит применять ИИ для повышения продуктивности в анализе данных. Основное внимание уделяется использованию крупных языковых моделей (LLMs), таких как ChatGPT, Claude.ai и других. Есть много практических кейсов: например, здесь Бекеш подробно описывает как генерировать графики распределения доходов в привязке к уровню образования и гендеру, приводя примеры промтов и результатов выдачи ChatGPT и Claude.ai. Если еще не используете ИИ в дата-анализе и исследованиях, курс - хорош для погружения 🧠
@evidencespace
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
50👨💻2
🦾Google Scholar — секретное оружие для OSINT-расследований
Знаете, какой инструмент почти никто не использует, а зря? Google Scholar. Да, тот самый поисковик научных статей. Он не раз меня спасал, когда нужно было найти иностранные судебные кейсы, связанные с людьми, компаниями или организациями.
Например, завтра в США начнется суд против экс-дипломата Сергея Шестакова по делу о содействии Дерипаске в обходе санкций. Если пробить его имя через раздел Case Law в Google Scholar — находится целая пачка дел, где он фигурировал.
Даже если интересующий вас человек или компания не настолько известны, одна найденная запись может дать кучу новых зацепок: имена, компании, адреса, телефоны, связи.
Что делаем:
1. Заходим в Google Scholar → Case Law.
2. Вбиваем имя или компанию.
3. Смотрим не только сам кейс, но и раздел «How Cited» — там часто всплывают другие дела с теми же фигурантами.
4. Извлекаем всё полезное: новые имена, компании, контакты, детали. Это новые селекторы для дальнейшего поиска.
Удачного поиска!
Знаете, какой инструмент почти никто не использует, а зря? Google Scholar. Да, тот самый поисковик научных статей. Он не раз меня спасал, когда нужно было найти иностранные судебные кейсы, связанные с людьми, компаниями или организациями.
Например, завтра в США начнется суд против экс-дипломата Сергея Шестакова по делу о содействии Дерипаске в обходе санкций. Если пробить его имя через раздел Case Law в Google Scholar — находится целая пачка дел, где он фигурировал.
Даже если интересующий вас человек или компания не настолько известны, одна найденная запись может дать кучу новых зацепок: имена, компании, адреса, телефоны, связи.
Что делаем:
1. Заходим в Google Scholar → Case Law.
2. Вбиваем имя или компанию.
3. Смотрим не только сам кейс, но и раздел «How Cited» — там часто всплывают другие дела с теми же фигурантами.
4. Извлекаем всё полезное: новые имена, компании, контакты, детали. Это новые селекторы для дальнейшего поиска.
Удачного поиска!
128❤🔥10👾3🔥1
LinkedIn как инструмент OSINT: что можно выжать из соцсети для карьеристов
LinkedIn — один из самых мощных источников для корпоративного OSINT. Особенно после запуска публичной рекламной библиотеки (да, теперь можно искать рекламу по ключевым словам, странам и датам). Но и помимо рекламы там полно полезного.
Что можно найти:
Структура компаний
- Ad Library — новый источник для поиска B2B-кампаний, «тихого» найма и политического таргетинга на профи-аудиторию.
- Раздел «People» показывает, кто где работает, какие у них роли, где учились и живут.
- Раздел «Jobs» — кладезь для анализа технологий и процессов (по описаниям вакансий).
- Посты и обновления — часто анонсируют партнёрства, увольнения, релокации.
Данные о людях
- Даже если фамилия скрыта — можно «угадать» её по буквам через поиск.
- Некоторые данные есть в URL (например имя-фамилия в username), в PDF-профилях и даже в картинках с сертификатами.
- Рекомендации от коллег часто раскрывают полное имя, даже если сам профиль — частично анонимный.
Язык и регион
- Язык интерфейса профиля можно узнать через PDF-экспорт — это помогает точнее подстроить ресёрч.
- По географии сотрудников можно понять, куда компания расширяется или откуда уходит.
- Люди постят бейджи, офисы, сувениры с логотипами — всё это может помочь в верификации.
- Если профиль верифицирован через рабочую почту — значит, она активна.
Инструменты
- Google Dorks → ищем профили без логина в LinkedIn:
- Outlook + LinkedIn интеграция → проверяем, привязан ли email к профилю.
Проверить публичные данные о рекламе можно здесь, почитать подробнее про остальные инструменты — здесь
LinkedIn — один из самых мощных источников для корпоративного OSINT. Особенно после запуска публичной рекламной библиотеки (да, теперь можно искать рекламу по ключевым словам, странам и датам). Но и помимо рекламы там полно полезного.
Что можно найти:
Структура компаний
- Ad Library — новый источник для поиска B2B-кампаний, «тихого» найма и политического таргетинга на профи-аудиторию.
- Раздел «People» показывает, кто где работает, какие у них роли, где учились и живут.
- Раздел «Jobs» — кладезь для анализа технологий и процессов (по описаниям вакансий).
- Посты и обновления — часто анонсируют партнёрства, увольнения, релокации.
Данные о людях
- Даже если фамилия скрыта — можно «угадать» её по буквам через поиск.
- Некоторые данные есть в URL (например имя-фамилия в username), в PDF-профилях и даже в картинках с сертификатами.
- Рекомендации от коллег часто раскрывают полное имя, даже если сам профиль — частично анонимный.
Язык и регион
- Язык интерфейса профиля можно узнать через PDF-экспорт — это помогает точнее подстроить ресёрч.
- По географии сотрудников можно понять, куда компания расширяется или откуда уходит.
- Люди постят бейджи, офисы, сувениры с логотипами — всё это может помочь в верификации.
- Если профиль верифицирован через рабочую почту — значит, она активна.
Инструменты
- Google Dorks → ищем профили без логина в LinkedIn:
site:linkedin.com inurl : "/in/" "<название_компании>" -inurl: "<название_компании>"
- Wayback Machine → ищем удалённые профили или проверяем изменения по вебархиву.- Outlook + LinkedIn интеграция → проверяем, привязан ли email к профилю.
Проверить публичные данные о рекламе можно здесь, почитать подробнее про остальные инструменты — здесь
🔥6👍4
Google проиндексировал сотни приватных чатов ChatGPT — это находка для расследований и серьезный риск для приватности
Журналист-расследователь Хенк ван Эсс обнаружил в свободном доступе свыше 500 чат-сессий с ChatGPT, где корпоративные топы, госслужащие и просто пользователи обсуждают с ИИ личные и служебные темы — от финансовых отчётов и предстоящих сделок до конфликтов и даже криминальных схем.
Каждый пятый чат содержал по-настоящему чувствительную информацию. Например, один пользователь планировал кибератаки против ХАМАС с использованием вредоносного ПО, другой обсуждал схему ухода от долгов на $750 тыс. Встретились и необычные кейсы: сотрудник международного аналитического центра создавал сценарии кризиса правительства США, а кто-то тщетно пытался подделать разрешение на парковку, объясняя это нейронке «борьбой с рабством».
🐱Почему чаты попали в открытый доступ?
ChatGPT имеет функцию «поделиться», создающую постоянные публичные ссылки на chatgpt.com/share. Эти ссылки индексируют поисковики вроде Google, открывая доступ к чатам. Другие ИИ-платформы (Claude, Bing, Gemini) такую автоматическую индексацию не допускают (а вот у Meta она тоже есть, будьте аккуратны).
🐱Зачем это дата-журналистам?
Это еще один неожиданный источник информации. Здесь можно найти информацию о служебных конфликтах, инсайдерские данные и необычные темы для расследований.
🐱Как искать эти чаты?
Принцип тот же, что и в дорках — с помощью сложных поисковых запросов (рассказывала об этом тут).
Вот примеры запросов от Хенка ван Эсса:
Деловая разведка:
Преступные намерения:
Профессиональные нарушения:
Раскрытие личной информации:
Ну и по нашей традиции для самых въедливых (таких как я) — вот источник инфы
Журналист-расследователь Хенк ван Эсс обнаружил в свободном доступе свыше 500 чат-сессий с ChatGPT, где корпоративные топы, госслужащие и просто пользователи обсуждают с ИИ личные и служебные темы — от финансовых отчётов и предстоящих сделок до конфликтов и даже криминальных схем.
Каждый пятый чат содержал по-настоящему чувствительную информацию. Например, один пользователь планировал кибератаки против ХАМАС с использованием вредоносного ПО, другой обсуждал схему ухода от долгов на $750 тыс. Встретились и необычные кейсы: сотрудник международного аналитического центра создавал сценарии кризиса правительства США, а кто-то тщетно пытался подделать разрешение на парковку, объясняя это нейронке «борьбой с рабством».
🐱Почему чаты попали в открытый доступ?
ChatGPT имеет функцию «поделиться», создающую постоянные публичные ссылки на chatgpt.com/share. Эти ссылки индексируют поисковики вроде Google, открывая доступ к чатам. Другие ИИ-платформы (Claude, Bing, Gemini) такую автоматическую индексацию не допускают (а вот у Meta она тоже есть, будьте аккуратны).
🐱Зачем это дата-журналистам?
Это еще один неожиданный источник информации. Здесь можно найти информацию о служебных конфликтах, инсайдерские данные и необычные темы для расследований.
🐱Как искать эти чаты?
Принцип тот же, что и в дорках — с помощью сложных поисковых запросов (рассказывала об этом тут).
Деловая разведка:
site:chatgpt.com/share ("my company" + (strategy OR revenue OR acquisition) OR "our competitor" OR "confidential" OR "NDA" OR "internal only" OR "upcoming merger" OR "quarterly earnings" OR "trade secret")
Преступные намерения:
site:chatgpt.com/share ("without getting caught" OR "avoid detection" OR "without permission" OR "get away with" OR "without anyone knowing")
Профессиональные нарушения:
site:chatgpt.com/share ("write my essay" OR "plagiarism" OR "my assignment due" OR "don't mention AI" OR "fake invoice" OR "insider trading")
Раскрытие личной информации:
site:chatgpt.com/share ("my salary" OR "my SSN" OR "diagnosed with" OR "my medication" OR "my therapist")
Ну и по нашей традиции для самых въедливых (таких как я) — вот источник инфы
👍4❤3🤯1