DataTalks
920 subscribers
507 photos
43 videos
402 links
Образовательный проект DataTalks. Рассказываем про управление данными на конференциях, митапах и марафонах.

#datatalks #безграниц #безрекламы #безводы

Контакты:
[email protected]
http://datatalks.rt.ru/
https://rutube.ru/channel/25367326/
加入频道
‼️ Lakehouse — не панацея: как выбрать подходящую технологию?

Мы постоянно слышим о росте объемов данных, но не всегда задумываемся, что это за данные и как меняется подход к работе с ними. Как в таких условиях выбрать правильную технологию?

10 июля вас ждет совместное выступление Михаила Комарова, директора по развитию бизнеса в области данных и ИИ «Ростелекома», и Григория Бокштейна, ведущего эксперта по управлению данными TData. Они расскажут:

как меняется подход к работе с данными и почему сегодня важно учитывать не только рост объёмов, но и разнообразие сценариев их использования;

стоит ли все бросать и бежать в Lakehouse?

как выбрать подходящие инструменты под конкретный проект;

какие преимущества дает использование различных технологий в рамках единой платформы.

Михаил Комаров более 15 лет занимается проектами в области управления данными, развития аналитических систем, хранилищ данных и ИИ.

Григорий Бокштейн обладает широкими экспертными знаниями в области технологий и методик управления данными, которые эффективно применяет для проектирования комплексных ИТ-решений в этой области.

Сайт и программа Форума
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥3👏2
Учёные разработали ИИ-систему Centaur, которая предсказывает, как человек будет вести себя в разных ситуациях — от ставок до логических игр. Она обучена на более чем 10 млн решений, собранных в 160 психологических экспериментах, и превзошла все классические модели. Разработчики хотели уйти от узкоспециализированных систем вроде AlphaGo и создали инструмент, который сам адаптируется к новым условиям. Но Centaur ограничен языковыми данными и преимущественно ориентирован на поведение жителей западных стран, что снижает его точность за пределами этой выборки. Подробнее в публикации Nature.

А Anthropic не только уничтожает книги в процессе обучения своих моделей ИИ, но и проводит необычные эксперименты: созданный на базе Claude Sonnet LLM-агент Claudius взял на себя управление небольшим магазином (и справился с этим не очень хорошо). В рамках «Project Vend» Claudius закупал еду, общался с покупателями и пытался продавать вольфрамовые кубы. А ещё он выдумал сотрудницу Сару, назначил встречу по адресу из «Симпсонов», пообещал доставить товары в пиджаке — и впал в кризис личности, но затем сам себя убедил, что всё это — первоапрельская шутка, и спокойно вернулся к работе.
🔥3🤔2
Робототехника стремительно развивается, вдохновляясь природой и новейшими технологиями.

Исследователи из МФТИ и ННГУ предложили новую модель для расчёта оптимальной подъемной силы в летательных аппаратах с машущим крылом. Их работа открывает путь к созданию более манёвренных и энергоэффективных орнитоптеров — роботов, способных летать там, где обычные дроны бессильны.

В Южной Корее инженеры создали уникальный 3D-акустический датчик, способный точно определять направление звука даже в условиях сильного шума. Это открывает новые возможности для поисково-спасательных роботов и автоматизации на производстве, где визуальные сенсоры часто оказываются бессильны.

А ученые из University College London представили систему, где роботы с помощью ультразвука могут совместно удерживать и перемещать объекты в воздухе без физического контакта. Система вдохновлена коллективным поведением муравьёв и позволяет роботам работать как поодиночке, так и в команде. Такая технология пригодится для микросборки и работы в сложных условиях.

Ещё одна впечатляющая разработка — технология mmNorm, которая позволяет роботам «видеть» сквозь стены, используя миллиметровые радиоволны Wi-Fi. Система способна распознавать и строить трёхмерные модели объектов которые скрыты за различными материалами, «заглядывать» внутрь коробок, определять повреждения под упаковкой и точно находить нужные инструменты в закрытых ящиках. Детали исследования — в оригинальной статье.
👍1🔥1
Минздрав России усиливает контроль над ИИ-решениями в медицине. С сентября 2025 года производители медицинского ПО должны будут указывать в документации наличие ИИ-технологий, описывать их функции, а также передавать данные о сбоях и ошибках через систему Росздравнадзора.

Медицинский ИИ уже активно применяется в клиниках: московские специалисты используют нейросеть для оперативного выявления артроза по рентгеновским снимкам, существенно сокращая сроки постановки диагноза. Учёные из Сеченовского университета представили нейросервис, который за считанные минуты создаёт точные трёхмерные модели печени для виртуального планирования хирургических операций. А разработанный в США алгоритм iSeg способен точнее врачей обнаруживать опухоли лёгких, впервые учитывая движение новообразований при дыхании пациента.

Однако стремительный рост использования ИИ открывает путь и для новых киберугроз. Недавнее исследование демонстрирует технологию RisingAttacK, позволяющую контролировать то, что «видят» нейросети, и эффективно манипулировать всеми популярными системами компьютерного зрения, что может создать серьёзные риски для критически важных областей, включая медицину и безопасность.
👍21🔥1
В России стартовали полевые испытания комбайнов с искусственным интеллектом и машинным зрением. Теперь техника самостоятельно ориентируется в пространстве с помощью видеокамер и алгоритмов, даже если GPS-сигнал пропадает. Разработка должна заметно повысить точность и экономичность уборки урожая.

А ученые из Нижнего Новгорода представили отечественный нейроинтерфейс для управления роботами и протезами при помощи «силы мысли». Система считывает команды мозга через ЭЭГ-шлем и мгновенно передаёт их устройству благодаря компактной мемристорной электронике.

В Пекине же создали контроллер, превращающий обычных пчёл в точных воздушных «киборгов». Небольшое устройство массой 74 мг позволяет управлять полётом насекомого на расстоянии, открывая возможности для разведки и спасательных операций в экстремальных условиях.
🔥1👏1😱1
В России представили нейросеть, которая всего за 20 секунд считывает 2500 паспортов. Теперь обработка документов идёт со скоростью до 10 миллионов паспортов в сутки, и система уже работает в банках, налоговой и даже аэропорту Шереметьево.

Чтобы туристы не стояли в очередях, «Петергоф» начал применять ИИ. Система проанализировала более 100 тысяч маршрутов и выбрала лучшие, которые помогут тысячам туристов спокойно и быстро перемещаться по дворцу.

А международная команда учёных при помощи ИИ разработала инновационные покрытия, которые снижают температуру зданий на 20°C. Такие материалы могут экономить тысячи киловатт энергии в год и пригодятся даже в космосе.
🔥3
В Дубае откроется ресторан Woohoo, в котором за создание блюд отвечает ИИ Aiman. Алгоритм опирается на молекулярную гастрономию и точные научные данные, а создатели обещают оригинальные блюда и экологичный подход к приготовлению еды.

А учёные из MIT и университета Тунцзи выяснили, что GPT не всегда "мыслят" одинаково на разных языках. На китайском нейросети чаще выбирают коллективистский подход и воспринимают информацию глобально, а на английском — индивидуализм и аналитическое мышление.

Но внедрение нейросетей не всегда проходит гладко. В Китае виртуальные сурдопереводчики на ТВ, созданные с помощью генеративного ИИ, провалили свою главную задачу. Слабослышащие зрители не могут понять аватаров из-за грубых ошибок и искажений в жестах и мимике. Эксперты объясняют проблемы поспешностью разработчиков и отсутствием консультаций со специалистами по жестовому языку.
1
Роботы делают еще один шаг к полной автономности. Китайская компания UBTech представила человекоподобного робота Walker S2, который сам заменяет себе аккумуляторы, не прекращая работу ни на секунду. Это позволяет ему работать круглосуточно, без выходных и простоев.

Однако роботы могут не только без устали работать, но и быть на спорте: в Пекине прошли первые футбольные матчи, сыгранные автономными роботами. Робо-игроки самостоятельно выбирали тактику, передвигались по полю и даже поднимались после падений, хотя некоторых всё же приходилось уносить на носилках, добавляя матчу человеческого драматизма.

А британские исследователи разработали четвероногого робота, который самостоятельно учится двигаться по незнакомой местности, меняя походку и баланс подобно животным. Такая технология значительно повысит эффективность использования роботов в экстремальных условиях, будь то спасательные операции или исследование опасных зон.
🔥1
10 июля в Москве прошёл форум Data Day 2025, собравший более 500 специалистов в области данных. Среди спикеров — эксперты TData и «Ростелекома».

➡️ Григорий Бокштейн (TData) рассказал о построении масштабируемой data-платформы и внедрении решений в телеком, промышленности и транспорте. Опыт «Ростелекома» с хранилищем более 10 ПБ помог создать платформу для высоконагруженных и гибко настраиваемых проектов.

➡️ Михаил Комаров («Ростелеком») отметил, что универсальных решений нет — важны надёжность, стоимость владения и адаптация к бизнес-задачам. Именно на этих принципах построена архитектура платформы по управлению данными TData.

Запись выступления — на официальном Rutube-канале TData.
🎤 Смотреть запись
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31🔥1
ИИ-сервис в московской системе здравоохранения ЕМИАС уже доказал свою эффективность: всего за месяц работы создано более двух миллионов кратких медицинских сводок из электронных карт пациентов. ИИ анализирует огромные массивы информации и предоставляет врачам саммари по жалобам пациентов перед приёмом, помогая ставить диагнозы быстрее и точнее.

Учёные из Высшей школы экономики представили технологию AncestryGNN, которая с помощью графовых нейросетей определяет генетическое происхождение человека точнее традиционных ДНК-тестов. Новый подход ориентирован на близкородственные популяции и уже показал свою эффективность в исследовании народов Восточно-Европейской равнины.

А в Лондоне появится первый в мире Центр изучения сознания животных, который займётся разработкой ИИ для общения с питомцами. Учёные планируют понять эмоции и желания различных животных — от кошек и собак до крабов и каракатиц. Важной задачей станет разработка этических рамок, которые позволят избежать искажения реальных потребностей животных при «переводе» их сигналов.
Компания TData анонсировала масштабное обновление продукта RT.DataGovernance — инструмента для управления данными.

В новой версии разработчики внедрили дополнительные функции, которые облегчают настройку процессов управления данными и делают работу с системой более удобной и эффективной.

Среди новшеств — поддержка Kafka и Airflow, AI-разметка персональных данных, возможность загружать метаданные без подключения к источникам, улучшенная визуализация потоков (Data Lineage), обновлённый бизнес-глоссарий и портал для работы с данными для бизнес-пользователей и ИТ-специалистов.

➡️Подробнее об RT.DataGovernance, его преимуществах и кейсах применения читайте на TAdviser
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍21
Подборка статей про технические аспекты квантовых технологий, их уникальные характеристики, прототипы и ключевую терминологию.

➡️Квантовые вычисления: основные идеи и состояние квантовых технологий
Статья подробно объясняет отличия квантовых компьютеров от традиционных процессоров, освещая их потенциальные возможности и ограничения.

➡️ Механический квантовый компьютер
В статье мы знакомимся с механическим квантовым компьютером, работающим на основе связанных маятников, что подчеркивает разнообразие подходов в создании квантовых систем.

➡️ «Кото-физика»: объясняем термины квантовой физики на простых и забавных примерах
Наконец, статья представляет алфавит квантовых терминов, используя котиков для объяснения сложных концепций квантовой физики, что способствует лучшему пониманию таких понятий, как алгоритмы Гровера и Шора, а также принцип неопределенности Гейзенберга.
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥1
Минцифры запланировало провести эксперимент по внедрению нейросетей в госуправление. ИИ будет проверять резюме кандидатов на госслужбу, составлять тестовые задания, отвечать на обращения граждан и даже анализировать законопроекты.

В Нижнем Новгороде система детекторов THOR-x3 начнёт управлять «умными» светофорами, регулируя движение в зависимости от дорожной ситуации. А авиакомпания Delta Air Lines запускает динамическое ценообразование билетов на основе алгоритмов Fetcherr: стоимость теперь будет зависеть от того, сколько готов заплатить конкретный пассажир.

Прежде чем стать полноценными помощниками, модели ИИ должны подтвердить свои знания. Компании Scale AI и CAIS представили сложнейший тест для оценки глубины знаний — Humanity’s Last Exam. Пока самые продвинутые модели смогли набрать от 24,9% до 44,4% правильных ответов. Однако темпы роста очень высоки: по прогнозу авторов HLE, к концу 2025 года ИИ могут превысить 50%. А российские разработчики представили MERA Code — первый открытый русскоязычный бенчмарк, позволяющий объективно оценить качество работы ИИ в задачах программирования.
Московский метрополитен запустил на Сокольнической линии нейродиктора, способного создавать объявления за считаные минуты, используя искусственный голос, практически неотличимый от человеческого. В перспективе это позволит быстро и качественно информировать пассажиров о любых изменениях.

А исследователи из НИУ ВШЭ разработали GLGENN — нейросеть, распознающую объекты даже в зеркальном отражении и требующую гораздо меньше ресурсов для обучения. Новая модель пригодится в физике, биоинформатике и робототехнике.

В Австралии протестировали альтернативу GPS — квантовый гравиметр компании Q-CTRL. Технология позволяет судну точно определить своё местоположение по изменениям гравитационного поля, не полагаясь на спутниковый сигнал, и устойчиво работать даже в условиях сильных вибраций и качки.
Отчёт McKinsey о технологических трендах‑2025 выводит на первое место агентный ИИ — автономные цифровые «коллеги», которые сами планируют многоходовые задачи и взаимодействуют с сервисами без участия человека. Масштаб инициатив отражается в деньгах: по расчётам Gartner общий объём мировых IT‑затрат в 2025‑м вырастет на 7,9 % до \$5,44 трлн, а самая динамичная статья — инфраструктура под ИИ‑нагрузки: спрос на серверы, оптимизированные под модели GenAI, растёт кратно.

ИИ проникает и в историческую науку: совместный проект DeepMind и историков‑антиковедов, модель Aeneas, успешно восстанавливает фрагментированные римские надписи и уверенно датирует даже «спорные» тексты вроде *Res Gestae* императора Августа.

Однако развитие технологий ставит и новые вопросы о безопасности. Итальянская разработка WhoFi идентифицирует человека по тому, как его тело искажает Wi‑Fi‑сигнал. В испытаниях точность повторного распознавания достигала 95,5 %, даже если человек неподвижен или находится за стеной. Потенциал для бесконтактного контроля доступа очевиден, но технология может породить серьёзные риски для приватности, предупреждают эксперты.
Runway запустила новую ИИ-модель Aleph, которая позволяет интерактивно редактировать видео — убирать лишнего человека из кадра, изменять освещение, добавлять элементы в сцену или создавать новый ракурс. По данным компании, крупные киностудии и рекламные агентства уже тестируют новый инструмент.

Среди других интересных решений — «режим обучения» в ChatGPT от OpenAI. ИИ теперь не просто выдаёт готовые ответы, а выступает в роли репетитора и постепенно ведёт пользователя через этапы решения задачи. Такой подход должен помочь студентам освоить материал, избегая соблазна бездумного списывания.

Но не все нововведения проходят гладко: на прошлой неделе тысячи личных переписок пользователей с ChatGPT оказались доступными в Google и других поисковиках. Пользователи не заметили галочку, делающую чат открытым для всех и их диалоги с ChatGPT можно было найти в открытом доступе. Спустя несколько часов OpenAI заявила об удалении из ChatGPT функции, позволяющей пользователям делать свои переписки видимыми для поисковых систем. Компания утверждает, что это был кратковременный эксперимент.
Устройства будущего смогут делать гораздо больше привычного. Исследователи из Университета штата Северная Каролина показали миниатюрный спектральный датчик, способный анализировать продукты, кровь и материалы на молекулярном уровне. Прототип занимает всего несколько квадратных миллиметров, и если технология дойдёт до коммерческой реализации, спектрометр сможет быть установлен даже в смартфонах, превращая их в портативные лаборатории.

Учёные из Пекина представили оптический микрофон, который «слушает» с помощью света. Он направляет луч на какой-нибудь предмет — например, на листок бумаги — и отслеживает едва заметные вибрации от звуковых волн. Эти маленькие, почти невидимые колебания устройство превращает обратно в звук. Однако технология пока работает только в лабораторных условиях.

А «Яндекс» поделился своим алгоритмом распознавания речи в шуме, применяемым в «Алисе» и умных колонках. Нейросеть анализирует два потока сигнала и выбирает наиболее чистый в реальном времени, повышая точность понимания команд.
В России стартует обновлённая квантовая программа. Росатом будет курировать дорожную карту до 2030 года : её бюджет превышает 29 млрд рублей. Ключевые цели – создание квантового процессора на 300 кубитов, разработка десятков новых алгоритмов и запуск облачной платформы для доступа к квантовым вычислениям.

Учёные РАН в проекте «Суперквант» создают криоэлектронику и терагерцевые приёмники для масштабирования квантовых компьютеров и точного управления кубитами, а их зарубежные коллеги на CERN добилась исторического результата: создан кубит из антиматерии — один антипротон удерживали в квантовой суперпозиции 50 секунд. Эксперимент служит сверхточным измерительным инструментом для проверки CPT-симметрии и может прояснить, почему во Вселенной вещества больше, чем антивещества.

А исследователи из США открыли новое квантовое состояние материи – «квантовый жидкий кристалл». Оно появляется на стыке вейлевского полуметалла и спинового льда и меняет поведение электронов в сильных магнитных полях. Исследование открывает перспективы для создания более чувствительных квантовых датчиков и управления электронными свойствами материалов
OpenAI представила GPT-5 — флагманскую модель, которая показала высокие результаты в бенчмарках по программированию, медицине и научным задачам, а уровень галлюцинаций в режиме рассуждения снизился на 80% по сравнению с предыдущими моделями. Она уже становится моделью по умолчанию в ChatGPT и доступна даже в бесплатной версии — с ограничениями по лимитам.

Вторая новость от OpenAI — релиз моделей gpt-oss с открытыми весами. Обе версии — 20b и 120b — доступны под Apache 2.0, поддерживают цепочки рассуждений и легко запускаются даже локально. По ряду бенчмарков они превосходят o3-mini и приближаются к o4-mini. Технические детали — в обзоре на Хабре.

Однако открытость и интеграция ИИ с внешними сервисами дают хакерам новые инструменты. Так, ChatGPT оказался уязвим для атаки AgentFlayer: скрытые инструкции в документе позволяют незаметно передавать данные из Google Drive.

Схожую уязвимость обнаружили у Google Gemini. Через «Google Календарь» злоумышленники смогли активировать команды, которые запускали устройства умного дома. Команда, набранная белым шрифтом, превращалась в скрипт, выполняемый ИИ. Это серьёзный сигнал: генеративные модели уже не только генерируют тексты, но и могут быть инструментом вмешательства в физическую среду.
Российская модель 3DGraphLLM научилась читать трёхмерные сцены с пониманием контекста — например, распознавать не только объекты, но и их функциональные связи. Разработка заняла лидирующие позиции по точности среди LLM-подходов и уже адаптируется для робототехнических платформ.

А Google тестирует Genie 3 — ИИ, который по описанию строит игровые миры в реальном времени. Модель способна создавать игровые миры с анимацией, погодой и физикой. Genie работает с частотой 24 кадра в секунду и визуальной памятью, но пока не справляется с точной симуляцией сложных взаимодействий между персонажами и доступна только ограниченной группе исследователей.

Пока технологии усложняются, люди к ним привыкают с разной скоростью. Согласно исследованию Flowwow, 45% IT-специалистов всё ещё не применяют нейросети в работе, чаще всего — из-за сложности запросов или недостаточной полезности. Однако среди тех, кто освоился, ИИ ускоряет процессы, снижает число ошибок и помогает находить нестандартные решения. При этом 87% опрошенных не считают, что ИИ угрожает их профессии.