AI.Insaf
1.09K subscribers
122 photos
1 file
33 links
Личный канал Инсафа Ашрапова
Исполнительный директор по исследованию данных в банке (aka Lead DS) — @insafq
Здесь про AI, менеджмент, личные истории и многое другое
加入频道
До следующей поездки нужно написать про прошлую ✈️. Еще в конце февраля мы ездили во Вьетнам (Ханой -> Фукуок), а затем в Малайзию.

Все началось с пересадки в Чэнду (Китай) – это родина панд, и нам удалось попасть в один из главных их заповедников. Кухня там тоже интересная, особенно сычуанский перец, который не столько острый, сколько дает интересное чувство онемения. А панды же там просто сидят и едят бамбук

Ханой неожиданно понравился больше всего в поездке. Очень классная кухня (не только фо бо, но и бун ча – суп с поджаренным мясом, яичный кофе, свежие роллы, которые сам заворачиваешь). Было прикольно сходить в ресторан из гида Мишлен, где суп с пивом стоил 250 рублей и где за соседним столиком сидел сам Обама. Из города удалось съездить в бухту Халонг (более 1000 островов) и в Ниньбинь, где тоже много гор

Фукуок – это уже перелет с самого севера на самый юг Вьетнама. Там много активностей: аквапарк, сафари-парк, огромная канатная дорога и т.д. По ощущениям похоже на Пхукет.

Куала-Лумпур (Малайзия) – жарко и влажно, зато какие классные джунгли в черте города. Старше лесов Амазонии (возрастом 150 млн лет), и город позиционирует себя как единственный в мире с такими древними джунглями в своих границах. Он показался очень похожим на Сингапур, но намного более живым. Башни Петронас вживую – уважение
🔥115🙏2
12😁3🔥2🙏2
24🔥10🙏2
Career Development: What It Really Means to be a Manager, Director, or VP

Статья хоть и старая, но подобных материалов не так много. Часто пишут про отличия джунов, мидлов и сеньоров. Например, тут (пост в тг) или тут (доклад на youtube), где через аналогию объясняется, как каждый уровень успешно копает канал; отдельное спасибо, что не гребет. И этому докладу больше 6 лет, а я там был лично

В статье же утверждается следующее:

Managers доводят задачи до результата и не требуют избыточного контроля. Однако разработка глобального плана обычно не входит в их обязанности

Directors как и менеджеры, доводят дело до конца, но уже мыслят шире находя обходные пути при необходимости

• VPs цель - разработка глобального плана. Их задача - понять бизнес-ситуацию компании, составить и согласовать план, а затем придти с ним к успеху

Основная идея статьи: VP несут полную ответственность за результаты. В отличие от директоров, они не могут оправдать неудачу тем, что "выполняли согласованный план". Это стимулирует VP к созданию плана, в который он действительно верит

PS. Забавно, что все три уровня (от manager до VP) звучат как классические разбивки на джунов, мидлов и т.д.
👍133😁1
автор статьи конечно тот еще шутник:

It conflates career development and salary negotiation. It encourages a mindset of saying, “what must I do to make L10” when you want to say, “I want a $10K raise.” I can’t tell you the number of times people have asked me for “development” or “leveling” conversations where I get excited and start talking about learning, skills gaps, and such and it’s clear all they wanted to talk about was salary. Disappointing.
😁10👏6🌚2
Сходил сегодня на Датафест в Яндексе, где были только доклады про внутренние продукты. Что послушал:

Спрос Яндекс Лавки: смесь Prophet и бустингов с дальнейшим разделением на продукты, регионы и там, где это улучшало метрики. TimeGPT не используем, так как в Prophet легко добавить выходные дни.
• У очень многих людей (2% или 20%) есть две колонки Алисы, и пришлось научиться понимать, к какой обращаются, и ещё учесть, что может быть несколько пользователей (мультиаккаунтинг). Во второй задаче ожидаемо лучше всего работает, когда человек сам об этом говорит.
• Большой доклад по рекомендациям в Яндекс Лавке. Суть в том, что работает двухбашенный подход с трансформером user-items, косинусные расстояния, которые передаются в бустинги, но дополнительно туда добавляются и сами запросы пользователей, и текущая корзина. И вот они попробовали это всё заменить графовой сеткой (PinSage + TwHIN, где ребра товар-корзина), иииии.... метрики упали. Что не понял, это что при первом запуске бизнес метрики упали, и только когда модель дофитили на результатах 1го запуска - метрики позеленели, это бага или фича? Сейчас же до 20% GMV - за счет рекомендаций
Экран отписки от Плюса – метрика средней выручки с сохранившихся на экране пользователей с вычетом затрат на сохранение. Ранжирование не работает, так как лучше всего сохраняет скидка на подписку, предиктивно с оттоком не начинали, всё на бустингах
• Активно используют VLM для нейро и оффлайн эмбедингов для поиска картинок. Но интересно что нейро пока не научились монетизировать

Если выше это доклады из бизнесовой секции, то еще была 2я техническая, но слишком техническая. Например «Быстрая аппроксимация матрицы Фишера с помощью факторизации Кронекера» 🫡

P.S. Конференция растет, сидр уже давно, а вот кальяны — это что-то новое. И даже был квиз. Доклады можно посмотреть и в записи потом, а так главное там это живое общение
👍18🔥102🙏1
Вчера сходил на Датафест в Avito. Ожидаемо, основной фокус был на LLM и рекомендациях

По докладам:
1. Самый сильный доклад - про post-training LLM и библиотеку torchtune (реализованы SFT, DPO, PPO и т. д. без обёрток Hugging Face), в которую сам докладчик контрибьютит. Берём Llama (вроде бы 7B, batch_size=2) с QLoRA`й - обучение займёт 358 минут с пиком потребления памяти 7 ГБ. Добавим Compile, packing батчей, FlexAttention — и время обучения уменьшится до 36 минут, но какой ценой: потребление памяти вырастет до 40 ГБ (x6),. Можно ещё добавить Context Parallel и улететь в космос с пиками потребления до 70 ГБ.

2. Несколько докладов по продуктовому применению LLM в Avito и Т-Банке (например разметка звонков, чатов на факт сделки и т. д.). Общий подход - максимально очистить выборку и согласовать инструкцию к разметке, добившись консистентности разметки, т. е. чтобы разные люди размечали одинаково. Далее - максимально понятный LLM workflow, так чтобы задача решалась итерационно; если контекст сильно растёт, добавляем RAG. При этом в одном из кейсов Avito для RAG зашла комбинация BM25, LLM, BERT и реранкера из RoBERTa. PS Агентов еще не завезли

3. Дообучение LLM в Avito. Дообучали (DPO) лёгкие 7B модели (Qwen) - получили небольшие приросты метрик, которые нивелируются релизами новых опенсорсных моделей. Ключевой эффект - в дообучении своего токенизатора с фокусом на русский язык (+31% к скорости инференса).

4. Рекомендации на главной Avito: ретривал на трансформерах с позиционными эмбедингами товаров (кликов и просмотров) + ranking на CatBoost. Вся эта история даёт 50% просмотров и 30% кликов по объявлениям. Из интересного - добавление блендера, чтобы в бесконечной ленте были товары из разных категорий

5. Большая дискуссия про важность ML-соревнований. В конце спикеры сошлись на том, что если результат соревнования/хакатона определяется местом на лидерборде, то презентации не стоит учитывать (важен результат, а не то, как он достигнут). Эх, не зря ругают звездолёты кагглеров

6. Инсайды с обсуждений вне докладов - chatgpt любит некоторые буквы заменять на редкие аналоги, которые выглядят так же, чтобы потом можно было бы определить что текст сгенерирован. Плюс наличие нового абзаца с двух пробелов или использование длинного тире - текст сгенерирован, тк такое человек не использует

P.S. На квизе вспомнили про Bimorph - вот так становятся легендой. Пик одс в 2019г и я там был, сейчас нашел статью на хабре, но те обсуждения под 1к сообщение в слаке уже не найти 🫡

P.S2 На фото - вид с веранды офиса, красивое
🔥148👍3
Люди работая на работе инвестирует буквально свое время, я сделал ход конем и инвестировал деньгами 💸– купив ноут. Базовый мак 15” на m4 за <100к - достойно

Кто еще на интеле рекомендую к миграции, состарились и продать не так легко

PS Прогрел несколько людей в офисе
PS2 AI редакторы и яблоко покатилось на 2м фото 🫡
👍8😁73
На этой неделе удалось побывать на закрытой конференции Яндекса «Yet another insight» для руководителей с фокусом на аналитику. В начале — несколько докладов и инсайтов:

• Как понять, какие факторы влияют на ключевую метрику бизнеса? Нужно построить логистическую регрессию и посмотреть на коэффициенты, которые как раз дадут ответ. Увеличение признака повышает вероятность целевого события на этот коэффициент, в данном случае — бизнес-метрики. Когда я построил такую модель, работая в Delivery Club, оказалось, что ключевым фактором, влияющим на удовлетворённость службой доставки, является то, опоздал ли курьер и насколько сильно. Топ-менеджмент был поражён глубиной анализа, спойлер - нет 😔
• Разрабатывают собственный text2sql: всё через LLM и RAG по структуре базы данных. Глобальная цель — передать туда до 5% запросов, смело, что это вынесено в Telegram-бота. Основной челлендж в том, что в компании используется не SQL, а YQL, а предобученные модели его не знают.
• Поиск «Нейро» всё-таки получит рекламу, пока эффекты в прокрашенных метриках DAU/MAU
• В США, несмотря на такое превосходство, на Amazon приходится только 40% рынка e-commerce, ещё 10% — на Shopify (сервис для создания интернет-магазинов). Так вот, Яндекс.Маркет тоже хочет построить аналог Shopify с бэкендом от Яндекс.Маркета.
• Зафиксировал попытки переманить на сторону падела с большого тенниса.

P.S. Чем отличается эта конференция от прошедших Датафестов? Здесь вместо пива наливают вино.
P.P.S. За то, что хорошо провёл время, ещё и умную ленту подарили — нравится . Все проходило в Императорском яхт-клуб, но на яхте не покатали, отметим как зону роста
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥64😁3
В Х пропушили библиотеку Memvid, у которой уже 5 тысяч ⭐️ на GitHub. Теперь вместо векторных баз данных предлагают хранить всё в видеофайлах, где каждый кадр — это QR-код. Правда, как справедливо заметили в комментариях, внутри всё равно крутится FAISS и те же векторные базы. Вот до чего доводит вайб-кодинг
😁103👍2