Forwarded from ML-легушька (Николай Кутузов)
Ну что же, я сдал технику и свой бейдж, подписал заявление на увольнение. Я больше официально не яндексоид. Давайте подведём итоги моих 15 месяцев работы в Яндексе.
Скажу большое спасибо людям, работавшим со мной, особенно Антону (моему лиду из геопоиска, ему особенно, он суперняшка и крутой) и Филиппу (моему ментору на время стажировки в такси), я очень много спамил их вопросами, спасибо за ответы и за синки в телеграме в 2 часа ночи.
Теперь о преимуществах работы:
1) Бенефиты - пушка. Можно почти не тратить деньги на еду, так как бейдж можно тратить на доставку продуктов в офис или в ближайших продуктовых (в спаре, если быть точным). Ну и командировка за счёт яндекса в СПб, просто собраться командой, тоже очень круто
2) Люди, с которыми вы работаете вместе, обычно очень мощные гигачады, и хорошие люди в целом.
3) Корпоративы это новый уровень. Я помню, как поражался корпорату в хуавее в серебряном бору, ну вот яндекс это на много голов выше. Как вы помните, там даже был робот, разносящий пиво.
5) То, что ты делаешь, влияет на продукты, которыми сам пользуешься. Я и до работы активно пользовался всем яндексовым, приятно было когда фиксишь что-то в картах и потом видишь, как стало лучше.
6) Хорошие зарплаты. Реально на уровне рынка, как мне кажется.
И о недостатках, в их случае идёт чисто мой субъективный опыт:
1) Деление ролей в продукте не по навыкам, а по зонам отвественности. С одной стороны, это логично, так как позволяет меньше обращаться к членам других команд. С другой же стороны, работая типо млщиком, у тебя прилетает ещё много тасок, связанных с какими-то минорными багами, зачастую не связанными с ML, при этом они могут забрать много времени на их решение.
2) Внутренние сервисы. Большая часть вещей, которые вы бы сделали на обычной работе, уже завернута и автоматизирована, соответственно вместо написания кода он почти всегда пишется в UI/с помощью проприетарных языков. С одной стороны, это огромный плюс, так как позволяет почти не думать про работу с большими данными, про то, как раскидать данные по шардам, и в целом о нужных ресурсах. С другой стороны, внутренние сервисы не всегда хорошо задокументированы, и новые знания зачастую получаются либо методом тыка, либо через извлечение знаний из сокомандников.
3) Развитие. Тут тоже пункт неоднозначный. С одной стороны, ты действительно узнаешь много новых подходов в ML, видишь как строить большие системы и сильно прокачиваешься с точки зрения system design. Также можно проходить внутренние курсы, и за счёт яндекса проходить платные образовательные курсы партнёров. За это большой респект. Но... Смотрим в пункт 2. В роли млщика, ты не трогаешь почти никакие технологии извне, соответственно, основную часть времени вы учитесь не применять какой-то новый технологический стэк, а учитесь применять проприетарные яндексовые сервисы, и с точки зрения стэка ваша прокачка очень маленькая. Вероятно, это проблема всего бигтеха, но, как мне показалось, именно яндекс страдает от этого больше всего.
Как итог: я совершенно не жалею, что работал здесь. Мой уход в основном мотивирован тем, что нужно закрывать физтех, что вместе с фултайм работой на втором курсе и сайд-активностями типо Сириуса и биотурнира сделать проблематично. Я советую вам, будучи млщиком, поработать в яндексе, если вы либо начинающий, так как у яндекса лучшие бенефиты среди других компаний и вы очень сильно забуститесь с точки зрения sd, либо если вы уже взрослый и полностью состоявшийся млщик, который хочет спокойно делать свою работу и получать за неё деньги. В целом, хоть раз советую поработать всем.
Все выводы сделаны на основании моего личного опыта и опыта моих знакомых, скорее всего, в других ML-подразделениях все иначе.
Всем добра и удачи в построении карьеры.
Скажу большое спасибо людям, работавшим со мной, особенно Антону (моему лиду из геопоиска, ему особенно, он суперняшка и крутой) и Филиппу (моему ментору на время стажировки в такси), я очень много спамил их вопросами, спасибо за ответы и за синки в телеграме в 2 часа ночи.
Теперь о преимуществах работы:
1) Бенефиты - пушка. Можно почти не тратить деньги на еду, так как бейдж можно тратить на доставку продуктов в офис или в ближайших продуктовых (в спаре, если быть точным). Ну и командировка за счёт яндекса в СПб, просто собраться командой, тоже очень круто
2) Люди, с которыми вы работаете вместе, обычно очень мощные гигачады, и хорошие люди в целом.
3) Корпоративы это новый уровень. Я помню, как поражался корпорату в хуавее в серебряном бору, ну вот яндекс это на много голов выше. Как вы помните, там даже был робот, разносящий пиво.
5) То, что ты делаешь, влияет на продукты, которыми сам пользуешься. Я и до работы активно пользовался всем яндексовым, приятно было когда фиксишь что-то в картах и потом видишь, как стало лучше.
6) Хорошие зарплаты. Реально на уровне рынка, как мне кажется.
И о недостатках, в их случае идёт чисто мой субъективный опыт:
1) Деление ролей в продукте не по навыкам, а по зонам отвественности. С одной стороны, это логично, так как позволяет меньше обращаться к членам других команд. С другой же стороны, работая типо млщиком, у тебя прилетает ещё много тасок, связанных с какими-то минорными багами, зачастую не связанными с ML, при этом они могут забрать много времени на их решение.
2) Внутренние сервисы. Большая часть вещей, которые вы бы сделали на обычной работе, уже завернута и автоматизирована, соответственно вместо написания кода он почти всегда пишется в UI/с помощью проприетарных языков. С одной стороны, это огромный плюс, так как позволяет почти не думать про работу с большими данными, про то, как раскидать данные по шардам, и в целом о нужных ресурсах. С другой стороны, внутренние сервисы не всегда хорошо задокументированы, и новые знания зачастую получаются либо методом тыка, либо через извлечение знаний из сокомандников.
3) Развитие. Тут тоже пункт неоднозначный. С одной стороны, ты действительно узнаешь много новых подходов в ML, видишь как строить большие системы и сильно прокачиваешься с точки зрения system design. Также можно проходить внутренние курсы, и за счёт яндекса проходить платные образовательные курсы партнёров. За это большой респект. Но... Смотрим в пункт 2. В роли млщика, ты не трогаешь почти никакие технологии извне, соответственно, основную часть времени вы учитесь не применять какой-то новый технологический стэк, а учитесь применять проприетарные яндексовые сервисы, и с точки зрения стэка ваша прокачка очень маленькая. Вероятно, это проблема всего бигтеха, но, как мне показалось, именно яндекс страдает от этого больше всего.
Как итог: я совершенно не жалею, что работал здесь. Мой уход в основном мотивирован тем, что нужно закрывать физтех, что вместе с фултайм работой на втором курсе и сайд-активностями типо Сириуса и биотурнира сделать проблематично. Я советую вам, будучи млщиком, поработать в яндексе, если вы либо начинающий, так как у яндекса лучшие бенефиты среди других компаний и вы очень сильно забуститесь с точки зрения sd, либо если вы уже взрослый и полностью состоявшийся млщик, который хочет спокойно делать свою работу и получать за неё деньги. В целом, хоть раз советую поработать всем.
Все выводы сделаны на основании моего личного опыта и опыта моих знакомых, скорее всего, в других ML-подразделениях все иначе.
Всем добра и удачи в построении карьеры.
👍2
Forwarded from Reliable ML
Опубликован новый пример дизайна ML системы по шаблону Reliable ML
Пополняем базу примеров хороших дизайн-документов
Сегодня добавили новый пример дизайн-документа - проект от Симулятора ML. Даниил Картушов и команда представляют pet project по разработке чат-бота для поиска ответов на разные запросы в телеграм-каналах.
Опубликованный дизайн-док - пример хорошо проработанного и не перегруженного лишней информацией документа. Для более глубокого погружения в потребности пользователей в части про бизнес-требования команда проекта добавила User Story Map и Customer Journey Map. Это, кстати, может стать отличным дополнением к шаблону дизайн-документов.
Огромное спасибо авторам документа за вклад в развитие ML-дизайна.
Шаблон дизайн-документа ML-систем от Reliable ML
Материалы по работе с дизайн-доком
Как написать док вместе с Reliable ML
Stay tuned!
Ваш @Reliable ML
#business #tech #ml_system_design
Пополняем базу примеров хороших дизайн-документов
Сегодня добавили новый пример дизайн-документа - проект от Симулятора ML. Даниил Картушов и команда представляют pet project по разработке чат-бота для поиска ответов на разные запросы в телеграм-каналах.
Опубликованный дизайн-док - пример хорошо проработанного и не перегруженного лишней информацией документа. Для более глубокого погружения в потребности пользователей в части про бизнес-требования команда проекта добавила User Story Map и Customer Journey Map. Это, кстати, может стать отличным дополнением к шаблону дизайн-документов.
Огромное спасибо авторам документа за вклад в развитие ML-дизайна.
Шаблон дизайн-документа ML-систем от Reliable ML
Материалы по работе с дизайн-доком
Как написать док вместе с Reliable ML
Stay tuned!
Ваш @Reliable ML
#business #tech #ml_system_design
Forwarded from Dan Okhlopkov - канал
Набор дата сайнтиста в стартапе по-британски
1. Firestore - NoSQL бд, чтобы хранить целиком жсоны и строить дата пайплайны поверх onCreate/onUpdate
2. Typescript - какая разница, на каком языке прогать? А тут зато js команда поймет, что ты делаешь
3. Firebase Cloud Functions - ETL весьма может быть и на серверлесс
4. ChatGPT, Gemini, Claude - вместо тысячи NLP, NER и парсеров
5. Crunchbase, Pitchbook, Apollo - базы с ~Series A стартапами
6. Cursor.sh + claude - самый мощный копайлот тудэй
Другие наборы из серии:
- дамская сумочка стартаперши
- мобильный сайд-хаслер
1. Firestore - NoSQL бд, чтобы хранить целиком жсоны и строить дата пайплайны поверх onCreate/onUpdate
2. Typescript - какая разница, на каком языке прогать? А тут зато js команда поймет, что ты делаешь
3. Firebase Cloud Functions - ETL весьма может быть и на серверлесс
4. ChatGPT, Gemini, Claude - вместо тысячи NLP, NER и парсеров
5. Crunchbase, Pitchbook, Apollo - базы с ~Series A стартапами
6. Cursor.sh + claude - самый мощный копайлот тудэй
Другие наборы из серии:
- дамская сумочка стартаперши
- мобильный сайд-хаслер
This media is not supported in your browser
VIEW IN TELEGRAM
Корейцы из soy.lab жгут, конечно.
Пора пересаживаться в ComfyUI
Пора пересаживаться в ComfyUI
🔥3❤1
1) Берем такой датасет https://github.com/AceLewis/my_first_calculator.py/blob/master/my_first_calculator.py#L20822
2) Обучаем
3) Получаем готовый калькулятор
2) Обучаем
3) Получаем готовый калькулятор
GitHub
my_first_calculator.py/my_first_calculator.py at master · AceLewis/my_first_calculator.py
my_first_calculator.py. Contribute to AceLewis/my_first_calculator.py development by creating an account on GitHub.
Запустил Ламу в фоне на компьютере и забыл. Теперь делаю alt-tab, когда нужно проверить или сократить любой текст, задать вопрос, помочь в формулировке, сделать выжимку.
По качеству выше чем бесплатные версии Claude, Gemini, GPT.
Бесплатно, работает локально на любой пароварке, требует 4.5GB памяти, не нужен интернет и никуда не отправляет ваши данные.
Установка занимает 2 минуты, не нужно даже консоль открывать: https://lmstudio.ai
По качеству выше чем бесплатные версии Claude, Gemini, GPT.
Бесплатно, работает локально на любой пароварке, требует 4.5GB памяти, не нужен интернет и никуда не отправляет ваши данные.
Установка занимает 2 минуты, не нужно даже консоль открывать: https://lmstudio.ai
🔥7👍2 1
Возникла идея запарсить сообщения телеграм чатов у районов/домов/микрорайонов, насколько оно полезно?
👍2😁2
Moderna, крупная фарма компания, утверждает что 100% их лигал команды плотно сидит на GPT, они разработали 400+ внутренних GPTs для автоматизации работы, используют для обработки данных для дозирования лекарств. Понятно, что этот ролик скорее рекламный ролик OpenAI.
YouTube
Moderna partners with OpenAI to accelerate the development of life-saving treatments
Moderna deployed ChatGPT Enterprise to thousands of employees, seeing remarkable adoption across the company. They’ve created hundreds of custom versions of ChatGPT, including a pilot Dose ID GPT that uses the advanced data analysis feature to further evaluate…
Media is too big
VIEW IN TELEGRAM
Стартап из Индии Swaayatt Robots делает беспилотник для местных дорог.
Им приходится работать с коровами на дорогах, машинами на встречке, мотороллерами и тук-туками, которые пытаются попасть под колёса, полным отсутствием разметки и знаков (да и дорог тоже).
Это вам не по идеальным улицам Калифорнии тестировать беспилотник.
Им приходится работать с коровами на дорогах, машинами на встречке, мотороллерами и тук-туками, которые пытаются попасть под колёса, полным отсутствием разметки и знаков (да и дорог тоже).
Это вам не по идеальным улицам Калифорнии тестировать беспилотник.
🔥4😁1
Наушники с возможностью съема данных электрической активности мозга (ЭЭГ)
https://neiry.ru/
Берем, отслеживаем во время решения задачек с leetcode и замеряем стату
https://neiry.ru/
Берем, отслеживаем во время решения задачек с leetcode и замеряем стату
👍1👏1
Увидел какой-то монстр-смартфон Unihertz Tank 3 pro
Нравятся подобные
В телефоне:
- 23 800 миллиАмпер
- 18 Гб ОЗУ
- 512 Гб памяти
- Мега-яркий фонарик
- Проектор, 100 люмен, 120 Гц
- экран 120 Гц
- ещё куча всего, лень писать
обзорчик тык
Нравятся подобные
В телефоне:
- 23 800 миллиАмпер
- 18 Гб ОЗУ
- 512 Гб памяти
- Мега-яркий фонарик
- Проектор, 100 люмен, 120 Гц
- экран 120 Гц
- ещё куча всего, лень писать
обзорчик тык
🔥4
Начал писать аналог этой библиотеки, под капотом которой будет FastAPI
GitHub
GitHub - coleifer/sqlite-web: Web-based SQLite database browser written in Python
Web-based SQLite database browser written in Python - coleifer/sqlite-web
🔥5
В России впервые оштрафовали за воровство идеи для рилса. Блогер по теме недвижимости пожаловался в суд на риелтора, который нагло украл его идею для видео.
Суд принял решение оштрафовать плагиатора на 300 тысяч рублей.
Теперь нужно будет придумывать свои идеи самостоятельно
https://kad.arbitr.ru/Card/253a8f3a-7178-4c76-8541-20b1980b3017
Суд принял решение оштрафовать плагиатора на 300 тысяч рублей.
Теперь нужно будет придумывать свои идеи самостоятельно
https://kad.arbitr.ru/Card/253a8f3a-7178-4c76-8541-20b1980b3017
Daniilak — Канал
Сделал для Чебоксар канал, который мониторит публичные обращения и ответы в приложении «Решаем вместе» от Госуслуг https://yangx.top/cheb_problems В целом, можно расширить на всю страну, учитывая что я уже публиковал небольшой датасет t.me/opendatarussiachat1/35032…
Практически 6 тысяч публичных обращений опубликовано
https://yangx.top/cheb_problems
Статистика обращений с января по март тут начиная с этого сообщения
https://yangx.top/cheb_problems
Статистика обращений с января по март тут начиная с этого сообщения
Telegram
Обращения Чувашия
Отслеживаем публичные обращения в Решаем вместе
🔥2