Data Science Jobs
17K subscribers
44 photos
3 videos
1 file
674 links
Лучшие вакансии по темам Data Science, машинного обучения, нейросетей, искусственного интеллекта, компьютерного зрения, сбора, обработки и анализа данных.

🗄Мы в реестре каналов: https://vk.cc/cEZ5Ff

По всем вопросам: @musit
Чат: @bigdata_ru
加入频道
#вакансия

Вакансия: NLP Data Scientist (Middle+, Senior, Team Lead)
Компания: Газпромбанк
Вилка: 130-300 net
Опыт: от 2 лет
Формат работы: Удаленный

О компании:
Центр Технологий Искусственного Интеллекта - это подразделение Газпромбанка для разработки и внедрения AI решений. Сильная команда профессионалов: ТОП-100 Kaggle, выпускники МФТИ, МГУ, ВШЭ, Бауманки, ШАД и др.

Наш идеальный кандидат:
— Имеет опыт в fintech на аналогичной позиции от 2 лет

Задачи:
— Работа с текстовыми данными - обращения клиентов, отзывы, чаты (NLTK, genism, TF-IDF, word2vec, Bert, etc)
— Применение алгоритмов иерархической классификации к обращениям
— Сентимент анализ, распознавание сущностей (NER) и суммаризация клиентских обращений, поиск наилучшего ответа оператора
— Анализ различных источников, разведочный анализ данных (EDA), генерация признаков для построения модели
— Разработка и внедрение моделей машинного обучения в прод
— Проверка гипотез, проведение A/B тестирования
— Рисерч новых технологий

Требования:
— Middle+/Senior/Team Lead, опыт в NLP от 2 лет
— Практический опыт полного цикла решения ML задачи: предобработка данных, выбор алгоритмов и тюнинг их параметров, оценка качества моделей, визуализация
— Уверенное знание Python, SQL
— Опыт работы с фреймворками PyTorch / TensorFlow / Keras
— Опыт работы с Linux, bash, git

Условия работы в ГПБ:
— удаленная работа в крупнейшем банке России
— 33 дня отпуска в год
— достойная зп
— возможности для обучения
— ДМС
— льготные условия кредитования

Если вы увлечены наукой о данных и хотите работать над интересными проектами с командой профессионалов, мы ждем вас😊

Писать: @valiullin
Company: ZERO
Level: Senior/Staff
NLP Engineer
Salary range: 5-8k$ net
City: Armenia, Erevan
or Remote
HR contact:
@seda_hakobyan

We are looking for a skilled and highly driven NLP Engineer with expertise in Large Language Models (LLMs) to join our team. The perfect candidate will possess a hackathon mindset, capable of swiftly solving tasks and effectively combining existing technologies to address problems. Your role will involve developing and incorporating LLM-based solutions into our business products (focused on the legal and financial sectors), covering a range of scenarios from question-answering to creating LLM agents.

Responsibilities:
- Design, build, and deploy LLM-based solutions for diverse applications, including question-answering systems, search engines, content generation, and task-solving agents
- Research and stay current with the latest advancements in NLP and LLM technologies, frameworks, and libraries
- Collaborate with cross-functional teams to establish product requirements, deliver top-quality solutions, and ensure seamless integration with existing systems
- Optimize and fine-tune LLM models for enhanced performance, efficiency, and accuracy
- Create and maintain documentation for implemented solutions and share knowledge with the team
- Troubleshoot and resolve issues related to LLM usage in production scenarios, ensuring high reliability and performance.


Qualifications and Skill Set:
- Solid experience working with LLMs, such as GPT3/ Llama/ T5/ BERT, and NLP frameworks, like Hugging Face Transformers, PyTorch /JAX
- Experience with LLMOps: Auto-GPT, Langchain, LlamaIndex, VectorDBs
- Demonstrated programming skills in Python3, using efficient algorithms and software design patterns.
- Familiarity with best practices in software development, including version control, testing, and continuous integration
- Excellent communication and teamwork abilities, with the capacity to work effectively in a dynamic, cross-functional setting
- Exceptional problem-solving, analytical, and critical thinking skills, with the ability to adapt to new challenges and technologies.


It would be cool if you have:
- Experience with cloud platforms, such as AWS, Azure, or Google Cloud
- Experience in commercializing ChatGPT or GPT3/4 for business applications
- Be a promt engineering guru - know how to solve a problem using 101 different promts
- Technical PR (victories in competitions/hackathons, open LLM/NLP projects on GitHub)
- Participation in early-stage startups, involvement in accelerators, or working in their own startup

Our benefits:
- Medical insurance with Dental Services
- Wellness Package (GYM, sports equipment, etc)
- English classes and other learning activities (conference etc)
- Help with relocation and an apartment for the first time
#вакансия #удаленка #аналитик #работа #СистемныйАналитик


Всем привет) Мы в поиске Senior Системного аналитика

Формат работы:
удаленный
Страна: РФ
Занятость:
полная
Зарплатная вилка: 200к net
Компания: Vsemirsoft
Формат: Аутстаффинг

Требования:
- Опыт работы с базами данных в качестве аналитика от трех лет;
- Опыт работы с системами класса MDM;
- Опыт участия в проектах по созданию и разБ*гтик> DWH;
- Понимание принципов разработки с помошью ETL инструментария;
-Опыт написания технических заданий на разработку ETL-инструментов;
- Понимание прехмегной области Телеком;
- Понимание нюансов работы платформ Tcradata. Hadoop. Oracle. Spark. Jira. Confluence

Задачи:
- AdHoc задачи по построению отчетности;
- Формирование мэплингов для загрузки новых источников;
- Анализ требований заказчиков и проработка решений с учетом текущей архитектуры;
- Разработка ТЗ для вендора на доработку системы;
- Постановка задач на аналитиков по Ad-hoc и выборкам данных;
- Подготовка ТЗ на построение DWH-внтрин по продуктовым агрегатам;
- Участие в разработке архитектуры продукта;
- Постановка задач на разработчиков на доработку систем;
- Разработка документации на confluence.

Буду рада ответить на твои вопросы: @valentinaTrecruiter
Компания: Nutson
Уровень: Middle/Senior Software Engineer (anti-fraud)
Вилка: net 250-300к (middle), 300-450к+ (senior)
Город: Москва, возможна удаленная работа

Кто мы: Наш основной продукт - Cheelee (https://cheelee.io/) - это платформа коротких видео с механикой Watch2Earn, которая платит всем пользователям за просмотр ленты. Более 500 инфлюенсеров (50+ звезд интернета и ТВ) и внутренний продюсерский центр участвуют в постоянном создании эксклюзивного контента. Компания основана в 2019 году, зарегистрирована в США. Размер компании - около 200 сотрудников, треть - отдел разработки (10+ команд).

Требования
- Самостоятельнось и умение работать без ТЗ;
- Уверенное знание python (3.9+) и опыт с asyncio;
- Глубокие знания в области system design;
- Опыт работы с Redis;
- Понимание классических алгоритмов и структур данных;
- Опыт работы с базами данных (запросы, миграции, оптимизация, профилирование);
- 4+ лет опыта разработки стабильных и масштабируемых веб-сервисов и API (REST, JSON-RPC, gRPC);

Желательно
- Опыт работы с высоконагруженными системами;
- Опыт работы с ClickHouse;
- Умение визуализировать данные большим количеством способов;
- Опыт поиска аномалий и подозрительных закономерностей в данных;
- Опыт разработки антифрод систем. Если никогда не работали -- научим;

Задачи
Разработка системы антифрода.
Нужно будет разрабатывать инфраструктуру проверок и алгоритмов, чтобы находить единичные нарушения и мошеннические фермы. Система должна быть отказоустойчива, с высокой пропускной способностью, масштабируема.
Поиск аномалий в данных. Нужно будет анализировать пользовательское поведение, находить аномальные паттерны, автоматизировать их идентификацию. Все данные о пользовательском поведении попадают в кафку и храним в ClickHouse. Надо будет смотреть на данные в ClickHouse, находить подозрительные закономерности, реализовывать в виде реал-тайм процессинга.
Разработка системы мониторинга и алертинга. Нужно разрабатывать систему мониторинга и алертинга по сработанным мошенническим действиям.

Условия
- GPU/CPU сервера в облаке;
- Топовое оборудование и весь необходимый софт;
- Офис в шаговой доступности от метро Добрынинская / Серпуховская;
- Возможность удаленной работы;
- Возможность получения опциона;
- Гибкий график.

Команда
Mы - команда R&D, которая занимается всем что связано с данными и машинным обучением. Нас в команде 6 человек и среди нас: Data Analysts, ML Engineers и Software Engineers - кросс-функциональная команда про данные, ML и инженерку.
Мы отвечаем за полный цикл своих разработок. Т.е. сами строим модели, заворачиваем в сервисы и выкатываем в прод. Сами мониторим. Сами несем ответственность за отказоустойчивость.
Наша команда занимается следующими задачами: рекомендательная система, автомодерация контента, антифрод, продуктовая и маркетинговая аналитика.
Стремимся вырастить всех внутри команды full-stack.
У нашей команды нет проджект менеджера или системного аналитика, кто писал бы нам ТЗ. Мы сами понимаем приоритеты бизнеса, синхронизируемся с бизнесом. Сами формулируем задачи, декомпозируем их и распределяем внутри команды. Зачастую сами приходим к бизнесу с новыми решениями и идеями.

Технологии
Пишем сервисы на python (FastAPI, Faust), go и C++.
Все крутится в AWS. Легкие сервисы разворачиваем в k8s-кластере, ML сервисы в AWS Sagemaker. Раскатываем через Gitlab CI. В питоне активно используем mypy, pylint, flake, isort, bandit - без прохождения линтеров пайплайн не пропустит merge request.
Пользовательские события отправляются сервисами на бэкенде в kafka. Для аналитики из кафки мы собираем все в ClickHouse используя движок kafka в самом CH. Любое изменение схемы в БД версионируем через миграции. В антифроде события из кафки вычитываем, аггрегируем и складываем в Redis. Для распределенных транзакций используем паттерн saga.
Мониторинг с помощью: prometheus, grafana, sentry, kibana.

Контакты:
Алтухов Илья, Head of R&D @ Cheelee
https://yangx.top/ilyaaltukhov
#вакансия #vacancy #ML #pytorch #python #релокация #rибрид #relocate #fulltime #Gym #tenserflow #Грузия #Тбилиси #DS

🚀 Компания: the_covert
🔎 Вакансия: Machine Learning Engineer
🌍 Локация: Тбилиси
🚧 Тип занятости: full-time
Формат: Remote/офис/гибрид
💵 Зп вилка: 2000- 5000 $ (по итогам собеседования)

🗣Сейчас мы находимся в поиске опытного Machine Learning engineer, чтобы усилить команду машинного обучения.

💫Мы – международная группа IT-компаний. С 2006 года создаём собственные продукты, которые востебованы пользователями во всём мире. Наш продукт – это финтех платформа, предлагающая доступ к многофункциональной экосистеме для работы с финансами. Мы работаем с клиентами по всему миру, а общая аудитория насчитывает более 100 млн пользователей.

❗️Стек: Pytorch+Pytroch-Lighting, Gym, ClearML, ETL Airflow, Docker, Crontab, Jira+Confluence, Slack.


💰Что предлагаем:
– ЗП в в долларах без привязки к курсу рубля;
– Возможность релокации, помогаем с переездом;
– Забота о здоровье сотрудников - медицинская страховка после прохождения ИС;
– Компенсация спорта;
– Индивидуальный подход к области ответственности и пулу задач.

Что предстоит делать:
– Работать над организацией бесшовной генерацией конфигов для работы с данными;
– Рефакторинг кода;
– Автоматизация рутинных процессов;
– Проводить эксперименты с моделью;
– Организация, настройка и сопровождение процессов ETL\ELT.

⚠️Ожидаем от вас:
– Опыт работы с пайплайнами ML/DL;
– Опыт программирования на Python 3.7+;
– Опыт работы с одной или несколькими средами deep learning, такими как Tensorflow/Keras или PyTorch.

Будет плюсом:
– Опыт программирования на C++;
– Участие в олимпиадах/хакатонах по data science.


✉️Контакты:
Даниил, @danpushkin
Improvado (https://improvado.io/) — быстрорастущий SaaS-стартап из США, который строит высокотехнологичный продукт в сфере данных и маркетинга (https://www.forbes.ru/svoi-biznes/465359-startap-programmista-iz-tomska-privlek-22-mln-ot-amerikanskoj-investkompanii).

Позиция: Head of R&D / Senior ML Engineer

Стек: Python, PyTorch, TensorFlow

Вилка: ~ $6000-12500 USD gross

Что делать?
Сейчас мы запустили новый продукт — text2sql. Первая версия работает. Ищем сильных инженеров для развития продукта.

Что мы ждем от соискателей:
- Настройка тестирования продуктов ML;
- Опыт и понимание моделей LLM. Большим плюсом будет релевантный математический опыт;
- Уверенное знание Python, анализа данных и ML-фреймворков (PyTorch, TensorFlow);
- Сложный график. Готовность на компромиссы по графику с распределенной командой от Алматы, Киева, Лондона и Барселоны до Буэнос Айроса, Нью Йорка и Сан Франциско;
- Разговорный английский.

Мы предлагаем:
- Возможность работать удаленно или в нашем офисе в Алматы;
- Конкурентоспособную заработную плату в долларах США;
- Стартап с Product / Market Fit;
- Вариант получить акции компании.

Процесс интервью: Короткий квиз (15 мин) -> Мини-форма о себе -> Домашнее задание (до 6 ч)* -> Тех. интервью -> Финал с CEO

*Подробнее про домашнее задание
Нужно будет сделать прототип text2sql. На входе мы дадим ссылки на нужные фреймворки, которые помогают это сделать быстро. Но вы можете собрать и другое решение.

Откликнуться: @tychkov_max
#вакансия #ML #удаленка #DS #MachineLearning
В нашу дружную команду мы приглашаем ML engineer Computer vizion 🔥

Вакансия: ML инженер (middle/senior)
Компания: «Наносемантика» — ведущий разработчик технологий искусственного интеллекта https://nanosemantics.ai/

Формат работы: удалённо
Полная занятость
Условия: вилка 140-200 net;
Работа в аккредитованной IT компании;
Оформление по ТК РФ с первого рабочего дня + ДМС для сотрудников (включая бизнес стоматологию).

Чем предстоит заниматься:
✔️Работать с задачами image captioning, детекции объектов, классификации сцен, распознаванию персон и локаций, теггированию фото и видео и редуцированию объектов до wikidata;
✔️Изучение статей и реализация архитектур моделей, функций потерь, оптимизаторов по статьям;
✔️Построение и отладка пайплайнов предобработки данных, обучения и инференса моделей;
✔️Обучение и скоринг моделей;
✔️Сборка сервисов, использующих модели.

Наши ожидания:
✔️Опыт работы 2–3 года в области компьютерного зрения;
✔️Уверенное владение Python 3;
✔️Продвинутый пользователь Linux;
✔️Опыт работы с Git;
✔️Опыт работы по крайней мере с одной из нейросетевых библиотек глубокого обучения: PyTorch, TensorFlow/Keras;
✔️Опыт квантизации моделей;
✔️Хорошее представление о задачах компьютерного зрения, в частности, о детекции объектов, классификации изображений, трекинге, распознавании лиц, сегментации изображений;
✔️Опыт работы с функционалом библиотеки OpenCV (не только для чтения и записи изображений);

🚀Будет плюсом хорошее представление и опыт обучения хотя бы части различных нейросетевых архитектурах для решения задач компьютерного зрения: (Detectron2, YOLOv…, RetinaNet, SSD, R-CNN, Faster R-CNN, MobileNet (v2), SqueezeNet, EfficientNet, U-Net, U2Net, Mask R-CNN, FastFCN, ResNet-50 (-18, -100), InceptionV3, VGG19 (16), AlexNet, DarkNet-53, …);
Бонусом будет опыт работы с мультимодальными сетями (CLIP и другие).


Контакты для связи: @ViktoriaNano
Мы - bidease.com - международный DSP/SSP на рынке мобильной (in-app) рекламы с клиентами по всему миру с 2017 года.
Главный офис - США (Нью-Йорк), филиалы - Дубай, Пекин, Южная Корея, Россия.
Мы ищем Senior Machine Learning Engineer.
Зарплата: $11,000 - $15,000 USD/месяц + акции, полный удаленный формат работы, возможность переезда в США в дальнейшем.

Обязанности:
Разработка моделей, предсказывающих вероятности событий и размеры ставок для рекламных аукционов в реальном времени.
Изучение и анализ данных. Предложение новых способов их использования, извлечение ценности из имеющихся и создание новых признаков.
Оценка работы моделей в продакшене и оптимизация с учетом нагрузки и результатов.
Разработка необходимых инструментов и виджетов (используя streamlit) для представления результатов работы моделей и анализа данных.
Оптимизация управления рекламными кампаниями с использованием RL.

Наша инфраструктура и данные:
Обучение с использованием CatBoost (+эмбеддинги из других инструментов/моделей, таких как BERT для текстов и CLIP для изображений) + SQL + Python.
Основное хранилище данных - ClickHouse (более 45 трлн. событий для 6 млрд. объектов в год) с быстрым доступом к данным для обучения. Сейчас уже более 4 петабайт данных.
Продакшн и инференс на Go + Aerospike.
Исследования и разработка на Python.
RPS 3,5 млн.

Минимальные требования/навыки:
Базовые навыки работы в Linux-среде (консоль, Docker, SSH, Git и т.д.) - чтобы не возникало вопросов о доступе к серверу и просмотре логов Docker при необходимости.
Знание методов бустинга.
Уверенное владение Python и стандартным набором инструментов для ML (pandas, numpy, sklearn, pytorch, huggingface, fastapi и т.д.).
Базовые навыки работы с SQL (+готовность улучшить их, так как это основной способ извлечения данных из ClickHouse).
Английский язык на уровне, достаточном для письменного (иногда устного) общения с коллегами, не владеющими русским языком.

Преимущества:
Опыт работы с ClickHouse (словари, функции массивов, оконные функции, разделение данных и т.д.) и понимание причин, почему нельзя делать SELECT * LIMIT 10 на продакшене.
Работа с объемными данными в петабайтах, понимание методов работы с таким объемом данных.
Опыт в распределенных вычислениях данных, map-reduce и прочих подобных методах, а также наличие опыта исправления ошибок.
Опыт работы с OpenRTB и перформанс-биддингом.
Широкое и глубокое понимание принципов работы ML, практический опыт в различных областях - CV, NLP, Tabular, RL - хотя в нашей модельной воронке используются бустинги, мы имеем данные всех типов, и желательно уметь их трансформировать одновременно.

Что мы предлагаем:
Работа в небольшой команде в компании, которая является операционно прибыльной и входит в топ-500 самых быстрорастущих компаний в США по данным ft.com, а также в топ-300 самых инновационных компаний.
Возможность получения вида на жительство в Дубае с нулевым налогом и банковским счетом сразу после трудоустройства.
Помощь с организацией переезда в США при выдающихся результатах.
Необходимое рабочее оборудование (MacBook, Lenovo и все, что вам нужно) и сервера (в течение 1-3 дней).
Готовность быстро тестировать ваши идеи в продакшене.

СV слать: @sgl30 @seva273 @ilia_vo
Ищем в команду Agenda Media AI Developer (DeepFake).
Готовы рассмотреть кандидатов от уровня Junior, но обязательно с опытом в Deepfake

Ты будешь:
Участвовать в процессе создания deepfake-контента на качественном уровне:
- быстро и качественно использовать и создавать RTM и RTT модели
- с нуля создавать модели для DFLive
- участвовать вместе с командой в поиске и использовании новых технологий (например, генерация голоса персонажа, создание качественных моделей в условиях ограниченного фейссета и т.д.)

Что мы можем предложить:
- работу full-time по договору оказания услуг или ТК РФ;
- возможность работать из любой точки мира;
- в твоем портфолио появятся очень известные клиенты и проекты;

уровень заработной платы до 200.000 net

По всем вопросам, а также для отправки резюме и cv пишите: @MayskayaKS
#вакансия #дистанционная #системныйаналитик

АО «ГНИВЦ» заработная плата (по итогам собеседования) 250 000- 350 000 рублей. ❗️Требуются системные аналитики на интеграционные проекты по импортозамещению БД Oracle для разрабатываемых общесистемных компонентов. Возможно работа на одном проекте или сразу на нескольких, в зависимости от возможностей.

1) Проект: Менеджер потоков данных
входит в состав интеграционного слоя платформы и предназначен для организации и автоматизации доставки данных между подсистемами, т.е. общесистемный ETL-инструмент. Система будет работать с сотнями витрин и таблиц, несколько сотен ТБ данных.

Типовые сценарии
• Копирование снимка данных, где не требуется трансформация данных
• Инкрементальная репликация данных через отслеживание изменения данных (CDC - Change Data Capture)
• Периодический сбор данных через веб сервис и запись данных в базу данных или файл
• Разовое или регулярное чтение файла на сетевом диске и запись данных в таблицы БД с возможностью контроля
• Интеграция с типовыми решениями, где задействована шина данных

2) Проект: Шина данных
Корпоративная Шина данных предназначена для асинхронного взаимодействия и обмена данными между десятками системам. Сейчас идет активная разработка, на базе Apache Kafka. Шина данных планируется использоваться при переходе на микросервисную архитектуру. Планируется обмен сообщениями в несколько десятков тысяч сообщений в секунду.

Основные задачи:
• Взаимодействие с продуктовыми командами
• Анализ требований и сценариев
• Формирование и апробация решений
• Оценка применимости шаблонного решения или требуется разработка индивидуального инструмента
• Документирование (Confluence, ОПЗ)
• Формирование задач разработчикам
• Проведение презентаций для продуктовых команд
• Наставничество.

Контакт:
@NatalyaMaki
#developer #вакансия #удаленка #работа #ML #deepfake #remote #dataengineer #datascience #ComputerVision

📍Вакансия - Data engineer (Middle/middle+)

Merlin Clone (https://merlinclone.com/#algoritm) - IT стартап в области ML. Это уникальный искусственный интеллект, позволяющий автоматически озвучивать и переводить видео на английский язык (китайский, хинди и многие другие) с любого языка мира, сохраняя индивидуальный голос, тембр, мимику. Теперь каждый может говорить как носитель языка.

✔️Компания: Merlin Clone

Формат работы: удаленно, из любой точки мира, в удобном графике
Работа: полная занятость
Вилка : от 200 000 - 330 000 gross
Локация: любая

📌Обязанности:
- Работать с данными разной модальности - табличными, графовыми, текстовыми, аудио, изображениями и видео;
- Самостоятельно формулировать гипотезы и проверять их, конструировать фичи, подготавливать датасеты для дальнейшего использования в ML.

📌Необходимые навыки:
- опыт работы дата-инженером от 4-х лет;
- опыт работы c Hadoop, Hive, Spark;
- хорошее знание python;
- отличное знание SQL;
- понимание и интерес к области больших данных;
- понимание и интерес к data science решениям и ML;
- желателен опыт работы с NiFi и Airflow;
- умение работать в команде над большим техническим проектом (GitHub, Docker, etc.);
- умение быстро изучать новые технологии и решать сложные задачи.


📌Как преимущество:
-опыт в развертывании и сопровождении инфраструктуры;
- понимание и опыт применения основных методов машинного обучения и знание принципов статистического анализа;
- понимание жизненного цикла и опыт продукционализации ML моделей;
- опыт Devops (Docker, Gitlab-CI, настройка окружения на серверах и др.);
- опыт разработки сервисов (Flask, Django, Asyncio и др.);
- опыт проектирования высоконагруженных приложений и/или приложений работы с большими данными;
-опыт разворачивания, настройки мониторинга и передача на поддержку разработанных решений;
-Pytest/Unitest;
-опыт работы с такими базами данных как PostgresQL, Greenplum, Clickhouse.


📌Что мы предлагаем:
- Полностью удаленный формат работы, в любом часовом поясе, из любой точки мира;
- Возможность выплат в криптовалюте (по вашему желанию);
- Возможность быть у истоков быстрорастущей, перспективной IT компании;
- Комфортные условия работы, не токсичная команда;
- Применение лучших практик и современный стек технологий, получение опыта в передовых направлениях ML и CV.

📲 Если вакансия вас заинтересовала пишите в личные сообщения @Nadezhda120288
#удаленка #backend #python

Привет. Я владелец продукта в компании Гринатом (компания входит в Росатом) и мне в отдел очень нужны Backend-middle/senior'ы. В данный момент мы разрабатываем собственное OCR-решение, направленное на автоматизацию документопотока как внутри всего Росатома, так и для внешних клиентов. Решение разрабатывается под серьезную нагрузку (до 40 тысяч документов в час) и под разные цели, начиная от распознавания паспортов и заканчивая сложными, неструктурированными документами. В центре продукта лежит собственная сетка по распознаванию, которая уже делает на 70% меньше ошибок, чем Tesseract V5.

🧠 Обязанности:
• Разработка системы OCR с использованием open source решений (backend);
• Написание высоконагруженных приложений и микросервисов на Python;
• Участие в разработке уже имеющихся приложений в составе команды Data Science;
• Взаимодействие с аналитиками, DataScience-специалистами;
• Участие в принятии архитектурных решений по проекту;
• Поддержка и развитие созданных решений;
• Написание unit-тестов на pytest.
🧠 Требования:
• Опыт разработки серверных приложений – от 2-х лет;
• Уверенное знание Python 3+, SQL;
• Знание фреймворков FastAPI/Flask;
• Знание базовых алгоритмов и структур данных;
• Опыт разработки нагруженных отказоустойчивых систем;
• Умение работать с серверной инфраструктурой: Nginx, Docker и т.п.
• Опыт работы с базами данных: PostgreSQL, MongoDB, Redis;
• Опыт работы с RabbitMQ;
• Опыт работы с объектным хранилищем: s3, Minio;
• Опыт работы с GIT, знание CI/CD;
• Опыт работы с Linux.
🧠 Будет большим плюсом:
• Опыт работы с OCR системами;
• Опыт интеграционных и системных тестов;
• Опыт работы с высоконагруженными системами
🧠 Будет плюсом:
• Понимание микросервисной архитектуры;
• Знание методологии Scrum;
• Опыт работы с Open Project;
• Опыт тестирования клиент-серверных запросов;
• Опыт наставничества и codereview.

✍️Да, мы «госуха», но у нас нет проблем ни с выездом заграницу, ни с оплатой труда. Работаем полностью удаленно, поэтому в офис можешь не ходить или работать хоть из тайги. Есть классный ДМС и разные отсрочки.

✍️В отделе уже более 50 человек: бэки, фронты, ds, аналитики, разметчики, дизайнеры и много кто еще. С большими проектами работаем по скраму. С малыми в более упрощенном режиме.

💵Оклад: 150-350 на руки + до 1 млн. рублей годовой бонус

Писать: @MoveSlowAttackFaster или [email protected]
Mad Devs company is looking for a machine learning engineer of middle level for one of our b2b projects - an actively developing product with a broad user base. Our team solves core business problems using Deep Learning and non-template ML.

At the moment we are focusing on 3 projects.

The first one is the development of recommendation system based on unstructured data sources: data about user and website interactions, data and purchases of different products provided by b2b platform. Currently we have terabytes of historical data and the amount is constantly growing.

The second one is an intelligent chat-bot which interacts with different data sources of the platform and provides the most relevant answers to user queries helping to promote the business products of the site.

The third is a content generation system. In this area we are dedicated to saving human resources on preparing content for publication. The goal of our team is to enhance all current platform baselines with new data sources and approaches, as well as to reduce the time2market of the developed models. The quality metrics of our AI services are directly converted into platform profits, so we have deep integration with the business.

What you will need to do:
- Build and implement machine learning algorithms
- Developing and implementing machine learning models in production
- Comparing multiple approaches to solve a business problem
- Participating in communications with customers to identify business problems and opportunities to solve them using machine learning tools
- Development of algorithms for recommendation systems

What kind of experience we are expecting:
- Mathematical background
- Knowledge of basic ML algorithms and metrics
- Experience in developing recommendation systems
- Experience working towards NLP
- Understanding of CI/CD processes
- Ability to work according to business requirements
- Ability to meet deadlines and multi-task
- Experience in bringing ML models to production and evaluating the business impact of implementation

Will be a plus:
- Experience with classic ML and DL (training projects/competitions)
- Experience working with chatbots, voice bots/assistants
- Experience with Code Review

Technological stack:
- Python, Django
- SQL, PostgreSQL
- Pandas
- Sklearn
- Pytorch, Transformers
- Git, BitBucket, CI / CD, conflict resolution
- Docker

Please write @EkaterinaBludova for the details
Всем привет! В компании Теле2 открыта вакансия Product manager (Big Data) 🔎

Ваши будущие задачи:

▪️Создание новых продуктов Big Data в рамках конкретного продуктового направления с целью роста эффекта от монетизации.

▪️Анализ рынка, определение целевой аудитории и ценностного предложения, формирование бизнес-модели.

▪️Планирование и контроль разработки продуктов в роли Product Owner, планирование инвестиций в направление, контроль маржинальности продуктовой команды и продуктов.

▪️Взаимодействие с клиентами для выявления потребностей в продуктах Big Data, проведение глубинных интервью.

▪️Продвижение продуктов Big Data. Обучение для продавцов, выступления на внешних конференциях/митапах.

Чтобы стать кандидатом, нужно:

▫️Опыт самостоятельного развития продуктов – не менее 2х лет.
▫️Опыт управления проектами – не менее 2х лет.

▫️Понимание предметных областей Big Data, Machine Learning, Artificial Intelligence с точки зрения кейсов применения на рынке.
▫️Хорошее понимание существующего рынка продуктов аналитики больших данных (верификация, скоринг, лидогенерация, особенности продуктов аналитики из разных индустрий).

Плюсы для вас:

◾️Зеленый свет для новых идей и предложений: мы часто делаем то, на что другие не отваживаются

◼️Возможности профессионального и карьерного роста

◼️Полное соответствие ТК РФ

◼️Расширенная медицинская страховка в России и за пределами страны - даже для любителей черных горнолыжных трасс

◼️Компенсация затрат на мобильную связь

◼️Дополнительные материальные выплаты (пособия при рождении ребенка, вступлении в брак и т.п.)

◼️Компенсация занятий спортом

Контакты для связи: @yavanturina ☎️☎️
Please open Telegram to view this post
VIEW IN TELEGRAM
Grade: Senior Recommendation Systems Machine Learning Engineer

💰 Salary: 70-90k$ + 20k$ options

📍 Format: Remote

🚀 At FameFlow.ai, we are experts in synthesizing ads with celebrities.

Recommendation system machine learning engineer task is to match our customers’ product with celebrities, extract audience for each pair and build deployment infrastructure.

As we are growing very fast, we have realized the need to hire someone who would help us with creating advertisement pipeline.

We are looking for a confident data scientist who can understand which papers and tricks we should use to solve each problem, build and iteratively improve the generation pipeline and understand how each change affects the business.

🦾 The following needs to be done:
- Extract essential information about each celebrity and product
- Create matching system
- Find best targeting audience
- Create ad deployment pipeline
- Adapt ad generation based on the gathered statistics
- Data engineering.
- Write requirements for data labeling team
- Improve pipeline based on new papers and previous experience
- Read and discuss new papers to improve the pipeline
- Understand the overall business growth vector and align tech vector with business one

💻 The following qualifications are required:
- Commercial development experience in PyTorch for at least 2 years.
- Commercial experience of developing recommendation systems for at least 1 year
- Experience in software engineering data-intensive solutions
- Ability to read papers easily
- English B2+
- Understanding of how a certain feature affects product business metrics.
- Ability to offer 5 options for implementing a feature and implement one of them.
- Ability to solve tasks quickly while keeping hacks away.

Contacts: [email protected]
#вакансия #москва #analyst #datascience #ml

Всем привет!
Драйвовая, лидирующая и активно развивающаяся компания, GlowByte, в поисках Старшего аналитика Data Science и Тимлида DS.

🍊Требования
• Высшее ИТ / техническое образование;
• Python, SQL, Git;
• Большим плюсом будет понимание предметной области: Ритейл, FMCG, сети быстрого питания;
• Знание подходов к прогнозированию временных рядов (регрессионные модели, форесты, бустинги, нейронки, ...) и оптимизации (от классических LP до MINLP);
• Лиду необходим опыт в координировании команды, оценке задач и проч. "лидовских" активностях.

🍊 Решаем задачи двух типов:
• Прогнозирования временных рядов;
• Различные оптимизационные задачи
+ все сопутствующие задачи

🍊Условия
• Стабильный оклад + премия по итогам года / проекта;
• Карьерный рост, профессиональное обучение;
• Гибкий график работы;
• Гибкий соц. пакет (ДМС/ английский/ абонемент в спортзал и т.д.);
• Комфортный офис в Мск в БЦ Арма (предпочтителен гибрид, возможна полная удаленка);
• Кофе, фрукты, каши по утрам;
• Вилка по результатам собеса.

Подробности @alya_IT_rec
PieData AI, Inc., первая в мире платформа, позволяющая союбирать и фильтровать данные для Generstive AI. Команда с exit-ами в Snap и опытом поднятия компаний с 0 до оценки в миллиарды долларов. Ищем опытного Data Scientist, который присоединится к нашей команде. За последний год мы прошли Alchemist, закрыли раунд с Altair Capital и заработали $1M+ выручки на продукт.

Описание должностных обязанностей:
• Разработка и реализация моделей машинного обучения для анализа данных.
• Создание и управление Data Lake для хранения и обработки больших объемов данных.
• Исследование и применение передовых методов в области компьютерного зрения (CV).
• Оптимизация и настройка моделей с использованием библиотек faiss, PyTorch и HuggingFace.
• Анализ и интерпретация данных для выявления трендов и паттернов.

Требования:
• Опыт работы в области компьютерного зрения (CV) не менее 6 лет.
• Глубокие знания и практический опыт с библиотеками faiss, PyTorch и HuggingFace.
• Умение эффективно работать с большими объемами данных и создавать Data Lake для хранения и обработки данных.
• Способность разрабатывать и оптимизировать модели машинного обучения.
• Опыт работы в удаленном формате.

Мы предлагаем гибкую почасовую оплату в соответствии с вашим опытом и компетенциями. Если вы готовы присоединиться к нашей команде и внести свой вклад в инновационные проекты в области анализа данных, мы будем рады рассмотреть вашу кандидатуру.

Пожалуйста, отправьте свое резюме и портфолио на адрес [email protected] и укажите в теме письма "Вакансия Data Scientist". Мы свяжемся с вами для дальнейшего обсуждения.

Мы находимся в режиме удаленной работы, поэтому данная вакансия доступна для соискателей из любой локации.
Открыта позиция Data Scientist в направлении RnD
✔️Компания:
Atsearch Group
Находимся в поиске middle/senior Data Scientist в крупную страховую компанию.
Команда занимается исследовательской деятельность, разработкой и внедрением ML моделей.

Рассмотрим кандидатов с опытом от 2х лет из Казани, Волгограда, Санкт Петербурга, с опытом от 3х лет по всей России☺️

✔️Стек: Стек: SQL (MS, Oracle), Python, Мат.стат./теория вероятности
🔌Доход: открыто несколько ставок, ориентир на опыт

✔️Задачи:
Полный цикл построение ML моделей:
Валидация моделей других команд

Типовые задачи:
Валидация моделей прогнозирования убытка
Построение пайплайна ML моделей.
Используют любые другие типы моделей, которые покажут свою эффективность на ретро данных.
✔️Требования:
Знание методов машинного обучения;
Опыт обработки больших объемов данных;
Знания SQL, Python (уровень не ниже middle), Statsmodels и библиотек для ML (CatBoost,GLM, Pandas);

Будет плюсом:
GitLab, MLFlow, Airflow, Grafana
TensorFlow, PyTorch, pyspark
Опыт и знания в страховой/банковской сферах

✔️Условия:
Работа в крупной и стабильной компании;
Официальное трудоустройство по ТК РФ в штат компании;
ДМС со стоматологией с первого дня работы в компании;
Формат работы по договоренности
Скидки на страховые продукты.
Спорт, обучающие мероприятия.
Квартальные премии.

💬За деталями и рекомендацией писать @kiriich🙋‍♀️
ML Research Engineer
GOAT.Al
4.000 to 5.000 USD NET per month
Almaty Office

GOAT.Al is a research lab on Human <> AI engagement.
The team behind the popular app GoatChat.Al.
We are working on solving the problems of large language models, including hallucination, mode collapse, and context length limitations
.

Responsibilities:
• Conduct cutting-edge research on large language models
• Write and publish academic papers describing new research

Requirements:
• Broad knowledge of academic research in the field of deep learning, with a focus on the latest trends and papers
• Experience with PyTorch and related frameworks like DeepSpeed and HuggingFace
• Knowledge of state-of-the-art training techniques, including mixed-precision training
• Proficiency in MLOps and experience with distributed training

Optional skills: Experience with natural language processing (NLP) or reinforcement learning (RL) is preferred, but not required.

Contacts:
📧 [email protected]
@rempact
Мобильный оператор Yota продолжает расти и ищет в команду опытного web-аналитика.

Чем предстоит заниматься:
— Настраивать счетчики в Google Analytics и Яндекс Метрике.
— Искать инсайты и выявлять аномалии в данных.
— Визуализировать информацию в Tableau, Excel и Powerpoint.
— Собирать ежемесячные отчеты. 
— Готовить рекомендации и влиять на развитие бизнеса.

Требования:
— Вы работаете с Яндекс Метрикой и другими системами аналитики. 
— Пишете SQL-запросы на уровне junior+ или middle.
— Строите отчетность в Tableau/QlikSence, SuperSet.
— Работаете с большими массивами данных в Excel.
— Внедряете инструменты аналитики в сайты и приложения.
— Интересуетесь диджитал-маркетингом и новыми технологиями.
— У вас есть опыт юзабилити-тестирования сайтов и приложений.
— Вы ставили и трекали задачи в JIRA или аналогичных системах.

Резюме и короткий рассказ о себе присылайте на [email protected] с темой письма «Вакансия web-аналитик в Yota».
Perl-разработчик в Газпромбанк (intern)
#удаленка #полныйдень

З/П от 100 000 ₽

Локация: Удаленно (из любого города РФ)

Задачи:
— Создавать работающий код для банковского сопровождения, для генерации отчетности, для выполнения ряда интеграционных и вспомогательных задач при помощи языка программирования perl и собственных аналитических способностей
— Ты приобретёшь практический опыт работы с perl, с отчетами, с моделями данных, с интеграционным взаимодействием, опыт коммерческой back-end разработкой и всё это на реальных задачах

Требования:
— Заканчиваешь вуз в 2024 году или выпускник/выпускница 2018-2023 гг.
— Сможешь работать full-time с самого старта программы
— Имеешь базовые знания любого языка программирования и владеешь ОС Linux на уровне пользователя
— Хочешь дать яркий старт своей карьере в разработке

P.S.: Знание Perl не требуется, тебя научат на стажировке.

Откликнуться: https://bit.ly/GPB-dev-intern