Zen of Python

Бесплатный курс по Big Data и Data Science

Этот курс поможет углубить знания в области больших данных и машинного обучения, а также изучить применение Data Science на примерах практики передовых компаний. Курс подойдёт тем, кто уже немного знаком с Data Science и хочет продолжить обучение.

Подробнее:

https://tprg.ru/fD5C

#datascience

👍1

8.1K views08:14

Zen of Python

Seaborn — отличная data science библиотека для визуализации на Python

В этом видео вы узнаете, как создавать различные графики c помощью seaborn и в чём преимущества этой библиотеки по сравнению с тем же matplotlib.

https://tprg.ru/P8FV

#видео #datascience

YouTube

Seaborn - лучшая data science библиотека для визуализации на Python?

🔥 Telegram https://yangx.top/ershov_diary

🔥 Индивидуальная программа по обучению data science под вашу цель с моей менторской поддержкой до результата:
https://bit.ly/3uRvTz3

Тут я рассказываю почему я создал эту программу, для кого она подходит и в чем ее…

7.63K views15:03

Zen of Python

Бесплатный курс по анализу данных на Python

Небольшой курс, рассказывающий об основах анализа данных. Здесь вы познакомитесь с несколькими библиотеками Python, такими как NumPy, Pandas, а также изучите SQL и не только.

Посмотреть можно тут:

https://tprg.ru/rGBy

#видео #курс #datascience

7.19K views09:20

Zen of Python

Как оптимизировать проект Data Science с помощью Prefect

При отсутствии оптимизации в Data Science проекте может получиться так, что один процесс будет тормозить остальные при возможности разделения их работы независимо друг от друга.

Prefect — это фреймворк с открытым исходным кодом для построения рабочих процессов на Python. Он позволяет легко создавать, запускать и контролировать конвейеры данных различного масштаба, в том числе и устраняя проблему выше.

https://tprg.ru/pYfO

#datascience

6.48K viewsedited 15:20

Zen of Python

5 грязных трюков в соревновательном Data Science, о которых тебе не расскажут в приличном обществе

Такому вас точно не научат в школе или универе, на курсах вам тоже вряд ли дадут памятку по использованию грязных приёмчиков. Но тем не менее, эти хитрости и уловки лучше знать. Даже не для личного использования, но для возможности выявить нечестного оппонента.

Если интересно, как можно сжульничать на соревновании по Data Science, то переходите по ссылке и скорее читайте статью:

https://habr.com/ru/post/600067/

#datascience

🤯9👍8👏4🤔1😢1

9.91K views15:35

Zen of Python

Как метод подмены задачи борется с несовершенством данных

Для того, чтобы понять зачем использовать этот метод, можно взглянуть на соревнования по анализу данных. Там этот метод применяется для максимально быстрого прохождения всех необходимых тестов даже в условиях не репрезентативности обучающей выборке и её сильном отличии от выборки тестовой.

Расписывать здесь, как именно это делается, слишком долго, поэтому предлагаем вам сразу перейти в статью и почитать подробное объяснение от опытного ML разработчика:

https://habr.com/ru/company/ru_mts/blog/648063/

#datascience

👍6

7.85K views17:04

Zen of Python

Работа с отсутствующими значениями в Pandas

Отсутствующее значение в наборе данных отображается как вопросительный знак, ноль, NaN или просто пустая ячейка. Но как можно справиться с недостающими данными?

На самом деле есть много способов. В этой статье рассмотрены типичные варианты на примере набора данных «Titanic». Эти данные являются открытым набором данных Kaggle. Подробнее:

https://habr.com/ru/post/663414/

#pandas #datascience

👍4

8.22K views14:09

Zen of Python

Топовые пакеты Python для очистки данных

Специалисты по данным вынуждены тратить уйму времени на то, что привести эти данные в порядок и очистить их от лишнего. К счастью, для этого уже существует множество различных пакетов, помогающих быстрее избавиться от мусора. Подробнее о них в статье:

https://nuancesprog.ru/p/15768/

#datascience

👍8

8.16K views17:34

Zen of Python

Пакетная обработка 22 ГБ данных о транзакциях с помощью Pandas

С большими наборами данных работать сложно, особенно при отсутствии необходимых ресурсов. Если вы не располагаете достаточно мощным компьютером, то решить проблему такой обработки можно с помощью фрагментации данных. Как это сделать можно узнать здесь:

https://nuancesprog.ru/p/15805/

#datascience #pandas

👍11😁1💩1

7.68K views16:15

Zen of Python

Быстрое прототипирование в проектах анализа данных

Быстрое протитипирование снижает риски затрат при неуспешном проекте, а также помогает проверить готовность процессорв к использованию модели машинного обучения.

В этой статье вы узнаете на что стоит обращать внимание при прототипировании:

https://tproger.ru/articles/bystroe-prototipirovanie-v-proektah-analiza-dannyh/

#datascience

👍4

7.14K views15:50

Zen of Python

3 худших совета по осваиванию науки о данных

Изучать что-то новое очень сложно. В поисках необходимых знаний приходится перебирать различные способы обучения. К сожалению, узнать об эффективности способа или полезности ресурса зачастую довольно сложно.

В этой статье собраны плохие советы, которым точно не стоит следовать при изучении науки о данных:

https://nuancesprog.ru/p/15835/

#datascience

👍8

7.32K views12:14

Zen of Python

Что такое выпас данных и почему он необходим?

Плохие данные приводят к принятию некачественных решений. Поэтому вам необходимо очистить и отформатировать ваши данные – взять их под контроль, чтобы они были готовы к последующим процессам. Тут на помощь приходит выпас данных. Он позволяет более тщательно преобразовать, переформатировать и подготовить данные, чем при простой очистке.

Подробнее о методе:

https://habr.com/ru/company/piter/blog/675796/

#datascience

👍6

7.28K views10:42

Zen of Python

Машинный перевод с двухсот языков, генерация бесконечных изображений от Microsoft и рефлексия нейросети о самой себе.

Подробнее о ярких новостях из мира Data Science можно прочитать в дайджесте от МТС Диджитал:
https://tprg.ru/z5Em

#datascience

👍11

6.99K views15:01

Zen of Python

JupyterHub, или как перестать бояться pip install

JupyterHub — это тот же Jupyter, который ставится он на отдельный сервер и работает как клиент-серверное веб-приложение, позволяя автоматизировать и изолировать рабочее окружение каждого пользователя. Благодаря этому вам не надо думать об установке Jupyter и тратить локальные ресурсы.

Подробнее:

https://habr.com/ru/company/rostelecom/blog/689596/

#jupyter #datascience

👍6

6.6K viewsedited 11:06

Zen of Python

«Вам курицу или рыбу?» — как рекомендательная система понимает чего вы хотите

Сегодня столько разнообразной информации, что легко запутаться в попытках найти нужное. Разработчики платформы по продаже фермерских продуктов подумали о том, как помочь пользователям выбрать среди обилия фермеров и их товаров именно те, которые им точно нужны и понравятся.

Для этого они разработали рекомендательную систему, которая состоит из трёх этапов. А вот каких именно и как это всё работает, узнаете здесь:

https://habr.com/ru/company/rshb/blog/701278/

#ml #datascience

👍11

5.75K views12:04

Zen of Python

Как получить данные в нужном формате с помощью Pandas

Специалистам по данным постоянно приходится приводить данные в нужный им вид. Иногда, очищая от лишнего, в других случаях меняя формат данных. Чаще всего применяются два формата данных: длинный и широкий.

В этой статье вы рассмотрите несколько примеров, чтобы понять, как именно выглядит каждый формат данных, а затем посмотрите, как конвертировать один формат в другой с помощью Pandas:

https://nuancesprog.ru/p/16466/

#pandas #datascience

👍13🔥1

5.99K views12:43

Zen of Python

Data Science на Python для начинающих

Это видео научит вас почти всему, что вам нужно знать для анализа данных и построения модели машинного обучения. Смотрите в оригинале, с субтитрами или переведите его с помощью Яндекс.

https://youtu.be/BqfM9eeD6KA?list=PL7mOFdpoBB6QiW3_n7aKn_eHTCCftPJLw

#видео #datascience

👍9💩3

6.34K views17:14

Zen of Python

Как из данных узнавать о том, что в продукте что-то пошло не по плану

К сожалению, мониторинг не всегда может выявить аномалии в работе продукта, потому что они не всегда вызваны багами или техническими ошибками. Но зато их можно обнаружить при анализе данных. Например, когда пользователи начинают совершать нестандартные действия.

Подробнее об этом расскажет продуктовый аналитик — тот, кто лично находит такие аномалии:

https://habr.com/ru/post/704988/

#datascience

👍3💩3

7.2K views13:04

Zen of Python

Шпаргалка по DataFrame

DataFrame — ключевая структура данных Python-библиотеки pandas. В шпаргалке есть всё про основные операции с DataFrame. Акцент сделан на Data Wrangling — этапе работы с данными, когда данные преобразовываются из «сырого» формата в пригодный для аналитики.

Если вы инженер данных, аналитик или датасаентист — эта шпаргалка точно для вас.

#datascience

👍30💩1

7.25K views09:31

About

Blog

Apps

Platform