Zen of Python
20.1K subscribers
1.22K photos
162 videos
32 files
3.17K links
Полный Дзен Пайтона в одном канале

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Сайт: https://tprg.ru/site

Регистрация в перечне РКН: https://tprg.ru/xZOL
加入频道
3 худших совета по осваиванию науки о данных

Изучать что-то новое очень сложно. В поисках необходимых знаний приходится перебирать различные способы обучения. К сожалению, узнать об эффективности способа или полезности ресурса зачастую довольно сложно.

В этой статье собраны плохие советы, которым точно не стоит следовать при изучении науки о данных:

https://nuancesprog.ru/p/15835/

#datascience
👍8
Что такое выпас данных и почему он необходим?

Плохие данные приводят к принятию некачественных решений. Поэтому вам необходимо очистить и отформатировать ваши данные – взять их под контроль, чтобы они были готовы к последующим процессам. Тут на помощь приходит выпас данных. Он позволяет более тщательно преобразовать, переформатировать и подготовить данные, чем при простой очистке.

Подробнее о методе:

https://habr.com/ru/company/piter/blog/675796/

#datascience
👍6
Машинный перевод с двухсот языков, генерация бесконечных изображений от Microsoft и рефлексия нейросети о самой себе.

Подробнее о ярких новостях из мира Data Science можно прочитать в дайджесте от МТС Диджитал:
https://tprg.ru/z5Em

#datascience
👍11
JupyterHub, или как перестать бояться pip install

JupyterHub — это тот же Jupyter, который ставится он на отдельный сервер и работает как клиент-серверное веб-приложение, позволяя автоматизировать и изолировать рабочее окружение каждого пользователя. Благодаря этому вам не надо думать об установке Jupyter и тратить локальные ресурсы.

Подробнее:

https://habr.com/ru/company/rostelecom/blog/689596/

#jupyter #datascience
👍6
«Вам курицу или рыбу?» — как рекомендательная система понимает чего вы хотите

Сегодня столько разнообразной информации, что легко запутаться в попытках найти нужное. Разработчики платформы по продаже фермерских продуктов подумали о том, как помочь пользователям выбрать среди обилия фермеров и их товаров именно те, которые им точно нужны и понравятся.

Для этого они разработали рекомендательную систему, которая состоит из трёх этапов. А вот каких именно и как это всё работает, узнаете здесь:

https://habr.com/ru/company/rshb/blog/701278/

#ml #datascience
👍11
Как получить данные в нужном формате с помощью Pandas

Специалистам по данным постоянно приходится приводить данные в нужный им вид. Иногда, очищая от лишнего, в других случаях меняя формат данных. Чаще всего применяются два формата данных: длинный и широкий.

В этой статье вы рассмотрите несколько примеров, чтобы понять, как именно выглядит каждый формат данных, а затем посмотрите, как конвертировать один формат в другой с помощью Pandas:

https://nuancesprog.ru/p/16466/

#pandas #datascience
👍13🔥1
Data Science на Python для начинающих

Это видео научит вас почти всему, что вам нужно знать для анализа данных и построения модели машинного обучения. Смотрите в оригинале, с субтитрами или переведите его с помощью Яндекс.

https://youtu.be/BqfM9eeD6KA?list=PL7mOFdpoBB6QiW3_n7aKn_eHTCCftPJLw

#видео #datascience
👍9💩3
Как из данных узнавать о том, что в продукте что-то пошло не по плану

К сожалению, мониторинг не всегда может выявить аномалии в работе продукта, потому что они не всегда вызваны багами или техническими ошибками. Но зато их можно обнаружить при анализе данных. Например, когда пользователи начинают совершать нестандартные действия.

Подробнее об этом расскажет продуктовый аналитик — тот, кто лично находит такие аномалии:

https://habr.com/ru/post/704988/

#datascience
👍3💩3
Шпаргалка по DataFrame

DataFrame — ключевая структура данных Python-библиотеки pandas. В шпаргалке есть всё про основные операции с DataFrame. Акцент сделан на Data Wrangling — этапе работы с данными, когда данные преобразовываются из «сырого» формата в пригодный для аналитики.

Если вы инженер данных, аналитик или датасаентист — эта шпаргалка точно для вас.

#datascience
👍30💩1
В чём разница между дата-аналитиком и ML-инженером?

Разбираем обязанности вместе с реальными специалистами: https://tprg.ru/F956

#datascience #ml
👍5
Работаем с данными через GUI

Познакомившись с Bamboolib вы будете жалеть, что не узнали о ней раньше. Она позволяет работать с фреймами данных pandas через графический интерфейс, что сильно упрощает задачу.

Познакомиться с её возможностями подробнее и установить можно по ссылке:

https://pypi.org/project/bamboolib/#description

#библиотека #datascience #pandas
6
Data Science и Big Data: одно и то же или есть различия?

Некоторые люди считают эти термины чуть ли не синонимами, но это не верно. Data Science — междисциплинарная область, которая охватывает практически всё, что связано с данными. А вот Big Data, как можно догадаться из названия, занимается работой исключительно с большими объёмами данных.

Это самое базовое различие, но далеко не единственное. Отличия есть в областях применения, необходимых навыках, задачах и так далее. Всё в один пост не влезет, поэтому рекомендую прочитать эту статью, там всё разложено по полочкам.

#datascience #bigdata
1