Zen of Python
20.1K subscribers
1.22K photos
162 videos
32 files
3.17K links
Полный Дзен Пайтона в одном канале

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Сайт: https://tprg.ru/site

Регистрация в перечне РКН: https://tprg.ru/xZOL
加入频道
Кроссплатформенное Data Science приложение с помощью PySimpleGUI

С помощью библиотеки PySimpleGUI можно создавать самые разные графические интерфейсы для различных платформ быстро и просто.

В этой статье вы узнаете, как создать Data Science приложение с помощью PySimpleGUI для Windows, а затем сможете перенести его и на другие ОС при желании. Подробнее:

https://tprg.ru/3HFx

#datascience #библиотека
Бесплатный курс по Big Data и Data Science

Этот курс поможет углубить знания в области больших данных и машинного обучения, а также изучить применение Data Science на примерах практики передовых компаний. Курс подойдёт тем, кто уже немного знаком с Data Science и хочет продолжить обучение.

Подробнее:

https://tprg.ru/fD5C

#datascience
👍1
Бесплатный курс по анализу данных на Python

Небольшой курс, рассказывающий об основах анализа данных. Здесь вы познакомитесь с несколькими библиотеками Python, такими как NumPy, Pandas, а также изучите SQL и не только.

Посмотреть можно тут:

https://tprg.ru/rGBy

#видео #курс #datascience
Как оптимизировать проект Data Science с помощью Prefect

При отсутствии оптимизации в Data Science проекте может получиться так, что один процесс будет тормозить остальные при возможности разделения их работы независимо друг от друга.

Prefect — это фреймворк с открытым исходным кодом для построения рабочих процессов на Python. Он позволяет легко создавать, запускать и контролировать конвейеры данных различного масштаба, в том числе и устраняя проблему выше.

https://tprg.ru/pYfO

#datascience
5 грязных трюков в соревновательном Data Science, о которых тебе не расскажут в приличном обществе

Такому вас точно не научат в школе или универе, на курсах вам тоже вряд ли дадут памятку по использованию грязных приёмчиков. Но тем не менее, эти хитрости и уловки лучше знать. Даже не для личного использования, но для возможности выявить нечестного оппонента.

Если интересно, как можно сжульничать на соревновании по Data Science, то переходите по ссылке и скорее читайте статью:

https://habr.com/ru/post/600067/

#datascience
🤯9👍8👏4🤔1😢1
Как метод подмены задачи борется с несовершенством данных

Для того, чтобы понять зачем использовать этот метод, можно взглянуть на соревнования по анализу данных. Там этот метод применяется для максимально быстрого прохождения всех необходимых тестов даже в условиях не репрезентативности обучающей выборке и её сильном отличии от выборки тестовой.

Расписывать здесь, как именно это делается, слишком долго, поэтому предлагаем вам сразу перейти в статью и почитать подробное объяснение от опытного ML разработчика:

https://habr.com/ru/company/ru_mts/blog/648063/

#datascience
👍6
Работа с отсутствующими значениями в Pandas

Отсутствующее значение в наборе данных отображается как вопросительный знак, ноль, NaN или просто пустая ячейка. Но как можно справиться с недостающими данными?

На самом деле есть много способов. В этой статье рассмотрены типичные варианты на примере набора данных «Titanic». Эти данные являются открытым набором данных Kaggle. Подробнее:

https://habr.com/ru/post/663414/

#pandas #datascience
👍4
Топовые пакеты Python для очистки данных

Специалисты по данным вынуждены тратить уйму времени на то, что привести эти данные в порядок и очистить их от лишнего. К счастью, для этого уже существует множество различных пакетов, помогающих быстрее избавиться от мусора. Подробнее о них в статье:

https://nuancesprog.ru/p/15768/

#datascience
👍8
Пакетная обработка 22 ГБ данных о транзакциях с помощью Pandas

С большими наборами данных работать сложно, особенно при отсутствии необходимых ресурсов. Если вы не располагаете достаточно мощным компьютером, то решить проблему такой обработки можно с помощью фрагментации данных. Как это сделать можно узнать здесь:

https://nuancesprog.ru/p/15805/

#datascience #pandas
👍11😁1💩1