Zen of Python
20.1K subscribers
1.22K photos
162 videos
32 files
3.17K links
Полный Дзен Пайтона в одном канале

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Сайт: https://tprg.ru/site

Регистрация в перечне РКН: https://tprg.ru/xZOL
加入频道
Кроссплатформенное Data Science приложение с помощью PySimpleGUI

С помощью библиотеки PySimpleGUI можно создавать самые разные графические интерфейсы для различных платформ быстро и просто.

В этой статье вы узнаете, как создать Data Science приложение с помощью PySimpleGUI для Windows, а затем сможете перенести его и на другие ОС при желании. Подробнее:

https://tprg.ru/3HFx

#datascience #библиотека
Бесплатный курс по Big Data и Data Science

Этот курс поможет углубить знания в области больших данных и машинного обучения, а также изучить применение Data Science на примерах практики передовых компаний. Курс подойдёт тем, кто уже немного знаком с Data Science и хочет продолжить обучение.

Подробнее:

https://tprg.ru/fD5C

#datascience
👍1
Бесплатный курс по анализу данных на Python

Небольшой курс, рассказывающий об основах анализа данных. Здесь вы познакомитесь с несколькими библиотеками Python, такими как NumPy, Pandas, а также изучите SQL и не только.

Посмотреть можно тут:

https://tprg.ru/rGBy

#видео #курс #datascience
Как оптимизировать проект Data Science с помощью Prefect

При отсутствии оптимизации в Data Science проекте может получиться так, что один процесс будет тормозить остальные при возможности разделения их работы независимо друг от друга.

Prefect — это фреймворк с открытым исходным кодом для построения рабочих процессов на Python. Он позволяет легко создавать, запускать и контролировать конвейеры данных различного масштаба, в том числе и устраняя проблему выше.

https://tprg.ru/pYfO

#datascience
5 грязных трюков в соревновательном Data Science, о которых тебе не расскажут в приличном обществе

Такому вас точно не научат в школе или универе, на курсах вам тоже вряд ли дадут памятку по использованию грязных приёмчиков. Но тем не менее, эти хитрости и уловки лучше знать. Даже не для личного использования, но для возможности выявить нечестного оппонента.

Если интересно, как можно сжульничать на соревновании по Data Science, то переходите по ссылке и скорее читайте статью:

https://habr.com/ru/post/600067/

#datascience
🤯9👍8👏4🤔1😢1
Как метод подмены задачи борется с несовершенством данных

Для того, чтобы понять зачем использовать этот метод, можно взглянуть на соревнования по анализу данных. Там этот метод применяется для максимально быстрого прохождения всех необходимых тестов даже в условиях не репрезентативности обучающей выборке и её сильном отличии от выборки тестовой.

Расписывать здесь, как именно это делается, слишком долго, поэтому предлагаем вам сразу перейти в статью и почитать подробное объяснение от опытного ML разработчика:

https://habr.com/ru/company/ru_mts/blog/648063/

#datascience
👍6
Работа с отсутствующими значениями в Pandas

Отсутствующее значение в наборе данных отображается как вопросительный знак, ноль, NaN или просто пустая ячейка. Но как можно справиться с недостающими данными?

На самом деле есть много способов. В этой статье рассмотрены типичные варианты на примере набора данных «Titanic». Эти данные являются открытым набором данных Kaggle. Подробнее:

https://habr.com/ru/post/663414/

#pandas #datascience
👍4
Топовые пакеты Python для очистки данных

Специалисты по данным вынуждены тратить уйму времени на то, что привести эти данные в порядок и очистить их от лишнего. К счастью, для этого уже существует множество различных пакетов, помогающих быстрее избавиться от мусора. Подробнее о них в статье:

https://nuancesprog.ru/p/15768/

#datascience
👍8
Пакетная обработка 22 ГБ данных о транзакциях с помощью Pandas

С большими наборами данных работать сложно, особенно при отсутствии необходимых ресурсов. Если вы не располагаете достаточно мощным компьютером, то решить проблему такой обработки можно с помощью фрагментации данных. Как это сделать можно узнать здесь:

https://nuancesprog.ru/p/15805/

#datascience #pandas
👍11😁1💩1
Быстрое прототипирование в проектах анализа данных

Быстрое протитипирование снижает риски затрат при неуспешном проекте, а также помогает проверить готовность процессорв к использованию модели машинного обучения.

В этой статье вы узнаете на что стоит обращать внимание при прототипировании:

https://tproger.ru/articles/bystroe-prototipirovanie-v-proektah-analiza-dannyh/

#datascience
👍4
3 худших совета по осваиванию науки о данных

Изучать что-то новое очень сложно. В поисках необходимых знаний приходится перебирать различные способы обучения. К сожалению, узнать об эффективности способа или полезности ресурса зачастую довольно сложно.

В этой статье собраны плохие советы, которым точно не стоит следовать при изучении науки о данных:

https://nuancesprog.ru/p/15835/

#datascience
👍8
Что такое выпас данных и почему он необходим?

Плохие данные приводят к принятию некачественных решений. Поэтому вам необходимо очистить и отформатировать ваши данные – взять их под контроль, чтобы они были готовы к последующим процессам. Тут на помощь приходит выпас данных. Он позволяет более тщательно преобразовать, переформатировать и подготовить данные, чем при простой очистке.

Подробнее о методе:

https://habr.com/ru/company/piter/blog/675796/

#datascience
👍6
Машинный перевод с двухсот языков, генерация бесконечных изображений от Microsoft и рефлексия нейросети о самой себе.

Подробнее о ярких новостях из мира Data Science можно прочитать в дайджесте от МТС Диджитал:
https://tprg.ru/z5Em

#datascience
👍11
JupyterHub, или как перестать бояться pip install

JupyterHub — это тот же Jupyter, который ставится он на отдельный сервер и работает как клиент-серверное веб-приложение, позволяя автоматизировать и изолировать рабочее окружение каждого пользователя. Благодаря этому вам не надо думать об установке Jupyter и тратить локальные ресурсы.

Подробнее:

https://habr.com/ru/company/rostelecom/blog/689596/

#jupyter #datascience
👍6
«Вам курицу или рыбу?» — как рекомендательная система понимает чего вы хотите

Сегодня столько разнообразной информации, что легко запутаться в попытках найти нужное. Разработчики платформы по продаже фермерских продуктов подумали о том, как помочь пользователям выбрать среди обилия фермеров и их товаров именно те, которые им точно нужны и понравятся.

Для этого они разработали рекомендательную систему, которая состоит из трёх этапов. А вот каких именно и как это всё работает, узнаете здесь:

https://habr.com/ru/company/rshb/blog/701278/

#ml #datascience
👍11
Как получить данные в нужном формате с помощью Pandas

Специалистам по данным постоянно приходится приводить данные в нужный им вид. Иногда, очищая от лишнего, в других случаях меняя формат данных. Чаще всего применяются два формата данных: длинный и широкий.

В этой статье вы рассмотрите несколько примеров, чтобы понять, как именно выглядит каждый формат данных, а затем посмотрите, как конвертировать один формат в другой с помощью Pandas:

https://nuancesprog.ru/p/16466/

#pandas #datascience
👍13🔥1