Записки юного data scientist'a
85 subscribers
6 files
20 links
Я разработчик, стремящийся познать все тонкости data sceince и machine learning. Здесь буду выкладывать интересные материалы, которые привлекли моё внимание, а также авторские статьи для улучшения своих и ваших знаний.
Для связи: @my_diamonds_dancing.
加入频道
Первая книга из статьи про полезные материалы для МЛ:
Введение в машинное обучение Python(2017).
Вторая книга из статьи про полезные материалы для МЛ:
Python и машинное обучение(2017).
Ну и книжка для углубленного изучения Питона.
Немного отойдём от практики и ознакомимся с самим понятием - "data scientist".
P.S. Статья не моя, но очень понравилась, потому грех не распространить.
https://dou.ua/lenta/articles/it-position-ds-ml/
Всем добрый день. Есть один интересный датасет, который для обучения использовать не особо интересно, а вот для визуализации данных подойдёт вполне. Предлагаю объединиться и визуализировать как можно больше таблиц, графиков и т.д. из этого датасета.
Своими вариантами можете поделиться здесь: https://yangx.top/chat_of_data_science, или отправить мне в личку: @my_diamonds_dancing.
Сам датасет: https://www.kaggle.com/NUFORC/ufo-sightings
После довольно длительного перерыва возвращаюсь с интересной статьей на тему футбола. Вы могли видеть эту статью в Code Blog, однако если кто не ознакомлен, преподношу к просмотру. Здесь не будет чудес визуализации, использован один метод со словарями. Больше акцента было на просмотр статистики, а не на развитии навыков визуализации.
https://telegra.ph/Python-i-FIFA-01-20
#matplotlib #keras #sklearn #tensor_flow #pandas #numpy

Вашему вниманию предоставляется сборник огромного количества полезнейших документов Jupyter Notebook на самые разные темы из мира DS. Сам сборник доступен по ссылке:
https://github.com/donnemartin/data-science-ipython-notebooks/blob/master/README.md

Как вы уже заметили, я ввожу систему тэгов для удобного поиска материалов по различным темам.
#python
Машинное обучение это конечно хорошо, однако владение базовыми алгоритмами не помешало еще ни одному программисту. В моей статье, которая была опубликована в паблике Code Blog, показаны основы работы с генераторами, которые в обработке данных имеют свою роль, а также реализованы несколько алгоритмов.
Сама статья : https://vk.com/@codeblog-generatory-v-python
pulsar_stars.csv
1.7 MB
Датасет из последней статьи
Добрый день. На повестке дня стоит вопрос: испытываете ли вы трудности чтения статей в Telegraph? Из-за того, что я не живу в России, я не могу полностью оценить проблему. Если у вас есть какие-либо проблемы с чтением статей, прошу отписать мне: @liveMLP.
Небольшая "разговорная" статья про соблюдение правил написания кода и ООП. Имеете противоположное мнение? Пишите - @liveMLP, обсудим.
https://tgraph.io/Pro-pravila-napisaniya-koda-03-26