BigData
3.31K subscribers
754 photos
89 videos
3 files
835 links
Data Science : Big Data : Machine Learning : Deep Learning. По всем вопросам @evgenycarter
加入频道
Краткое руководство по созданию наборов данных с помощью Python

Если вам когда-нибудь приходилось собирать данные о своих пользователях, вы знаете, насколько это сложно. Так почему бы не попытаться создать свой собственный набор данных?

В этой статье я опишу простой процесс сбора пользовательских данных, который можно реализовать менее чем за час. Это позволит вам легко собирать и хранить пользовательские данные.

👉 @bigdata_1
👍3
Pysentimiento: A Python toolkit for Sentiment Analysis and Social NLP tasks

Github: https://github.com/pysentimiento/pysentimiento

Paper: https://arxiv.org/abs/2106.09462

English model: https://huggingface.co/finiteautomata/bertweet-base-sentiment-analysis

👉 @bigdata_1
👍3
MASSIVE: датасет Amazon для многоязычного обучения моделей

https://www.amazon.science/blog/amazon-releases-51-language-dataset-for-language-understanding

👉 @bigdata_1
👍3
Serverless в цифровой трансформации

К 2025 году 50% крупных компаний развернут платформу бессерверных функций как сервис. Мы хотим быть на шаг впереди и поэтому проводим для вас настоящий ликбез по бессерверным вычислениям.

На вебинаре Наталия Воронова расскажет, как Serverless упрощает жизнь бизнеса, помогает в цифровой трансформации и экономит ваш бюджет. Вы узнаете, как легко запустить чат-бот, виртуального помощника или веб-сайт с Serverless и сможете задать вопросы на Q&A-сессии.

Вебинар будет интересен всем, кто активно следит за трендами и трансформирует бизнес в любых условиях. Кстати, если вы планируете что-то поменять и мигрировать в российское облако, предлагаем сделать это до конца лета на выгодных условиях.

Подробности расскажем на вебинаре. Присоединяйтесь!
This media is not supported in your browser
VIEW IN TELEGRAM
D2L.ai: Interactive Deep Learning Book with Multi-Framework Code, Math, and Discussions

Github: https://github.com/d2l-ai/d2l-en

Book: https://d2l.ai/

Paper: https://arxiv.org/abs/2106.11342v1

👉 @bigdata_1
👍3🔥1
Различные модели машинного обучения

Машинное обучение (МО) — это одна из областей искусственного интеллекта и информатики, которая с помощью данных и алгоритмов имитирует то, как обучается человек, постепенно улучшая точность.

Мы живем в эпоху данных, где все вокруг нас подключено к источнику данных и записывается в цифровом формате. Например, современный электронный мир обладает огромным количеством различных видов данных из таких сфер, как интернет вещей (IoT), кибербезопасность, умный город, бизнес, смартфоны, социальные сети, здравоохранение, COVID-19 и многих других. Далее

👉 @bigdata_1
👍4
Pyramid Vision Transformer

Image classification, object detection, and semantic segmentation tasks

Github: https://github.com/whai362/PVT

Paper: https://arxiv.org/abs/2106.13797v2

👉 @bigdata_1
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft AutoML - Neural Architecture Search

New one-shot architecture search framework dedicated to vision transformer search

Github: https://github.com/microsoft/AutoML

Paper: https://arxiv.org/abs/2107.00651v1

Models: https://drive.google.com/drive/folders/1NLGAbBF9bA1IUAxKlk2VjgRXhr6RHvRW

Dataset: https://paperswithcode.com/dataset/cifar-10

👉 @bigdata_1
👍3
TensorFlow vs PyTorch в 2021: сравнение фреймворков глубокого обучения

Всем привет! Меня зовут Дмитрий, я занимаюсь разработкой в области компьютерного зрения в команде MTS AI. Так исторически сложилось, что в своей работе я использую, как правило, связку устаревшей версии TensorFlow 1 и Keras. Пришло время двигаться дальше, но прежде чем полностью перейти на TensorFlow 2, я решил сравнить наиболее популярные на сегодня фреймворки глубокого обучения: TensorFlow и PyTorch. Эта статья будет полезна всем Data Scientist'ам, кто желает узнать чуть больше про особенности и производительность TensorFlow и PyTorch.

👉 @bigdata_1
👍3
👍2
Independent Encoder for Deep Hierarchical Unsupervised Image-to-Image Translation

Github: https://github.com/Elvinky/IEGAN

Paper: https://arxiv.org/abs/2107.02494

Datasets: https://github.com/Elvinky/IEGAN/tree/main/dataset

Image-to-Image Translation: https://paperswithcode.com/task/image-to-image-translation

👉 @bigdata_1
👍3
GraphWorld: бенчмарк для графовых нейросетей

https://ai.googleblog.com/2022/05/graphworld-advances-in-graph.html

👉 @bigdata_1
👍2
👍2
👍3
Как импортировать наборы данных Kaggle в Google Colab?

Kaggle используется практически всеми, кто занимается наукой о данных. Эта платформа содержит датасеты для всех областей знаний. Вы можете получить набор данных практически для любого случая использования, включая развлечения, медицину, электронную коммерцию и даже астрономию. Пользователи Kaggle могут попрактиковаться на различных наборах, чтобы проверить свои компетенции в науке о данных и машинном обучении.

В этой статье будет показано, как импортировать наборы данных из Kaggle непосредственно в блокноты Google Colab.

👉 @bigdata_1
👍3