Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
🐍🗺️ Геокодирование для Data Scientists: вводное руководство с примерами
Может возникнуть ситуация, когда набор данных содержит адрес, но широта и долгота отсутствуют. В этом случае первым шагом для дополнения данных будет добавление этой пары координат. Этот процесс преобразования адреса в широту и долготу называется геокодированием.
В новой статье разбираем три различных способа геокодирования с помощью Geopy.
🔗 Читать статью
🔗 Зеркало
Может возникнуть ситуация, когда набор данных содержит адрес, но широта и долгота отсутствуют. В этом случае первым шагом для дополнения данных будет добавление этой пары координат. Этот процесс преобразования адреса в широту и долготу называется геокодированием.
В новой статье разбираем три различных способа геокодирования с помощью Geopy.
🔗 Читать статью
🔗 Зеркало
Для чего используют gradient clipping (обрезку градиентов) при обучении DL-моделей?
Anonymous Quiz
53%
Чтобы предотвратить слишком сильный рост градиентов и несходимость модели
18%
Для снижения вычислительных затрат на расчёт градиентов
10%
Чтобы стимулировать рост градиентов и ускорить сходимость
19%
Чтобы предотвратить переобучение
✍️ Разбор задач прошедшей недели
1️⃣ У нас были два вопроса по np.nan. Давайте поясним, что это вообще такое.
NaN — это сокращение для Not a number. Это значит, что np.nan применяют для обозначения нечисловых значений. В NumPy nan имеет тип данных float. Его можно использовать как заглушку для значений в массиве, если для вас неважно, каким было оригинальное значение.
▪️np.nan не равно себе же. Выражение np.nan == np.nan всегда будет возвращать False. Поэтому в некоторых случаях следует пользоваться функцией np.isnan().
▪️Любая арифметическая операция с np.nan будет возвращать np.nan.
2️⃣ В этой задаче была допущена банальная синтаксическая ошибка. Для доступа к элементам списка следует использовать квадратные скобки. Правильной записью была бы такая: print(phrase[0]). И вывела бы она 'Добрый день'.
Нередко именно такие глупые ошибки могут стать загвоздкой и мешать вашему коду корректно исполняться 👾
#разбор_задач
1️⃣ У нас были два вопроса по np.nan. Давайте поясним, что это вообще такое.
NaN — это сокращение для Not a number. Это значит, что np.nan применяют для обозначения нечисловых значений. В NumPy nan имеет тип данных float. Его можно использовать как заглушку для значений в массиве, если для вас неважно, каким было оригинальное значение.
▪️np.nan не равно себе же. Выражение np.nan == np.nan всегда будет возвращать False. Поэтому в некоторых случаях следует пользоваться функцией np.isnan().
▪️Любая арифметическая операция с np.nan будет возвращать np.nan.
2️⃣ В этой задаче была допущена банальная синтаксическая ошибка. Для доступа к элементам списка следует использовать квадратные скобки. Правильной записью была бы такая: print(phrase[0]). И вывела бы она 'Добрый день'.
Нередко именно такие глупые ошибки могут стать загвоздкой и мешать вашему коду корректно исполняться 👾
#разбор_задач
В модели Transformer какой компонент использует multi-head self-attention?
Anonymous Quiz
26%
Энкодер
21%
Декодер
46%
Оба
6%
Ни один
🧑💻 Статьи для IT: как объяснять и распространять значимые идеи
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Примерно какой процент данных находится на расстоянии не более одного стандартного отклонения от среднего в нормальном распределении?
Anonymous Quiz
21%
Около 34%
57%
Около 68%
16%
Около 95%
6%
Около 99.7%
Столбец с каким названием будет выведен в результате выполнения кода выше?
Anonymous Quiz
7%
Expenses
11%
E
26%
Profit
56%
P
Самые полезные каналы для программистов в одной подборке!
Сохраняйте себе, чтобы не потерять 💾
🔥Для всех
Библиотека программиста — новости, статьи, досуг, фундаментальные темы
Книги для программистов
IT-мемы
Proglib Academy — тут мы рассказываем про обучение и курсы
#️⃣C#
Книги для шарпистов | C#, .NET, F#
Библиотека шарписта — полезные статьи, новости и обучающие материалы по C#
Библиотека задач по C# — код, квизы и тесты
Библиотека собеса по C# — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Вакансии по C#, .NET, Unity Вакансии по PHP, Symfony, Laravel
☁️DevOps
Библиотека devops’а — полезные статьи, новости и обучающие материалы по DevOps
Вакансии по DevOps & SRE
Библиотека задач по DevOps — код, квизы и тесты
Библиотека собеса по DevOps — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
🐘PHP
Библиотека пхпшника — полезные статьи, новости и обучающие материалы по PHP
Вакансии по PHP, Symfony, Laravel
Библиотека PHP для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по PHP — код, квизы и тесты
🐍Python
Библиотека питониста — полезные статьи, новости и обучающие материалы по Python
Вакансии по питону, Django, Flask
Библиотека Python для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Python — код, квизы и тесты
☕Java
Библиотека джависта — полезные статьи по Java, новости и обучающие материалы
Библиотека Java для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Java — код, квизы и тесты
Вакансии для java-разработчиков
👾Data Science
Книги для дата сайентистов | Data Science
Библиотека Data Science — полезные статьи, новости и обучающие материалы по Data Science
Библиотека Data Science для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Data Science — код, квизы и тесты
Вакансии по Data Science, анализу данных, аналитике, искусственному интеллекту
🦫Go
Книги для Go разработчиков
Библиотека Go разработчика — полезные статьи, новости и обучающие материалы по Go
Библиотека Go для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Go — код, квизы и тесты
Вакансии по Go
🧠C++
Книги для C/C++ разработчиков
Библиотека C/C++ разработчика — полезные статьи, новости и обучающие материалы по C++
Библиотека C++ для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по C++ — код, квизы и тесты
Вакансии по C++
💻Другие профильные каналы
Библиотека фронтендера
Библиотека мобильного разработчика
Библиотека хакера
Библиотека тестировщика
💼Каналы с вакансиями
Вакансии по фронтенду, джаваскрипт, React, Angular, Vue
Вакансии для мобильных разработчиков
Вакансии по QA тестированию
InfoSec Jobs — вакансии по информационной безопасности
📁Чтобы добавить папку с нашими каналами, нажмите 👉сюда👈
🤖Также у нас есть боты:
Бот с IT-вакансиями
Бот с мероприятиями в сфере IT
Мы в других соцсетях:
🔸VK
🔸YouTube
🔸Дзен
🔸Facebook *
🔸Instagram *
* Организация Meta запрещена на территории РФ
Сохраняйте себе, чтобы не потерять 💾
🔥Для всех
Библиотека программиста — новости, статьи, досуг, фундаментальные темы
Книги для программистов
IT-мемы
Proglib Academy — тут мы рассказываем про обучение и курсы
#️⃣C#
Книги для шарпистов | C#, .NET, F#
Библиотека шарписта — полезные статьи, новости и обучающие материалы по C#
Библиотека задач по C# — код, квизы и тесты
Библиотека собеса по C# — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Вакансии по C#, .NET, Unity Вакансии по PHP, Symfony, Laravel
☁️DevOps
Библиотека devops’а — полезные статьи, новости и обучающие материалы по DevOps
Вакансии по DevOps & SRE
Библиотека задач по DevOps — код, квизы и тесты
Библиотека собеса по DevOps — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
🐘PHP
Библиотека пхпшника — полезные статьи, новости и обучающие материалы по PHP
Вакансии по PHP, Symfony, Laravel
Библиотека PHP для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по PHP — код, квизы и тесты
🐍Python
Библиотека питониста — полезные статьи, новости и обучающие материалы по Python
Вакансии по питону, Django, Flask
Библиотека Python для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Python — код, квизы и тесты
☕Java
Библиотека джависта — полезные статьи по Java, новости и обучающие материалы
Библиотека Java для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Java — код, квизы и тесты
Вакансии для java-разработчиков
👾Data Science
Книги для дата сайентистов | Data Science
Библиотека Data Science — полезные статьи, новости и обучающие материалы по Data Science
Библиотека Data Science для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Data Science — код, квизы и тесты
Вакансии по Data Science, анализу данных, аналитике, искусственному интеллекту
🦫Go
Книги для Go разработчиков
Библиотека Go разработчика — полезные статьи, новости и обучающие материалы по Go
Библиотека Go для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Go — код, квизы и тесты
Вакансии по Go
🧠C++
Книги для C/C++ разработчиков
Библиотека C/C++ разработчика — полезные статьи, новости и обучающие материалы по C++
Библиотека C++ для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по C++ — код, квизы и тесты
Вакансии по C++
💻Другие профильные каналы
Библиотека фронтендера
Библиотека мобильного разработчика
Библиотека хакера
Библиотека тестировщика
💼Каналы с вакансиями
Вакансии по фронтенду, джаваскрипт, React, Angular, Vue
Вакансии для мобильных разработчиков
Вакансии по QA тестированию
InfoSec Jobs — вакансии по информационной безопасности
📁Чтобы добавить папку с нашими каналами, нажмите 👉сюда👈
🤖Также у нас есть боты:
Бот с IT-вакансиями
Бот с мероприятиями в сфере IT
Мы в других соцсетях:
🔸VK
🔸YouTube
🔸Дзен
🔸Facebook *
🔸Instagram *
* Организация Meta запрещена на территории РФ
Нужно ли масштабирование признаков в Наивном Байесе?
Anonymous Quiz
35%
Нет, в основном не нужно
29%
Нужно, гарантирует, что все признаки вносят равный вклад в классификацию
30%
Нужно, снижает влияние выбросов на оценки вероятностей
7%
Нужно, повышает точность на данных с дисбалансом
Формула какой функции активации изображена на картинке выше?
Anonymous Quiz
19%
Сигмоида
61%
Гиперболический тангенс
13%
ReLU
7%
Leaky ReLU
✍️ Разбор задач прошедшей недели
1️⃣ Функция DataFrame.rename в Pandas позволяет переименовать столбцы. Однако, как и многие другие функции, она применяется не inplace по умолчанию, то есть она возвращает новый объект DataFrame с изменениями, не затрагивая исходный объект. Чтобы изменения применились к исходному объекту DataFrame, необходимо использовать аргумент inplace=True.
По этой причине код выведет столбец с названием Profit.
2️⃣ Функция divmod в Python принимает два аргумента и возвращает пару чисел, состоящую из частного и остатка от деления первого аргумента на второй. В случае с divmod(15, 4) выведется кортеж (3, 3). Таким образом, sum в качестве аргументов передаётся следующее: (3, 3) и 2. 2 служит здесь начальным значением для суммирования, к которому добавляется сумма элементов кортежа (3, 3).
3️⃣ Наивный Байес — это довольно простой алгоритм. Он работает на предположении, что все признаки в наборе данных независимы друг от друга. Благодаря этому алгоритм может использовать принцип условной вероятности. Так, он учитывает вероятности появления определённых признаков при наличии конкретного класса.
В отличие от многих других алгоритмов машинного обучения Наивный Байес не рассчитывает расстояния между точками, из-за этого он не чувствителен к масштабу признаков.
#разбор_задач
1️⃣ Функция DataFrame.rename в Pandas позволяет переименовать столбцы. Однако, как и многие другие функции, она применяется не inplace по умолчанию, то есть она возвращает новый объект DataFrame с изменениями, не затрагивая исходный объект. Чтобы изменения применились к исходному объекту DataFrame, необходимо использовать аргумент inplace=True.
По этой причине код выведет столбец с названием Profit.
2️⃣ Функция divmod в Python принимает два аргумента и возвращает пару чисел, состоящую из частного и остатка от деления первого аргумента на второй. В случае с divmod(15, 4) выведется кортеж (3, 3). Таким образом, sum в качестве аргументов передаётся следующее: (3, 3) и 2. 2 служит здесь начальным значением для суммирования, к которому добавляется сумма элементов кортежа (3, 3).
3️⃣ Наивный Байес — это довольно простой алгоритм. Он работает на предположении, что все признаки в наборе данных независимы друг от друга. Благодаря этому алгоритм может использовать принцип условной вероятности. Так, он учитывает вероятности появления определённых признаков при наличии конкретного класса.
В отличие от многих других алгоритмов машинного обучения Наивный Байес не рассчитывает расстояния между точками, из-за этого он не чувствителен к масштабу признаков.
#разбор_задач
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.
В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги
👉Подписаться👈
В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги
👉Подписаться👈
О чём говорит Центральная предельная теорема (ЦПТ)?
Anonymous Quiz
48%
При росте размера выборки её среднее приближается к среднему генеральной совокупности.
45%
Распределение суммы независимых случайных величин приближается к нормальному, если выборка велика
3%
Дисперсия случайной выборки увеличивается пропорционально размеру выборки
4%
Вероятность появления редкого события стремится к нулю при увеличении числа испытаний