Работаем с данными
pandas - это мощный инструмент для анализа данных в Python. С помощью данного фреймворка, работа с «реляционными» или «помеченными» данными простой и интуитивно понятной. Сегодня мы применим его для модификации
Чтобы загрузить датафрейм из файла (пример), используем метод
Применим фильтр по полю
В
Для удаления одной или нескольких колонок можно использовать метод
При сохранении в файл мы можем дополнительно указать
#pandas
pandas - это мощный инструмент для анализа данных в Python. С помощью данного фреймворка, работа с «реляционными» или «помеченными» данными простой и интуитивно понятной. Сегодня мы применим его для модификации
csv
файла.Чтобы загрузить датафрейм из файла (пример), используем метод
pd.read_csv()
.Применим фильтр по полю
sepal.length > 5
. В SQL данная операция выглядела бы таким образом:SELECT * FROM df WHERE sepal.length > 5
.В
pandas
же для получения необходимых строк фрейма можем использовать метод loc
, передав в нее необходимый фильтр: df = df.loc[df['sepal.length'] > 5]
Для удаления одной или нескольких колонок можно использовать метод
df.drop()
:df = df.drop(columns=['petal.width', 'petal.length'])
При сохранении в файл мы можем дополнительно указать
pandas
не добавлять генерирующийся индекс строкам, если он нам не нужен:df.to_csv('new_iris.csv', index = False)
#pandas