Анализ данных с помощью Python
План лекции
49.32M

2. Лекция 2

1. Анализ данных с помощью Python

Лекция 2

2. План лекции

Основы Pandas и манипулирование данными



Создание, чтение и запись DataFrame
Основные функции и методы Pandas
Манипулирование данными
Очистка данных с помощью Pandas




Выявление и обработка пропущенных значений
Работа с дубликатами
Преобразование типов данных
Обработка аномалий и выбросов

3.

PanDas = Panel Data
(«панельные данные»)
Pandas Series (серия) —
это
одномерный
массив.
Визуально он похож на
пронумерованный
список:
слева в колонке находятся
индексы
элементов,
а
справа — сами элементы.
Pandas DataFrame — это
двумерный массив, похожий
на
таблицу/лист
Excel.
Датафрейм
состоит
из
столбцов и строк, причем
столбцы объекты — Series.
English     Русский Rules