Similar presentations:
2. Лекция 2
1. Анализ данных с помощью Python
Лекция 22. План лекции
Основы Pandas и манипулирование данными➔
➔
➔
Создание, чтение и запись DataFrame
Основные функции и методы Pandas
Манипулирование данными
Очистка данных с помощью Pandas
➔
➔
➔
➔
Выявление и обработка пропущенных значений
Работа с дубликатами
Преобразование типов данных
Обработка аномалий и выбросов
3.
PanDas = Panel Data(«панельные данные»)
Pandas Series (серия) —
это
одномерный
массив.
Визуально он похож на
пронумерованный
список:
слева в колонке находятся
индексы
элементов,
а
справа — сами элементы.
Pandas DataFrame — это
двумерный массив, похожий
на
таблицу/лист
Excel.
Датафрейм
состоит
из
столбцов и строк, причем
столбцы объекты — Series.