3.04M
Category: softwaresoftware

CSV в Python

1.

CSV в Python

2.

Программисты часто сталкиваются с
задачей обработки больших объемов
структурированных данных. Python имеет
встроенную библиотеку CSV, с помощью
которой программист может работать
со специальными CSV файлами.
Это своего рода электронные таблицы.

3.

Что такое файлы CSV
Файл CSV – это особый вид файла, который позволяет структурировать большие
объемы данных.
Пример CSV файла, где в качестве разделителя используется запятая:
Имя, Профессия, Год рождения
Виктор, Токарь, 1995
Сергей,Сварщик,1983
27.03.2022

4.

Библиотека CSV
Эта основная библиотека для работы с CSV файлами в Python.
Библиотека csv является встроенной, поэтому её не нужно скачивать,
достаточно использовать обычный импорт:
27.03.2022

5.

Чтение из файлов (парсинг)
27.03.2022

6.

Классы DictReader и DictWriter
27.03.2022

7.

Запись в файл
27.03.2022

8.

Запись в файл
27.03.2022

9.

Диалекты
27.03.2022

10.

Диалекты
27.03.2022

11.

Диалекты
27.03.2022

12.

Диалекты
27.03.2022

13.

Pandas
Pandas — одна из самых популярных библиотек Python для аналитики и
работы с Data Science. Это как SQL для Python. Все потому, что pandas
позволяет работать с двухмерными таблицами данных в Python. У нее есть
и масса других особенностей. В этой серии руководств по pandas вы
узнаете самое важное (и часто используемое), что необходимо знать
аналитику или специалисту по Data Science. Это первая часть, в которой
речь пойдет об основах.
27.03.2022

14.

Pandas
Импортировать numpy и pandas в Jupyter Notebook с помощью двух строк кода:
Информация может храниться в файлах .csv или таблицах SQL. Возможно, в файлах Excel. Или
даже файлах .tsv. Или еще в каком-то другом формате. Но цель всегда одна и та же. Если
необходимо анализировать данные с помощью pandas, нужна структура данных, совместимая
с pandas.
27.03.2022

15.

Структуры данных Python
В pandas есть два вида структур данных: Series и DataFrame.
Series в pandas — это одномерная структура данных («одномерная ndarray»), которая
хранит данные. Для каждого значения в ней есть уникальный индекс.
27.03.2022

16.

Структуры данных Python
DataFrame — двухмерная структура, состоящая из колонок и строк. У колонок есть
имена, а у строк — индексы.
27.03.2022

17.

Загрузка файла .csv в pandas
DataFrame
Для загрузки .csv файла с данными в pandas используется функция read_csv().
Начнем с простого образца под названием zoo. В этот раз для практики предстоит создать файл
.csv. Вот сырые данные:
animal,uniq_id,water_need
elephant,1001,500
elephant,1002,600
elephant,1003,550
tiger,1004,300
tiger,1005,320
27.03.2022

18.

Загрузка файла .csv в pandas
DataFrame
Вернемся во вкладку “Home” https://you_ip:you_port/tree Jupyter для создания нового
текстового файла…
27.03.2022

19.

Загрузка файла .csv в pandas
DataFrame
27.03.2022

20.

Загрузка файла .csv в pandas
DataFrame
Вернемся в Jupyter Notebook (который называется «pandas_tutorial_1») и откроем в нем этот .csv
файл!
pd.read_csv('zoo.csv', delimiter=',')
Это файл zoo.csv, перенесенный в pandas. Это двухмерная таблица — DataFrame. Числа слева — это
индексы. А названия колонок вверху взяты из первой строки файла zoo.csv.
27.03.2022

21.

Чтение из файлов (парсинг)
27.03.2022
English     Русский Rules