Similar presentations:
CSV в Python
1.
CSV в Python2.
Программисты часто сталкиваются сзадачей обработки больших объемов
структурированных данных. Python имеет
встроенную библиотеку CSV, с помощью
которой программист может работать
со специальными CSV файлами.
Это своего рода электронные таблицы.
3.
Что такое файлы CSVФайл CSV – это особый вид файла, который позволяет структурировать большие
объемы данных.
Пример CSV файла, где в качестве разделителя используется запятая:
Имя, Профессия, Год рождения
Виктор, Токарь, 1995
Сергей,Сварщик,1983
27.03.2022
4.
Библиотека CSVЭта основная библиотека для работы с CSV файлами в Python.
Библиотека csv является встроенной, поэтому её не нужно скачивать,
достаточно использовать обычный импорт:
27.03.2022
5.
Чтение из файлов (парсинг)27.03.2022
6.
Классы DictReader и DictWriter27.03.2022
7.
Запись в файл27.03.2022
8.
Запись в файл27.03.2022
9.
Диалекты27.03.2022
10.
Диалекты27.03.2022
11.
Диалекты27.03.2022
12.
Диалекты27.03.2022
13.
PandasPandas — одна из самых популярных библиотек Python для аналитики и
работы с Data Science. Это как SQL для Python. Все потому, что pandas
позволяет работать с двухмерными таблицами данных в Python. У нее есть
и масса других особенностей. В этой серии руководств по pandas вы
узнаете самое важное (и часто используемое), что необходимо знать
аналитику или специалисту по Data Science. Это первая часть, в которой
речь пойдет об основах.
27.03.2022
14.
PandasИмпортировать numpy и pandas в Jupyter Notebook с помощью двух строк кода:
Информация может храниться в файлах .csv или таблицах SQL. Возможно, в файлах Excel. Или
даже файлах .tsv. Или еще в каком-то другом формате. Но цель всегда одна и та же. Если
необходимо анализировать данные с помощью pandas, нужна структура данных, совместимая
с pandas.
27.03.2022
15.
Структуры данных PythonВ pandas есть два вида структур данных: Series и DataFrame.
Series в pandas — это одномерная структура данных («одномерная ndarray»), которая
хранит данные. Для каждого значения в ней есть уникальный индекс.
27.03.2022
16.
Структуры данных PythonDataFrame — двухмерная структура, состоящая из колонок и строк. У колонок есть
имена, а у строк — индексы.
27.03.2022
17.
Загрузка файла .csv в pandasDataFrame
Для загрузки .csv файла с данными в pandas используется функция read_csv().
Начнем с простого образца под названием zoo. В этот раз для практики предстоит создать файл
.csv. Вот сырые данные:
animal,uniq_id,water_need
elephant,1001,500
elephant,1002,600
elephant,1003,550
tiger,1004,300
tiger,1005,320
27.03.2022
18.
Загрузка файла .csv в pandasDataFrame
Вернемся во вкладку “Home” https://you_ip:you_port/tree Jupyter для создания нового
текстового файла…
27.03.2022
19.
Загрузка файла .csv в pandasDataFrame
27.03.2022
20.
Загрузка файла .csv в pandasDataFrame
Вернемся в Jupyter Notebook (который называется «pandas_tutorial_1») и откроем в нем этот .csv
файл!
pd.read_csv('zoo.csv', delimiter=',')
Это файл zoo.csv, перенесенный в pandas. Это двухмерная таблица — DataFrame. Числа слева — это
индексы. А названия колонок вверху взяты из первой строки файла zoo.csv.
27.03.2022
21.
Чтение из файлов (парсинг)27.03.2022