панды

Как построить данные в Pandas Python

Как построить данные в Pandas Python
Визуализация данных играет важную роль в анализе данных. Pandas - мощная библиотека анализа данных на Python для науки о данных. Он предоставляет различные варианты визуализации данных с помощью .plot () метод. Даже если вы новичок, вы можете легко построить свои данные с помощью библиотеки Pandas. Вам нужно импортировать панды и matplotlib.пакет pyplot для визуализации данных.

В этой статье мы рассмотрим различные методы построения графиков данных с помощью Python Pandas. Мы выполнили все примеры в редакторе исходного кода pycharm, используя matplotlib.пакет pyplot.

Построение в Pandas Python

В пандах .plot () имеет несколько параметров, которые вы можете использовать в зависимости от ваших потребностей. В основном, используя параметр 'kind', вы можете определить, какой тип графика вы будете создавать.

Синтаксис для построения данных с использованием Pandas Python

Следующий синтаксис используется для построения DataFrame в Pandas Python:

# импортировать панды и matplotlib.Пакеты pyplot
импортировать панд как pd
импортировать matplotlib.pyplot как plt
# Подготовить данные для создания DataFrame
data_frame =
'Столбец1': ['поле1', 'поле2', 'поле3', 'поле4',…],
'Столбец2': ['поле1', 'поле2', 'поле3', 'поле4',…]

var_df = pd.DataFrame (data_frame, columns = ['Column1', 'Column2])
печать (переменная)
# построение гистограммы
var_df.участок.bar (x = 'Столбец1', y = 'Столбец2')
plt.показывать()

Вы также можете определить тип графика, используя параметр kind следующим образом:

var_df.plot (x = 'Column1', y = 'Column2', kind = 'bar')

Объекты Pandas DataFrames имеют следующие методы построения графиков:

Если пользователь использует только метод plot () без использования каких-либо параметров, он создает линейный график по умолчанию.

Теперь мы подробно остановимся на некоторых основных типах построения графиков с помощью некоторых примеров.

Точечная диаграмма в пандах

В этом типе построения мы представили взаимосвязь между двумя переменными. Возьмем пример.

Пример

Например, у нас есть данные о корреляции между двумя переменными GDP_growth и Oil_price. Чтобы построить связь между двумя переменными, мы выполнили следующий фрагмент кода в нашем редакторе исходного кода:

импортировать matplotlib.pyplot как plt
импортировать панд как pd
gdp_cal = pd.DataFrame (
'GDP_growth': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
"Oil_Price": [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (gdp_cal, columns = ['Oil_Price', 'GDP_growth'])
печать (df)
df.plot (x = 'Oil_Price', y = 'GDP_growth', kind = 'scatter', color = 'red')
plt.показывать()

Построение линейных диаграмм в пандах  

График линейной диаграммы - это основной тип построения, при котором заданная информация отображается в виде ряда точек данных, которые далее соединяются сегментами прямых линий. Используя линейные графики, вы также можете отображать тенденции изменения информации во времени.

Пример

В приведенном ниже примере мы взяли данные об уровне инфляции за прошлый год. Сначала подготовьте данные, а затем создайте DataFrame. Следующий исходный код строит линейный график доступных данных:

импортировать панд как pd
импортировать matplotlib.pyplot как plt
infl_cal = 'Год': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
Infl_Rate: [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (infl_cal, columns = ['Year', 'Infl_Rate'])
data_frame.plot (x = 'Year', y = 'Infl_Rate', kind = 'line')
plt.показывать()

В приведенном выше примере вам нужно установить kind = 'line' для построения линейной диаграммы.

Метод 2 # Использование сюжета.line () метод

Приведенный выше пример вы также можете реализовать с помощью следующего метода:

импортировать панд как pd
импортировать matplotlib.pyplot как plt
inf_cal = 'Год': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (inf_cal, columns = ['Inflation_Rate'], index = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.участок.линия()
plt.title («Сводная информация об уровне инфляции за последние 11 лет»)
plt.ylabel ('Inflation_Rate')
plt.xlabel ('Год')
plt.показывать()

После выполнения вышеуказанного кода отобразится следующий линейный график:

Построение гистограмм в пандах

Построение гистограммы используется для представления категориальных данных. На этом типе графика прямоугольные полосы разной высоты строятся на основе заданной информации. Гистограмма может быть построена в двух различных горизонтальных или вертикальных направлениях.

Пример

В следующем примере мы взяли уровень грамотности в нескольких странах. DataFrames создаются, в которых 'Country_Names' и 'literacy_Rate' являются двумя столбцами DataFrame. Используя Pandas, вы можете отобразить информацию в форме гистограммы следующим образом:

импортировать панд как pd
импортировать matplotlib.pyplot как plt
lit_cal =
«Country_Names»: [«Пакистан», «США», «Китай», «Индия», «Великобритания», «Австрия», «Египет», «Украина», «Саудия», «Австралия»,
'Малайзия'],
'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (lit_cal, columns = ['Country_Names', 'litr_Rate'])
печать (data_frame)
data_frame.участок.bar (x = 'Country_Names', y = 'litr_Rate')
plt.показывать()

Вы также можете реализовать приведенный выше пример, используя следующий метод. Установите kind = "bar" для построения гистограммы в этой строке:

data_frame.сюжет (x = 'Country_Names', y = 'litr_Rate', kind = 'bar')
plt.показывать()

Построение горизонтальной гистограммы

Вы также можете нанести данные на горизонтальные полосы, выполнив следующий код:

импортировать matplotlib.pyplot как plt
импортировать панд как pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (data_chart, columns = ['litr_Rate'], index = ['Пакистан', 'США', 'Китай', 'Индия', 'Великобритания', 'Австрия', 'Египет', 'Украина', 'Саудия' , 'Австралия',
'Малайзия'])
df.участок.барх ()
plt.title («Уровень грамотности в разных странах»)
plt.ylabel ('Country_Names')
plt.xlabel ('litr_Rate')
plt.показывать()

В df.участок.barh (), barh используется для горизонтального построения. После выполнения вышеуказанного кода в окне отображается следующая гистограмма:

Построение круговой диаграммы в пандах

Круговая диаграмма представляет данные в круглой графической форме, в которой данные отображаются в виде фрагментов в зависимости от заданного количества.

Пример

В следующем примере мы отобразили информацию о 'Earth_material' в разных частях круговой диаграммы. Сначала создайте DataFrame, затем с помощью панд отобразите все детали на графике.

импортировать панд как pd
импортировать matplotlib.pyplot как plt
material_per = 'Earth_Part': [71,18,7,4]
dataframe = pd.DataFrame (material_per, columns = ['Earth_Part'], index = ['Water', 'Mineral', 'Sand', 'Metals'])
фрейм данных.участок.pie (y = 'Earth_Part', figsize = (7, 7), autopct = '% 1.1f %% ', начальный угол = 90)
plt.показывать()

Приведенный выше исходный код строит круговую диаграмму доступных данных:

Заключение

В этой статье вы увидели, как построить DataFrames в Python Pandas. В статье выше выполняются различные виды построения. Чтобы построить больше видов, таких как box, hexbin, hist, kde, density, area и т. Д., вы можете использовать тот же исходный код, просто изменив тип сюжета.

Курсор прыгает или перемещается случайным образом при наборе текста в Windows 10
Если вы обнаружите, что ваш курсор мыши прыгает или перемещается сам по себе, автоматически, случайным образом при вводе текста на ноутбуке или компью...
Как изменить направление прокрутки мыши и сенсорной панели в Windows 10
Мышь а также Сенсорная панельs не только упрощают вычисления, но и делают их более эффективными и требуют меньше времени. Мы не можем представить себе...
Как изменить указатель мыши и размер курсора, цвет и схему в Windows 10
Указатель мыши и курсор в Windows 10 - очень важные аспекты операционной системы. То же самое можно сказать и о других операционных системах, так что,...