панды

Как использовать Boxplot в Python

Как использовать Boxplot в Python
Ящичковая диаграмма используется для суммирования наборов данных с использованием метода ящичной и усовой диаграмм. Эта функция помогает пользователям правильно понимать сводку данных. Ящичные диаграммы могут быть очень полезны, когда мы хотим знать, как данные распределяются и распространяются. На ящичковой диаграмме для построения данных используются три типа квартилей. Эти значения включают в себя медианное, максимальное, минимальное, статистические значения верхнего и нижнего квартилей. Коробчатая диаграмма суммирует эти данные в 25th, 50th, и 75th процентили. Из этого туториала Вы узнаете, как создавать коробчатые диаграммы на основе заданного набора данных с помощью панды а также морской библиотеки Python.

Предварительное условие

Если вы новый пользователь Python, вам сначала нужно настроить среду, чтобы отображать выходные данные блочного графика. Вы можете использовать любой интерпретатор Python для выполнения кода. В этом уроке я буду использовать Spyder3 выполнить код. Если вы не установили панды а также морской библиотеки раньше, то вы должны запустить следующую команду из терминала, чтобы установить эти библиотеки:

$ pip3 установить pandas seaborn

Коробчатые сюжеты с пандами

В boxplot () метод панды используется для генерации фигурных диаграмм на основе фрейма данных. Этот метод содержит много аргументов; некоторые из этих аргументов используются в примерах ниже. Эта часть руководства будет включать два примера, которые покажут вам, как создавать блочные диаграммы в панды. Вы можете использовать случайно сгенерированные данные в библиотеке NumPy или данные из файла CSV, чтобы сгенерировать коробчатую диаграмму в панды.

Пример 1: ящичные диаграммы на основе случайных значений

Ящичные диаграммы в следующем примере были созданы с использованием NumPy а также панды. Библиотека NumPy используется в скрипте для создания объекта фрейма данных путем создания двумерного массива случайных значений, который содержит 5 строк и 5 столбцов. Содержимое фрейма данных будет напечатано с использованием голова() метод. Далее boxplot () используется для создания блочных диаграмм с синим цветом, размером шрифта 10 и углом поворота 30 градусов для отображения значений столбца.

#!/ usr / bin / env python3
# Импортировать библиотеку pandas
импортировать панд как pd
# Импортировать библиотеку NumPy для создания случайных чисел для массива
импортировать numpy как np
"
Сгенерировать набор данных на основе случайно созданного массива NumPy
и пять значений столбцов
"
dataframe = pd.DataFrame (np.случайный.randn (5,5), columns = ['2016', '2017', '2018',
«2019», «2020»])
 
# Распечатать значения фрейма данных
печать (фрейм данных.глава())
# Отображение блочной диаграммы на основе значений фрейма данных
фрейм данных.boxplot (grid = 'false', color = 'blue', fontsize = 10, rot = 30)

Выход

Следующий вывод появится после выполнения кода.

Пример 2: прямоугольные диаграммы на основе данных CSV

Ящичные диаграммы в следующем примере были созданы на основе данных CSV. Создайте файл CSV с именем банк.csv используя следующие данные.

банк.csv

SL, Client_Name, Account_Type, Gender, Balance
1, Мария Эрнандес, Спасение, Женщина, 120000
2, Мэри Смит, Текущая, Женщина, 40000
3, Дэвид Смит, Текущий, Мужской, 379000
4, Мария Родригес, Спасение, Женщина, 56000
5, Марк Ли, Saving, мужской, 93500
6, Джонатан Бинг, Current, Мужской, 5900
7, Дэниел Уильямс, Спасение, Мужчина, 2300
8, Майк Браун, Текущий, Мужской, 124888
9, Пол Смит, Текущий, Мужской, 59450
10, Мария Лопес, Спасение, Женщина, 487600

В следующем сценарии matplotlib библиотека использовалась для настройки размера фигуры блочной диаграммы и для отображения вывода в строке. Все записи банк.csv файл был загружен с помощью read_csv () метод панды. Затем были напечатаны первые 8 записей фрейма данных с использованием глава() метод. В boxplot () в следующем утверждении использовался метод, чтобы нарисовать фигуру коробчатой ​​диаграммы с использованием красного цвета на основе 'Тип аккаунта' со столбцом с именем 'Остаток средств.'

#!/ usr / bin / env python3
# Импортировать панд для создания коробчатого графика
импортировать панд как pd
# Импортируйте matplotlib, чтобы установить размер рисунка блочной диаграммы
импортировать matplotlib.pyplot как plt
# Импортировать get_ipython для встроенного форматирования вывода
из IPython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'встроенный')
# Настроить размер фигуры
plt.rcParams ['рисунок.figsize '] = (8,4)
# Загрузить набор данных из файла CSV
df = pd.read_csv ("банк.csv ")
# Распечатать первые 8 строк загруженных данных
печать (df.голова (8))
# Отображение коробчатых диаграмм на основе используемых параметров
df.boxplot (by = 'Account_Type', grid = 'True', column = ['Balance'], color = 'red')

Выход

Следующий вывод появится после выполнения кода.

Коробчатые участки с морскими корнями

Еще одна библиотека Python, обычно используемая для рисования коробчатых диаграмм, - это библиотека морской.  Одной из важных особенностей этой библиотеки является то, что она имеет множество встроенных наборов данных для тестирования различных задач. В следующих двух примерах будет рассмотрено использование двух различных наборов данных для построения коробчатых диаграмм с использованием морской библиотека.

Пример 3: прямоугольные диаграммы на основе параметра x

В следующем примере используется образец набора данных с именем 'бриллианты ' из морское дно библиотека для создания коробчатой ​​диаграммы. Здесь стиль сетки определяется с помощью set_style () метод. В load_dataset () используется для загрузки данных из 'бриллианты ' набор данных. Первые пять записей печатаются из набора данных, а boxplot () затем используется метод для построения коробчатой ​​диаграммы на основе столбца с именем 'глубина,'с синим цветом.

# Импортировать библиотеку seaborn для создания коробчатой ​​диаграммы
импортировать seaborn как sns
# Импортируйте matplotlib, чтобы настроить размер фигуры прямоугольной диаграммы
импортировать matplotlib.pyplot как plt
# Импортировать get_ipython для встроенного форматирования вывода
из IPython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'встроенный')
# Настроить стиль сетки
sns.set_style ("белая сетка")
# Настроить размер фигуры
plt.rcParams ['рисунок.figsize '] = (8,4)
# Загрузить образец набора данных
diamond_dataset = sns.load_dataset ('бриллианты')
# Показать первые 5 записей набора данных
печать (diamond_dataset.глава())
# Нарисуйте фигуру коробчатого графика
sns.boxplot (x = diamond_dataset ['глубина'], цвет = 'синий')

Выход

Следующий вывод появится после выполнения кода.

Пример 4: Ящичные диаграммы на основе параметров x и y

В следующем примере используется образец набора данных с именем 'полеты'нарисовать коробчатую диаграмму. Здесь как параметры x, так и y коробчатая диаграмма () метод используются для рисования фигуры. Остальные утверждения аналогичны предыдущему примеру.

# Импортировать библиотеку seaborn для создания коробчатой ​​диаграммы
импортировать seaborn как sns
# Импортируйте matplotlib, чтобы настроить размер фигуры прямоугольной диаграммы
импортировать matplotlib.pyplot как plt
# Импортировать get_ipython для встроенного форматирования вывода
из IPython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'встроенный')
 
# Настроить стиль сетки
sns.set_style ("темная сетка")
# Настроить размер фигуры
plt.rcParams ['рисунок.figsize '] = (12,4)
 
# Загрузить образец набора данных
flight_dataset = sns.load_dataset ('полеты')
# Показать первые 5 записей набора данных
печать (flight_dataset.глава())
 
# Нарисуйте фигуру коробчатого графика
sns.boxplot (x = 'месяц', y = 'пассажиры', data = flight_dataset, color = 'blue')

Выход

Следующий вывод появится после выполнения кода.

Заключение

При работе с большим объемом данных может потребоваться суммировать данные с помощью диаграммы, например прямоугольной диаграммы. В этом руководстве использовалось несколько примеров, чтобы показать вам, как создавать ящичные диаграммы с двумя библиотеками Python.

Добавьте жесты мыши в Windows 10 с помощью этих бесплатных инструментов
В последние годы компьютеры и операционные системы сильно эволюционировали. Было время, когда пользователям приходилось использовать команды для навиг...
Контроль и управление перемещением мыши между несколькими мониторами в Windows 10
Диспетчер мыши с двумя дисплеями позволяет контролировать и настраивать движение мыши между несколькими мониторами, замедляя ее движения возле границы...
WinMouse позволяет настраивать и улучшать движение указателя мыши на ПК с Windows
Если вы хотите улучшить функции указателя мыши по умолчанию, используйте бесплатное ПО WinMouse. Он добавляет дополнительные функции, которые помогут ...