- Что такое Python Seaborn?
- Типы участков, которые мы можем построить с помощью Seaborn
- Работа с несколькими графиками
- Некоторые альтернативы Python Seaborn
Это похоже на то, что нужно покрыть. Давай начнем сейчас.
Что такое библиотека Python Seaborn?
Библиотека Seaborn - это пакет Python, который позволяет нам создавать инфографику на основе статистических данных. Поскольку он сделан поверх matplotlib, поэтому он по своей сути совместим с ним. Кроме того, он поддерживает структуру данных NumPy и Pandas, поэтому построение графиков можно выполнять непосредственно из этих коллекций.
Визуализация сложных данных - одна из важнейших задач Seaborn. Если бы мы сравнили Matplotlib с Seaborn, Seaborn может упростить те вещи, которые трудно достичь с помощью Matplotlib. Однако важно отметить, что Seaborn - это не альтернатива Matplotlib, а его дополнение. На протяжении этого урока мы также будем использовать функции Matplotlib во фрагментах кода. Вы выберете работу с Seaborn в следующих случаях использования:
- У вас есть данные статистического временного ряда для построения графика с отображением неопределенности оценок
- Чтобы визуально установить разницу между двумя подмножествами данных
- Для визуализации одномерного и двумерного распределений
- Добавление гораздо большего визуального эффекта к графикам matplotlib с множеством встроенных тем
- Подбирать и визуализировать модели машинного обучения с помощью линейной регрессии с независимыми и зависимыми переменными
Перед тем как начать, обратите внимание на то, что мы используем виртуальную среду для этого урока, который мы сделали с помощью следующей команды:
python -m virtualenv seabornисточник seaborn / bin / activate
Как только виртуальная среда станет активной, мы можем установить библиотеку Seaborn в виртуальной среде, чтобы можно было выполнять следующие примеры:
pip install seabornВы также можете использовать Anaconda для запуска этих примеров, что проще. Если вы хотите установить его на свой компьютер, посмотрите урок, который описывает «Как установить Anaconda Python на Ubuntu 18».04 LTS »и поделитесь своим мнением. Теперь давайте перейдем к различным типам графиков, которые можно построить с помощью Python Seaborn.
Использование набора данных покемонов
Чтобы продолжить этот урок, мы будем использовать набор данных Pokemon, который можно загрузить с Kaggle. Чтобы импортировать этот набор данных в нашу программу, мы будем использовать библиотеку Pandas. Вот весь импорт, который мы выполняем в нашей программе:
импортировать панд как pdиз matplotlib импортировать pyplot как plt
импортировать seaborn как sns
Теперь мы можем импортировать набор данных в нашу программу и показать некоторые образцы данных с помощью Pandas как:
df = pd.read_csv ('Покемон.csv ', index_col = 0)df.глава()
Обратите внимание, что для запуска приведенного выше фрагмента кода набор данных CSV должен находиться в том же каталоге, что и сама программа. Запустив приведенный выше фрагмент кода, мы увидим следующий результат (в записной книжке Anaconda Jupyter):
Построение кривой линейной регрессии
Одна из лучших вещей в Seaborn - это интеллектуальные функции построения графиков, которые он предоставляет, которые не только визуализируют набор данных, который мы ему предоставляем, но и строят вокруг него регрессионные модели. Например, можно построить график линейной регрессии с помощью одной строки кода. Вот как это сделать:
sns.lmplot (x = 'Атака', y = 'Защита', data = df)Запустив приведенный выше фрагмент кода, мы увидим следующий результат:
В приведенном выше фрагменте кода мы заметили несколько важных вещей:
- В Seaborn есть специальная функция построения графиков
- Мы использовали функцию аппроксимации и построения графика Сиборна, которая предоставила нам линию линейной регрессии, которую он сам смоделировал
Не бойтесь, если вы думали, что у нас не может быть сюжета без этой линии регрессии. Мы можем ! Теперь попробуем новый фрагмент кода, похожий на предыдущий:
sns.lmplot (x = 'Атака', y = 'Защита', data = df, fit_reg = False)На этот раз мы не увидим линии регрессии на нашем графике:
Теперь это намного яснее (если нам не нужна линия линейной регрессии). Но это еще не конец. Сиборн позволяет нам изменить этот сюжет, и именно этим мы и займемся.
Построение коробчатых диаграмм
Одна из величайших особенностей Seaborn - это то, как он легко принимает структуру Pandas Dataframes для построения данных. Мы можем просто передать Dataframe в библиотеку Seaborn, чтобы она могла построить из него коробочную диаграмму:
sns.коробчатая диаграмма (данные = df)Запустив приведенный выше фрагмент кода, мы увидим следующий результат:
Мы можем удалить первое чтение итога, так как это выглядит немного неудобно, когда мы на самом деле строим здесь отдельные столбцы:
# Новая диаграмма с использованием stats_df
sns.boxplot (data = stats_df)
Запустив приведенный выше фрагмент кода, мы увидим следующий результат:
Заговор роя с Сиборном
Мы можем построить интуитивно понятный сюжет Swarm с помощью Seaborn. Мы снова будем использовать фрейм данных из Pandas, который мы загрузили ранее, но на этот раз мы будем вызывать функцию show Matplotlib, чтобы показать построенный нами график. Вот фрагмент кода:
sns.set_context ("бумага")sns.swarmplot (x = "Атака", y = "Защита", data = df)
plt.показывать()
Запустив приведенный выше фрагмент кода, мы увидим следующий результат:
Используя контекст Seaborn, мы позволяем Seaborn добавлять индивидуальный подход и плавный дизайн к сюжету. Можно настроить этот график еще больше с помощью настраиваемого размера шрифта, используемого для меток на графике, чтобы облегчить чтение. Для этого мы передадим больше параметров функции set_context, которая работает точно так же, как они звучат. Например, чтобы изменить размер шрифта меток, мы воспользуемся шрифтом.параметр размера. Вот фрагмент кода для модификации:
sns.swarmplot (x = "Атака", y = "Защита", data = df)
plt.показывать()
Запустив приведенный выше фрагмент кода, мы увидим следующий результат:
Размер шрифта для метки был изменен на основе предоставленных нами параметров и значения, связанного со шрифтом.параметр размера. Сиборн является экспертом в том, чтобы сделать сюжет очень интуитивно понятным для практического использования, а это означает, что Seaborn - это не просто практический пакет Python, а фактически то, что мы можем использовать в наших производственных развертываниях.
Добавление заголовка к участкам
Добавлять заголовки к нашим сюжетам легко. Нам просто нужно выполнить простую процедуру использования функций уровня Axes, где мы будем вызывать set_title () функция, как показано в фрагменте кода здесь:
sns.set_context ("бумага", font_scale = 3, rc = "font.размер ": 8", осей.labelize ": 5)my_plot = sns.swarmplot (x = "Атака", y = "Защита", data = df)
my_plot.set_title ("График LH Swarm")
plt.показывать()
Запустив приведенный выше фрагмент кода, мы увидим следующий результат:
Таким образом, мы можем добавить гораздо больше информации к нашим графикам.
Сиборн vs Матплотлиб
Посмотрев на примеры в этом уроке, мы можем определить, что Matplotlib и Seaborn нельзя сравнивать напрямую, но их можно рассматривать как дополняющие друг друга. Одна из особенностей, которая делает Seaborn на шаг впереди, - это способ, которым Seaborn может статистически визуализировать данные.
Чтобы максимально использовать параметры Seaborn, мы настоятельно рекомендуем просмотреть документацию Seaborn и выяснить, какие параметры следует использовать, чтобы сделать ваш участок максимально приближенным к потребностям бизнеса.
Заключение
В этом уроке мы рассмотрели различные аспекты этой библиотеки визуализации данных, которую мы можем использовать с Python для создания красивых и интуитивно понятных графиков, которые могут визуализировать данные в той форме, которая требуется бизнесу от платформы. Seaborm - одна из самых важных библиотек визуализации, когда дело доходит до инженерии данных и представления данных в большинстве визуальных форм, определенно навык, который нам необходимо иметь за плечами, поскольку он позволяет нам строить модели линейной регрессии.
Поделитесь своими отзывами об уроке в Twitter с @sbmaggarwal и @LinuxHint.