Наука о данных

Учебник Python Seaborn

Учебник Python Seaborn
В этом уроке, посвященном библиотеке Python Seaborn, мы рассмотрим различные аспекты этой библиотеки визуализации данных, которую мы можем использовать с Python для создания красивых и интуитивно понятных графиков, которые могут визуализировать данные в той форме, которая требуется бизнесу от платформы. Чтобы завершить этот урок, мы рассмотрим следующие разделы:

Это похоже на то, что нужно покрыть. Давай начнем сейчас.

Что такое библиотека Python Seaborn?

Библиотека Seaborn - это пакет Python, который позволяет нам создавать инфографику на основе статистических данных. Поскольку он сделан поверх matplotlib, поэтому он по своей сути совместим с ним. Кроме того, он поддерживает структуру данных NumPy и Pandas, поэтому построение графиков можно выполнять непосредственно из этих коллекций.

Визуализация сложных данных - одна из важнейших задач Seaborn. Если бы мы сравнили Matplotlib с Seaborn, Seaborn может упростить те вещи, которые трудно достичь с помощью Matplotlib. Однако важно отметить, что Seaborn - это не альтернатива Matplotlib, а его дополнение. На протяжении этого урока мы также будем использовать функции Matplotlib во фрагментах кода. Вы выберете работу с Seaborn в следующих случаях использования:

Перед тем как начать, обратите внимание на то, что мы используем виртуальную среду для этого урока, который мы сделали с помощью следующей команды:

python -m virtualenv seaborn
источник seaborn / bin / activate

Как только виртуальная среда станет активной, мы можем установить библиотеку Seaborn в виртуальной среде, чтобы можно было выполнять следующие примеры:

pip install seaborn

Вы также можете использовать Anaconda для запуска этих примеров, что проще. Если вы хотите установить его на свой компьютер, посмотрите урок, который описывает «Как установить Anaconda Python на Ubuntu 18».04 LTS »и поделитесь своим мнением. Теперь давайте перейдем к различным типам графиков, которые можно построить с помощью Python Seaborn.

Использование набора данных покемонов

Чтобы продолжить этот урок, мы будем использовать набор данных Pokemon, который можно загрузить с Kaggle. Чтобы импортировать этот набор данных в нашу программу, мы будем использовать библиотеку Pandas. Вот весь импорт, который мы выполняем в нашей программе:

импортировать панд как pd
из matplotlib импортировать pyplot как plt
импортировать seaborn как sns

Теперь мы можем импортировать набор данных в нашу программу и показать некоторые образцы данных с помощью Pandas как:

df = pd.read_csv ('Покемон.csv ', index_col = 0)
df.глава()

Обратите внимание, что для запуска приведенного выше фрагмента кода набор данных CSV должен находиться в том же каталоге, что и сама программа. Запустив приведенный выше фрагмент кода, мы увидим следующий результат (в записной книжке Anaconda Jupyter):

Построение кривой линейной регрессии

Одна из лучших вещей в Seaborn - это интеллектуальные функции построения графиков, которые он предоставляет, которые не только визуализируют набор данных, который мы ему предоставляем, но и строят вокруг него регрессионные модели. Например, можно построить график линейной регрессии с помощью одной строки кода. Вот как это сделать:

sns.lmplot (x = 'Атака', y = 'Защита', data = df)

Запустив приведенный выше фрагмент кода, мы увидим следующий результат:

В приведенном выше фрагменте кода мы заметили несколько важных вещей:

Не бойтесь, если вы думали, что у нас не может быть сюжета без этой линии регрессии. Мы можем ! Теперь попробуем новый фрагмент кода, похожий на предыдущий:

sns.lmplot (x = 'Атака', y = 'Защита', data = df, fit_reg = False)

На этот раз мы не увидим линии регрессии на нашем графике:

Теперь это намного яснее (если нам не нужна линия линейной регрессии). Но это еще не конец. Сиборн позволяет нам изменить этот сюжет, и именно этим мы и займемся.

Построение коробчатых диаграмм

Одна из величайших особенностей Seaborn - это то, как он легко принимает структуру Pandas Dataframes для построения данных. Мы можем просто передать Dataframe в библиотеку Seaborn, чтобы она могла построить из него коробочную диаграмму:

sns.коробчатая диаграмма (данные = df)

Запустив приведенный выше фрагмент кода, мы увидим следующий результат:

Мы можем удалить первое чтение итога, так как это выглядит немного неудобно, когда мы на самом деле строим здесь отдельные столбцы:

stats_df = df.drop (['Всего'], ось = 1)
# Новая диаграмма с использованием stats_df
sns.boxplot (data = stats_df)

Запустив приведенный выше фрагмент кода, мы увидим следующий результат:

Заговор роя с Сиборном

Мы можем построить интуитивно понятный сюжет Swarm с помощью Seaborn. Мы снова будем использовать фрейм данных из Pandas, который мы загрузили ранее, но на этот раз мы будем вызывать функцию show Matplotlib, чтобы показать построенный нами график. Вот фрагмент кода:

sns.set_context ("бумага")
sns.swarmplot (x = "Атака", y = "Защита", data = df)
plt.показывать()

Запустив приведенный выше фрагмент кода, мы увидим следующий результат:

Используя контекст Seaborn, мы позволяем Seaborn добавлять индивидуальный подход и плавный дизайн к сюжету. Можно настроить этот график еще больше с помощью настраиваемого размера шрифта, используемого для меток на графике, чтобы облегчить чтение. Для этого мы передадим больше параметров функции set_context, которая работает точно так же, как они звучат. Например, чтобы изменить размер шрифта меток, мы воспользуемся шрифтом.параметр размера. Вот фрагмент кода для модификации:

sns.set_context ("бумага", font_scale = 3, rc = "font.размер ": 8", осей.labelize ": 5)
sns.swarmplot (x = "Атака", y = "Защита", data = df)
plt.показывать()

Запустив приведенный выше фрагмент кода, мы увидим следующий результат:

Размер шрифта для метки был изменен на основе предоставленных нами параметров и значения, связанного со шрифтом.параметр размера. Сиборн является экспертом в том, чтобы сделать сюжет очень интуитивно понятным для практического использования, а это означает, что Seaborn - это не просто практический пакет Python, а фактически то, что мы можем использовать в наших производственных развертываниях.

Добавление заголовка к участкам

Добавлять заголовки к нашим сюжетам легко. Нам просто нужно выполнить простую процедуру использования функций уровня Axes, где мы будем вызывать set_title () функция, как показано в фрагменте кода здесь:

sns.set_context ("бумага", font_scale = 3, rc = "font.размер ": 8", осей.labelize ": 5)
my_plot = sns.swarmplot (x = "Атака", y = "Защита", data = df)
my_plot.set_title ("График LH Swarm")
plt.показывать()

Запустив приведенный выше фрагмент кода, мы увидим следующий результат:

Таким образом, мы можем добавить гораздо больше информации к нашим графикам.

Сиборн vs Матплотлиб

Посмотрев на примеры в этом уроке, мы можем определить, что Matplotlib и Seaborn нельзя сравнивать напрямую, но их можно рассматривать как дополняющие друг друга. Одна из особенностей, которая делает Seaborn на шаг впереди, - это способ, которым Seaborn может статистически визуализировать данные.

Чтобы максимально использовать параметры Seaborn, мы настоятельно рекомендуем просмотреть документацию Seaborn и выяснить, какие параметры следует использовать, чтобы сделать ваш участок максимально приближенным к потребностям бизнеса.

Заключение

В этом уроке мы рассмотрели различные аспекты этой библиотеки визуализации данных, которую мы можем использовать с Python для создания красивых и интуитивно понятных графиков, которые могут визуализировать данные в той форме, которая требуется бизнесу от платформы. Seaborm - одна из самых важных библиотек визуализации, когда дело доходит до инженерии данных и представления данных в большинстве визуальных форм, определенно навык, который нам необходимо иметь за плечами, поскольку он позволяет нам строить модели линейной регрессии.

Поделитесь своими отзывами об уроке в Twitter с @sbmaggarwal и @LinuxHint.

Курсор прыгает или перемещается случайным образом при наборе текста в Windows 10
Если вы обнаружите, что ваш курсор мыши прыгает или перемещается сам по себе, автоматически, случайным образом при вводе текста на ноутбуке или компью...
Как изменить направление прокрутки мыши и сенсорной панели в Windows 10
Мышь а также Сенсорная панельs не только упрощают вычисления, но и делают их более эффективными и требуют меньше времени. Мы не можем представить себе...
Как изменить указатель мыши и размер курсора, цвет и схему в Windows 10
Указатель мыши и курсор в Windows 10 - очень важные аспекты операционной системы. То же самое можно сказать и о других операционных системах, так что,...