Также есть возможность сохранить дизайн графиков в автономном режиме, чтобы их можно было легко экспортировать. Есть много других функций, которые упрощают использование библиотеки:
- Сохраняйте графики для использования в автономном режиме в виде векторной графики, оптимизированной для печати и публикации
- Экспортируемые диаграммы имеют формат JSON, а не формат изображения. Этот JSON можно легко загрузить в другие инструменты визуализации, такие как Tableau, или управлять им с помощью Python или R
- Поскольку экспортируемые графики по своей природе являются JSON, их практически очень легко встроить в веб-приложение
- Plotly - хорошая альтернатива Matplotlib для визуализации
Чтобы начать использовать пакет Plotly, нам необходимо зарегистрировать учетную запись на веб-сайте, упомянутом ранее, чтобы получить действительное имя пользователя и ключ API, с которым мы можем начать использовать его функции. К счастью, для Plotly доступен бесплатный тарифный план, благодаря которому мы получаем достаточно функций для создания графиков производственного уровня.
Установка Plotly
Обратите внимание, перед тем как начать, вы можете использовать виртуальную среду для этого урока, что можно сделать с помощью следующей команды:
python -m virtualenv сюжетноисточник numpy / bin / активировать
После того, как виртуальная среда станет активной, вы можете установить библиотеку Plotly в виртуальной среде, чтобы можно было выполнять следующие примеры:
pip install plotlyВ этом уроке мы будем использовать Anaconda и Jupyter. Если вы хотите установить его на свой компьютер, посмотрите урок, который описывает «Как установить Anaconda Python на Ubuntu 18».04 LTS »и поделитесь своим мнением, если у вас возникнут проблемы. Чтобы установить Plotly с Anaconda, используйте следующую команду в терминале от Anaconda:
conda install -c plotly plotlyМы видим что-то подобное, когда выполняем указанную выше команду:
После того, как все необходимые пакеты установлены и выполнены, мы можем начать использовать библиотеку Plotly с помощью следующего оператора импорта:
Импортировать сюжетноПосле того, как вы создали учетную запись на Plotly, вам потребуются две вещи - имя пользователя учетной записи и ключ API. К каждой учетной записи может принадлежать только один ключ API. Так что храните его в безопасном месте, так как если вы его потеряете, вам придется восстановить ключ, и все старые приложения, использующие старый ключ, перестанут работать.
Во всех программах Python, которые вы пишете, укажите следующие учетные данные, чтобы начать работу с Plotly:
хитроумно.инструменты.set_credentials_file (username = 'username', api_key = 'your-api-key')Приступим к работе с этой библиотекой сейчас.
Начало работы с Plotly
В нашей программе мы будем использовать следующий импорт:
импортировать панд как pdимпортировать numpy как np
импортировать scipy как sp
Импортировать сюжетно.сюжетно как ру
Мы используем:
- Панды для эффективного чтения файлов CSV
- NumPy для простых табличных операций
- Scipy для научных расчетов
- Сюжет для визуализации
Для некоторых примеров мы будем использовать собственные наборы данных Plotly, доступные на Github. Наконец, обратите внимание, что вы также можете включить автономный режим для Plotly, когда вам нужно запускать скрипты Plotly без сетевого подключения:
импортировать панд как pdимпортировать numpy как np
импортировать scipy как sp
Импортировать сюжетно
хитроумно.не в сети.init_notebook_mode (подключено = True)
Импортировать сюжетно.офлайн как py
Вы можете запустить следующую инструкцию, чтобы проверить установку Plotly:
печать (плотно.__версия__)Мы видим что-то подобное, когда выполняем указанную выше команду:
Наконец, мы загрузим набор данных с помощью Pandas и визуализируем его в виде таблицы:
Импортировать сюжетно.figure_factory как ffdf = pd.read_csv ("https: // необработанный.githubusercontent.com / plotly / datasets / master / school_
заработок.csv ")
таблица = ff.create_table (df)
ру.iplot (таблица, имя файла = 'таблица')
Мы видим что-то подобное, когда выполняем указанную выше команду:
Теперь построим Гистограмма для визуализации данных:
Импортировать сюжетно.graph_objs как идутdata = [перейти.Бар (x = df.Школа, y = df.Женщины)]
ру.iplot (данные, имя файла = 'женский бар')
Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:
Когда вы видите приведенную выше диаграмму с блокнотом Jupyter, вам будут представлены различные варианты увеличения / уменьшения масштаба в определенном разделе диаграммы, выбора окна и лассо и многое другое.
Сгруппированные гистограммы
С помощью Plotly можно легко сгруппировать несколько гистограмм для сравнения. Давайте воспользуемся одним и тем же набором данных для этого и покажем различия в присутствии мужчин и женщин в университетах:
женщины = иди.Бар (x = df.Школа, y = df.Женщины)мужчины = иди.Бар (x = df.Школа, y = df.Мужчины)
data = [мужчины, женщины]
layout = go.Макет (barmode = "group")
фиг = идти.Рисунок (данные = данные, макет = макет)
ру.iplot (рис)
Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:
Хотя это выглядит хорошо, надписи в правом верхнем углу нет, исправьте! Исправим их:
женщины = иди.Бар (x = df.Школа, y = df.Женщины, name = "Women")мужчины = иди.Бар (x = df.Школа, y = df.Мужчины, name = "Мужчины")
Теперь график выглядит более наглядным:
Попробуем изменить режим бара:
layout = go.Макет (barmode = "relative")фиг = идти.Рисунок (данные = данные, макет = макет)
ру.iplot (рис)
Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:
Круговые диаграммы с Plotly
Теперь мы попытаемся построить круговую диаграмму с помощью Plotly, которая установит базовую разницу между процентом женщин во всех университетах. Названия университетов будут на этикетках, а фактические числа будут использоваться для расчета процента от общего количества. Вот фрагмент кода для того же:
след = идти.Пирог (label = df.Школа, ценности = df.Женщины)ру.iplot ([трассировка], имя файла = 'пирог')
Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:
Хорошо то, что в Plotly есть множество функций увеличения и уменьшения масштаба, а также множество других инструментов для взаимодействия с построенной диаграммой.
Визуализация данных временных рядов с помощью Plotly
Визуализация данных временных рядов - одна из самых важных задач, с которыми сталкивается аналитик данных или инженер данных.
В этом примере мы будем использовать отдельный набор данных в том же репозитории GitHub, поскольку более ранние данные не включали конкретно данные с отметкой времени. Как и здесь, мы построим график изменения рыночных запасов Apple с течением времени:
financial = pd.read_csv ("https: // необработанный.githubusercontent.com / plotly / datasets / master /финансы-диаграммы-яблоко.csv ")
data = [перейти.Scatter (x = финансовый.Дата, y = финансовый ['AAPL.Закрывать'])]
ру.iplot (данные)
Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:
Как только вы наведете указатель мыши на линию вариации графика, вы сможете указать детали точки:
Мы можем использовать кнопки увеличения и уменьшения, чтобы видеть данные, относящиеся к каждой неделе.
График OHLC
Диаграмма OHLC (Open High Low Close) используется для отображения вариаций объекта за определенный промежуток времени. Это легко построить с помощью PyPlot:
from datetime import datetimeopen_data = [33.0, 35.3, 33.5, 33.0, 34.1]
high_data = [33.1, 36.3, 33.6, 33.2, 34.8]
low_data = [32.7, 32.7, 32.8, 32.6, 32.8]
close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
даты = [datetime (год = 2013, месяц = 10, день = 10),
datetime (год = 2013, месяц = 11, день = 10),
datetime (год = 2013, месяц = 12, день = 10),
datetime (год = 2014, месяц = 1, день = 10),
datetime (год = 2014, месяц = 2, день = 10)]
след = идти.Ohlc (x = даты,
open = open_data,
high = high_data,
low = low_data,
close = close_data)
data = [трассировка]
ру.iplot (данные)
Здесь мы предоставили некоторые образцы данных, которые можно сделать следующим образом:
- Открытые данные описывают курс акций при открытии рынка
- Высокие данные описывают самый высокий уровень запасов, достигнутый за данный период времени
- Низкие данные описывают самый низкий уровень запасов, достигнутый за определенный период времени
- Данные закрытия описывают курс акций на момент закрытия, когда заданный временной интервал закончился
Теперь давайте запустим фрагмент кода, который мы предоставили выше. Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:
Это отличное сравнение того, как проводить сравнение времени объекта с его собственным и сравнивать его с высокими и низкими достижениями.
Заключение
В этом уроке мы рассмотрели другую библиотеку визуализации, Plotly, которая является отличной альтернативой Matplotlib в приложениях производственного уровня, которые представлены в виде веб-приложений. Plotly - очень динамичная и многофункциональная библиотека для использования в производственных целях, так что это определенно навык, который нам нужно иметь за плечами.
Найдите весь исходный код, использованный в этом уроке, на Github. Поделитесь своими отзывами об уроке в Twitter с @sbmaggarwal и @LinuxHint.