Наука о данных

Учебное пособие по Python

Учебное пособие по Python
Plotly - аналитическая компания, известная разработкой инструментов аналитики, статистики и построения графиков в реальном времени для веб-приложений и автономных скриптов Python. В этом уроке мы рассмотрим основные примеры с помощью Plotly и построим простые и интуитивно понятные графики данных временных рядов, которые будут на 100% интерактивными по своей природе и при этом простыми в разработке. Эти графики можно использовать в презентациях, поскольку они полностью интерактивны и готовы к работе с.

Также есть возможность сохранить дизайн графиков в автономном режиме, чтобы их можно было легко экспортировать. Есть много других функций, которые упрощают использование библиотеки:

Чтобы начать использовать пакет Plotly, нам необходимо зарегистрировать учетную запись на веб-сайте, упомянутом ранее, чтобы получить действительное имя пользователя и ключ API, с которым мы можем начать использовать его функции. К счастью, для Plotly доступен бесплатный тарифный план, благодаря которому мы получаем достаточно функций для создания графиков производственного уровня.

Установка Plotly

Обратите внимание, перед тем как начать, вы можете использовать виртуальную среду для этого урока, что можно сделать с помощью следующей команды:

python -m virtualenv сюжетно
источник numpy / bin / активировать

После того, как виртуальная среда станет активной, вы можете установить библиотеку Plotly в виртуальной среде, чтобы можно было выполнять следующие примеры:

pip install plotly

В этом уроке мы будем использовать Anaconda и Jupyter. Если вы хотите установить его на свой компьютер, посмотрите урок, который описывает «Как установить Anaconda Python на Ubuntu 18».04 LTS »и поделитесь своим мнением, если у вас возникнут проблемы. Чтобы установить Plotly с Anaconda, используйте следующую команду в терминале от Anaconda:

conda install -c plotly plotly

Мы видим что-то подобное, когда выполняем указанную выше команду:

После того, как все необходимые пакеты установлены и выполнены, мы можем начать использовать библиотеку Plotly с помощью следующего оператора импорта:

Импортировать сюжетно

После того, как вы создали учетную запись на Plotly, вам потребуются две вещи - имя пользователя учетной записи и ключ API. К каждой учетной записи может принадлежать только один ключ API. Так что храните его в безопасном месте, так как если вы его потеряете, вам придется восстановить ключ, и все старые приложения, использующие старый ключ, перестанут работать.

Во всех программах Python, которые вы пишете, укажите следующие учетные данные, чтобы начать работу с Plotly:

хитроумно.инструменты.set_credentials_file (username = 'username', api_key = 'your-api-key')

Приступим к работе с этой библиотекой сейчас.

Начало работы с Plotly

В нашей программе мы будем использовать следующий импорт:

импортировать панд как pd
импортировать numpy как np
импортировать scipy как sp
Импортировать сюжетно.сюжетно как ру

Мы используем:

Для некоторых примеров мы будем использовать собственные наборы данных Plotly, доступные на Github. Наконец, обратите внимание, что вы также можете включить автономный режим для Plotly, когда вам нужно запускать скрипты Plotly без сетевого подключения:

импортировать панд как pd
импортировать numpy как np
импортировать scipy как sp
Импортировать сюжетно
хитроумно.не в сети.init_notebook_mode (подключено = True)
Импортировать сюжетно.офлайн как py

Вы можете запустить следующую инструкцию, чтобы проверить установку Plotly:

печать (плотно.__версия__)

Мы видим что-то подобное, когда выполняем указанную выше команду:

Наконец, мы загрузим набор данных с помощью Pandas и визуализируем его в виде таблицы:

Импортировать сюжетно.figure_factory как ff
df = pd.read_csv ("https: // необработанный.githubusercontent.com / plotly / datasets / master / school_
заработок.csv ")
таблица = ff.create_table (df)
ру.iplot (таблица, имя файла = 'таблица')

Мы видим что-то подобное, когда выполняем указанную выше команду:

Теперь построим Гистограмма для визуализации данных:

Импортировать сюжетно.graph_objs как идут
data = [перейти.Бар (x = df.Школа, y = df.Женщины)]
ру.iplot (данные, имя файла = 'женский бар')

Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:

Когда вы видите приведенную выше диаграмму с блокнотом Jupyter, вам будут представлены различные варианты увеличения / уменьшения масштаба в определенном разделе диаграммы, выбора окна и лассо и многое другое.

Сгруппированные гистограммы

С помощью Plotly можно легко сгруппировать несколько гистограмм для сравнения. Давайте воспользуемся одним и тем же набором данных для этого и покажем различия в присутствии мужчин и женщин в университетах:

женщины = иди.Бар (x = df.Школа, y = df.Женщины)
мужчины = иди.Бар (x = df.Школа, y = df.Мужчины)
data = [мужчины, женщины]
layout = go.Макет (barmode = "group")
фиг = идти.Рисунок (данные = данные, макет = макет)
ру.iplot (рис)

Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:

Хотя это выглядит хорошо, надписи в правом верхнем углу нет, исправьте! Исправим их:

женщины = иди.Бар (x = df.Школа, y = df.Женщины, name = "Women")
мужчины = иди.Бар (x = df.Школа, y = df.Мужчины, name = "Мужчины")

Теперь график выглядит более наглядным:

Попробуем изменить режим бара:

layout = go.Макет (barmode = "relative")
фиг = идти.Рисунок (данные = данные, макет = макет)
ру.iplot (рис)

Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:

Круговые диаграммы с Plotly

Теперь мы попытаемся построить круговую диаграмму с помощью Plotly, которая установит базовую разницу между процентом женщин во всех университетах. Названия университетов будут на этикетках, а фактические числа будут использоваться для расчета процента от общего количества. Вот фрагмент кода для того же:

след = идти.Пирог (label = df.Школа, ценности = df.Женщины)
ру.iplot ([трассировка], имя файла = 'пирог')

Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:

Хорошо то, что в Plotly есть множество функций увеличения и уменьшения масштаба, а также множество других инструментов для взаимодействия с построенной диаграммой.

Визуализация данных временных рядов с помощью Plotly

Визуализация данных временных рядов - одна из самых важных задач, с которыми сталкивается аналитик данных или инженер данных.

В этом примере мы будем использовать отдельный набор данных в том же репозитории GitHub, поскольку более ранние данные не включали конкретно данные с отметкой времени. Как и здесь, мы построим график изменения рыночных запасов Apple с течением времени:

financial = pd.read_csv ("https: // необработанный.githubusercontent.com / plotly / datasets / master /
финансы-диаграммы-яблоко.csv ")
data = [перейти.Scatter (x = финансовый.Дата, y = финансовый ['AAPL.Закрывать'])]
ру.iplot (данные)

Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:

Как только вы наведете указатель мыши на линию вариации графика, вы сможете указать детали точки:

Мы можем использовать кнопки увеличения и уменьшения, чтобы видеть данные, относящиеся к каждой неделе.

График OHLC

Диаграмма OHLC (Open High Low Close) используется для отображения вариаций объекта за определенный промежуток времени. Это легко построить с помощью PyPlot:

from datetime import datetime
open_data = [33.0, 35.3, 33.5, 33.0, 34.1]
high_data = [33.1, 36.3, 33.6, 33.2, 34.8]
low_data = [32.7, 32.7, 32.8, 32.6, 32.8]
close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
даты = [datetime (год = 2013, месяц = ​​10, день = 10),
datetime (год = 2013, месяц = ​​11, день = 10),
datetime (год = 2013, месяц = ​​12, день = 10),
datetime (год = 2014, месяц = ​​1, день = 10),
datetime (год = 2014, месяц = ​​2, день = 10)]
след = идти.Ohlc (x = даты,
open = open_data,
high = high_data,
low = low_data,
close = close_data)
data = [трассировка]
ру.iplot (данные)

Здесь мы предоставили некоторые образцы данных, которые можно сделать следующим образом:

Теперь давайте запустим фрагмент кода, который мы предоставили выше. Мы видим нечто подобное, когда выполняем приведенный выше фрагмент кода:

Это отличное сравнение того, как проводить сравнение времени объекта с его собственным и сравнивать его с высокими и низкими достижениями.

Заключение

В этом уроке мы рассмотрели другую библиотеку визуализации, Plotly, которая является отличной альтернативой Matplotlib в приложениях производственного уровня, которые представлены в виде веб-приложений. Plotly - очень динамичная и многофункциональная библиотека для использования в производственных целях, так что это определенно навык, который нам нужно иметь за плечами.

Найдите весь исходный код, использованный в этом уроке, на Github. Поделитесь своими отзывами об уроке в Twitter с @sbmaggarwal и @LinuxHint.

Бесплатные движки с открытым исходным кодом для разработки игр для Linux
В этой статье будет рассмотрен список бесплатных игровых движков с открытым исходным кодом, которые можно использовать для разработки 2D- и 3D-игр в L...
Shadow of the Tomb Raider для Linux Учебное пособие
Shadow of the Tomb Raider - двенадцатое дополнение к серии Tomb Raider - франшизе приключенческой игры, созданной Eidos Montreal. Игра была очень хоро...
Как увеличить FPS в Linux?
FPS означает Кадров в секунду. Задача FPS - измерить частоту кадров при воспроизведении видео или во время игры. Проще говоря, количество непрерывных ...