р

Учебник по программированию на R

Учебник по программированию на R
Вы хотите быстро от новичка до опытного программиста на R? R - один из лучших языков программирования для работы со статистикой, математикой и наукой о данных. Это руководство поможет вам изучить R и построить свою первую модель машинного обучения. Давайте начнем.

Компиляция и запуск R из командной строки

Есть два способа запуска программ R: сценарий R, который широко используется и является наиболее предпочтительным, и второй - R CMD BATCH, это не часто используемая команда. Мы можем вызывать их прямо из командной строки или любого другого планировщика заданий.

Можно предположить, что эти команды можно вызывать из оболочки, встроенной в среду IDE, и в настоящее время в среде IDE RStudio есть инструменты, которые улучшают сценарий R и функции R CMD BATCH или управляют ими.

Функция source () внутри R - хорошая альтернатива использованию командной строки. Эта функция также может вызывать скрипт, но для использования этой функции вы должны находиться в среде R.

Наборы данных встроенного языка R

Чтобы вывести список наборов данных, встроенных в R, используйте команду data (), затем найдите то, что вы хотите, и используйте имя набора данных в функции data (). Как данные (имя функции).

Показать наборы данных в R

Знак вопроса (?) можно использовать для запроса помощи для наборов данных.

Чтобы проверить все, используйте summary ().

Plot () - это также функция, которая используется для построения графиков.

Создадим тестовый скрипт и запустим его. Создавать p1.р файл и сохраните его в домашнем каталоге со следующим содержимым:

Пример кода:

 # Простой код hello world в R print ("Hello World!") print (" LinuxHint ") print (5 + 6) 

Запуск Hello World

Кадры данных R

Для хранения данных в таблицах мы используем структуру в R, называемую Фрейм данных. Он используется для перечисления векторов одинаковой длины. Например, следующая переменная nm - это фрейм данных, содержащий три вектора x, y, z:

x = c (2, 3, 5) y = c ("aa", "bb", "cc") z = c (TRUE, FALSE, TRUE) # nm - фрейм данных nm = data.кадр (n, s, b) 

Есть концепция под названием ВстроенныйФреймы данных в R тоже. mtcars - один из таких встроенных фреймов данных в R, который мы будем использовать в качестве примера для лучшего понимания. См. Код ниже:

 > mtcars mpg cyl disp hp drat wt… Mazda RX4 21.0 6 160 110 3.90 2.62… автобус RX4 Wag 21.0 6 160 110 3.90 2.88… Datsun 710 22.8 4 108 93 3.85 2.32… 

фрейм данных mtcars Bulitin

Заголовок - это верхняя строка таблицы, содержащая имена столбцов. Строки данных передаются каждой горизонтальной линией; каждая строка начинается с имени строки, а затем следуют фактические данные. Элемент данных строки называется ячейкой.

Мы должны ввести координаты строки и столбца в одну квадратную скобку с оператором '[]', чтобы получить данные в ячейке. Для разделения координат используем запятую. Порядок важен. Координата начинается со строки, затем с запятой и заканчивается столбцом. Значение ячейки 2nd ряд и 1ул столбец представлен как:

 > mtcars [2, 2] [1] 6 

Мы также можем использовать имя строки и столбца вместо координат:

 > mtcars ["Автобус RX4", "миль на галлон"] [1] 6 

Функция nrow используется для нахождения количества строк во фрейме данных.

 > nrow (mtcars) # количество строк данных [1] 32 

Функция ncol используется для определения количества столбцов во фрейме данных.

 > ncol (mtcars) # количество столбцов [1] 11 

Циклы программирования R

В некоторых случаях мы используем циклы, когда хотим автоматизировать какую-то часть кода или хотим повторить последовательность инструкций.

Для цикла в R

Если мы хотим распечатать информацию за эти годы более одного раза.

 print (paste («Год есть», 2000)) «Год уже 2000» print (paste («Год есть», 2001)) «Год - 2001» print (paste («Год есть», 2002) ) Печать «Год есть 2002» (вставить («Год есть», 2003)) Печать «Год - 2003» (вставить («Год есть», 2004)) Печать «Год - 2004» (вставить (« Год ", 2005") "Год 2005" 

Вместо того чтобы повторять наше утверждение снова и снова, если мы используем для цикл нам будет намного проще. Как это:

 for (год в c (2000,2001,2002,2003,2004,2005)) print (paste («Год есть», год)) «Год - 2000» «Год - 2001» «Год - 2002 "" 2003 год "" 2004 год "" 2005 год " 

Пока цикл в R

 while (выражение) оператор 

Если результатом выражения является ИСТИНА, вводится тело цикла. Операторы внутри цикла выполняются, и поток возвращается, чтобы снова оценить выражение. Цикл будет повторяться до тех пор, пока выражение не станет FALSE, и в этом случае цикл завершится.

Пример цикла while:

 # i изначально инициализируется значением 0 i = 0, а (i<5)  print (i) i=i+1  Output: 0 1 2 3 4 

В приведенном выше цикле while выражение я<5который имеет значение ИСТИНА, поскольку 0 меньше 5. Следовательно, выполняется тело цикла, и я выводится и увеличивается. Важно увеличивать я внутри цикла, поэтому он каким-то образом будет соответствовать условию в какой-то момент. В следующем цикле значение я равно 1, и цикл продолжается. Он будет повторяться до тех пор, пока я равно 5, когда условие 5<5 reached loop will give FALSE and the while loop will exit.

Функции R

Чтобы создать функция мы используем директивную функцию (). В частности, это объекты R класса функция.

ж <- function()  ##some piece of instructions  

Примечательно, что функции могут быть переданы другим функциям в качестве аргументов, а функции могут быть вложенными, чтобы вы могли определять функцию внутри другой функции.

Функции могут иметь некоторые именованные аргументы, которые имеют значения по умолчанию. Если вам не нужно значение по умолчанию, вы можете установить для него значение NULL.

Некоторые факты об аргументах функции R:

# Определение функции: f <- function (x, y = 1, z = 2, s= NULL)   

Создание модели логистической регрессии со встроенным набором данных

В glm () функция используется в R для соответствия логистической регрессии. Функция glm () аналогична функции lm (), но у glm () есть некоторые дополнительные параметры. Его формат выглядит так:

 glm (X ~ Z1 + Z2 + Z3, family = binomial (link = "logit"), data = mydata) 

X зависит от значений Z1, Z2 и Z3. Это означает, что Z1, Z2 и Z3 являются независимыми переменными, а X - зависимой функцией. Функция включает в себя дополнительное семейство параметров и имеет биномиальное значение (link = «logit»), что означает, что функция связи имеет логит, а распределение вероятностей модели регрессии является биномиальным.

Предположим, у нас есть пример студента, в который он поступит по двум результатам экзаменов. Набор данных содержит следующие элементы:

Как изменить левую и правую кнопки мыши на ПК с Windows 10
Совершенно нормально, что все устройства компьютерной мыши эргономичны для правшей. Но есть мышиные устройства, специально разработанные для левшей ил...
Эмуляция щелчков мыши с помощью мыши без щелчка в Windows 10
Использование мыши или клавиатуры в неправильной позе или чрезмерное использование может привести к множеству проблем со здоровьем, включая растяжение...
Добавьте жесты мыши в Windows 10 с помощью этих бесплатных инструментов
В последние годы компьютеры и операционные системы сильно эволюционировали. Было время, когда пользователям приходилось использовать команды для навиг...