1 R

Program R jest zaawansowanym pakietem statystycznym i językiem programowania istniejącym na platformy Windows, Unix oraz MacOS. Objęty jest licencją GNU GPL.

Pierwsza wersja R (początek lat 90) została napisana przez Roberta Gentlemana i Ross Ihake pracujących na Wydziale Statystyki Uniwerstetu w Auckland. Obecnie rozwojem R kieruje fundacja “The R Foundation for Statistical Computing”.

Język R jest językiem interpretowanym, a nie kompilowanym (kolejne komendy interpretowane są linia po linii lub wykonywane jako skrypt).

Największą siłą R jest kilkadziesiąt tysięcy bibliotek funkcji napisanych przez setki osób z całego świata, przeznaczonych do najróżniejszych zastosowań. Każda biblioteka dostarczana jest z pełną dokumentacją.

Program RStudio

Istnieje wiele programów (nakładek) ułatwiających prace z programem R np. Rcmdr, RKWard, RStudio.

Strona domowa programu RStudio: www.rstudio.com

Programowanie w R

Język programowania R opiera się na zmiennych i funkcjach. Zmienne nie muszą być deklarowane.

Uwagi:

  1. Klasycznym operatorem przypisania jest \(<-\), można również wykorzystywać znak \(=\).
  2. Jeżeli chcemy, aby wynik przypisania został wyświetlony na ekranie, należy przypisanie zamknąć w nawiasy \(()\).
  3. Jeśli chcemy, aby kilka wyrażeń było zapisanych w jednej linii, to musimy oddzielić je średnikiem.
  4. R odróżnia wielkie i małe litery.
  5. W celu określenia kolejności działań używamy nawiasów okrągłych.
  6. Do grupowania wyrażeń używamy nawiasów klamrowych.

Podstawowe obiekty:

  1. Wektory - umieszczamy w nich obserwowane wartości danej zmiennej.
  2. Ramki danych - są to odpowiedniki arkuszy.
  3. Listy - są to odpowiedniki skoroszytów.

1.1 Wywołania w R

1.1.2 Podstwowe typy zmiennych w R

liczby = numeric

łańcuchy znakowe = character/factor

1.1.3 Podstawowe struktury danych w R

Wektory - uporządkowana kolekcja elementów tego samego typu, umieszczamy w nich obserwowane wartości danej zmiennej.

Tworzenie:

Edycja (tylko w RStudio):

Odwołania:

Przypadki szczególne:

Ramki danych - są to odpowiedniki arkuszy danych.

Tworzenie:

Edycja:

Proste funkcje:

Nazwy wierszy i kolumn:

Odwołania:

Usuwanie kolumn:

Uwaga: Większość danych w R przechowywana jest w postaci ramek.

Impory/Export danych

Zapis w formacie RData

Import w formacie RData

Dane: Diabetes

Import z pliku tekstowego

Dane: winequality-red

Import z formaty Excel

Dane: Demografia

Pakiet dplyr

tibble - rozszerzona wersja ramki danych

Przykładowe działania na tibblach (również w wersji potokowej)

Listy - większość funkcji zwraca wynik w postaci listy.

Tworzenie:

Odwołania:

Lista jako wynik funkcji princomp:

Uwaga: Pomoc wywołujemy poprzedzając nazwę funkcji znakiem zapytania, np. ?princomp

1.1.5 Raporty

Dane: Raport