1 . Kapitulua Instalazioa eta lehen pausuak
R programazio lengoaia libre bat da, gehienbat estatistika eta datu analisira bideratuta dagoena. R programazio lengoaia interpretatua da, hau da, terminal batean sartzen diren aginduak interpretatu eta segidan exekutatu egiten dira, ondoren emaitzak berriro ere terminalean erakutsiz.
Hori dela eta, Rrekin diharduteko behar den gauza bakarra komando interpretea da, hots, R terminala. Edonola ere, gero ikusiko dugun moduan, lana errazteko, garapenerako ingurune integratuak (IDE-ak) ere erabil daitezke.
1.1 Rren instalazioa
Rren instalazioa gure sistema eragilearen araberakoa da; informazio guztia web ofizialean aurki daiteke.1 Windows eta MacOS sistemen kasuan, instalazio fitxategiak eta jarraibideak ondorengo helbide hauetan aurki daitezke:
Linux sistematan, berriz, R instalatzeko biderik errazena distribuzioko pakete kudeatzailea erabiltzea da. Ubunturen kasuan, instalatu behar diren paketeak r-base
eta r-base-dev
dira. Edonola ere, Ubunturen repositorioetan dagoen bertsioa zaharkitua egon daiteke –Ubuntu bera azken bertsiokoa ez bada, batik bat–. Rren azken bertsioa instalatzeko, pakete kudeatzaileari Rko repositorioa gehitzea komeni da. Hau egiteko, ondoko komando hauek exekutatu behar dira2:
sudo add-apt-repository 'http://cran.r-project.org/bin/linux/ubuntu artful/'
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E084DAB9
sudo apt-get update
sudo apt-get install r-base
sudo apt-get install r-base-dev
Jarraibide hauek Rren oinarrizko instalazioa burutzen dute eta beraz lengoaia hau erabiltzen hastea ahalbidetzen digute.
1.2 R konsola
Lehen esan bezala, R lengoaia interpretatua da, eta ondorioz, erabiltzen hasteko terminal bat besterik ez dugu behar. Noski, oinarrizko instalazioa egiten dugunean Rko terminala erabilgarri jartzen zaigu.
Rren terminalak itxura ezberdina hartzen du sistema eragile ezberdinetan. Mac eta Linux sistemetan terminala oinarrizkoa da, eta erabili ahal izateko ohiko terminalean R
komandoa exekutatuko dugu.
Bertan, Rko edozein komando idatz dezakegu, emaitzak berriro ere terminalean lortuz. Ataza konplexuagoak burutzeko, ohikoena, scriptak erabiltzea da. Rko Script bat, agindu zerrenda luze bat gordeko dituen fitxategi bat izango da (.R amaierakoa), bata bestearen atzetik exekutatuko direnak. Scriptekin jarduteko testu lauak editatzeko programa bat eta Rren terminala besterik ez dira behar eta programatzaile askok bi elementu hauekin soilik egiten dute lan.
Windows sistemetan R terminalak itxura apur bat berezia dauka eta gainera, zenbait funtzionalitate gehigarri dauzka beste bi sistema eragileekin alderatuz. Adibidez, script editore bat eskeintzen du.
1.3 Garapenerako ingurune integratuak: RStudio
Nahiz eta terminala eta testu fitxategiak Rn lan egiteko nahikoak izan, badaude R lengoaian programatzeko garapen ingurune integratuak (IDE-ak). Garapen ingurune integratu bat software programa bat da programatzaileei haien software-a garatzerako garaian hainbat erraztasun/erosotasun eskaintzen dizkionak, hala nola, kode editore bat, debugger bat, kodearen auto-konpletatzen sistema bat, etab.
Gaur egun Rren IDE hedatuena RStudio da.3
RStudio-k bi IDE modalitate ditu: desktop eta server; lehena da, kasu gehienetan, instalatu beharko duguna. Honez gain, modalitate bakoitzerako, bi bertsio daude, bata dohakoa eta bestea profesionala. Guk dohakoa erabiliko dugu. Programa instalatzeko, beraz, RStudioren webunean Download RStudio botoian sakatu, desktop mota aukeratu eta ondoren Open Source Edition aukera. Bertan programaren hainbat bertsio izango ditugu eta gure sistemari dagokiona aukeratu beharko dugu.
RStudio zabaltzen dugunean hiru zatitan banaturiko lehio bat agertuko zaigu. Ezkerreko aldean R terminala izango dugu. Eskuinean, goiko partean, kargatutako R objektuak eta komandoen historiala izango ditugu. Beheko partean, berriz, aukera ezberdinak eskeintzen dituzten hainbat fitxa daude: fitxategiak, grafikoak, paketeak, laguntza eta bistaratzailea. Fitxategi bat zabaltzen dugunean ezkerreko zatia (hasieran terminala soilik zena) bitan banatuko da, script fitxategia –goian– eta terminala –behean– erakusteko.

RStudioren itxura
Aspektu honetan sakontzea ez denez kapitulu honen helburua, interesatuta egon ezkero, jarraian zerrendatzen diren webguneetan baliabide gehiago aurki ditzakezu:
1.4 Lehenengo urratsak
Aldagaiek Rko objektuak gordeko dituzte. Beraz, aldagai bati balio zehatz bat esleitzeko <-
sinboloa erabiliko dugu, edo baliokideki =
sinboloa. Bata zein bestearen erabileraren inguruko irizpideak, estilo gidan aurki daitezke (A eranskinean). Adibidez, x
aldagaiari, 2.45 balioa esleitzeko:
x <- 2.45
Hala, behar ezberdinak betetzeko, aldagai mota ezberdinak definitu daitezke Rn:
- Numeric: zenbaki errealak gordetzen dituzten aldagai motak dira.
x <- 3.2
- Integer: zenbaki osoak gordetzen dituzten aldagai motak dira.
x <- 1
- Logic: aldagai bitarrak gordetzen dituzten aldagai motak dira,
TRUE
edoFALSE
balioak har ditzakete.
x <- TRUE
- Character: karaktereak eta karaktere kateak gordetzen dituzten aldagai motak dira.
x <- "kaixo"
- Factor: aldagai kualitatiboen balioak gordetzen dituzten aldagaiak dira, hau da, multzo finitu bateko balioak hartzen dituzten aldagaiek dira, adibidez 1, 2 edo 3. Ohartu, horrelako aldagai bat definitzea, apur bat konplexuagoa dela, izan ere, balioa esleitzeaz gain, aldagaiak har ditzakeen balio posibleen multzoa ere zehaztu behar ditugu era honetan:
x <- factor(1, levels=c(1,2,3))
Kasu honetan aldagaiak 1 balioa hartzen du eta balio posibleen multzoa {1,2,3} da. gainera, ikus daitekeen bezala, faktore motako objektu batek zein balio har ditzakeen adierazteko levels
parametroa erabiltzen da.
Aldagai baten balioa ikusteko, bere izena idatzi eta enter sakatu behar dugu, besterik gabe. Gainera, ohartu, uneoro oso argi izan behar dugu zein motakoa den gure aldagaia, izan ere, honen arabera eragiketa batzuk ala besteak egin ahalko ditugu harekin.
Azkenik, ohartu R lengoaian, NA
balio galdu a adierazteko erabiltzen dela; ez da nahastu behar NaN
objektuarekin ez-zenbaki a (not a number) adierazten duena.
1.4.1 Eragiketa aritmetikoak
Aldagai numeriko edo osoen artean eragiketa aritmetikoak egin ditzakegu:
Sinboloa | Eragiketa |
---|---|
+ | Batuketa |
- | Kenketa |
* | Biderkaketa |
/ | Zatiketa |
^ | Berreketa |
%% | Moduluak (x mod y) |
%/% | Zatiketaren zati osoa |
Adibidez,
x <- 2
y <- 3
x*y
## [1] 6
1.4.2 Eragiketa logikoak
Eragiketa mota hauek beti TRUE (egia) ala FALSE (gezurra) itzuliko digute, eta horregatik deitzen dira eragiketa logikoak. Aldagaien gaineko baldintzak konprobatzeko balio dute. Hasteko, bi elementuren arteko konparaketak egin ditzakegu:
Sinboloa | Eragiketa |
---|---|
< eta > | Handiago edo txikiago moduko konparaketak (soilik aldagai oso eta errealak) |
<= eta >= | “txikiago edo berdin” eta “handiago edo berdin” motako konparaketak (soilik aldagai oso eta errealak) |
== | Bi elementu berdinak diren konprobatzeko (edozein aldagai mota) |
!= | Bi elementu ezberdinak diren konprobatzeko (edozein aldagai mota) |
Adibidez,
x <- 5
y <- 7
x<y
## [1] TRUE
Gainera, baldintza konplexuagoak eraikitzen lagunduko diguten beste operadore logiko batzuk ere badauzkagu:
Sinboloa | Eragiketa |
---|---|
! baldintza | Baldintza baten kontrakoa konprobatzeko balio du. |
baldintza1 | baldintza2 | Baldintza bat edo bestea betetzen diren konprobatzen du. |
baldintza1 & baldintza2 | Bi baldintzak aldi berean betetzen direla konprobatzen du. |
isTRUE(baldintza) | baldintza egia bada, TRUE itzuliko du eta bestela FALSE. |
Adibidez,
x <- 2
y <- 6
!(x%%2==0) # x ez da bikoitia?
## [1] FALSE
(x>3) | (y<7) # x 3 baino handiagoa EDO y 7 baino txikiagoa da?
## [1] TRUE
isTRUE(x==2) # Egia da, x 2-ren berdina dela?
## [1] TRUE
Eragiketa konplexuagoak egiteko, Rn funtzioak erabiltzen dira, baina hori aurrerago ikusiko dugu
1.5 Ariketak
Erantzun honako galderei, kasu bakoitzean soilik Rko kode lerro bakar bat erabiliz:
1. Ariketa Sortu aldagai berri bat, x
izenekoa, 6 balioa hartzen duena eta beste bat, y
izenekoa, 10 balioa hartzen duena.
2. Ariketa x
aldagaiaren erroa 2.5 baino txikiagoa da?
3. Ariketa x
eta y
aldagaien arteko biderkadura bakoitia al da?
4. Ariketa Egia al da x
aldagaia 3 baino txikiagoa edo berdina eta y
aldagaia 5 baino handiagoa direla?
5. Ariketa Egia al da y
aldagaia bikoitia edo 4ren multiploa dela?
6. Ariketa Kalkulatu x
eta y
aldagaien batuketa, 3rekin zatitzean lortzen dugun zati osoa.
Kontutan izan Rko repositorio hau Ubuntu 17.10 sistemarentzat dela baliagarria; Ubunturen beste bertsio bat izanez gero
artful
, sistemari dagokion izenarekin aldatu beharko duzu.↩