8.11.15

Indexación

Indexación

La indexación es la selección de subconjuntos de datos de un vector o de datos estructurales, para esto se utilizan los operadores de selección [ ], [[ ]] y $. Es un poco diferente para cada uno objeto, y existen básicamente tres tipos de indexación: por vector lógico, por números enteros y selección negativa.



Vectores: aquí solamente especificamos la posición del o los datos que queremos seleccionar con un solo valor.
> data<--5:5         # creamos vector de -5 a 5
> data
[1] -5 -4 -3 -2 -1  0  1  2  3  4  5
> data[2]            # selección del valor en la segunda posición
[1] -4
> data[c(1,3,5,10)]  # selección en la posición 1, 3, 5 y 10
[1] -5 -3 -1  4
> data[-1]           # no seleccionar primer valor
[1] -4 -3 -2 -1  0  1  2  3  4  5
> data[c(-3:-6)]     #  no seleccionar del tercero al sexto valor
[1] -5 -4  1  2  3  4  5
> data[data<0]       # seleccionar los valores menor a 0
[1] -5 -4 -3 -2 -1
> data[data>=0]      ## seleccionar los valores mayor igual a 0
[1] 0 1 2 3 4 5

Listas

Listas

Hoy vamos a ver las listas, los elementos de las listas pueden ser objetos de cualquier clase (numérica, carácter, lógica, etc.) y de cualquier estructura (matrices, dataframe, array, etc.), incluso pueden contener otras listas. Así las listas se pueden considerar como un almacén de objetos, y cada objeto esta enumerado y ordenado, para su acceso.


Para la creación de listas se ocupa la función list(),  utilizando vectores o datos estructurales para conformar los objetos internos, escribiendo el nombre de cada uno.
> edad<-round(rnorm(10,40,10))
> sexo<-gl(2,3,10,labels = c("M","H"))
> SS<-rep(c(F,T),5)
> Listas<-list(Edad=edad,Sexo=sexo,SeguroSocial=SS)
> Listas
$Edad
 [1] 28 40 41 53 21 39 26 39 40 33
 
$Sexo
 [1] M M M H H H M M M H
Levels: M H
 
$SeguroSocial
 [1] FALSE  TRUE FALSE  TRUE FALSE  TRUE FALSE  TRUE FALSE  TRUE

7.11.15

Series de tiempo

Series de Tiempo

Hola continuamos con los objetos, hoy veremos las Series de Tiempo. son vectores de tiempo dimensional porque combina dos componentes: los datos (un vector o una matriz con valores numéricos) y las fechas de los datos, y son de una clase básica, estas series de tiempo se crean con la función ts().
Una serie de tiempo es una secuencia de números recogidos en intervalos regulares durante un periodo de tiempo.

Con la función ts() escribimos primero los datos, despues definimos la frecuencia, esto es que cada valores representara un tiempo en el intervalo, por ejemplo si colocamos doce cada valores representara un mes o si colocamos cuatro cada valor representara un cuarto del año.
> ts(1:10,start = 2000) 

Factores

Factores

Hola continuamos con los objetos, hoy veremos los factores. Los factores, son vectores unidimensional que incluye los valores correspondientes a una variable categórica, pero también los diferentes niveles posibles de esta variable, por ejemplo la variable sexo que incluye hombre y mujer o la variable tipo de sangre que incluye los tipos A, B, AB y O.

Hay dos formas de hacer factores, la primera es usar la función gl(), en donde especificamos el numero de niveles, el numero de repeticiones y el numero total de datos respectivamente, y  con el argumento labels se especifica el nombre de los niveles.
> edades<-gl(4,5,15,labels=c("Niños","Jovenes","Adulto","Anciano"))
> edades
 [1] Niños   Niños   Niños   Niños   Niños   Jovenes Jovenes Jovenes Jovenes Jovenes
[11] Adulto  Adulto  Adulto  Adulto  Adulto 
Levels: Niños Jovenes Adulto Anciano

6.11.15

Dataframes

Data Frames

Hola continuamos con los objetos, hoy veremos los data frames, también conocidos como tablas de datos o marco de datos, se utilizara "data frame" porque su traducción puede producir confusión.

Los dataframes son vectores dimensionales, y pueden de dos o más clases, esto es que cada columna  pueden ser de diferente clase. Esta característica las hace las más utilizadas para estructurar datos para su análisis, por ejemplo en el contexto científico muchos de los experimentos cosiste en medir diferentes variables tanto cualitativas como cuantitativas, poder utilizar estos diferentes datos hace posible análisis más robusto y completo.


La función que se utiliza es data.frame(), en el cual podemos colocar datos o vectores para crear el data frame.
> edad<-round(rnorm(10,50,10))
> sexo<-rep(c("H","M"),5)
> sueldo<-round(rnorm(10,10000,100),2)
> data<-data.frame(edad,sexo,sueldo)
> data