Inicio Inicio
Inicio Mapa del sitio <-

El lenguaje R y su entorno gráfico

Introducción

R es un sistema para análisis estadísticos y gráficos creado por Ross Ihaka y Robert Gentleman. R tiene una naturaleza doble de programa y lenguaje de programación y es considerado como un dialecto del lenguaje S creado por los Laboratorios AT&T Bell.

R se distribuye gratuitamente bajo los términos de la GNU General Public Licence; su desarrollo y distribución son llevados a cabo por varios estadísticos conocidos como el Grupo Nuclear de Desarrollo de R.

R está disponible en varias formas: el código fuente está escrito principalmente en C (y algunas rutinas en Fortran), esencialmente para máquinas Unix y Linux, o como archivos binarios precompilados para Windows, Linux (Debian, Mandrake, RedHat, SuSe), Macintosh y Alpha Unix.

Los archivos necesarios para instalar R, ya sea desde las fuentes o binarios precompilados, se distribuyen desde el sitio de internet Comprehensive R Archive Network (CRAN) junto con las instrucciones de instalación. Para las diferentes distribuciones de Linux, los binarios están disponibles generalmente para las versiones más actualizadas de éstas y de R; visite el sitio CRAN si es necesario.

R posee muchas funciones para análisis estadísticos y gráficos; estos últimos pueden ser visualizados de manera inmediata en su propia ventana y ser guardados en varios formatos (jpg, png, bmp, ps, pdf, emf, pictex, xfig; los formatos disponibles dependen del sistema operativo). Los resultados de análisis estadísticos se muestran en la pantalla, y algunos resultados intermedios (como valores P-, coeficientes de regresión, residuales,...) se pueden guardar, exportar a un archivo, o ser utilizados en análisis posteriores.

El lenguaje R permite al usuario, por ejemplo, programar bucles («loops» en inglés) para analizar conjuntos sucesivos de datos. También es posible combinar en un solo programa diferentes funciones estadísticas para realizar análisis más complejos. Usuarios de R tienen a su disponibilidad un gran número de programas escritos para S y disponibles en la red; la mayoría de estos pueden ser utilizados directamente con R.

Al principio, R puede parecer demasiado complejo para el no especialista. Esto no es cierto necesariamente. De hecho, una de las características más sobresalientes de R es su enorme flexibilidad. Mientras que programas más clásicos muestran directamente los resultados de un análisis, R guarda estos resultados como un «objeto», de tal manera que se puede hacer un análisis sin necesidad de mostrar su resultado inmediatamente. Esto puede ser un poco extraño para el usuario, pero esta característica suele ser muy útil. De hecho, el usuario puede extraer solo aquella parte de los resultados que le interesa.

R es un lenguaje orientado a objetos: bajo este complejo término se esconde la simplicidad y flexibilidad de R. El hecho que R es un lenguaje de programación puede desaminar a muchos usuarios que piensan que no tienen «alma de programadores». Esto no es necesariamente cierto por dos razones. Primero R es un lenguaje interpretado (como Java) y no compilado (como C, C++, Fortran, Pascal,...), lo cual significa que los comandos escritos en el teclado son ejecutados directamente sin necesidad de construir ejecutables.


Emmanuel Paradis, Jorge A. Ahumada (trad.)
R para Principiantes
http://cran.r-project.org/doc/contrib/rdebuts_es.pdf .pdf



1.  Descargar el archivo de instalación o el código que corresponda al sistema operativo del ordenador en la URL

http://www.r-project.org


La consola de comandos de Windows tiene el siguientes aspecto:


Interfaz de R Console


En la dirección antes mencionada hay abundante documentación para aprender a utilizar R. En español podemos destacar:
También puede ser útil tener a mano algún resumen con los principales comandos: Hay un curso abierto (OpenCourseWare) de R en la UC3M: Y el libro Estadística Básica con R y R-Commander en varios formatos (doy las gracias a mi compañera Isabel Molina Peralta por esta información):
Arriba


2.  Además de utilizar R introduciendo directamente el código en la ventana de comando, hay una forma cómoda de ir evaluando —y guardando, si se desea— el código de R que tengamos escrito. Basta dividir la ventana principal de R en dos partes: en una estará el código que vamos escribiendo, desde la que será enviado a la otra para que se evalúe. Para ello hay que hacer que la ventana de comandos ocupe una mitad, y la ventana de editar código la otra.


Interfaz de R con una subventana


La subventana para editar código aparece al entrar en el menú

Archivo -> Nuevo script

si el código no está guardado en ningún archivo, o
Archivo -> Abrir script...

si ya lo está.


Interfaz de R con las dos subventanas


Ahora, para evaluar una parte del código, basta seleccionarla y pulsar

Ctrl+R

o, menos cómodo, entrar en el menú
Editar -> Correr línea o selección.

Para evaluar todo el código del archivo, se puede entrar en el menú

Editar -> Ejecutar todo,

o seleccionarlo todo y utilizar la forma anterior.

Ésta es una forma parecida —pero mucho menos potente— que la que se consigue al instalar Emacs Speaks Statistics (ESS). Obsérvese que vale tanto para cuando tenemos el código guardado en un archivo como para cuando no, cosa que no sucede si desde la ventana de comandos llamamos a source("archivo.R"), que evaluará todo el código previamente guardado en ese archivo.


Arriba


3.  Si además del entorno de línea de comandos se desea tener un entorno gráfico, el paquete Rcmdr lo proporciona (quiero dar las gracias a mi compañero Juan-Miguel Marín Diazaraque por haberme informado de su existencia). Para instalar un paquete, el programa tiene integrado un gestor de paquetes. Hay que:
  1. Entrar en el menú Paquetes -> Instalar paquete(s)...
  2. En la ventana que aparece, elegir un repositorio (o espejo) desde el que descargar el paquete. Cuanto más cercano esté, mejor.
  3. Elegir el nombre del paquete que se quiere instalar, en este caso Rcmdr.
En el caso de este paquete se van a instalar muchos otros paquetes (dependencias), que son necesarios para que puedan funcionar todas las opciones de los menús del entorno gráfico.


Cada vez que se quiera abrir el R Commander hay que teclear library(Rcmdr) en la consola de comandos, o entrar en el menú Paquetes -> Cargar paquete... y seleccionar Rcmd en la ventana que aparece. La interfaz gráfica es la siguientes:


Interfaz de R Commander


Arriba


4.  Como ejemplo de lo potente y cómodo (además de económico: es gratis) que puede llegar a ser el sistema operativo Linux (Linux), veamos cómo se harían los dos pasos anteriores en la distribución Debian. Ésta no es quizá la mejor distribución para iniciarse en Linux, aunque es una de las más fiables y más fieles a la filosofía del código libre; sin embargo, hay varias distribuciones más fáciles de utilizar al principio (con muchos programas y controladores ya instalados): Knoppix, Ubuntu y, a su vez basada en Knoppix, está la distribución Quantian, especialmente pensada para el munco científico. Supongo (no lo sé) que en estas distribuciones estará instalado todo lo necesario para poder utilizar R; en cualquier caso:
  1. Con el comando para gestionar paquetes, no es más que teclear en una consola, como superusuario (root):
    apt-get install r-base
    Después de la instalación de este paquete, ya puedes utilizar R. Sólo tienes que abrir una sesión en la consola (ya no hace falta que lo hagas como superusuario):
    R
  2. Si la consola no te satisface del todo y quieres más potencia y comodidad, puedes utilizar el editor de texto GNU Emacs. Si tienes que instalarlo, puedes hacer (como superusuario):
    apt-get install emacs
    Ya tienes instalado este potentísimo (menos freír huevos debe de hacer de todo) y a la vez sencillo editor de texto. Ahora, la comodidad de su uso reside en que puedes dividir su ventana en dos partes (o las que quieras) y tener abierto el archivo de R en una y una sesión de consola (de Linux) en otra. Ahora abre GNU Emacs. Si la ventana no está dividida en dos, se divide en dos cada vez que haces:
    Mantener Ctrl pulsada mientras presionas la tecla x, suelta las dos y pulsa la tecla del 2
    En la ventana de arriba, por ejemplo, abre el archivo de texto. En la de abajo, sitúa el cursor (con el ratón o haciendo del mismo modo Ctrl + x y luego la letra o) y para iniciar una sesión de consola haz:
    Mantener Alt pulsada mientras presionas la tecla x, suelta las dos y escribe (el cursor se pone abajo del todo) shell y pulsa la tecla Intro/Enter
    Ya tienes tu consola y tu archivo, que puedes ir modificando y compilando a la vez.


    Interfaz de Emacs


    ¡Maravilloso! Es maravilloso... Si quieres aprender algo más sobre el manejo de GNU Emacs con las teclas (aunque tiene también menús, al final es más rápido utilizarlas):
    Una introducción rápida a GNU Emacs: .pdf
    Brevísima introducción a Emacs: .pdf
    Emacs Command Reference: .pdf
    La anterior forma de utilizar R con GNU Emacs no es más que aprovechar las comodidades de este editor de texto para abrir el archivo con el código en una de sus subventanas y una consola en otra. Algo mucho más cómodo e integrado es lo que hace ESS, que hace que aparezca un menú nuevo en el editor de texto y permite enviar directamente parte o todo el código de su subventana a otra donde el editor abre una sesión de R.


Una forma de aumentar la velocidad de R (doy las gracias a mi compañero Juan-Miguel Marín Diazaraque por esta información):
Otras opciones para utilizar R:
Arriba   Inicio


David Casado de Lucas

Última actualización: Enero del 2012
Quiero dar las gracias a las personas que hacen posibles proyectos como Linux, Debian, GNU Emacs, GIMP, The W3C Markup Validation Service y Servicio de Validación de CSS del W3C, entre otros, y ponen a disposición de los usuarios, de forma gratuita, programas de tan alta calidad.
HTML válido CSS válidas Logotipo de Linux