Capítulo 10 Primeiros Passos em R

10.1 Introdução

R permite que especialistas interpretem, interajam e visualizem dados de forma rápida e fácil

Antes de inicializar qualquer projeto aplicado através da linguagem computacional R, é importante entender um pouco sobre esta ferramenta, e para isto é necessário destacar que o \(\texttt{R}\) é um ambiente para análise de dados. Básicamente é uma linguagem, e pode ser entendida também como um projeto de código aberto, isto é, um projeto cujos códigos estão disponíveis para seu livre descarregamento sem custo nenhum, pemitindo a qualquer pessoa utilizá-los.

A linguagem \(\texttt{R}\) surgiu no começo da década de 90, e foi inicialmente concebida por Robert Gentleman e Ross Ihaka, na época, ambos professores de Departamento de Estatística da Universidade de Auckland, na Nova Zelândia, e especialistas em dados. Desde 1997, o projeto \(\texttt{R}\) é gerenciado pelo \(\texttt{R}\) Core Group, sendo feito seu primeiro lançamento em fevereiro de 2000. O trabalhos que tiveram o uso intensivo da linguagem envolviam o mapeamento das tendências sociais e de marketing on-line, passando pelo desenvolvimento de modelos financeiros e globando também modelos climáticos para fomentar o desenvolvimento da economia e a sociedade. Assim, muitas das visualizações impactantes de dados e análises estatísticas que são performadas na atualidade por pesquisadores, estatísticos e cientistas de dados podem certamente estarem usando a linguagem \(\texttt{R}\) para estes propósitos.

Diversos contribuidores do Core Group continuaram no desenvolvimento e aprimoramento do \(\texttt{R}\), dando surgimento a novas ferramentas e aplicativos, acumulando alto volume de pacotes (package, no inglês) criadas pelos usuários com o intuito de aprimorar a funcionalidade do \(\texttt{R}\) em diversas áreas. A validação da qualidade desses pacotes se dá através de especialistas e líderes reconhecidos em todos os campos, contando com um suporte via crowdsourcing. Adicionalmente, a linguagem \(\texttt{R}\) se destaca por ser interativa, orientada a objetos e funções, onde os objetos podem ser conjuntos de dados, vetores, funções, matrizes etc, e cujas manipulações podem ser cálculos, entradas e saídas de dados, análises estatísticas e gráficos

10.2 Instalando o R

No intuito de auxiliar no processo de download do software, é importante entender que ela é feita \(\texttt{R}\) através do CRAN (Comprehensive R Archive Network), sendo uma rede de servidores que se encontra distribuída ao redo do mundo, contendo as diversãs e idénticas versões dos códigos e documentações da linguagem de forma atualizada.

Para fazer download do software, inicialmente selecione a CRAN https://cran.r-project.org/ do seu país e em seguida a cidade mais próxima a você.

+ Para o caso do Rio de Janeiro, selecione a CRAN Oswaldo Cruz Foundation, Rio de Janeiro, ou acesse [`http://cran.fiocruz.br/`](http://cran.fiocruz.br/)

10.2.1 Passo a passo da instalação

  • Após escolher a CRAN, selecione o link de download compatível com seu sistema operacional, o \(\texttt{R}\) se encontra disponível para Linux(Debian, Fedora/Redhat, Ubuntu), macOS e Windows.

  • Clique no link ‘install R for the first time’.

  • Por fim, selecione ‘Download R X.X.X for Windows’, ou seja, a versão mais atual disponível.

  • Uma vez realizado o download, clique duas vezes no arquivo que foi descarregado e siga as instruções da instalação padrão.

  • Qualquer dúvida sobre a instalação ou demais, visite a página de perguntas frequentes: http://cran.r-project.org/doc/FAQ/R-FAQ.html.

Após executar toda a instalação corretamente, o software pode ser acessado pelo Menu Iniciar (Sistema Windows) ou pelo ícone na sua área de trabalho. Na seguinte Figura está a interface de comando que deverá aparecer quando iniciar o \(\texttt{R}\),

10.3 Instalando o \(\texttt{RStudio}\)

O \(\texttt{RStudio}\) é um ambiente de desenvolvimento integrado (IDE) aberto e free para o software \(\texttt{R}\). Seu principal objetivo é facilitar a integração entre o \(\texttt{R}\) e o usuário, sendo uma interface user-friendly. O \(\texttt{RStudio}\) é desenvolvido na linguagem de programação C++ e está disponível para diversos sistemas operacionais, tais como: Microsoft Windows, Mac OS X e GNU/Linux. Antes da instalação do \(\texttt{RStudio}\) é prioritário ter feito a instalação do \(\texttt{R}\).

10.3.1 Passo a passo para a instalação \(\texttt{RStudio}\)

  • Acesse no site oficial do \(\texttt{RStudio}\): http://www.rstudio.org

  • Clique no menu Products (OPEN SOURCE Get started with R) \(\rightarrow\) RStudio

  • Descenda na página e selecione RStudio Desktop

  • Escolha o link de acordo com o seu sistema operacional

  • Instale o programa a partir do arquivo salvo

Uma vez instalado o software pode ser acessado pelo Menu Iniciar (Sistema Windows) ou pelo ícone na sua área de trabalho tendo o seguinte layout que conta com 4 quadrantes:

Esses quadrantes representam o editor, o console, o workspace e o output. O padrão e organização vem nesse formato e ordem, mas você pode ter uma disposição diferente priorizando suas preferências do formato, para isto acesse no menu Tools na opção Global options na seção do painel esquedo: Pane Layout. Os dois principais paineis do \(\texttt{RStudio}\) são o editor e o console.

  1. Editor/Scripts: painel onde são escritos os códigos, o cujo espaço pode ser guardado, sendo aextensão do arquivo “.R” Assim como o layout pode ser ajustado, as cores do texto dos códigos também podem ser ajustadas facilitando a sua leitura (Siga o caminho: Tools \(\rightarrow\) Global optios \(\rightarrow\) Appearance).

  2. Console: é o painel onde os códigos são rodados e onde também são fornecidas a maioria das saídas.

Os demais painéis são auxiliares. O objetivo deles é facilitar pequenas tarefas que fazem parte tanto da programação quanto da análise de dados, como olhar a documentação de funções, analisar os objetos criados em uma sessão do \(\texttt{R}\), procurar e organizar os arquivos que compõem a nossa análise, armazenar e analisar os gráficos criados e muito mais.

  • Environment: painel com todos os objetos criados na sessão.
  • History: painel com um histórico dos comandos rodados.
  • Files: mostra os arquivos no diretório de trabalho. É possível navegar entre diretórios.
  • Plots: painel onde os gráficos serão apresentados.
  • Packages: apresenta todos os pacotes instalados e carregados.
  • Help: janela onde a documentação das funções serão apresentadas.
  • Viewer: painel onde relatórios e dashboards serão apresentados.

10.4 Usando o \(\texttt{RStudio}\) Cloud

Uma alternativa do \(\texttt{RStudio}\) é o \(\texttt{RStudio}\) Cloud, permitindo o uso on-line do \(\texttt{R}\) e do \(\texttt{RStudio}\). O \(\texttt{RStudio}\) Cloud se destaca por ser um serviço do \(\texttt{RStudio}\), com algumas restrições para o seu uso gratuito, mas oferecendo opções de planos para a expasão dos serviços e a possibilidade trabalhos colaborativos conjuntos. Umas grandes vantagens do \(\texttt{RStudio}\) Cloud é o seu armazenamento na nuvem no servidor de todos os projetos criados (incluindo todos os arquivos \(\texttt{R}\)). Além disso, você pode acessar aos arquivos/projetos em qualquer lugar, independentemente do computador que você estiver usando e a qualquer hora.

Para poder acessar ao \(\texttt{RStudio}\) Cloud de forma gratuita, siga os seguintes passos:

  • Acesse em: https://rstudio.cloud/plans

  • Selecione o plano gratuito (Campo: Cloud \(\rightarrow\) Free)

  • Seleccione

  • Para logar, pode ser usado o seu e-mail ou escolher entre a conta Google ou GitHub.

Ao acessar na página do \(\texttt{RStudio}\) Cloud a página que aparece é a seguinte:

Logando no \(\texttt{RStudio}\) Cloud

Uma vez que você fizer o login na sua conta, será direcionado pelo sistema para criar o nome da sua conta:

Criando um projeto no \(\texttt{RStudio}\) Cloud

Posteriormente, será direcionado para os seus projetos, ali é só criar um novo projeto clicando no botão New Project:

Interface do \(\texttt{RStudio}\) Cloud

10.5 Criação de Projetos

  • O \(\texttt{RStudio}\) tem uma funcionalidade muito importante que é a de criar projetos.

    • Um projeto é basicamente uma pasta no seu computador ou na nuvem, na qual estarão todos os arquivos que você usará ou criará no processo de análise.

10.5.1 Passos para a criação

  • Selecione o menu File \(\rightarrow\) New Project… .

  • Uma caixa de diálogo será aberta, clique em New Directory \(\rightarrow\) New Project

  • O primeiro campo da caixa de diálogo será usado para criar nome do projeto e pasta e uma nova pasta onde está contido. O segundo campo será usado caso deseje criar o projeto dentro de uma pasta já existente.

Assim que criar seu projeto ele será aberto no \(\texttt{RStudio}\), e o nome do projeto aparecerá no canto superior direito da tela. Na aba Files, aparecerão todos os arquivos contidos no projeto.

A estrutura básica, considerando a extensão dos arquivos pode ser da forma:

10.6 Manipulação simples no Console

A forma mais direta de interagir com o \(\texttt{R}\) é através das linhas de comandos

  • Os comandos são digitados no prompt de comando (ou console) do \(\texttt{R}\), onde o símbolo indica que o prompt está listo para recebê-los.
  • Continuação da linha ou o comando enviado está incompleto é indicado pelo símbolo .
  • Para submeter os comandos pressione a tecla .
  • Para inserir vários comandos na mesma linha, utilize ponto e vírgula: .

2+4
## [1] 6
5-8
## [1] -3
1*9
## [1] 9
10/2
## [1] 5

Use os parênteses para calcular expressões, por exemplo,

((20 + 7)/3)^2
## [1] 81
  • O \(\texttt{R}\) ignora os espaços em brancos excessivos
18               /              3
## [1] 6
  • String/caracteres devem ser inseridos entre aspas simples ou dupla: ou
"Exemplo de string/caracter"
## [1] "Exemplo de string/caracter"

10.7 Pacotes

  • A versão do \(\texttt{R}\) possui uma coleção enorme de funções, como por exemplo:

    • Modelos estatísticos

    • Algoritmos computacionais

    • Métodos computacionais

    • Visualização de dados

    • E MUITAS outras funções

  • No entanto, às vezes precisamos acessar outros módulos que contenham funções mais específicas como por exemplo:

    • Análise multivariada

    • Análise Bayesiana

    • Manipulação de dados

    • Gráficos a nível de publicação

    • Big Data

    • Machine Learning

    • Processamento de imagens

    • Modelos Econométricos

    • etc.

Os pacotes podem ser entendidos como sendo uma coleção de funções que são chamadas diretamente de dentro do \(\texttt{R}\). Eles incluem: funções, dados para exemplificar as funcionalidades do pacote, arquivo com ajuda (help) para cada função, e uma descrição do pacote. Esses também são conhecidos como módulos, ou , pelo seu nome em inglês. Como indicado anteriormente, posser de um software de ambiente livre, qualquer pessoa pode desenvolver seus pacotes e submeter ao CRAN, disponibilizando através do GitHub ou standalone.

Instalando pacotes

  • Para instalar um pacote do \(\texttt{R}\) que já esteja no CRAN basta usar o comando:
install.packages('ggplot2')
  • Além da opção de comando, também podemos instalar pacotes utilizando os menus do \(\texttt{R}\) , ou do \(\texttt{RStudio}\)

  • Uma vez que o pacote foi instalado não há mais a necessidade de instalar sempre que for utilizar as suas funcionalidades, basta carregar o pacote com os comandos: ou

library(ggplot2)
require(ggplot2)

10.7.1 Outros recursos