Unidade 1 Introdução ao R
R é um software livre (open-source) que disponibiliza todo um ambiente computacional para a realização de análises estatísticas (colaborativas e reprodutíveis), incluindo a produção de gráficos de alta qualidade, facilmente customízavéis. Esse ambiente pode ser compilado e executado em diferentes plataformas(UNIX, Windows e MacOS).
1.1 Instalação e Configuração
**ATENÇÃO: Pule essa seção se não está usando R localmente. (Por exemplo, usando R via servidor Jupyter no browser.)
Se vc ainda não instalou os programas:
Download e instale R ( http://cran.r-project.org )
Download e instale RStudio ( https://www.rstudio.com ). Oferece uma interface amigavel para interação com o ambiente R, facilitando e estendendo o uso das suas funcionalidades.
1.2 Um pouco de história
- A linguagem S foi uma linguagem de programação para análises estatísticas desenvolvida por John Chambers e colegas no laboratório da Bell/AT&T.
Após a definição da linguagem de formal, uma implementação comercial foi desenvolvida e comercializada com o nome de S-Plus. (2001) Usei esse pacote comercial S-Plus, e foi meu primeiro contato com o que viria a ser o R :)
O S-Plus implementava uma interface gráfica mais amigável para a utilização da linguagem “S”. Mesma ideia do RStudio
- A partir da definição formal da linguagem S, o código foi então reaproveitado por dois acadêmicos autralianos, Ross Ihaka e Robert Gentleman, resultando na plataforma de programação R que temos hoje. Dizem que o nome dessa linguagem foi escolhido devido a primeira letra do primeiro nome de seus criadores. Prefiro acreditar que se segue ao S (do pacote inicial.)
- O R Studio é só mais uma interface para o ambiente R, mas que conquistou uma grande fatia de mercado pela forma como disponibiliza e estende as funcionalidades do ambiente R.
1.3 Sua primeira sessão em R
Esse é o R!

Figura 1.1: Janela do R

Figura 1.2: Janela do R
Em uma sessão, o R guarda todos os objetos criados na sua memória, formando o que chamamos de workspace.
Você pode salvar seu workspace, e carregá-lo posteriormente. Contudo, veremos que raramente isso é necessário. Aliás, não recomendado. Seu workspace será salvo como um arquivo ‘xxx.RData’.
1.4 Iniciando um projeto
Abrir um projeto no RStudio/R basicamente significa definir um diretório de trabalho, onde por default serão salvos todos os seus arquivos de trabalho e o diretório a partir do qual todos os seus arquivos serão lidos. Um arquivo nome_do_projeto.Rproj será criado com as configurações básicas do seu projeto.
Uma grande vantagem desse ambiente é que a maioria dos arquivos serão do tipo texto e podem ser abertos e lidos em qq editor de texto.
A maneira mais fácil de criar um projeto é pelo menu do R Studio, mas essa é uma das poucas funcionalidades que iremos utilizar usando a barra de menu do aplicativo. O quanto antes aprendermos a usar os scripts maior será nossa produtividade.
Abra um projeto e vamos explorar uma sessão:
ls()
## [1] "uncover"
1.5 Entendendo os pacotes em R
As funcionalidades do R podem ser estendidas por meio de pacotes. Esse é um conceito central que reflete um dos grandes diferenciais da plataforma R. Imagine que toda a comunidade científica pode contribuir com pacotes de código para a plataforma R. Tais pacotes podem ser facilmente instalados no seu computador e carregados na sua sessão. Neste momento a sua sessão/instalação está capacitada a executar todas as funcionalidades disponibilizadas pelo pacote instalado.
O “Comprehensive R Archive Network (CRAN)” (https://cran.r-project.org/) é o repositório oficial de pacotes do R. Qualquer um pode submeter um pacote ao CRAN. É claro que o código precisa passar por um processo de avaliação e de formatação do código. Mas sendo aprovado, seu pacote fará parte de repositório e poderá ser instalado diretamente do R ou R Studio. Existem outros repositórios não oficiais, mas não serão abordados nesse curso.
Os pacotes podem ser instalados a partir do RStudio ou diretamente do console R:
install.packages("nome_do_pacote", dependences = TRUE)
Uma vez instalado, o pacote precisa ser disponibilizado na sua sessão, o que é feito pelo comando library()
.
library("nome_do_pacote")
Verifique quais pacote estão carregados na sua sessão usando search()
search()
É importante sempre manter os pacotes instalados atualizados, o que pode ser realizado pelo RStudio ou pelo console usando update.packages()
O Ambiente do R está focado em permitir o trabalho colaborativo e a reprodutibilidade das pesquisa, logo pode ser que seja necessário tirar uma foto do seu ambiente para outro ussuário possa reproduzí-lo. Isso pode ser realizado usando a função sessionInfo()
.
sessionInfo()