Unidade 2 R Project - Conceitos Básicos
Referências utilizadas para esse capítulo:
- R for Data Science. Garrett Grolemund e Hadley Wickham (Grolemund and Wickham 2016)
- R programming for Data Science. Roger D. Peng (Peng 2015)
E recentemente encontrei um ótimo livro em português, criado pelo Prof. Marcelo Perlin da UFRGS, cuja parte de introdução ao R é bem completa e se encaixa perfeitamente ao nosso curso.
2.1 Iniciando pelo básico
Vamos inicialmente usar R como uma calculadora!
1 / 40 * 1000
## [1] 25
(50 + 31 + 7) / 3
## [1] 29.33333
cos(pi / 2)
## [1] 6.123032e-17
Olhando R sob esse ponto de vista, é possível entender que a implementação da Linguagem R incorpora outros paradigmas de Linguagens de programação (Paradigma funcional), além daqueles que normalmente já estamos acostumados, como o Paradigma de orientação de objetos.
Na verdade, na Linguagem R tudo é objeto!
2.2 Iniciando uma variável do um valor
Quando atribuímos um valor a uma variável, estamos na verdade criando um objeto, onde um dos seus atributos é o valor daquela variável.
No R novos objetos são criados com <-
(verifique qual atalho pode ser usado no seu Sistema operacional para gerar) <-
:
x <- 3 * 4
Todas os objetos criados em R são criados da mesma forma, usando um comando de atribuição:
nome_do_objeto <- valor
Ao ler que o código, é como se fosse “o nome do objeto obtém valor”!
Você fará muitas atribuições e digitar <-
pode se tornar cansativo.
Tente não usar =
: vai funcionar, mas vai causar confusão mais tarde.
Em vez disso, use o atalho de teclado do RStudio: Alt + - (sinal de subtração). Observe que o RStudio automaticamente inclui espaços <-
, o que é uma boa prática de formatação de código.
2.3 Inspecionando os valores das variáveis
x <- 5 ## nada é impresso
x ## auto-printing
## [1] 5
#`[1]` indica que o primeiro elemento contido em `x` é o valor `5`.
print(x) ## o valor é impresso como resultado (raramente é usado, já que a opção anterior é mais prática)
## [1] 5
Obs: #
é usado para inserir um comentário em R. Nada será executado.
Outras atribuições:
x <- 1:20
x
x <- 1 # O valor anterior é sobrescrito
x
msg <- "hello"
#Para fazer a inicialização e ao mesmo tempo imprimir use
(x <- 1:10) # raramente usado
Obs: O operador :
é usado para criar sequência de inteiros.
2.4 Como nomear suas variáveis
Nomes de objeto devem começar com uma letra, e conter apenas letras, números, _
e .
. Se você quer que seus nomes sejam de fácil associação, então a recomendação é usar um padrão de codificação.
Uma sugestão é o padrão snake case (meu_modelo) onde você separa palavras em letras minúsculas com _
Exemplos:
eu_uso_snake_case
otherPeopleUseCamelCase
some.people.use.periods
E_algumas.Pessoas_NAOusamPadrao
2.5 Atalhos
esse_e_um_nome_longo <- 2.5
Para inspecionar esse objeto, tente usar o funcionalidade auto completar do R Studio: Digete “esse”, pressione TAB, adicione caracteres até formar um prefixo único, então pressione ENTER.
No caso de cometer um erro: esse_e_um_nome_longo
deve ter valor 3.5 não 2,5.
Use outro atalho de teclado para ajudá-lo a corrigi-lo. Digite esse
, em seguida, pressione Ctrl/Cmd
+ seta para cima
. Isso irá listar todos os comandos que você digitou que começam com aqueles caracteres. Use as setas para navegar e, em seguida, pressione ENTER
para digitar novamente o comando. Mude de 2.5 a 3.5 e execute novamente.
Outro detalhe:
r_rocks <- 2 ^ 3
Vamos tentar inspecionar esta variável:
r_rock
#> Error: object 'r_rock' not found
R_rocks
#> Error: object 'R_rocks' not found
Há um contrato implícito entre você e o R: O R fará toda a computação tediosa para você, mas em troca, você deve ser completamente preciso em suas instruções. Ele é case sensitive
2.6 Use a assistência da interface
Digite o código abaixo e note a assistência com as aspas emparelhadas:
x <- "hello world"
Aspas e parênteses devem sempre vir em um par. RStudio faz o seu melhor para ajudá-lo, mas ainda é possível errar e acabar com uma incompatibilidade. Se isso acontecer, R irá mostrar-lhe o caractere de continuação de “+”:
x <- "hello
#+
O +
diz-lhe que R está esperando por mais alguma entrada. Ele acha que você ainda não digitou tudo. Normalmente isso significa que você tenha esquecido ou um "
ou um )
. Adicione o par ausente ou pressione ESC para abortar a expressão e tente novamente.

Figura 2.1: Variáveis de ambiente visualizados no painel “Environment” no RStudio
2.7 Chamando funções
R tem uma grande coleção de funções internas que são chamados assim:
function_name(arg1 = val1, arg2 = val2, ...)
Vamos tentar usar o seq()
, que cria uma sequência de números. Digite ‘se’ e pressione TAB
. Um popup mostra os possíveis comandos (funções). Digitando mais (um q
), ou usando as setas cima/baixo
, você pode selecionar a função ‘seq()’.
Observe a dica flutuante que aparece, lembrando os argumentos da função e seu propósito. Se você quiser mais ajuda, pressione F1 para obter todos os detalhes no guia de ajuda no painel inferior direito.
Pressione TAB
uma vez mais, quando você selecionar a função que você quer. RStudio adicionará os parênteses correspondentes, abrindo (
e fechando )
parênteses para você. Digite os argumentos ‘1, 10’ e pressione ENTER
.
seq(1, 10)
## [1] 1 2 3 4 5 6 7 8 9 10
Se você fizer uma atribuição, não verá o valor da atribuição. Mas como vimos antes, é fácil verificar o valor da variável logo em seguida:
y <- seq(1, 10, length.out = 5)
y
## [1] 1.00 3.25 5.50 7.75 10.00
Um atalho pode ser inserir o commando entre parênteses (pouco usado):
(y <- seq(1, 10, length.out = 5))
## [1] 1.00 3.25 5.50 7.75 10.00
2.8 R Markdown
Esse arquivo foi preparado usando o RMarkdown dentro do RStudio. Os arquivos de tipo Rmarkdown podem der utilizados para estender os scriptos em R para a geração de conteúdo em vários formatos, como HTML e PDF. Os blocos de código são inseridos ao longo de texto, os quais podem ser executados como scrpts ou na geração dos documentos.
Os blocos de código são chamados de chunk e podem ser executados clicando o botão de run
ou posicionando o cursor dentro do chunck e pressionando Ctrl+Shift+Enter
.
Para adicionar um novo chunck use insert chunch na barra de ferramentas ou pressione Ctrl+Alt+I
.
Se o seu arquivo markdown for do tipo notebook
, ao salvar o seu arquivo .Rmd
no RStudio, um arquivo HTML também será salvo. (Para visualizar uma prévia do seu notebook em HTML, pressione preview
na barra de ferramentas ou as teclas Ctrl+Shift+K
.
References
Grolemund, Garrett, and Hadley Wickham. 2016. “R for Data Science.” http://r4ds.had.co.nz/.
Peng, Roger D. 2015. “R Programming for Data Science.” The R Project; R Foundation, 132. doi:10.1073/pnas.0703993104.
Perlin, Marcelo S. 2017. Processamento e Modelagem de Dados Financeiros com o R.