Minicurso de R
Pós-Graduação em Modelagem Computacional da UFJF
Conteúdo:
1 - Interface R
2 - Sintaxe R
3 - Pacotes do R
4 - Gráficos
5 - Interface com outras linguagens
6 - Análise de casos
Minicurso de R
Pós-Graduação em Modelagem Computacional da UFJF
Conteúdo:
1 - Interface R
2 - Sintaxe R
3 - Pacotes do R
4 - Gráficos
5 - Interface com outras linguagens
6 - Análise de casos
Aula do curso de Introdução ao QGis para Análise Multicriterial, Tribunal de Contas da União, Brasília, 17 de outubro de 2018.
Bases de Dados Disponíveis em:
https://app.box.com/s/txo3thu4cwsqxomrfdppu8ag6qzuo338
e
https://app.box.com/s/4c699dn8r7mn30ddfbz3gwvo5ty2k92s
Módulo 12 - Introdução aos sistemas de informaçãoLuis Ferreira
1. Necessidade das bases de dados.
2. Sistemas de gestão de bases de dados.
3. Os modelos como métodos de conceção de sistemas.
4. Modelos utilizados na gestão de bases de dados (Relacional, Hierárquico, Rede).
Ao final da aula, os alunos saberão identificar as principais diferenças entre a programação estruturada e a programação orientada a objetos.
Apresentar aos alunos uma pequena revisão de C# e a IDE Visual Studio.
Você sabe o que é ou o que faz um Banco de Dados? Veja essa apresentação e sua continuação (vou postar em breve) e conheça um pouquinho mais sobre tecnologia.
Aula do curso de Introdução ao QGis para Análise Multicriterial, Tribunal de Contas da União, Brasília, 17 de outubro de 2018.
Bases de Dados Disponíveis em:
https://app.box.com/s/txo3thu4cwsqxomrfdppu8ag6qzuo338
e
https://app.box.com/s/4c699dn8r7mn30ddfbz3gwvo5ty2k92s
Módulo 12 - Introdução aos sistemas de informaçãoLuis Ferreira
1. Necessidade das bases de dados.
2. Sistemas de gestão de bases de dados.
3. Os modelos como métodos de conceção de sistemas.
4. Modelos utilizados na gestão de bases de dados (Relacional, Hierárquico, Rede).
Ao final da aula, os alunos saberão identificar as principais diferenças entre a programação estruturada e a programação orientada a objetos.
Apresentar aos alunos uma pequena revisão de C# e a IDE Visual Studio.
Você sabe o que é ou o que faz um Banco de Dados? Veja essa apresentação e sua continuação (vou postar em breve) e conheça um pouquinho mais sobre tecnologia.
Objetivos da apresentação
• Introduzir o R como um software para análise de dados, estatística, armazenamento e criação de gráficos, que é também uma linguagem de programação
• Introduzir a operação básica do software R e apresentar algumas das suas funcionalidades e potencialidades
• Partilhar um conjunto de recursos que facilitem a aprendizagem e exploração do R
• Apresentar alguns exemplos do uso de R
• Propor uma comunidade de uso local, para explorar o R
Cartilha de R para Estatística e Data Science.pdfEdkallenn Lima
R é uma linguagem de programação estatística que vem passando por diversas evoluções e se tornando cada vez mais uma linguagem de amplos objetivos.
R é também um conjunto de pacotes e ferramentas para computação estatística, munido de funções que facilitam sua utilização, desde a criação de simples rotinas até análises de dados complexas, com visualizações bem acabadas.
Esta cartilha é uma introdução de R e de sua linguagem.
Aprenda de forma bem objetiva as principais estruturas de dados disponíveis no Python: listas, tuplas, set, dicionário, pilha e fila. Conheça também primitivas de programação funcional como list comprehension, map, reduce, filter sorted entre outros.
R é uma linguagem gratuita, poderosa e rápida para análise e visualização de dados. Tire suas próprias conclusões! Mini-palestra apresentada no CPDx (Ciclo de Palestras para Desenvolvedores) na UFBA em 16/01/2013
Construindo URA e Sistemas de Call Center com AsteriskRodrigo R Passos
Orientar desenvolvedores sobre a utilização do Asterisk para desempenhar o papel de uma URA com programação avançada.
Estabelecer uma infra-estrutura para empresas que precisam de um sistema de Contact/Call Center
Prover conhecimento para empresas que querem partir para o desenvolvimento de uma solução de Contact/Call Center baseado em Asterisk
Construindo URA e Sistemas de Call Center com AsteriskRodrigo R Passos
Orientar desenvolvedores sobre a utilização do Asterisk para desempenhar o papel de uma URA com programação avançada.
Estabelecer uma infra-estrutura para empresas que precisam de um sistema de Contact/Call Center
Prover conhecimento para empresas que querem partir para o desenvolvimento de uma solução de Contact/Call Center baseado em Asterisk
O BestPoint é o seu assistente personalizado para viagens e turismo. Com ele você pode descobrir a melhor época e o local para a viagem dos seus sonhos, construir planos e roteiros de viagens automatizados, otimizar todos os custos e obter as melhores experiências de acordo com seus gostos pessoais.
Quem nunca parou para olhar milhares de sites e blogs para planejar uma viagem seja ela de negócios ou a lazer, seja sozinho ou com sua família? Ou quem fica perdido sempre que precisa buscar um lugar ou um evento para ir em sua própria cidade com um grupo de amigos, com a namorada/esposa ou só.
Pensando nessas dificuldades estamos desenvolvendo a aplicação BestPoint que além de integrar informações sobre oferta turística, eventos e opções de lazer e entretenimento oferece recomendações personalizadas pra você e seus grupos de amigos, colegas de trabalho, família e outros facilitando o acesso às informações desejadas em um curso espaço de tempo.
Através do BestPoint você pode descobrir o melhor lugar para ir com poucos cliques e de uma maneira muito fácil e rápida tendo também as opções de rotas, trajetos, meios de transporte e estacionamentos. Tudo isso graças à inteligência artificial da plataforma que realiza recomendações baseadas no perfil do usuário/grupo, da disponibilidade financeira, da localização geográfica e também das avaliações e recomendações de outros usuários.
Para mais informações acesse: www.bestpoint.com.br
Quem nunca parou para olhar milhares de sites e blogs para planejar uma viagem seja ela de negócios ou a lazer, seja sozinho ou com sua família? Ou quem fica perdido sempre que precisa buscar um lugar ou um evento para ir em sua própria cidade com um grupo de amigos, com a namorada/esposa ou só.
Pensando nessas dificuldades estamos desenvolvendo a aplicação BestPoint que além de integrar informações sobre oferta turística, eventos e opções de lazer e entretenimento oferece recomendações personalizadas pra você e seus grupos de amigos, colegas de trabalho, família e outros facilitando o acesso às informações desejadas em um curso espaço de tempo.
Através do BestPoint você pode descobrir o melhor lugar para ir com poucos cliques e de uma maneira muito fácil e rápida tendo também as opções de rotas, trajetos, meios de transporte e estacionamentos. Tudo isso graças à inteligência artificial da plataforma que realiza recomendações baseadas no perfil do usuário/grupo, da disponibilidade financeira, da localização geográfica e também das avaliações e recomendações de outros usuários.
Para mais informações acesse: www.bestpoint.com.br
2. Mauricio C. Purificação
Consultor de Business Intelligence (BI), Data Discovery e Business Analytics,
palestrante, instrutor das suítes Pentaho, QlikView e Qlik Sense;
Líder Técnico do Projeto de BI do Hospital Cárdio Pulmonar da Bahia;
Mestrando em Engenharia de Sistemas e Produtos (IFBA);
MBA em Administração/Gestão de Negócios - Universidade Salvador (UNIFACS);
Bacharel em Ciência da Computação - Universidade Federal da Bahia (UFBA);
Pesquisador nas áreas de Business Intelligence, Business Analytics, Big Data,
Mineração de Dados, Inteligência Artificial e Modelos Preditivos.
http://lattes.cnpq.br/3312807554334758
3. Um Pouco Sobre R: O Que É?
O R não é um "aplicativo" que lhe possibilita através de uma interface gráfica
amigável realizar algumas tarefas sem saber exatamente o que está fazendo;
O R é um ambiente de trabalho para realização de análises estatísticas;
Do ponto de vista da análise de dados, o R tem uma filosofia que o diferencia
radicalmente dos outros softwares estatísticos;
ANALISAR DADOS É PROGRAMAR COM DADOS: toda a análise de dados deve
ser pensada como a construção de um programa que ao ser executado gera a
análise esperada.
4. Um Pouco Sobre R: História
Desenvolvido originalmente por Ross Ihaka e Robert Gentleman (Depto
Estatística da Universidade de Auckland, Nova Zelândia);
Inspirado em duas linguagens:
S (John Chambers e colegas – Bell Labs): sintaxe
Scheme (Hal Abelson and Gerald Sussman): implementação e semântica
R está disponível como um software livre, nos termos da GNU GPL (General
Public License).
Windows, Linux, OS X (Mac)
5. Um Pouco Sobre R: História
1980: Linguagem S: desenvolvida por R. Becker, J. Chambers e A. Wilks (AT&T
Bell Laboratories)
1980: Versão comercial: S-Plus (Insightful Corporation)
1996: Versão livre: R desenvolvido por R. Ihaka e R. Gentleman (Universidade
de Auckland)
1997: R Development Core Team
Hoje: 20 desenvolvedores principais e muitos outros colaboradores em todo o
mundo
Estatísticos, matemáticos e programadores
6. Um Pouco Sobre R: Características
INTERFACE: o R é uma interface para análises de dados, criando um ambiente
de trabalho;
INTERATIVIDADE: essa interface é interativa, isto é, você digita comandos e
obtêm os resultados;
MODULAR: o R é composto por módulos, que são chamados de pacotes
(packages). O pacote básico traz a funcionalidade necessária para as análises
matemáticas e estatísticas mais usuais. Existem literalmente milhares de outros
pacotes para realizar análises específicas nas mais diversas áreas do
conhecimento científico.
7. Um Pouco Sobre R: Características
FUNCIONAL: a linguagem S, a linguagem que se fala dentro do R, é uma
linguagem funcional, isto é, todas as análises e ações são realizadas por
funções;
ORIENTAÇÃO PARA OBJETOS: a linguagem S é uma linguagem de programação
orientada para objetos, isto é, todas as entidades no ambiente R (dados,
análises, gráficos, funções) são efetivamente objetos;
COLABORATIVO: o R é um esforço mundial de programação em código aberto.
8. Vantagens & Desvantagens
Vantagens Desvantagens
Rápido e gratuito Curva de aprendizagem significativa
Pesquisadores de Estatística fornecem os seus
métodos em pacotes de R
Não há suporte comercial
Nos gráficos perde apenas para o Matlab
Trabalhando com grandes conjuntos de dados
é limitada pela RAM
Comunidade de usuários ativos
Fácil cometer erros se não conhecer bem a
linguagem
Excelente para a simulação, programação,
análises intensivas de computador, etc.
Preparação e limpeza de dados pode ser mais
confusa e mais propenso erro em R que em
soluções proprietárias como SPSS ou SAS
Interfaces com software de armazenamento
de banco de dados (SQL)
Descobrir que métodos utilizar ou como usar
uma função pode ser frustrante.
9. Pipeline de Analytics
Importação de arquivos (readr, readxl, haven, data.table)
Limpeza e tratamento de dados (dplyr, data.table, tidyr, stringr)
Gráficos (ggplot2, dygraphs, plotly)
Interface com bancos de dados (RPostgreSQL, RMySQL, RODBC)
Análise preditiva / Data Science (caret, forecast, rpart, e1071,
knn,
randomForest)
Relatório analítico final (rmarkdown, knitr)
Dashboards interativos (shiny, shinydashboard)
10. Noções de Programação
parênteses "()": são utilizados para toda e qualquer função. P. ex.
função(argumento)
atribuição "<-": são utilizados para nomear objetos. P. ex. nome
do objeto <- função(argumento)
chaves "{}": são utilizados para construir novas funções. P. ex.
função(argumento){
comandos
resultados }
aspas "" são utilizadas para denominar caracteres. P. ex. "Oi,
meu nome é John Snow"
11. Nomes de Variáveis
O R é case sensitive – isto é, letras maiúsculas e minúsculas
são diferenciadas – portanto x1 (com x minúsculo) e X1
(com x maiúsculo) são objetos diferentes;
Os nomes dos objetos no R podem conter combinações
arbitrárias de números, textos, bem como ponto ( . ) e
underscore ( _ ). Entretanto, os nomes não podem começar
com números ou underscore.
15. Salvando o Workspace
# grava o seu workspace com o nome genérico: ".RData"
save.image()
# grava o seu workspace com o nome indicado
save.image(file="minha_sessao_inicial_de_R.RData")
load(file=" minha_sessao_inicial_de_R.RData ")
save(objeto, file="objeto.RData")
q()
21. Tipos de Objetos
vector: o mais elementar e um dos mais importantes;
matrix e array: generalizações multi-dimensionais de vetores;
factor: forma compacta para manipulação de dados categóricos;
list: forma geral de vetores, nos quais os elementos não precisam ser do
mesmo tipo básico. Útil p.ex. para retorno de funções, quando diversos objetos
necessitam ser devolvidas;
data frames: são estruturas na forma de matrizes, em que as colunas podem
ser de diferentes tipos básicos;
funções: maneira simples e conveniente de estender as funcionalidades do R.
22. Criação de Objetos
a = 1:5
b = factor(rep(c("a","b","c"), each=3))
c = data.frame(sec=c("XIX", "XX", "XXI"), inicio=c(1801,1901,2001))
d = matrix(round(runif(40,0,100)), ncol=8)
e = array(1:12, c(3,2,2))
minha.lista = list(um.vetor = a, um.fator = b, um.data.frame = c, uma.matriz =
d)
str(minha.lista); str(minha.lista$um.data.frame); str(d)
length(b); length(minha.lista); dim(minha.lista$um.data.frame); nrow(e);
ncol(e)
23. Indexando e Acessando Itens
O operador [ ] sempre retorna um objeto da mesma classe que o original. Pode
ser usado para selecionar múltiplos elementos de um objeto
O operador [[ ]] é usado para extrair elementos de uma lista ou data frame.
Pode ser usado para extrair um único elemento, e a classe do objeto retornado
não precisa necessariamente ser uma lista ou data frame.
O operador $ é usado para extrair elementos nomeados de uma lista ou data
frame. É similar ao operador [[ ]].
34. Estatística Descritiva
Estatística Descritiva Nome da Função
Média mean
Mediana median
Mínimo min
Máximo max
Amplitude de variação range
Quartis e quantis quantile
Distância Interquartil (Inter Quarter Range) IQR
Variância var
Desvio padrão (Standard Deviation) sd
Desvio abosluto mediano (Mean Absolut
Deviation)
mad
35. Link’s Úteis
Página do Projeto está disponível em http://www.r-project.org/;
Página de download está disponível em http://cran.r-project.org;
Página do RStudio: http://www.rstudio.com/;
Página do Tinn-R: http://nbcgib.uesc.br/lec/software/desenvolvidos/editores/tinn-r/en;
Tutoriais estão disponíveis em http://cran.r-project.org/other-docs.html;
Grupos de discussão são encontrados em http://wiki.r-project.org/rwiki/doku.php;
Novidades são disponíveis em http://cran.r-project.org/doc/Rnews/;
R site search: http://finzi.psych.upenn.edu/search.html;
CRAN Task Views: http://cran.r-project.org/web/views/;
Cartão de referência preparado por Jonathan Baron:
http://www.leg.ufpr.br/~paulojus/misc/refcard.pdf.
36. Os 10 Mandamentos do R
0º - Não entrarás em pânico!
1º - Utilizarás o R para tuas análises bem como para a manipulação de teus dados(não mais o
Excel);
2º - Nunca digitarás o código no console;
3º - Salvarás seus scripts e não se preocuparás com o .RData;
4º - Sempre concatenarás;
5º - Jamais esquecerás dos parênteses das funções;
6º - Conferirás o diretório de trabalho e os dados após a importação, antes de enlouqueceres;
7º - Usarás o help antes de perguntares e não culparás o R por teus erros;
8º - Não esmorecerás após as primeiras noites em claRo e jamais amaldiçoarás o R por tuas faltas
de vírgulas;
9º - Lembrarás das aspas dos caracteres;
10º- Não cobiçarás e aperfeiçoarás os códigos alheios e nunca ocultarás o código e a autoria
original;