SlideShare uma empresa Scribd logo
DATA SCIENCE:
PYTHON VS R
Mestrado em Métodos Quantitativos para
a Decisão Económica e Empresarial
Realizado por:
Iolanda Mota || 48766
•Professor Doutor Carlos J. Costa
•Gestão de Dados || 2019/2020
•DEFINIÇÃO DE DATA SCIENCE
•DATA SCIENCE = { MATEMÁTICA E ESTATÍSTICA
⋂ CIÊNCIAS DA COMPUTAÇÃO ⋂
CONHECIMENTO DO DOMÍNIO EM ANÁLISE}
• DATA SCIENCE:
• O LADO TRANSDISCIPLINAR
•DATA SCIENCE = {ESTATÍSTICA ⋂ INFORMÁTICA
⋂ COMPUTAÇÃO ⋂ COMUNICAÇÃO ⋂
•SOCIOLOGIA ⋂ GESTÃO | DADOS, DOMÍNIO,
PENSAMENTO}
• DATA SCIENCE:
•METODOLOGIA DO PROCESSO
•Fase 1- Compreensão do problema: começa-se por enunciar
de forma clara os objetivos do projeto para posteriormente se
formular o problema de modo a que possa ser resolvido com
recurso a Data Science
•Fase 2- Preparação dos dados: procede-se à limpeza e
preparação dos dados
•Fase 3- Análise exploratória dos dados: obtêm-se
informações sobre os dados através de exploração gráfica
• DATA SCIENCE:
•METODOLOGIA DO PROCESSO
•Fase 4- Configuração: estabelece-se um modelo que servirá
de base. No caso de ser necessário, dividem-se e equilibram-
se os dados
•Fase 5- Modelagem: aplicam-se algoritmos de última geração
para perceber se existem relações interessantes entre os
dados
•Fase 6- Avaliação: determina-se se os modelos criados são
bons e seleciona-se o modelo que apresenta um melhor
desempenho de entre o conjunto de modelos concorrentes
•Fase 7- Implementação: procede-se à aplicação do modelo
no contexto real
PYTHON VS R
R
FUNDADORES: Ross Ihaka e Robert Gentleman
LANÇAMENTO: 1995
OBJETIVO: Código de fácil leitura
SINTAXE: Orientada para as funçõesPYTHON
FUNDADOR: Guido Van Rossum
LANÇAMENTO: 1991
OBJETIVO: Análise de dados, estatísicas e modelos gráficos
SINTAXE: Orientada para o objeto
https://res.cloudinary.com/dyd911kmh/image/upload/f_auto,q_auto:best/v1523009719/main-qimg-9dcf536c501455f073dfbc4e09798a51_vpijr0.png
•INTERESSE NA PESQUISA:
PYTHON E R
INTERFACE
IMPORTAÇÃO DE FICHEIROS CSV E COMANDO HEAD
CÁLCULO DO Nº DE LINHAS DE DADOS E CÁLCULO DA MÉDIA
DATA SCIENCE:
PYTHON VS R

Mais conteúdo relacionado

Semelhante a Data Science: Python vs. R

informações gerenciais
informações gerenciaisinformações gerenciais
informações gerenciais
Sergio Padua
 
AULA 12 - FUNDAMENTOS DE BIG DATA - Data Science
AULA 12 - FUNDAMENTOS DE BIG DATA - Data ScienceAULA 12 - FUNDAMENTOS DE BIG DATA - Data Science
AULA 12 - FUNDAMENTOS DE BIG DATA - Data Science
MaraLuizaGonalvesFre
 
Técnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTécnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literatura
Talita Lima
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
Alexandre Duarte
 
Mineração de Dados Educacionais
Mineração de Dados Educacionais Mineração de Dados Educacionais
Mineração de Dados Educacionais
Prof. Dr. Leandro Augusto
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
Talita Lima
 
Introdução sobre a Mensuração na Comunicação
Introdução sobre a Mensuração na ComunicaçãoIntrodução sobre a Mensuração na Comunicação
Introdução sobre a Mensuração na Comunicação
PaperCliQ Comunicação
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
Marlesson Santana
 
PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS: EXTRAÇÃO DE INFORMAÇ...
PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS: EXTRAÇÃO DE INFORMAÇ...PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS: EXTRAÇÃO DE INFORMAÇ...
PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS: EXTRAÇÃO DE INFORMAÇ...
Kewerson Hugo
 

Semelhante a Data Science: Python vs. R (9)

informações gerenciais
informações gerenciaisinformações gerenciais
informações gerenciais
 
AULA 12 - FUNDAMENTOS DE BIG DATA - Data Science
AULA 12 - FUNDAMENTOS DE BIG DATA - Data ScienceAULA 12 - FUNDAMENTOS DE BIG DATA - Data Science
AULA 12 - FUNDAMENTOS DE BIG DATA - Data Science
 
Técnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTécnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literatura
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
 
Mineração de Dados Educacionais
Mineração de Dados Educacionais Mineração de Dados Educacionais
Mineração de Dados Educacionais
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
Introdução sobre a Mensuração na Comunicação
Introdução sobre a Mensuração na ComunicaçãoIntrodução sobre a Mensuração na Comunicação
Introdução sobre a Mensuração na Comunicação
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS: EXTRAÇÃO DE INFORMAÇ...
PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS: EXTRAÇÃO DE INFORMAÇ...PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS: EXTRAÇÃO DE INFORMAÇ...
PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS: EXTRAÇÃO DE INFORMAÇ...
 

Mais de eurosigdoc acm

Blockchain e o Futuro do Setor Financeiro
Blockchain e o Futuro do Setor FinanceiroBlockchain e o Futuro do Setor Financeiro
Blockchain e o Futuro do Setor Financeiro
eurosigdoc acm
 
No code – Caso Prático no App Inventor - BroTrip
No code – Caso Prático no App Inventor - BroTripNo code – Caso Prático no App Inventor - BroTrip
No code – Caso Prático no App Inventor - BroTrip
eurosigdoc acm
 
The oracle problem nos smart contracts
The oracle problem nos smart contractsThe oracle problem nos smart contracts
The oracle problem nos smart contracts
eurosigdoc acm
 
Robotic process automation
Robotic process automation Robotic process automation
Robotic process automation
eurosigdoc acm
 
Robotic Process Automation: caso de estudo Delloite
Robotic Process Automation: caso de estudo DelloiteRobotic Process Automation: caso de estudo Delloite
Robotic Process Automation: caso de estudo Delloite
eurosigdoc acm
 
Projeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma pplProjeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma ppl
eurosigdoc acm
 
Implementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low CodeImplementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low Code
eurosigdoc acm
 
Proteção de dados e redes sociais
Proteção de dados e redes sociaisProteção de dados e redes sociais
Proteção de dados e redes sociais
eurosigdoc acm
 
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIALCLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
eurosigdoc acm
 
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDINGCROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
eurosigdoc acm
 
Low code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicaçõesLow code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicações
eurosigdoc acm
 
Robotic Process Automation
Robotic Process AutomationRobotic Process Automation
Robotic Process Automation
eurosigdoc acm
 
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDECrowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
eurosigdoc acm
 
Business Intelligence e o Desporto
Business Intelligence e o DesportoBusiness Intelligence e o Desporto
Business Intelligence e o Desporto
eurosigdoc acm
 
Blockchain
Blockchain Blockchain
Blockchain
eurosigdoc acm
 
Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?
eurosigdoc acm
 
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
eurosigdoc acm
 
Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo
eurosigdoc acm
 
Outsystems e o Universo do Low-Code
Outsystems e o Universo do Low-CodeOutsystems e o Universo do Low-Code
Outsystems e o Universo do Low-Code
eurosigdoc acm
 
Erp
ErpErp

Mais de eurosigdoc acm (20)

Blockchain e o Futuro do Setor Financeiro
Blockchain e o Futuro do Setor FinanceiroBlockchain e o Futuro do Setor Financeiro
Blockchain e o Futuro do Setor Financeiro
 
No code – Caso Prático no App Inventor - BroTrip
No code – Caso Prático no App Inventor - BroTripNo code – Caso Prático no App Inventor - BroTrip
No code – Caso Prático no App Inventor - BroTrip
 
The oracle problem nos smart contracts
The oracle problem nos smart contractsThe oracle problem nos smart contracts
The oracle problem nos smart contracts
 
Robotic process automation
Robotic process automation Robotic process automation
Robotic process automation
 
Robotic Process Automation: caso de estudo Delloite
Robotic Process Automation: caso de estudo DelloiteRobotic Process Automation: caso de estudo Delloite
Robotic Process Automation: caso de estudo Delloite
 
Projeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma pplProjeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma ppl
 
Implementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low CodeImplementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low Code
 
Proteção de dados e redes sociais
Proteção de dados e redes sociaisProteção de dados e redes sociais
Proteção de dados e redes sociais
 
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIALCLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
 
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDINGCROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
 
Low code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicaçõesLow code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicações
 
Robotic Process Automation
Robotic Process AutomationRobotic Process Automation
Robotic Process Automation
 
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDECrowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
 
Business Intelligence e o Desporto
Business Intelligence e o DesportoBusiness Intelligence e o Desporto
Business Intelligence e o Desporto
 
Blockchain
Blockchain Blockchain
Blockchain
 
Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?
 
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
 
Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo
 
Outsystems e o Universo do Low-Code
Outsystems e o Universo do Low-CodeOutsystems e o Universo do Low-Code
Outsystems e o Universo do Low-Code
 
Erp
ErpErp
Erp
 

Último

Certificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdfCertificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdf
joaovmp3
 
Manual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdfManual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdf
WELITONNOGUEIRA3
 
História da Rádio- 1936-1970 século XIX .2.pptx
História da Rádio- 1936-1970 século XIX   .2.pptxHistória da Rádio- 1936-1970 século XIX   .2.pptx
História da Rádio- 1936-1970 século XIX .2.pptx
TomasSousa7
 
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdfDESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
Momento da Informática
 
Logica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptxLogica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptx
Momento da Informática
 
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdfTOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
Momento da Informática
 

Último (6)

Certificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdfCertificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdf
 
Manual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdfManual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdf
 
História da Rádio- 1936-1970 século XIX .2.pptx
História da Rádio- 1936-1970 século XIX   .2.pptxHistória da Rádio- 1936-1970 século XIX   .2.pptx
História da Rádio- 1936-1970 século XIX .2.pptx
 
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdfDESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
 
Logica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptxLogica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptx
 
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdfTOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
 

Data Science: Python vs. R

  • 1. DATA SCIENCE: PYTHON VS R Mestrado em Métodos Quantitativos para a Decisão Económica e Empresarial Realizado por: Iolanda Mota || 48766 •Professor Doutor Carlos J. Costa •Gestão de Dados || 2019/2020
  • 2. •DEFINIÇÃO DE DATA SCIENCE •DATA SCIENCE = { MATEMÁTICA E ESTATÍSTICA ⋂ CIÊNCIAS DA COMPUTAÇÃO ⋂ CONHECIMENTO DO DOMÍNIO EM ANÁLISE}
  • 3. • DATA SCIENCE: • O LADO TRANSDISCIPLINAR •DATA SCIENCE = {ESTATÍSTICA ⋂ INFORMÁTICA ⋂ COMPUTAÇÃO ⋂ COMUNICAÇÃO ⋂ •SOCIOLOGIA ⋂ GESTÃO | DADOS, DOMÍNIO, PENSAMENTO}
  • 4. • DATA SCIENCE: •METODOLOGIA DO PROCESSO •Fase 1- Compreensão do problema: começa-se por enunciar de forma clara os objetivos do projeto para posteriormente se formular o problema de modo a que possa ser resolvido com recurso a Data Science •Fase 2- Preparação dos dados: procede-se à limpeza e preparação dos dados •Fase 3- Análise exploratória dos dados: obtêm-se informações sobre os dados através de exploração gráfica
  • 5. • DATA SCIENCE: •METODOLOGIA DO PROCESSO •Fase 4- Configuração: estabelece-se um modelo que servirá de base. No caso de ser necessário, dividem-se e equilibram- se os dados •Fase 5- Modelagem: aplicam-se algoritmos de última geração para perceber se existem relações interessantes entre os dados •Fase 6- Avaliação: determina-se se os modelos criados são bons e seleciona-se o modelo que apresenta um melhor desempenho de entre o conjunto de modelos concorrentes •Fase 7- Implementação: procede-se à aplicação do modelo no contexto real
  • 7. R FUNDADORES: Ross Ihaka e Robert Gentleman LANÇAMENTO: 1995 OBJETIVO: Código de fácil leitura SINTAXE: Orientada para as funçõesPYTHON FUNDADOR: Guido Van Rossum LANÇAMENTO: 1991 OBJETIVO: Análise de dados, estatísicas e modelos gráficos SINTAXE: Orientada para o objeto https://res.cloudinary.com/dyd911kmh/image/upload/f_auto,q_auto:best/v1523009719/main-qimg-9dcf536c501455f073dfbc4e09798a51_vpijr0.png
  • 10. IMPORTAÇÃO DE FICHEIROS CSV E COMANDO HEAD
  • 11. CÁLCULO DO Nº DE LINHAS DE DADOS E CÁLCULO DA MÉDIA