O documento resume como o Pentaho Big Data Analytics pode orquestrar bancos de dados NoSQL como HBase, Cassandra e MongoDB. Ele também discute como o Pentaho pode integrar e analisar dados armazenados nesses bancos de dados.
FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...Ambiente Livre
Nesta palestra será apresentado como podemos construir uma plataforma para geração de insights significativos usando apenas tecnologias open source e free softwares. Desafios do uso do Open Source e diferenciais competitivos e estratégicos. Serão detalhadas também questões técnicas da funções das ferramentas de integração de dados, carga de lotes, qualidade dos dados, segurança dos dados, estrutura distribuída, data warehouse, fluxo de dados em tempo real, processamento e visualização de dados todas open source para que possa se implementar uma plataforma Open Source para Data Science. Um destaque especial do uso do Pentaho nesta plataforma será abordado.
Low Code Data Science with Pentaho Machine IntelligenceAmbiente Livre
Palestra apresentada na CONFLOSS 2021
Resumo da palestra:
Apresentaremos como podemos usar e tratar dados para executa-los e capturar seus resultados de forma automatizada para automação corporativa de processos de IA ou ML usando as ferramenta Pentaho Data Integration e a Weka/PMI ( Pentaho Machine Intelligence) e um case será desenvolvido ao vivo.
Palestra apresentada no TDC 2018 - São Paulo com uma visão geral do Apache Flink e suas características , assim como uma comparação com apache Spark e Map Reduce e como montar um cluster com Flink.
Informações sobre treinamento em Apache Flnk acesse: http://www.ambientelivre.com.br/treinamento/hadoop/apache-flink.html
AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration Ambiente Livre
Palestra apresentada no TDC Florianópolis 2018 na Trilha Data Science.
AEL é o futuro das aplicação a partir de motores emergentes. Hoje você pode desenvolver visualmente o aplicativo para o motor Pentaho em um cluster Spark. À medida que surgem novas tecnologias, a AEL será implementada para outros motores, de modo que os desenvolvedores não precisam reescrever sua aplicação. Esta abordagem também permite que Cientistas de Dados usem das melhores praticas tecnologias sem conhecer detalhes mais aprofundados de arquiteturas de big data e consigam executar seu tratamento de dados com pouco esforço ( ou nenhum ) de codificação. Atualmente o Pentaho e a única ferramenta de ETL que implementa o conceito de AEL no mundo e me parece uma tendência clara.
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Ambiente Livre
Nesta palestra será apresentado como podemos construir uma plataforma para geração de insights significativos usando apenas tecnologias open source e free softwares. Desafios do uso do Open Source e diferenciais competitivos e estratégicos. Serão detalhadas também questões técnicas da funções das ferramentas de integração de dados, carga de lotes, qualidade dos dados, segurança dos dados, estrutura distribuída, data warehouse, fluxo de dados em tempo real, processamento e visualização de dados todas open source para que possa se implementar uma plataforma Open Source para Data Science. Um destaque especial do uso do Pentaho nesta plataforma será abordado.
FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...Ambiente Livre
Nesta palestra será apresentado como podemos construir uma plataforma para geração de insights significativos usando apenas tecnologias open source e free softwares. Desafios do uso do Open Source e diferenciais competitivos e estratégicos. Serão detalhadas também questões técnicas da funções das ferramentas de integração de dados, carga de lotes, qualidade dos dados, segurança dos dados, estrutura distribuída, data warehouse, fluxo de dados em tempo real, processamento e visualização de dados todas open source para que possa se implementar uma plataforma Open Source para Data Science. Um destaque especial do uso do Pentaho nesta plataforma será abordado.
Low Code Data Science with Pentaho Machine IntelligenceAmbiente Livre
Palestra apresentada na CONFLOSS 2021
Resumo da palestra:
Apresentaremos como podemos usar e tratar dados para executa-los e capturar seus resultados de forma automatizada para automação corporativa de processos de IA ou ML usando as ferramenta Pentaho Data Integration e a Weka/PMI ( Pentaho Machine Intelligence) e um case será desenvolvido ao vivo.
Palestra apresentada no TDC 2018 - São Paulo com uma visão geral do Apache Flink e suas características , assim como uma comparação com apache Spark e Map Reduce e como montar um cluster com Flink.
Informações sobre treinamento em Apache Flnk acesse: http://www.ambientelivre.com.br/treinamento/hadoop/apache-flink.html
AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration Ambiente Livre
Palestra apresentada no TDC Florianópolis 2018 na Trilha Data Science.
AEL é o futuro das aplicação a partir de motores emergentes. Hoje você pode desenvolver visualmente o aplicativo para o motor Pentaho em um cluster Spark. À medida que surgem novas tecnologias, a AEL será implementada para outros motores, de modo que os desenvolvedores não precisam reescrever sua aplicação. Esta abordagem também permite que Cientistas de Dados usem das melhores praticas tecnologias sem conhecer detalhes mais aprofundados de arquiteturas de big data e consigam executar seu tratamento de dados com pouco esforço ( ou nenhum ) de codificação. Atualmente o Pentaho e a única ferramenta de ETL que implementa o conceito de AEL no mundo e me parece uma tendência clara.
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Ambiente Livre
Nesta palestra será apresentado como podemos construir uma plataforma para geração de insights significativos usando apenas tecnologias open source e free softwares. Desafios do uso do Open Source e diferenciais competitivos e estratégicos. Serão detalhadas também questões técnicas da funções das ferramentas de integração de dados, carga de lotes, qualidade dos dados, segurança dos dados, estrutura distribuída, data warehouse, fluxo de dados em tempo real, processamento e visualização de dados todas open source para que possa se implementar uma plataforma Open Source para Data Science. Um destaque especial do uso do Pentaho nesta plataforma será abordado.
Cientista de Dados – Dominando o Big Data com Software Livre Ambiente Livre
Palestra apresentada no FISL 16 - Serão apresentados os conceitos gerais sobre Big Data, as características as atividades do profissional de Big Data ( Cientista de Dados ), como tornar-se um cientista de dados, as principais ferramentas de mercado, e como este profissional pode usar o potencial das ferramentas de software livre e software aberto para dominar esta área de atuação. Uma visão geral sobre Hadoop, Cassandra, MongoDB, noSQL, BI, Data Mining e Analitycs entre outros conceitos emergentes da área de governança de dados será repassada aos participantes.
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
Serão apresentados os conceitos gerais sobre Big Data, as características as atividades do profissional de Big Data ( Cientista de Dados ), como tornar-se um cientista de dados, as principais ferramentas de mercado, e como este profissional pode usar o potencial das ferramentas de software livre e software aberto para dominar esta área de atuação.
ATENÇÃO: Como é um slide mais visual, os texto de apoio que estão apartir do slide 10 são de extrema importância, leia-os para compreender sobre o tema.
DESIGN DO SLIDE DE AUTORIA DE DAYANE CRISTINE LEITE.
ROTEIRO DO SLIDE DE AUTORIA DE MIGUEL DE OLIVEIRA.
Trabalho apresentado em equipe para a matéria de Fundamentos de Sistemas de Informação em 2018.
Links utilizados:
http://nyti.ms/1EQTznL
http://on.fb.me/1EQTq3A
https://www.cetax.com.br/blog/data-science-ou-ciencia-de-dados/
https://datajobs.com/what-is-data-science
https://www.datasciencegraduateprograms.com/python/
A apresentação tem como objetivo demonstrar uma arquitetura para solução Big Data utilizando componentes Open Source, a mesma foi apresentada no TDC 2014 em Porto Alegre.
Trabalho sobre Big Data apresentado na disciplina Tópicos Especiais de TI no curso de Sistemas de Informação do IFAL. Fala sobre algumas definições que auxiliaram no surgimento do que hoje chamamos de Big Data, além de falar sobre a ferramenta SPLUNK
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
Apresentação da utilização do PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho realizada no PgDay 2016 de Curitiba. Slides em :
Cientista de Dados – Dominando o Big Data com Software Livre Ambiente Livre
Palestra apresentada no FISL 16 - Serão apresentados os conceitos gerais sobre Big Data, as características as atividades do profissional de Big Data ( Cientista de Dados ), como tornar-se um cientista de dados, as principais ferramentas de mercado, e como este profissional pode usar o potencial das ferramentas de software livre e software aberto para dominar esta área de atuação. Uma visão geral sobre Hadoop, Cassandra, MongoDB, noSQL, BI, Data Mining e Analitycs entre outros conceitos emergentes da área de governança de dados será repassada aos participantes.
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
Serão apresentados os conceitos gerais sobre Big Data, as características as atividades do profissional de Big Data ( Cientista de Dados ), como tornar-se um cientista de dados, as principais ferramentas de mercado, e como este profissional pode usar o potencial das ferramentas de software livre e software aberto para dominar esta área de atuação.
ATENÇÃO: Como é um slide mais visual, os texto de apoio que estão apartir do slide 10 são de extrema importância, leia-os para compreender sobre o tema.
DESIGN DO SLIDE DE AUTORIA DE DAYANE CRISTINE LEITE.
ROTEIRO DO SLIDE DE AUTORIA DE MIGUEL DE OLIVEIRA.
Trabalho apresentado em equipe para a matéria de Fundamentos de Sistemas de Informação em 2018.
Links utilizados:
http://nyti.ms/1EQTznL
http://on.fb.me/1EQTq3A
https://www.cetax.com.br/blog/data-science-ou-ciencia-de-dados/
https://datajobs.com/what-is-data-science
https://www.datasciencegraduateprograms.com/python/
A apresentação tem como objetivo demonstrar uma arquitetura para solução Big Data utilizando componentes Open Source, a mesma foi apresentada no TDC 2014 em Porto Alegre.
Trabalho sobre Big Data apresentado na disciplina Tópicos Especiais de TI no curso de Sistemas de Informação do IFAL. Fala sobre algumas definições que auxiliaram no surgimento do que hoje chamamos de Big Data, além de falar sobre a ferramenta SPLUNK
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
Apresentação da utilização do PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho realizada no PgDay 2016 de Curitiba. Slides em :
A palestra apresenta o conceito de data lakes e big data, e como estas arquiteturas são formadas para o armazenamento e consumo de grande volumes de dados, sua relação com as arquiteturas distribuídas como é o caso do ecosistema Hadoop e como o a suíte Pentaho pode ajudar na gestão e extração de informações para tomada de decisão com recursos de big data analitycs.
Você obterá uma visão geral sobre Big Data!
(O que é Big Data?
Como esta o mercado de trabalho?
Quem está falando sobre o tema?
O que vem sendo feito nas indústrias e empresas?
Por onde começar?
Contatos:
Facebook: fb.com/PauloRicardovds
Linkedin:/in/pauloricardovds
Github:/pauloricardovds
Youtube: /user/pauloricardodba
Site: http://www.paulorsantos.com
Email: Paulo@paulorsantos.com
Pentaho Data Integration - Integração e Migração de Dados com ETL Open Source...Ambiente Livre
O Kettle, também conhecido como Pentaho Data Integration é uma ferramenta de ETL Open Source. A mesma faz parte da suíte de Pentaho Business Intelligence para integração de dados e migração de dados. A função de um ETL é o processo de Extração de dados, Transformação e Carga conforme regras de negócios para um Data Mart ou um Data Warehouse, contudo, ETL pode ser aplicado a um processo de carga de qualquer base de dados.
Moodle - Sistema de Gestão da Aprendizagem Open SourceAmbiente Livre
Apresentar as principais funcionalidades do Software Moodle e como o mesmo pode ajudar na gestão de aprendizagem. Serão apresentadas todas as características do software: Fóruns Gestão de conteúdos (Recursos) Questionários e pesquisas com diversos formatos Blogs Wikis Geração e gestão de Base de Dados Sondagens Chat Glossários Suporte multi-idioma (mais de sessenta idiomas são suportados pelo interface atual)
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
1. Orquestrando HBase,
Cassandra e MongoDB com
o Pentaho Big Data
Analytics.
Marcio Junior Vieira
CEO & Data Scientist, Ambiente Livre
Prof. MBA Universidade Positivo