O documento discute o uso de ferramentas de código aberto para ciência de dados, com foco na plataforma Pentaho. Apresenta os conceitos de ciência de dados, software livre e código aberto, e descreve as funcionalidades do Pentaho para integrar, armazenar, processar e visualizar dados, incluindo relatórios, dashboards e machine learning.
FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...Ambiente Livre
Nesta palestra será apresentado como podemos construir uma plataforma para geração de insights significativos usando apenas tecnologias open source e free softwares. Desafios do uso do Open Source e diferenciais competitivos e estratégicos. Serão detalhadas também questões técnicas da funções das ferramentas de integração de dados, carga de lotes, qualidade dos dados, segurança dos dados, estrutura distribuída, data warehouse, fluxo de dados em tempo real, processamento e visualização de dados todas open source para que possa se implementar uma plataforma Open Source para Data Science. Um destaque especial do uso do Pentaho nesta plataforma será abordado.
ATENÇÃO: Como é um slide mais visual, os texto de apoio que estão apartir do slide 10 são de extrema importância, leia-os para compreender sobre o tema.
DESIGN DO SLIDE DE AUTORIA DE DAYANE CRISTINE LEITE.
ROTEIRO DO SLIDE DE AUTORIA DE MIGUEL DE OLIVEIRA.
Trabalho apresentado em equipe para a matéria de Fundamentos de Sistemas de Informação em 2018.
Links utilizados:
http://nyti.ms/1EQTznL
http://on.fb.me/1EQTq3A
https://www.cetax.com.br/blog/data-science-ou-ciencia-de-dados/
https://datajobs.com/what-is-data-science
https://www.datasciencegraduateprograms.com/python/
Low Code Data Science with Pentaho Machine IntelligenceAmbiente Livre
Palestra apresentada na CONFLOSS 2021
Resumo da palestra:
Apresentaremos como podemos usar e tratar dados para executa-los e capturar seus resultados de forma automatizada para automação corporativa de processos de IA ou ML usando as ferramenta Pentaho Data Integration e a Weka/PMI ( Pentaho Machine Intelligence) e um case será desenvolvido ao vivo.
Palestra apresentada no TDC 2018 - São Paulo com uma visão geral do Apache Flink e suas características , assim como uma comparação com apache Spark e Map Reduce e como montar um cluster com Flink.
Informações sobre treinamento em Apache Flnk acesse: http://www.ambientelivre.com.br/treinamento/hadoop/apache-flink.html
FISL18 - Open Data Science - Elaborando uma plataforma de Big Data & Analytic...Ambiente Livre
Nesta palestra será apresentado como podemos construir uma plataforma para geração de insights significativos usando apenas tecnologias open source e free softwares. Desafios do uso do Open Source e diferenciais competitivos e estratégicos. Serão detalhadas também questões técnicas da funções das ferramentas de integração de dados, carga de lotes, qualidade dos dados, segurança dos dados, estrutura distribuída, data warehouse, fluxo de dados em tempo real, processamento e visualização de dados todas open source para que possa se implementar uma plataforma Open Source para Data Science. Um destaque especial do uso do Pentaho nesta plataforma será abordado.
ATENÇÃO: Como é um slide mais visual, os texto de apoio que estão apartir do slide 10 são de extrema importância, leia-os para compreender sobre o tema.
DESIGN DO SLIDE DE AUTORIA DE DAYANE CRISTINE LEITE.
ROTEIRO DO SLIDE DE AUTORIA DE MIGUEL DE OLIVEIRA.
Trabalho apresentado em equipe para a matéria de Fundamentos de Sistemas de Informação em 2018.
Links utilizados:
http://nyti.ms/1EQTznL
http://on.fb.me/1EQTq3A
https://www.cetax.com.br/blog/data-science-ou-ciencia-de-dados/
https://datajobs.com/what-is-data-science
https://www.datasciencegraduateprograms.com/python/
Low Code Data Science with Pentaho Machine IntelligenceAmbiente Livre
Palestra apresentada na CONFLOSS 2021
Resumo da palestra:
Apresentaremos como podemos usar e tratar dados para executa-los e capturar seus resultados de forma automatizada para automação corporativa de processos de IA ou ML usando as ferramenta Pentaho Data Integration e a Weka/PMI ( Pentaho Machine Intelligence) e um case será desenvolvido ao vivo.
Palestra apresentada no TDC 2018 - São Paulo com uma visão geral do Apache Flink e suas características , assim como uma comparação com apache Spark e Map Reduce e como montar um cluster com Flink.
Informações sobre treinamento em Apache Flnk acesse: http://www.ambientelivre.com.br/treinamento/hadoop/apache-flink.html
AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration Ambiente Livre
Palestra apresentada no TDC Florianópolis 2018 na Trilha Data Science.
AEL é o futuro das aplicação a partir de motores emergentes. Hoje você pode desenvolver visualmente o aplicativo para o motor Pentaho em um cluster Spark. À medida que surgem novas tecnologias, a AEL será implementada para outros motores, de modo que os desenvolvedores não precisam reescrever sua aplicação. Esta abordagem também permite que Cientistas de Dados usem das melhores praticas tecnologias sem conhecer detalhes mais aprofundados de arquiteturas de big data e consigam executar seu tratamento de dados com pouco esforço ( ou nenhum ) de codificação. Atualmente o Pentaho e a única ferramenta de ETL que implementa o conceito de AEL no mundo e me parece uma tendência clara.
Cientista de Dados – Dominando o Big Data com Software Livre Ambiente Livre
Palestra apresentada no FISL 16 - Serão apresentados os conceitos gerais sobre Big Data, as características as atividades do profissional de Big Data ( Cientista de Dados ), como tornar-se um cientista de dados, as principais ferramentas de mercado, e como este profissional pode usar o potencial das ferramentas de software livre e software aberto para dominar esta área de atuação. Uma visão geral sobre Hadoop, Cassandra, MongoDB, noSQL, BI, Data Mining e Analitycs entre outros conceitos emergentes da área de governança de dados será repassada aos participantes.
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
Serão apresentados os conceitos gerais sobre Big Data, as características as atividades do profissional de Big Data ( Cientista de Dados ), como tornar-se um cientista de dados, as principais ferramentas de mercado, e como este profissional pode usar o potencial das ferramentas de software livre e software aberto para dominar esta área de atuação.
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
Apresentação da utilização do PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho realizada no PgDay 2016 de Curitiba. Slides em :
Trabalho sobre Big Data apresentado na disciplina Tópicos Especiais de TI no curso de Sistemas de Informação do IFAL. Fala sobre algumas definições que auxiliaram no surgimento do que hoje chamamos de Big Data, além de falar sobre a ferramenta SPLUNK
Como é que o Marketing Analytics pode ser usado com o TableauGOOD Intelligence
A plataforma Business Intelligence Tableau é uma das mais utilizadas no mercado.
Aqui, utlizamos um exemplo de como a próprio Tableau a utiliza para o Marketing Analytics.
A tableau integra várias fontes de dados, mesmo do Google Analytics e do Social e coloca à disposição numa única plataforma.
Seis histórias de sucesso em Social Analytics, Web Monitoring e Issues Management aplicados a campanhas, crises corporativas e análise de performance na web.
Para fazer o download da pesquisa completa visite: www.medialogue.com.br/publicacoes
AEL - Adaptive Execution Layer on Spark Cluster with Pentaho Data Integration Ambiente Livre
Palestra apresentada no TDC Florianópolis 2018 na Trilha Data Science.
AEL é o futuro das aplicação a partir de motores emergentes. Hoje você pode desenvolver visualmente o aplicativo para o motor Pentaho em um cluster Spark. À medida que surgem novas tecnologias, a AEL será implementada para outros motores, de modo que os desenvolvedores não precisam reescrever sua aplicação. Esta abordagem também permite que Cientistas de Dados usem das melhores praticas tecnologias sem conhecer detalhes mais aprofundados de arquiteturas de big data e consigam executar seu tratamento de dados com pouco esforço ( ou nenhum ) de codificação. Atualmente o Pentaho e a única ferramenta de ETL que implementa o conceito de AEL no mundo e me parece uma tendência clara.
Cientista de Dados – Dominando o Big Data com Software Livre Ambiente Livre
Palestra apresentada no FISL 16 - Serão apresentados os conceitos gerais sobre Big Data, as características as atividades do profissional de Big Data ( Cientista de Dados ), como tornar-se um cientista de dados, as principais ferramentas de mercado, e como este profissional pode usar o potencial das ferramentas de software livre e software aberto para dominar esta área de atuação. Uma visão geral sobre Hadoop, Cassandra, MongoDB, noSQL, BI, Data Mining e Analitycs entre outros conceitos emergentes da área de governança de dados será repassada aos participantes.
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
Serão apresentados os conceitos gerais sobre Big Data, as características as atividades do profissional de Big Data ( Cientista de Dados ), como tornar-se um cientista de dados, as principais ferramentas de mercado, e como este profissional pode usar o potencial das ferramentas de software livre e software aberto para dominar esta área de atuação.
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
Apresentação da utilização do PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho realizada no PgDay 2016 de Curitiba. Slides em :
Trabalho sobre Big Data apresentado na disciplina Tópicos Especiais de TI no curso de Sistemas de Informação do IFAL. Fala sobre algumas definições que auxiliaram no surgimento do que hoje chamamos de Big Data, além de falar sobre a ferramenta SPLUNK
Como é que o Marketing Analytics pode ser usado com o TableauGOOD Intelligence
A plataforma Business Intelligence Tableau é uma das mais utilizadas no mercado.
Aqui, utlizamos um exemplo de como a próprio Tableau a utiliza para o Marketing Analytics.
A tableau integra várias fontes de dados, mesmo do Google Analytics e do Social e coloca à disposição numa única plataforma.
Seis histórias de sucesso em Social Analytics, Web Monitoring e Issues Management aplicados a campanhas, crises corporativas e análise de performance na web.
Para fazer o download da pesquisa completa visite: www.medialogue.com.br/publicacoes
Apresentação do Arquiteto e Urbanista Renato Schattan, sobre Geoprocessamento e utilização do QGis. Foi realizada nos dias 12 e 13 de Setembro no Media Lab - UFG
Como extrair insights no meio digital para execução de uma Estratégia Data...Estêvão Soares Custodio
Palestra ministrada no RD SUmmit 2017.
Uma visão prática sobre a análise de dados no meio digital, como extrair insights (incluindo dicas de ferramentas), métodos e processos.
E o maior importante, como utilizar dados de forma a apoiar o processo de decisão.
#RDsummit
@estevaosoares
facebook.com/estevao.sc
youtube.com/estevaosocial
instagram.com/estevaosoares
snap: estevaosoares
Apresentação realizada na IV Conferência sobre Tecnologia Cultura e Memória (CTCM-2017).
Palestrante: Batista, Conceição; Macêdo, Roberta
Palestra: Data analysis open data.
Facebook:
https://www.facebook.com/pg/CTCMUFPE/
https://www.facebook.com/liberufpe/
Palestra - Social Media Week - Carreira Social Media - Erros e acertos que vo...Fernando Souza
Essa palestra aborda os principais cargos e desdobramentos que podem aparecer pelo caminho de um profissional de social media, além de elencar alguns erros e acertos que podem alavancar ou derrubar sua carreira profissional. Conheça alguns cases e boa praticas para não fazer feio =)
Link do evento: http://fernando.tips/carreira-social-media
Video da Transmissão ao vivo: https://www.facebook.com/smwsp/videos/1623782531007780
Mais informações e contato: http://fernando.tips/smw-carreira-sm
CLASSIFICAÇÃO DE DOCUMENTOS FILATÉLICOS EM FORMATO ABERTO PARA WEB: o caso do...Liber UFPE
Apresentação realizada na IV Conferência sobre Tecnologia Cultura e Memória (CTCM-2017).
Palestrante: FEITOSA, Kézia de Lira; SALCEDO, Diego Andres
Palestra: CLASSIFICAÇÃO DE DOCUMENTOS FILATÉLICOS EM FORMATO ABERTO PARA WEB: o caso dos selos postais no Repositório Filatélico Brasileiro
Facebook:
https://www.facebook.com/pg/CTCMUFPE/
https://www.facebook.com/liberufpe/
Slides do Webinar para ir além do Básico em Social Media.
É importante ter sempre em vista como alinhar os objetivos de negócio com as ações no meio digital, caso contrário, você corre o risco de entrar em um modelo não sustentável.
A palestra apresenta o conceito de data lakes e big data, e como estas arquiteturas são formadas para o armazenamento e consumo de grande volumes de dados, sua relação com as arquiteturas distribuídas como é o caso do ecosistema Hadoop e como o a suíte Pentaho pode ajudar na gestão e extração de informações para tomada de decisão com recursos de big data analitycs.
Ciencia de dados na pratica, com transparencia e produtividadeJohn Lemos Forman
Apresentação durante o #rioinfo2018 mostrando como plataformas de ciência de dados podem ajudar a integrar equipes multidisciplinares aumentando sua produtividade. O processo fica mais gerenciável e transparente, ajudando as empresas em suas jornadas de transformação digital. Exemplos baseados na plataforma RapidMiner.
BIG DATA, O PODER DA INFORMAÇÃO, SEUS CASOS DE USO E PRINCIPAIS ARQUITETURAS.
Palestra sobre o poder da Informação e como os dados estão revolucionando o mundo. Quais os principais casos de uso dos gigantes de Telecom e E-Comerce, e arquiteturas que eles utilizam.
Pentaho Data Integration - Integração e Migração de Dados com ETL Open Source...Ambiente Livre
O Kettle, também conhecido como Pentaho Data Integration é uma ferramenta de ETL Open Source. A mesma faz parte da suíte de Pentaho Business Intelligence para integração de dados e migração de dados. A função de um ETL é o processo de Extração de dados, Transformação e Carga conforme regras de negócios para um Data Mart ou um Data Warehouse, contudo, ETL pode ser aplicado a um processo de carga de qualquer base de dados.
Moodle - Sistema de Gestão da Aprendizagem Open SourceAmbiente Livre
Apresentar as principais funcionalidades do Software Moodle e como o mesmo pode ajudar na gestão de aprendizagem. Serão apresentadas todas as características do software: Fóruns Gestão de conteúdos (Recursos) Questionários e pesquisas com diversos formatos Blogs Wikis Geração e gestão de Base de Dados Sondagens Chat Glossários Suporte multi-idioma (mais de sessenta idiomas são suportados pelo interface atual)
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics 100% Open Source
1. Open Source Data
Science
Open Source Data Science - Elaborando uma
plataforma de Big Data & Analytics 100% Open
Source
Marcio Junior Vieira
CEO & Data Scientist, Ambiente Livre
3. Open Source Data
Science
Open Source Data Science - Elaborando uma
plataforma de Big Data & Analytics 100% Open
Source
Marcio Junior Vieira
CEO & Data Scientist, Ambiente Livre