12. Bases dedados
Microsoft Excel Embora seja uma ferramenta amplamente conhecida, o Excel continua sendo uma ferramenta
valiosa para a coleta e análise de dados. Ele oferece recursos avançados para trabalhar com planilhas, como
fórmulas, gráficos e tabelas dinâmicas. O Excel também permite a importação e conexão com outras fontes de
dados, como bancos de dados e arquivos CSV. Excel apresenta limitações, como a dificuldade de lidar com
grandes volumes de dados.
SQL (link tabelas, tabelas relacionais. R e Python, falam com SQL). A linguagem SQL (Structured Query
Language - Linguagem de Consulta Estruturada) é utilizada para consultar e manipular bancos de dados
relacionais. É uma ferramenta essencial para a coleta e análise de dados, pois permite a extração de
informações de grandes volumes de dados armazenados em um banco de dados. O SQL possui uma sintaxe
simples e flexível, o que facilita a manipulação dos dados e a realização de consultas complexas.
13. Visualização de dados
Microsoft Power BI (trabalha com Excel, Bases SQL, R, Python). No início do texto, falamos de uma ferramenta
simples e de fácil acesso da Microsoft — o Excel, que pode ser utilizado na análise de dados simplificados. No
entanto, para quem busca uma maior capacidade e mais precisão, a gigante da tecnologia oferece o Power BI,
que tem como foco a inteligência de negócios — Business Intelligence.
Uma curiosidade interessante é que o Power BI começou como um plugin do Excel e, depois, foi desenvolvido
até se tornar um conjunto independente de software de análise de dados de negócios.
Entre os seus diferenciais, está a capacidade de os usuários criarem painéis visuais interativos a partir de uma
curva de aprendizado mínima. Outro destaque é a excelente conectividade de dados, que permite a integração
com o Excel e buscas em arquivos de textos, em servidores SQL (Structured Query Language) e em sistemas
em nuvem — como os programas analíticos do Google e da Amazon. Para quem quer conhecer a ferramenta, a
Microsoft oferece uma assinatura gratuita, com um limite de dados de 2 Gb. É uma excelente oportunidade para
fazer os testes antes de tomar a decisão de assinar ou não um plano pago.
Tableau - é uma plataforma de análise visual que está transformando a maneira como usamos dados para
solucionar problemas, capacitando pessoas e organizações para que obtenham o máximo de seus dados.
Amazon QuickSight é um serviço de Business Intelligence incorporável e sem servidor, baseado em nuvem,
com aprendizado de máquina integrado. Com essa ferramenta da AWS - Amazon Web Services, o usuário tem a
oportunidade de criar e publicar painéis interativos de Business Intelligence que podem ser consultados com a
utilização de linguagem natural.
Um dos benefícios dessa solução é a capacidade de escalar para milhares de usuários, sem a necessidade de
investimento e de infraestrutura. Uma das maneiras de testar o QuickSight é adquirindo um plano de pagamento
por demanda. Ou seja, você só pagará quando acessar os painéis e relatórios, que podem ser visualizados em
14. Linguagem
Python (linguagem). O Python é uma linguagem de programação que pode ser utilizada para várias
atividades e é considerada indispensável para cientistas e analistas de dados. Um dos diferenciais da
linguagem Python é a sua simplicidade sintática, que aumentou a sua popularidade entre os
desenvolvedores. O Python é uma das linguagens com o maior número de bibliotecas(Pandas, NumPy e
Scikit-learn) e recursos voltados para as tarefas relativas à análise de dados.
Linguagem/ Estatistica
R (análise de dados e modelagem). Assim como o Python, o R é uma linguagem de programação
amplamente utilizada na área de ciência de dados. O R oferece uma série de pacotes que permitem a
manipulação e análise de dados. Além disso, o R possui gráficos e funções estatísticas avançadas que
facilitam a exploração e modelagem dos dados. O R também é uma linguagem de fácil aprendizado e possui
uma grande comunidade de usuários que contribuem com pacotes e tutoriais.
SPSS O Statistical Package for Social Science for Windows (SPSS) - O SPSS e um software estatístico que
permite a utilização de dados em diversos formatos para gerar relatórios, calcular estatísticas descritivas,
conduzir analises estatísticas complexas e elaborar gráficos.
SAS. O popular SAS — sigla para Statistical Analysis System — é um conjunto de ferramentas de inteligência
de negócios e análise de dados. Ele foi desenvolvido pelo Instituto SAS na década de 1960 e evoluiu muito
desde então.
Seu principal uso hoje é para a criação de perfis de clientes, para a geração de relatórios, para a mineração
de dados e para a modelagem preditiva. Criado para o mercado corporativo, o software é robusto, versátil e
bastante utilizado nas grandes organizações — haja vista que o alto custo pode inviabilizar o seu emprego
em médias e pequenas empresas.
Um dos grandes benefícios de investir no SAS é que a sua equipe de desenvolvimento pode trabalhar de
forma ininterrupta, produzindo e entregando novos módulos que atendem às demandas mais recentes das
companhias.
15. As tendências em ferramentas de ciência de dados estão relacionadas à
inteligência artificial e aprendizado de máquina, big data e visualização de
dados.
Ao utilizar essas ferramentas de forma adequada, os profissionais de ciência de
dados podem obter insights valiosos e tomar decisões embasadas em dados sólidos.
16.
17.
18.
19. Dicas importantes
Seguem algumas dicas de sites de ferramentas interessantes para o dia a dia de
vocês
No Instagram
•Ninjaexcel
•hastahgtreinamentos
Curso Excel COMPLETO do Básico ao Avançado
https://www.udemy.com/course/excel-curso-completo/
https://www.sp.senac.br/cursos-livres/curso-de-excel-criando-planilhas-
interativas-e-dashboard Links to an external site.
https://ieg.com.br/produto/excel-aplicado-a-negocios-online/
Notas do Editor
A Amazon Web Services (AWS) é a plataforma de nuvem mais adotada e mais abrangente do mundo, oferecendo mais de 200 serviços completos de datacenters em todo o mundo. Milhões de clientes, incluindo as startups que crescem mais rápido, as maiores empresas e os maiores órgãos governamentais, estão usando a AWS para reduzir custos, ganhar agilidade e inovar
mais rapidamente.
O SQL é uma linguagem padrão para manipulação de registros em bancos de dados relacionais. A sigla SQL vem dos termos em inglês “Structured Query Language”, que podem ser traduzidos para o português como “Linguagem de Consulta Estruturada”
O ETL descreve o processo completo em que uma empresa coleta todos os dados, estruturados e não estruturados, e gerenciados por qualquer número de equipes em todo o mundo, e os processa de forma que eles se tornem realmente úteis para fins comerciais.