Leo Naressi - DP6
Preparando e
Processando Dados
para Inteligência
Artificial
Leo Naressi
// Tech & Dados
Leo Naressi - DP6
Leo Naressi - DP6
Leo Naressi - DP6
Agenda
1. Introdução: A IA e o futuro da Indústria
2. Como a IA se alimenta de dados?
3. Processos e tecnologias de dados para IA
4. Agentes de Inteligência Artificial
5. Para não esquecer
Leo Naressi - DP6
Leo Naressi - DP6
IA e o futuro da Indústria
Sociedade
Leo Naressi - DP6
Leo Naressi - DP6
Impacto
econômico
da IA é
imenso.
Em todas as
áreas da
sociedade.
Leo Naressi - DP6
Leo Naressi - DP6
A adoção já
começou
IA Generativa
(GenAI)
+ IA Preditiva
Leo Naressi - DP6
Leo Naressi - DP6
Quem não quer
mais produtividade
na indústria, não é?
Leo Naressi - DP6
Leo Naressi - DP6
Benefícios da IA já
começam a ser
percebidos como
importantes na
Indústria, mas,
falta de
conhecimento e
dificuldades
técnicas impedem
a adoção
Fonte: 2024 The State of AI in Manufacturing - rootstock
Leo Naressi - DP6
Leo Naressi - DP6
Apesar dos desafios,
potencial de retorno
em 2+ anos inclui
produtividade, corte
de custos e
aumento na receita
Leo Naressi - DP6
Leo Naressi - DP6
Estudo de Caso:
Toyota acelera
prototipação de
carros otimizando
design com GenAI
para atingir os
requisitos de
engenharia
https://pressroom.toyota.com/toyota-research-institute-unveils-new-generative-ai-technique-for-vehicle-design/
Leo Naressi - DP6
Leo Naressi - DP6
Estudo de Caso:
Otimizar o feed
de produtos
para campanhas
de e-commerce
com IA gera
+83% de receita
https://www.fifty-five.com/case-study/optimizing-product-feed-data-with-generative-ai
Leo Naressi - DP6
Leo Naressi - DP6
Estudo de Caso:
Call Center
reduz 50% do
tempo de
atendimento
com GenAI
https://www.bcg.com/publications/2023/maximizing-the-potential-of-generative-ai
Leo Naressi - DP6
Leo Naressi - DP6
Estudo de Caso:
Ferramenta de
geração de
conteúdo e peças
criativas para
campanhas
otimiza
produtividade,
eficiência e
resultados
https://trypencil.com
Velocidade
Tempo de
entrega
Escala
Anúncios por
projeto
Qualidade
% anúncios
aprovados
Resultados
Retorno x
Baseline
Custo
Produção de
anúncios
>40k anúncios
1.6-6x mais rápido 93% score
CreativeX
+151% ROAS 30-50% menor
custo de produção
Leo Naressi - DP6
Leo Naressi - DP6
Mas, nem tudo
são flores (ou
dólares)… Vieses e
preconceitos em
escala
Privacidade e
Segurança
Alucinação e
erros da IA
Custo Ambiental
Propriedade
intelectual
Desemprego
Integração de
tecnologias e
dados
Problemas
regulatórios e
legais
Leo Naressi - DP6
Leo Naressi - DP6
..e nem
tudo
parece
Inteligência
Leo Naressi - DP6
Leo Naressi - DP6
Por isso, precisamos
gerenciar e “domar” a IA
para entregar resultados e
agir responsavelmente
Leo Naressi - DP6
Leo Naressi - DP6
Antes que seja tarde
demais…
Leo Naressi - DP6
Leo Naressi - DP6
Como domar a IA?
Técnicas paras evoluir o entendimento e a inteligência para casos e
contextos específicos
OTIMIZAR
Leo Naressi - DP6
Leo Naressi - DP6
Modelos de IA e
LLM respondem
a partir dos
dados que
foram treinados
Dados / Internet IA / LLM
Treinamento
Prompt /
Comando
+ Contexto
Resposta!
Leo Naressi - DP6
Leo Naressi - DP6
O que podemos
fazer para
melhorar a
resposta?
Dados / Internet IA / LLM
Treinamento
Resposta!
Treinar com dados
melhores Prompt /
Comando
+ Contexto
Fornecer mais
contexto
Melhorar nossas
instruções
Leo Naressi - DP6
Leo Naressi - DP6
Técnicas para evoluir ou adaptar modelos de IA / LLM
Consultas mais estruturadas
Instruções mais detalhadas e com
abordagens metodológicas para guiar
a execução das respostas
● Definir personas ou papéis
● Condições lógicas
● passo-a-passo para tarefas
● Etapas de validação
● fornecer exemplos (few-shot,
chain-of-thought)
● formato de saída
● Encadeamento de prompts
Treino especializado
Re-treinamento dos modelos com
conjuntos de dados específicos, tanto
de conteúdo quanto de pares de
prompts e respostas
● Base de dados de conhecimento
específicos (jurídico, produto,
região, etc)
● Conteúdo em determinado
estilos
● Modelos mais leves e mais
especializados
● Propriedade intelectual
controlada
Extensão dos Modelos Gerais
Pesquisa e contextualização dinâmica
a partir dos prompts para direcionar
os modelos pré-treinados
● Grounding: Embasar respostas
com fornecimentos de dados
factuais
● Afunilar temas ou contextos de
interesse com conteúdo para
não divagar
● Personalizar respostas de
acordo com dados do solicitante
Prompt Engineering
Engenharia de Prompt, Prompt Design
Fine-Tuning
Ajuste-fino nos modelos
RAG
Retrieval-Augmented Generation
Leo Naressi - DP6
Leo Naressi - DP6
Técnicas para evoluir ou adaptar modelos de IA / LLM
Resposta
Prompts
Prompts e
Respostas
Melhorias
nos prompts
Pré-treino
geral
Treino
especializado
Modelo
IA / LLM
Modelo
IA / LLM
Dados
abertos /
internet
Dados privados
ou especializados
Modelo
IA / LLM
Prompts
Retriever
Prompt Engineering
Engenharia de Prompt, Prompt Design
Fine-Tuning
Ajuste-fino nos modelos
RAG
Retrieval-Augmented Generation
Dados privados
ou especializados
Resposta
Embedding /
Vetorização /
Bancos de
dados em
grafos e vetores
Incorpora
dados no
prompt
(Augmenting)
Consulta
dados
relevantes
Leo Naressi - DP6
Leo Naressi - DP6
Quando usar?
● Fácil, ou simples de replicar
● Flexível, se adapta a cada consulta
de acordo com as necessidades
de cada usuário
● Acessível, não requer tecnologias
adicionais
● Baixo impacto computacional
● Precisão escalável
● Consistência e qualidade,
consolidação do conhecimento
● Adaptação máxima ao tema,
indústria, segmento, área de
conhecimento
● Menor tempo de atualização,
informações mais “frescas”
● Relevância: Menos alucinações,
mais fatos, referências diretas
● Eficiência na busca por respostas
contextuais e bem embasadas
● Limitado ao conteúdo já treinado
nos modelos
● Limitado nos formatos de entrega
de cada modelo / tecnologia
● Resultados variam de acordo com
a qualidade técnica dos prompts
● Alto impacto computacional e
ambiental
● Baixa velocidade de atualização
● Exige recursos e conhecimento de
tecnologia, IA, Machine Learning
● Exige grandes volumes dados para
treinar os modelos
● Envolve desenvolvimento,
machine learning, e programação
complexa
● Requer estruturas e formatos de
dados específicos para consultas
dinâmicas
● Médio impacto computacional
Prompt Engineering
Engenharia de Prompt, Prompt Design
Fine-Tuning
Ajuste-fino nos modelos
RAG
Retrieval-Augmented Generation
Leo Naressi - DP6
Leo Naressi - DP6
Mas, peraí,
Vetorização?
Embedding?
WTF?
Dados privados
ou especializados
Embedding /
Vetorização /
Bancos de
dados em
grafos e vetores
Leo Naressi - DP6
Leo Naressi - DP6
Novas estruturas
Falando de dados de um jeito que IA entende
Leo Naressi - DP6
Leo Naressi - DP6
Processar conteúdo em
muitas dimensões
(texto, imagens,
atributos) significa
“entender” estas
dimensões e armazenar
de uma maneira que
possa ser pesquisada
com facilidade
Leo Naressi - DP6
Leo Naressi - DP6
Uma pesquisa em um
banco de dados vetorial
pode encontrar com
facilidade documentos,
textos, imagens que
representam
determinado conceito
Leo Naressi - DP6
Leo Naressi - DP6
Isso é especialmente
importante para IA
Generativa, pois
todas as referências
são úteis como
contexto de um
processo RAG ou de
Fine-Tuning
Leo Naressi - DP6
Leo Naressi - DP6
Tecnologias
de bancos de
dados
vetoriais que
começam a
despontar
como
referências
Leo Naressi - DP6
Leo Naressi - DP6
Bancos de dados vetoriais estão em alta popularidade e devem
ver um crescimento de dois dígitos nos próximos 3 anos
Leo Naressi - DP6
Leo Naressi - DP6
MyDatAgent:
Criador de agentes
de dados para
análise e insights
Automatiza a
ingestão e
vetorização dos
dados, orquestração
de agentes e provê
uma interface
conversacional e
APIs
http://MyDatAgent.ai
Leo Naressi - DP6
Leo Naressi - DP6
Para extrair real valor, precisamos ir além dos pilotos, escalar e
impactar o negócio
Leo Naressi - DP6
Leo Naressi - DP6
Para não esquecer
Recapitulando
Leo Naressi - DP6
Leo Naressi - DP6
Preparando e Processando Dados para
Inteligência Artificial
1. Modelos de IA/LLM aceleram produtividade e trazem benefícios mas também
carregam problemas como imprecisões, alucinações e dilemas éticos, sociais e
legais
2. Prompt Engineering, Fine-Tuning e RAG são técnicas que permitem aprimorar
os resultados obtidos com IA e mitigar problemas
3. Novas tecnologias e estruturas de dados como bases de dados vetoriais e
grafos são necessárias para alimentar e direcionar os modelos
4. Adquirir este conhecimento no time técnico irá permitir escalar os resultados
obtidos com IA para além dos pilotos e testes e impactar a rentabilidade do
negócio
Leo Naressi - DP6
OBRIGADO(A)!
linkedin.com/in/leonaressi

Congresso Indústria Digital 2024 | Preparando e Processando Dados para IA

  • 1.
    Leo Naressi -DP6 Preparando e Processando Dados para Inteligência Artificial Leo Naressi // Tech & Dados
  • 2.
    Leo Naressi -DP6 Leo Naressi - DP6 Leo Naressi - DP6 Agenda 1. Introdução: A IA e o futuro da Indústria 2. Como a IA se alimenta de dados? 3. Processos e tecnologias de dados para IA 4. Agentes de Inteligência Artificial 5. Para não esquecer
  • 3.
    Leo Naressi -DP6 Leo Naressi - DP6 IA e o futuro da Indústria Sociedade
  • 4.
    Leo Naressi -DP6 Leo Naressi - DP6 Impacto econômico da IA é imenso. Em todas as áreas da sociedade.
  • 5.
    Leo Naressi -DP6 Leo Naressi - DP6 A adoção já começou IA Generativa (GenAI) + IA Preditiva
  • 6.
    Leo Naressi -DP6 Leo Naressi - DP6 Quem não quer mais produtividade na indústria, não é?
  • 7.
    Leo Naressi -DP6 Leo Naressi - DP6 Benefícios da IA já começam a ser percebidos como importantes na Indústria, mas, falta de conhecimento e dificuldades técnicas impedem a adoção Fonte: 2024 The State of AI in Manufacturing - rootstock
  • 8.
    Leo Naressi -DP6 Leo Naressi - DP6 Apesar dos desafios, potencial de retorno em 2+ anos inclui produtividade, corte de custos e aumento na receita
  • 9.
    Leo Naressi -DP6 Leo Naressi - DP6 Estudo de Caso: Toyota acelera prototipação de carros otimizando design com GenAI para atingir os requisitos de engenharia https://pressroom.toyota.com/toyota-research-institute-unveils-new-generative-ai-technique-for-vehicle-design/
  • 10.
    Leo Naressi -DP6 Leo Naressi - DP6 Estudo de Caso: Otimizar o feed de produtos para campanhas de e-commerce com IA gera +83% de receita https://www.fifty-five.com/case-study/optimizing-product-feed-data-with-generative-ai
  • 11.
    Leo Naressi -DP6 Leo Naressi - DP6 Estudo de Caso: Call Center reduz 50% do tempo de atendimento com GenAI https://www.bcg.com/publications/2023/maximizing-the-potential-of-generative-ai
  • 12.
    Leo Naressi -DP6 Leo Naressi - DP6 Estudo de Caso: Ferramenta de geração de conteúdo e peças criativas para campanhas otimiza produtividade, eficiência e resultados https://trypencil.com Velocidade Tempo de entrega Escala Anúncios por projeto Qualidade % anúncios aprovados Resultados Retorno x Baseline Custo Produção de anúncios >40k anúncios 1.6-6x mais rápido 93% score CreativeX +151% ROAS 30-50% menor custo de produção
  • 13.
    Leo Naressi -DP6 Leo Naressi - DP6 Mas, nem tudo são flores (ou dólares)… Vieses e preconceitos em escala Privacidade e Segurança Alucinação e erros da IA Custo Ambiental Propriedade intelectual Desemprego Integração de tecnologias e dados Problemas regulatórios e legais
  • 14.
    Leo Naressi -DP6 Leo Naressi - DP6 ..e nem tudo parece Inteligência
  • 15.
    Leo Naressi -DP6 Leo Naressi - DP6 Por isso, precisamos gerenciar e “domar” a IA para entregar resultados e agir responsavelmente
  • 16.
    Leo Naressi -DP6 Leo Naressi - DP6 Antes que seja tarde demais…
  • 17.
    Leo Naressi -DP6 Leo Naressi - DP6 Como domar a IA? Técnicas paras evoluir o entendimento e a inteligência para casos e contextos específicos OTIMIZAR
  • 18.
    Leo Naressi -DP6 Leo Naressi - DP6 Modelos de IA e LLM respondem a partir dos dados que foram treinados Dados / Internet IA / LLM Treinamento Prompt / Comando + Contexto Resposta!
  • 19.
    Leo Naressi -DP6 Leo Naressi - DP6 O que podemos fazer para melhorar a resposta? Dados / Internet IA / LLM Treinamento Resposta! Treinar com dados melhores Prompt / Comando + Contexto Fornecer mais contexto Melhorar nossas instruções
  • 20.
    Leo Naressi -DP6 Leo Naressi - DP6 Técnicas para evoluir ou adaptar modelos de IA / LLM Consultas mais estruturadas Instruções mais detalhadas e com abordagens metodológicas para guiar a execução das respostas ● Definir personas ou papéis ● Condições lógicas ● passo-a-passo para tarefas ● Etapas de validação ● fornecer exemplos (few-shot, chain-of-thought) ● formato de saída ● Encadeamento de prompts Treino especializado Re-treinamento dos modelos com conjuntos de dados específicos, tanto de conteúdo quanto de pares de prompts e respostas ● Base de dados de conhecimento específicos (jurídico, produto, região, etc) ● Conteúdo em determinado estilos ● Modelos mais leves e mais especializados ● Propriedade intelectual controlada Extensão dos Modelos Gerais Pesquisa e contextualização dinâmica a partir dos prompts para direcionar os modelos pré-treinados ● Grounding: Embasar respostas com fornecimentos de dados factuais ● Afunilar temas ou contextos de interesse com conteúdo para não divagar ● Personalizar respostas de acordo com dados do solicitante Prompt Engineering Engenharia de Prompt, Prompt Design Fine-Tuning Ajuste-fino nos modelos RAG Retrieval-Augmented Generation
  • 21.
    Leo Naressi -DP6 Leo Naressi - DP6 Técnicas para evoluir ou adaptar modelos de IA / LLM Resposta Prompts Prompts e Respostas Melhorias nos prompts Pré-treino geral Treino especializado Modelo IA / LLM Modelo IA / LLM Dados abertos / internet Dados privados ou especializados Modelo IA / LLM Prompts Retriever Prompt Engineering Engenharia de Prompt, Prompt Design Fine-Tuning Ajuste-fino nos modelos RAG Retrieval-Augmented Generation Dados privados ou especializados Resposta Embedding / Vetorização / Bancos de dados em grafos e vetores Incorpora dados no prompt (Augmenting) Consulta dados relevantes
  • 22.
    Leo Naressi -DP6 Leo Naressi - DP6 Quando usar? ● Fácil, ou simples de replicar ● Flexível, se adapta a cada consulta de acordo com as necessidades de cada usuário ● Acessível, não requer tecnologias adicionais ● Baixo impacto computacional ● Precisão escalável ● Consistência e qualidade, consolidação do conhecimento ● Adaptação máxima ao tema, indústria, segmento, área de conhecimento ● Menor tempo de atualização, informações mais “frescas” ● Relevância: Menos alucinações, mais fatos, referências diretas ● Eficiência na busca por respostas contextuais e bem embasadas ● Limitado ao conteúdo já treinado nos modelos ● Limitado nos formatos de entrega de cada modelo / tecnologia ● Resultados variam de acordo com a qualidade técnica dos prompts ● Alto impacto computacional e ambiental ● Baixa velocidade de atualização ● Exige recursos e conhecimento de tecnologia, IA, Machine Learning ● Exige grandes volumes dados para treinar os modelos ● Envolve desenvolvimento, machine learning, e programação complexa ● Requer estruturas e formatos de dados específicos para consultas dinâmicas ● Médio impacto computacional Prompt Engineering Engenharia de Prompt, Prompt Design Fine-Tuning Ajuste-fino nos modelos RAG Retrieval-Augmented Generation
  • 23.
    Leo Naressi -DP6 Leo Naressi - DP6 Mas, peraí, Vetorização? Embedding? WTF? Dados privados ou especializados Embedding / Vetorização / Bancos de dados em grafos e vetores
  • 24.
    Leo Naressi -DP6 Leo Naressi - DP6 Novas estruturas Falando de dados de um jeito que IA entende
  • 25.
    Leo Naressi -DP6 Leo Naressi - DP6 Processar conteúdo em muitas dimensões (texto, imagens, atributos) significa “entender” estas dimensões e armazenar de uma maneira que possa ser pesquisada com facilidade
  • 26.
    Leo Naressi -DP6 Leo Naressi - DP6 Uma pesquisa em um banco de dados vetorial pode encontrar com facilidade documentos, textos, imagens que representam determinado conceito
  • 27.
    Leo Naressi -DP6 Leo Naressi - DP6 Isso é especialmente importante para IA Generativa, pois todas as referências são úteis como contexto de um processo RAG ou de Fine-Tuning
  • 28.
    Leo Naressi -DP6 Leo Naressi - DP6 Tecnologias de bancos de dados vetoriais que começam a despontar como referências
  • 29.
    Leo Naressi -DP6 Leo Naressi - DP6 Bancos de dados vetoriais estão em alta popularidade e devem ver um crescimento de dois dígitos nos próximos 3 anos
  • 30.
    Leo Naressi -DP6 Leo Naressi - DP6 MyDatAgent: Criador de agentes de dados para análise e insights Automatiza a ingestão e vetorização dos dados, orquestração de agentes e provê uma interface conversacional e APIs http://MyDatAgent.ai
  • 31.
    Leo Naressi -DP6 Leo Naressi - DP6 Para extrair real valor, precisamos ir além dos pilotos, escalar e impactar o negócio
  • 32.
    Leo Naressi -DP6 Leo Naressi - DP6 Para não esquecer Recapitulando
  • 33.
    Leo Naressi -DP6 Leo Naressi - DP6 Preparando e Processando Dados para Inteligência Artificial 1. Modelos de IA/LLM aceleram produtividade e trazem benefícios mas também carregam problemas como imprecisões, alucinações e dilemas éticos, sociais e legais 2. Prompt Engineering, Fine-Tuning e RAG são técnicas que permitem aprimorar os resultados obtidos com IA e mitigar problemas 3. Novas tecnologias e estruturas de dados como bases de dados vetoriais e grafos são necessárias para alimentar e direcionar os modelos 4. Adquirir este conhecimento no time técnico irá permitir escalar os resultados obtidos com IA para além dos pilotos e testes e impactar a rentabilidade do negócio
  • 34.
    Leo Naressi -DP6 OBRIGADO(A)! linkedin.com/in/leonaressi

Notas do Editor

  • #1 Preparando e Processando Dados para Inteligência Artificial Aplicações de Inteligência Artificial são as próximas fronteiras no relacionamento da Indústria com consumidores e consumidores. Mas, alimentar sistemas inteligentes e generativos com dados é um pouco diferente do que costumamos fazer. Quais são os desafios e novas abordagens necessárias em tecnologia e dados para IA?