by
Comunidado
Implementando Retrieval-
Augmented Generation utilizando
Vector Search no Azure Cosmos DB
Renato Groffe e Walter
Coan
by Comunidado
Joinville 05 de abril 2025
10 anos
Renato Groffe
https://www.linkedin.com/in/
renatogroffe/
• Microsoft MVP nas categorias Microsoft Azure, Developer
Technologies
• Docker Captain
• MTAC
• Solutions Achitect
Walter Silvestre Coan
www.linkedin.com/in/waltercoan/
• Microsoft MVP na categoria Internet das Coisas
• Mestre em Sistemas Distribuídos e Redes de sensores sem fio
PUCPR
• Instrutor autorizado Microsoft, AWS, NVIDIA na Ka Solution
• Professor universitário a 19 anos
Agenda
• Retrieval-Augmented Generation
• Embeddings
• Azure Cosmos DB ❤️
• Vector Search
Repositório
GitHub
Retrieval-Augmented
Generation
“Retrieval-Augmented Generation (RAG) é uma técnica
que combina a recuperação de informações (retrieval)
com a geração de texto (generation) para melhorar a
qualidade e a relevância das respostas geradas por
modelos de linguagem. “
Retrieval-Augmented
Generation
•Relevância Aumentada: A recuperação de
informações relevantes antes da geração ajuda a
aumentar a relevância e a precisão das respostas.
•Atualização de Conteúdo: Como a recuperação
pode ser feita em tempo real, as respostas podem
incluir informações mais atualizadas do que aquelas
disponíveis durante o treinamento do modelo.
•Mitigação de Alucinações: A técnica ajuda a reduzir
o problema de "alucinações" dos modelos de
geração, onde o modelo pode gerar informações
incorretas ou inventadas.
Benefícios
Retrieval-Augmented
Generation
•Assistentes Virtuais: Melhorar a precisão e a
relevância das respostas fornecidas por assistentes
virtuais.
•Sistemas de FAQ: Fornecer respostas mais precisas
e informadas em sistemas de perguntas frequentes.
•Geração de Conteúdo: Ajudar na criação de
conteúdo que exige informações atualizadas e
específicas.
Aplicações do RAG
Retrieval-Augmented
Generation
Retrieval-Augmented
Generation
Cosmos DB
Azure Open
AI Services
Fases: Preparação do Banco de
Dados
Aplicação
Insert dados
brutos + embeddings
Embeddings
Dados brutos
Insert
Usuário
Retrieval-Augmented
Generation
Cosmos DB
Azure Open
AI Services
Fases: Inferência (Geração de
conteúdo)
Aplicação
Documentos
Vector Search
Prompt
Usuário
Prompt + Docs
Chat Completion
Retrieval
Generation
Embeddings
“Embeddings são representações vetoriais de
informações, usadas com frequência em
aprendizado de máquina e inteligência artificial,
especialmente no processamento de linguagem
natural. Eles transformam dados, como
palavras, imagens ou outros tipos de
informações, em um formato numérico que os
computadores podem processar.”
Azure Cosmos DB ❤️
“O Azure Cosmos DB é um banco de dados NoSQL
distribuído globalmente e desenvolvido pela
Microsoft. Ele foi projetado para oferecer alta
disponibilidade, latência baixa e escalabilidade
elástica. O Cosmos DB suporta vários modelos de
dados, como documentos, grafos, tabelas e chave-
valor, permitindo flexibilidade para atender diferentes
necessidades de aplicações modernas.”
Azure Cosmos DB ❤️
“Entre suas principais características estão:
• Escalabilidade global e regional: Você pode replicar os dados
automaticamente em várias regiões do Azure para alta
disponibilidade.
• Baixa latência: Ideal para aplicativos que exigem respostas
rápidas, independentemente da localização do usuário.
• Compatibilidade com APIs: Ele suporta APIs de MongoDB,
Cassandra, Gremlin, Table e SQL para atender diferentes
necessidades e preferências.
• Consistência configurável: Oferece cinco modelos de
consistência para equilibrar desempenho e precisão dos
dados.”
• Windows emulator, containers Linux e módulo do
Testcontainers para ambientes de testes
Vector Search
Técnica matemática utilizada para determinar o quão
similar (próximos) dois vetores específicos estão dentro dos
embeddings.
Vector Search
Técnica matemática utilizada para determinar o quão
similar (próximos) dois vetores específicos estão dentro dos
embeddings.
Docker Hub – Gen AI Catalog
Docker Hub – Gen AI Catalog
Obrigado!
by Comunidado
Joinville 05 de abril 2025
10 anos

SQL Saturday 2025 RAG COSMOSDB Azure OpenAI

  • 1.
  • 2.
    Implementando Retrieval- Augmented Generationutilizando Vector Search no Azure Cosmos DB Renato Groffe e Walter Coan
  • 3.
    by Comunidado Joinville 05de abril 2025 10 anos
  • 4.
    Renato Groffe https://www.linkedin.com/in/ renatogroffe/ • MicrosoftMVP nas categorias Microsoft Azure, Developer Technologies • Docker Captain • MTAC • Solutions Achitect
  • 5.
    Walter Silvestre Coan www.linkedin.com/in/waltercoan/ •Microsoft MVP na categoria Internet das Coisas • Mestre em Sistemas Distribuídos e Redes de sensores sem fio PUCPR • Instrutor autorizado Microsoft, AWS, NVIDIA na Ka Solution • Professor universitário a 19 anos
  • 6.
    Agenda • Retrieval-Augmented Generation •Embeddings • Azure Cosmos DB ❤️ • Vector Search
  • 7.
  • 8.
    Retrieval-Augmented Generation “Retrieval-Augmented Generation (RAG)é uma técnica que combina a recuperação de informações (retrieval) com a geração de texto (generation) para melhorar a qualidade e a relevância das respostas geradas por modelos de linguagem. “
  • 9.
    Retrieval-Augmented Generation •Relevância Aumentada: Arecuperação de informações relevantes antes da geração ajuda a aumentar a relevância e a precisão das respostas. •Atualização de Conteúdo: Como a recuperação pode ser feita em tempo real, as respostas podem incluir informações mais atualizadas do que aquelas disponíveis durante o treinamento do modelo. •Mitigação de Alucinações: A técnica ajuda a reduzir o problema de "alucinações" dos modelos de geração, onde o modelo pode gerar informações incorretas ou inventadas. Benefícios
  • 10.
    Retrieval-Augmented Generation •Assistentes Virtuais: Melhorara precisão e a relevância das respostas fornecidas por assistentes virtuais. •Sistemas de FAQ: Fornecer respostas mais precisas e informadas em sistemas de perguntas frequentes. •Geração de Conteúdo: Ajudar na criação de conteúdo que exige informações atualizadas e específicas. Aplicações do RAG
  • 11.
  • 12.
    Retrieval-Augmented Generation Cosmos DB Azure Open AIServices Fases: Preparação do Banco de Dados Aplicação Insert dados brutos + embeddings Embeddings Dados brutos Insert Usuário
  • 13.
    Retrieval-Augmented Generation Cosmos DB Azure Open AIServices Fases: Inferência (Geração de conteúdo) Aplicação Documentos Vector Search Prompt Usuário Prompt + Docs Chat Completion Retrieval Generation
  • 14.
    Embeddings “Embeddings são representaçõesvetoriais de informações, usadas com frequência em aprendizado de máquina e inteligência artificial, especialmente no processamento de linguagem natural. Eles transformam dados, como palavras, imagens ou outros tipos de informações, em um formato numérico que os computadores podem processar.”
  • 15.
    Azure Cosmos DB❤️ “O Azure Cosmos DB é um banco de dados NoSQL distribuído globalmente e desenvolvido pela Microsoft. Ele foi projetado para oferecer alta disponibilidade, latência baixa e escalabilidade elástica. O Cosmos DB suporta vários modelos de dados, como documentos, grafos, tabelas e chave- valor, permitindo flexibilidade para atender diferentes necessidades de aplicações modernas.”
  • 16.
    Azure Cosmos DB❤️ “Entre suas principais características estão: • Escalabilidade global e regional: Você pode replicar os dados automaticamente em várias regiões do Azure para alta disponibilidade. • Baixa latência: Ideal para aplicativos que exigem respostas rápidas, independentemente da localização do usuário. • Compatibilidade com APIs: Ele suporta APIs de MongoDB, Cassandra, Gremlin, Table e SQL para atender diferentes necessidades e preferências. • Consistência configurável: Oferece cinco modelos de consistência para equilibrar desempenho e precisão dos dados.” • Windows emulator, containers Linux e módulo do Testcontainers para ambientes de testes
  • 17.
    Vector Search Técnica matemáticautilizada para determinar o quão similar (próximos) dois vetores específicos estão dentro dos embeddings.
  • 18.
    Vector Search Técnica matemáticautilizada para determinar o quão similar (próximos) dois vetores específicos estão dentro dos embeddings.
  • 19.
    Docker Hub –Gen AI Catalog
  • 20.
    Docker Hub –Gen AI Catalog
  • 21.
  • 22.
    by Comunidado Joinville 05de abril 2025 10 anos