SlideShare uma empresa Scribd logo
1 de 36
Baixar para ler offline
Do papel ao Digital com
Document
Understanding
Samuel Simão
2
Desenvolvedor RPA UiARD UiPath
samuelsimao47@gmail.com
Samuel Simão
Palestrante
3
1. Parte I – O que é Document Understanding?
• O que ele pode fazer?
• Quais benefícios podemos alcançar?
• Cenário de exemplo do UiPath AI Summit
2. Parte II – Como ele funciona?
• Etapas do framework
3. Parte III – Prática dentro do UiPath Studio
Sumário
O que é Document
Understanding?
Parte I
6
O que é o Document Understanding?
7
• Ferramenta da UiPath para leitura de
documentos;
O que é o Document Understanding?
8
• Ferramenta da uipath para leitura de
documentos;
• Baseado em tecnologias de OCR, NLP e
Machine Learning;
O que é o Document Understanding?
OCR NLP ML
=
9
• Ferramenta da uipath para leitura de
documentos;
• Baseado em tecnologias de OCR, NLP e
Machine Learning;
• Permite utilização de modelos pré-treinados ou
uso dos seus próprios modelos.
O que é o Document Understanding?
OCR NLP ML
=
11
O que ele é capaz de fazer?
12
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
O que ele é capaz de fazer?
Formulários Identidades Passaportes
Estruturados
13
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
O que ele é capaz de fazer?
Faturas Ordens de
Compra
Contas
Semi-Estruturados
14
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
O que ele é capaz de fazer?
Não-Estruturados
Contratos Registros
de Saúde
Emails
15
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
O que ele é capaz de fazer?
16
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
• Escritos a mão, assinados
O que ele é capaz de fazer?
17
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
• Escritos a mão, assinados
• Extenções de arquivos pdf, jpeg, png, etc
O que ele é capaz de fazer?
18
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
• Escritos a mão, assinados
• Extenções de arquivos pdf, jpeg, png, etc
• Validação humana
O que ele é capaz de fazer?
19
Que benefícios podem ser alcançados?
20
• Tempos de processamento mais rápidos
• Menos erros humanos
• Redução de gargalo por aprovação de
documentos
Que benefícios podem ser alcançados?
Velocidade Acurácia Rentável
21
Cenário hipotético de exemplo
22
• A empresa FacAfiada, do setor industrial, quer
automatizar o processo de registro de boletos
recebidos de seus fornecedores
• Cada fornecedor tem seu formato de documento
e seu layout
• Esse processo pode ser demorado, propenso a
erros humanos e caro;
Cenário hipotético de exemplo
Fonte do
Documento
Todo processo de identificação e
extração é feito pelos funcionários
Enviados por
email,
scanneados
Verificar &
Registrar
Sistemas de
registro
23
Triagem
2 min
As-is do cenário hipotético
1. Documentos chegam por email;
2. Funcionário leva 12min por documento;
3. 20.000h gastas para processar 100.000 documentos.
Fonte do
Documento
As-is do processamento do documento
Enviados por
email,
scanneados
Verificar &
Registrar
Sistemas de
registro
Processo
10 min
100% 100.000 docs*12min
manual = 20.000 hrs
Volume=100.000
24
Triagem
2 min
As-is do cenário hipotético
1. Documentos chegam por email;
2. Funcionário leva 12min por documento;
3. 20.000h gastas para processar 100.000 documentos.
Fonte do
Documento
As-is do processamento do documento
&
Tempo médio de processo
Enviados por
email,
scanneados
Verificar &
Registrar
Sistemas de
registro
O valor da solução normalmente é medido em...
Verificar &
Registrar
Taxa de Processamento direto
Straight through processing (STP) rate
Relacionado com o tempo de Valor
Processo
10 min
100% 100.000 docs*12min
manual = 20.000 hrs
Volume=100.000
Fonte do
Documento
25
Cálculo do valor gerado
Taxa de
Processamento
Direto (STP)
Frequência
de Humano
no ciclo
(HITL)
100%
Documentos
descartados
&
Tempo médio de processo
Fonte de
Documento
Verificar &
Registrar
Taxa de Processamento direto
26
Cálculo do valor gerado
Taxa de
Processamento
Direto (STP)
Frequência
de Humano
no ciclo
(HITL)
Tempo médio
de validação
(AHT)
100%
FTE time
Documentos
descartados
&
Tempo médio de processo
Fonte de
Documento
Verificar &
Registrar
Taxa de Processamento direto
CÁLCULO
FUNDAMENTAL
DE VALOR
Frequência
de Humano
no ciclo
(HITL)
27
Exemplo do cálculo de valor
Destino do
Boleto
Fonte do
Documento
Clientes /
fornecedores
CoE Especialistas
Do negócio
Validação intuitiva
(eficiente)
1
min
Validação
Humana
Necessária
Validação
Automatizada
Lógica /
Depara
Sistema de
registro
Extração
com ML
28
Exemplo do cálculo de valor
1min*100,000 = 1667 hrs
92% redução
Se 100%
Validação
humana
1min*50,000 = 833 hrs
96% redução
100,000 docs*12min
= 20,000 hrs
100%
manual
Destino do
Boleto
Fonte do
Documento
Clientes /
fornecedores
CoE Especialistas
Do negócio
Validação intuitiva
(eficiente)
1
min
Validação
Humana
Necessária
Validação
Automatizada
Lógica /
Depara
Sistema de
registro
Extração
com ML
Se 50%
Validação
humana
Como ele funciona?
Parte II
31
Framework
32
Framework
Taxonomia Digitize Classify Extract Validate Export
33
Taxonomia Digitize Classify Extract Validate Export
• Define os tipos de documentos da automação;
• Define os campos extraídos de cada documento.
De Boletos bancários, eu quero extrair:
- Nome do Banco (texto);
- Código de barras (texto);
- Data do vencimento (data);
- Valor total (número)
BancoBom
BancoBom
34
Digitize
Taxonomia Digitize Classify Extract Validate Export
• Usa OCR para identificar textos e suas posições;
• É possível utilizar vários tipos de OCR.
BancoBom
BancoBom
35
Digitize Classify Extract Validate Export
Taxonomia
• Identifica o tipo de documento.
• Uso de modelos de classificação
• Há validação de regras de negócios
BancoBom
BancoBom
Com base nos textos identificados, o
classificador retorna uma % de
chance de um arquivo ser referente a
um documento definido na taxonomia.
36
Valores extraídos:
- Nome do Banco = BancoBom
- Código de barras = 23791.11103 6000...
- Data do vencimento = 2011-01-25
- Valor total = 20000000,00
Digitize Classify Extract Validate Export
Taxonomia
• Extrai as informações lidas no documento.
• Uso de modelos de extração
• Há validação de regras de negócios
BancoBom
BancoBom
37
Digitize Classify Extract Validate Export
Taxonomia
• Quando necessário, pede ajuda para um
humano validar a classificação e/ou extração;
• Permite retreino dos modelos;
Valores extraídos:
- Nome do Banco = BancoBom
- Código de barras = 23791.11103 6000...
- Data do vencimento = 2011-01-29
- Valor total = 20000000,00
BancoBom
BancoBom
38
Em json:
{"Nome do Banco":" BancoBom“, “Código
de barras”: “23791.11103 6000...”, “Data
do vencimento”: “2011-01-29”, “Valor
total”: 20000000.00}
Em excel:
Digitize Classify Extract Validate Export
Taxonomia
• Exporta os dados extraídos para uso posterior;
• Enviar para uma queue, salvar em excel,
mandar um json para outro sistema...
39
Framework

Mais conteúdo relacionado

Semelhante a Do papel ao digital com Document Understanding

Forca de Digital & RPA
Forca de Digital & RPAForca de Digital & RPA
Forca de Digital & RPA
Eduardo Britto
 
01 14092011-1530-paulo-carneiro
01 14092011-1530-paulo-carneiro01 14092011-1530-paulo-carneiro
01 14092011-1530-paulo-carneiro
guiabusinessmedia
 
IBM - Portal & Colaboracao
IBM - Portal & Colaboracao IBM - Portal & Colaboracao
IBM - Portal & Colaboracao
Francis Ricalde
 
Menos teste e mais qualidade - como equilibrar essa equação?
Menos teste e mais qualidade - como equilibrar essa equação?Menos teste e mais qualidade - como equilibrar essa equação?
Menos teste e mais qualidade - como equilibrar essa equação?
Igor Abade
 

Semelhante a Do papel ao digital com Document Understanding (20)

Forca de Digital & RPA
Forca de Digital & RPAForca de Digital & RPA
Forca de Digital & RPA
 
Produtividade das Engenharias
Produtividade das EngenhariasProdutividade das Engenharias
Produtividade das Engenharias
 
Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...
Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...
Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...
 
Engenharia de Software - Unimep/Pronatec - Aula 4
Engenharia de Software - Unimep/Pronatec - Aula 4Engenharia de Software - Unimep/Pronatec - Aula 4
Engenharia de Software - Unimep/Pronatec - Aula 4
 
BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...
BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...
BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...
 
RPA - Apresentação Conceitual - iProcess
RPA - Apresentação Conceitual - iProcessRPA - Apresentação Conceitual - iProcess
RPA - Apresentação Conceitual - iProcess
 
iColabora_Turbina
iColabora_TurbinaiColabora_Turbina
iColabora_Turbina
 
Tendências e Possibilidades do Mercado de Digitalização de Documentos
Tendências e Possibilidades do Mercado de Digitalização de DocumentosTendências e Possibilidades do Mercado de Digitalização de Documentos
Tendências e Possibilidades do Mercado de Digitalização de Documentos
 
Robotic Process Automation (RPA) - Apresentação Conceitual
Robotic Process Automation (RPA) - Apresentação ConceitualRobotic Process Automation (RPA) - Apresentação Conceitual
Robotic Process Automation (RPA) - Apresentação Conceitual
 
RPA - Portfólio de Serviços iProcess com RPA uiPath
RPA - Portfólio de Serviços iProcess com RPA uiPathRPA - Portfólio de Serviços iProcess com RPA uiPath
RPA - Portfólio de Serviços iProcess com RPA uiPath
 
UiPathChapter_Introducao_ao_RPA_v1.0.pptx
UiPathChapter_Introducao_ao_RPA_v1.0.pptxUiPathChapter_Introducao_ao_RPA_v1.0.pptx
UiPathChapter_Introducao_ao_RPA_v1.0.pptx
 
Apresentação impeto
Apresentação impetoApresentação impeto
Apresentação impeto
 
RPA - Apresentação Conceitual com uiPath
RPA - Apresentação Conceitual com uiPathRPA - Apresentação Conceitual com uiPath
RPA - Apresentação Conceitual com uiPath
 
Unidade 2 - o Computador e seus Componentes
Unidade 2 - o Computador e seus ComponentesUnidade 2 - o Computador e seus Componentes
Unidade 2 - o Computador e seus Componentes
 
O papel do Arquiteto de Soluções na RPA.
O papel do Arquiteto de Soluções na RPA.O papel do Arquiteto de Soluções na RPA.
O papel do Arquiteto de Soluções na RPA.
 
01 14092011-1530-paulo-carneiro
01 14092011-1530-paulo-carneiro01 14092011-1530-paulo-carneiro
01 14092011-1530-paulo-carneiro
 
RPA - Portfólio de Serviços iProcess
RPA - Portfólio de Serviços iProcessRPA - Portfólio de Serviços iProcess
RPA - Portfólio de Serviços iProcess
 
Software de impressão segura por biometria - Thiarlei - Impressão Gerenciada
Software de impressão segura por biometria - Thiarlei - Impressão GerenciadaSoftware de impressão segura por biometria - Thiarlei - Impressão Gerenciada
Software de impressão segura por biometria - Thiarlei - Impressão Gerenciada
 
IBM - Portal & Colaboracao
IBM - Portal & Colaboracao IBM - Portal & Colaboracao
IBM - Portal & Colaboracao
 
Menos teste e mais qualidade - como equilibrar essa equação?
Menos teste e mais qualidade - como equilibrar essa equação?Menos teste e mais qualidade - como equilibrar essa equação?
Menos teste e mais qualidade - como equilibrar essa equação?
 

Último

Assessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdfAssessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdf
Natalia Granato
 

Último (6)

Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object Calisthenics
 
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
 
Assessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdfAssessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdf
 
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
 
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemplo
 

Do papel ao digital com Document Understanding

  • 1. Do papel ao Digital com Document Understanding Samuel Simão
  • 2. 2 Desenvolvedor RPA UiARD UiPath samuelsimao47@gmail.com Samuel Simão Palestrante
  • 3. 3 1. Parte I – O que é Document Understanding? • O que ele pode fazer? • Quais benefícios podemos alcançar? • Cenário de exemplo do UiPath AI Summit 2. Parte II – Como ele funciona? • Etapas do framework 3. Parte III – Prática dentro do UiPath Studio Sumário
  • 4. O que é Document Understanding? Parte I
  • 5. 6 O que é o Document Understanding?
  • 6. 7 • Ferramenta da UiPath para leitura de documentos; O que é o Document Understanding?
  • 7. 8 • Ferramenta da uipath para leitura de documentos; • Baseado em tecnologias de OCR, NLP e Machine Learning; O que é o Document Understanding? OCR NLP ML =
  • 8. 9 • Ferramenta da uipath para leitura de documentos; • Baseado em tecnologias de OCR, NLP e Machine Learning; • Permite utilização de modelos pré-treinados ou uso dos seus próprios modelos. O que é o Document Understanding? OCR NLP ML =
  • 9. 11 O que ele é capaz de fazer?
  • 10. 12 • Lidar com documentos estruturados, semi- estruturados e não estruturados; O que ele é capaz de fazer? Formulários Identidades Passaportes Estruturados
  • 11. 13 • Lidar com documentos estruturados, semi- estruturados e não estruturados; O que ele é capaz de fazer? Faturas Ordens de Compra Contas Semi-Estruturados
  • 12. 14 • Lidar com documentos estruturados, semi- estruturados e não estruturados; O que ele é capaz de fazer? Não-Estruturados Contratos Registros de Saúde Emails
  • 13. 15 • Lidar com documentos estruturados, semi- estruturados e não estruturados; • Documentos escaneados, rotacionados O que ele é capaz de fazer?
  • 14. 16 • Lidar com documentos estruturados, semi- estruturados e não estruturados; • Documentos escaneados, rotacionados • Escritos a mão, assinados O que ele é capaz de fazer?
  • 15. 17 • Lidar com documentos estruturados, semi- estruturados e não estruturados; • Documentos escaneados, rotacionados • Escritos a mão, assinados • Extenções de arquivos pdf, jpeg, png, etc O que ele é capaz de fazer?
  • 16. 18 • Lidar com documentos estruturados, semi- estruturados e não estruturados; • Documentos escaneados, rotacionados • Escritos a mão, assinados • Extenções de arquivos pdf, jpeg, png, etc • Validação humana O que ele é capaz de fazer?
  • 17. 19 Que benefícios podem ser alcançados?
  • 18. 20 • Tempos de processamento mais rápidos • Menos erros humanos • Redução de gargalo por aprovação de documentos Que benefícios podem ser alcançados? Velocidade Acurácia Rentável
  • 20. 22 • A empresa FacAfiada, do setor industrial, quer automatizar o processo de registro de boletos recebidos de seus fornecedores • Cada fornecedor tem seu formato de documento e seu layout • Esse processo pode ser demorado, propenso a erros humanos e caro; Cenário hipotético de exemplo Fonte do Documento Todo processo de identificação e extração é feito pelos funcionários Enviados por email, scanneados Verificar & Registrar Sistemas de registro
  • 21. 23 Triagem 2 min As-is do cenário hipotético 1. Documentos chegam por email; 2. Funcionário leva 12min por documento; 3. 20.000h gastas para processar 100.000 documentos. Fonte do Documento As-is do processamento do documento Enviados por email, scanneados Verificar & Registrar Sistemas de registro Processo 10 min 100% 100.000 docs*12min manual = 20.000 hrs Volume=100.000
  • 22. 24 Triagem 2 min As-is do cenário hipotético 1. Documentos chegam por email; 2. Funcionário leva 12min por documento; 3. 20.000h gastas para processar 100.000 documentos. Fonte do Documento As-is do processamento do documento & Tempo médio de processo Enviados por email, scanneados Verificar & Registrar Sistemas de registro O valor da solução normalmente é medido em... Verificar & Registrar Taxa de Processamento direto Straight through processing (STP) rate Relacionado com o tempo de Valor Processo 10 min 100% 100.000 docs*12min manual = 20.000 hrs Volume=100.000 Fonte do Documento
  • 23. 25 Cálculo do valor gerado Taxa de Processamento Direto (STP) Frequência de Humano no ciclo (HITL) 100% Documentos descartados & Tempo médio de processo Fonte de Documento Verificar & Registrar Taxa de Processamento direto
  • 24. 26 Cálculo do valor gerado Taxa de Processamento Direto (STP) Frequência de Humano no ciclo (HITL) Tempo médio de validação (AHT) 100% FTE time Documentos descartados & Tempo médio de processo Fonte de Documento Verificar & Registrar Taxa de Processamento direto CÁLCULO FUNDAMENTAL DE VALOR Frequência de Humano no ciclo (HITL)
  • 25. 27 Exemplo do cálculo de valor Destino do Boleto Fonte do Documento Clientes / fornecedores CoE Especialistas Do negócio Validação intuitiva (eficiente) 1 min Validação Humana Necessária Validação Automatizada Lógica / Depara Sistema de registro Extração com ML
  • 26. 28 Exemplo do cálculo de valor 1min*100,000 = 1667 hrs 92% redução Se 100% Validação humana 1min*50,000 = 833 hrs 96% redução 100,000 docs*12min = 20,000 hrs 100% manual Destino do Boleto Fonte do Documento Clientes / fornecedores CoE Especialistas Do negócio Validação intuitiva (eficiente) 1 min Validação Humana Necessária Validação Automatizada Lógica / Depara Sistema de registro Extração com ML Se 50% Validação humana
  • 29. 32 Framework Taxonomia Digitize Classify Extract Validate Export
  • 30. 33 Taxonomia Digitize Classify Extract Validate Export • Define os tipos de documentos da automação; • Define os campos extraídos de cada documento. De Boletos bancários, eu quero extrair: - Nome do Banco (texto); - Código de barras (texto); - Data do vencimento (data); - Valor total (número) BancoBom BancoBom
  • 31. 34 Digitize Taxonomia Digitize Classify Extract Validate Export • Usa OCR para identificar textos e suas posições; • É possível utilizar vários tipos de OCR. BancoBom BancoBom
  • 32. 35 Digitize Classify Extract Validate Export Taxonomia • Identifica o tipo de documento. • Uso de modelos de classificação • Há validação de regras de negócios BancoBom BancoBom Com base nos textos identificados, o classificador retorna uma % de chance de um arquivo ser referente a um documento definido na taxonomia.
  • 33. 36 Valores extraídos: - Nome do Banco = BancoBom - Código de barras = 23791.11103 6000... - Data do vencimento = 2011-01-25 - Valor total = 20000000,00 Digitize Classify Extract Validate Export Taxonomia • Extrai as informações lidas no documento. • Uso de modelos de extração • Há validação de regras de negócios BancoBom BancoBom
  • 34. 37 Digitize Classify Extract Validate Export Taxonomia • Quando necessário, pede ajuda para um humano validar a classificação e/ou extração; • Permite retreino dos modelos; Valores extraídos: - Nome do Banco = BancoBom - Código de barras = 23791.11103 6000... - Data do vencimento = 2011-01-29 - Valor total = 20000000,00 BancoBom BancoBom
  • 35. 38 Em json: {"Nome do Banco":" BancoBom“, “Código de barras”: “23791.11103 6000...”, “Data do vencimento”: “2011-01-29”, “Valor total”: 20000000.00} Em excel: Digitize Classify Extract Validate Export Taxonomia • Exporta os dados extraídos para uso posterior; • Enviar para uma queue, salvar em excel, mandar um json para outro sistema...