O documento discute o uso de processamento óptico de caracteres (OCR) para digitalizar documentos do Superior Tribunal de Justiça do Brasil (STJ). O OCR permite que os documentos sejam pesquisáveis digitalmente e reduz o tamanho dos arquivos, economizando armazenamento. Atualmente, cerca de 70% do acervo do STJ foi processado com OCR.
Cavaleiros do Futebol: Equipamentos e Moda para Campeões.pptx
Apresentação.ENAI.2019.pptx
1.
2. Histórico
1. Processo Eletrônico no STJ iniciou em 2009
2. Necessidade de Digitalização dos documentos que compõem os processos Judiciais
3. Possibilidade de usar referências dos textos das páginas digitalizadas dos processos
4. Reduzir a demanda por armazenamento das Peças Processuais
2
3. Resumo do Trabalho
Os serviços de processamento OCR são vitais para:
1. O reconhecimento de caracteres em peças de processos judiciais no formato eletrônico “PDF”
permitindo também que os documentos digitalizados se tornem acessíveis;
2. Processamento em caráter contínuo do contingente de novos documentos eletrônicos
recebidos no STJ, com vistas a evitar uma fila de espera de documentos a serem processados; e
3. Redução do tamanho original de cada documento processado e, por conseguinte, resultando
na otimização e racionalização dos recursos de infraestrutura.
3
4. Resumo do Trabalho
O OCR Contribui ainda com dois projetos recentes e em curso nesta Corte:
1. O projeto de inclusão digital conduzido pelo Gabinete da Exma. Sra. Ministra Fátima Nancy
Andrighi
2. O Projeto estratégico de Inteligência Artificial da Presidência do STJ
4
5. Alguns Números
1. Quantidade de páginas recebidas diariamente no STJ (Média): 500.000 páginas por dia com
picos de até 1.000.000 de páginas por dia.
2. Quantidade de páginas processadas diariamente no STJ (Média): 500.000 páginas por dia, com
picos de até 700.000 páginas por dia.
5
6. Alguns Números
6
Qual o percentual de redução do tamanho dos arquivos?
Qual o grau de precisão no reconhecimento?
8. Custos Envolvidos
Aquisição das licenças da ferramenta PDF Compressor
Capacidade instalada: OCR anual para 180 milhões de páginas
Custo: R$ 2.185.424,00
8
9. Desafios
1. Novo Código de Processo Civil duplicou a demanda pelo serviço
2. Alto volume de documentos recebidos diariamente no STJ (Média de 500 mil páginas por dia);
3. Diferentes formatos de arquivos;
4. Adequação das diferentes formas de processamento de OCR de acordo com a necessidade do
usuário e sem perder a qualidade do arquivo original.
5. - Normal: Aplicação de camada de OCR nas imagens do arquivo
6. - Rasterizado: Transformação prévia do arquivo em imagem e processamento
7. Adequação do dicionário de palavras com termos jurídicos
9
10. Resultados Alcançados
1. Hoje, aproximadamente 70% do acervo de arquivos PDF do processo eletrônico no STJ estão
Ocerizados
10
11. Oportunidades de Melhoria
1. Uso do serviço de OCR em outros sistemas (SEI)
2. Melhorias na usabilidade e na experiencia dos usuários das aplicações que manipulam os
arquivos PDF Ocerizados;
3. Ampliação do serviço e maior agilidade no processamento com a aquisição de novos servidores
(máquinas físicas com alto poder de processamento) para o serviço OCR.
11
Os serviços de processamento OCR para os ativos de Tecnologia da Informação e Comunicação – TIC são vitais para:
o reconhecimento de caracteres em peças de processos judiciais no formato eletrônico “PDF”;
processamento em caráter contínuo do contingente de novos documentos eletrônicos recebidos no STJ, com vistas a evitar uma fila de espera de documentos a serem processados; e
redução do tamanho original de cada documento processado e, por conseguinte, resultando na otimização e racionalização dos recursos de infraestrutura.
Adicionalmente a essas informações, o procedimento de reconhecimento de textos em peças processuais eletrônicas contribui com dois projetos recentes em curso nesta Corte suportados pelo resultado do procedimento de reconhecimento e da indexação de texto nas peças processuais em tramitação, o projeto de inclusão digital conduzido pelo Gabinete da Exma. Sra. Ministra Fátima Nancy Andrighi e o projeto estratégico de Inteligência Artificial da Presidência do STJ que reconhece padrões terminológicos jurídicos contidos nos processos judiciais para estabelecimento de modelos e classificações de temas inerentes ao trabalho da área afim do Tribunal.
O OCR Contribui ainda com dois projetos recentes e em curso nesta Corte
O projeto de inclusão digital conduzido pelo Gabinete da Exma. Sra. Ministra Fátima Nancy Andrighi
O Projeto estratégico de Inteligência Artificial da Presidência do STJ que reconhece padrões terminológicos jurídicos contidos nos processos judiciais para estabelecimento de modelos e classificações de temas inerentes ao trabalho da área afim do Tribunal.