Servidor com processamento paralelo utilizando CUDA aplicado em uma urna eletrônica

Servidor com processamento paralelo utilizando CUDA
aplicado em uma urna eletrônica
Douglas A. Cunha1
, Rafael R. P. Araujo2
1
Centro Universitário IESB
CEP: 70.200-730 – Bras´ılia – DF – Brazil
2
Ciência da Computação – Centro Universitário IESB
Bras´ılia, Brazil
{douglasxxdouglas,bsb.rafaelaraujo}@gmail.com
Abstract. The present research aims to identify and develop through the
integration of the companies analyzed, a set of valid data, count and manipulate
the data sent by each state of the federation. The study, looked for more
profitable algorithms, since, the value of stresses was of 1 billion of registries.
For the development of the work several technologies were used, in particular,
a programming language for the decision making on the ability to optimize the
time for the validation as the counting of votes through the parallelism and use
of the video card as processing source. The reflection of the research, turned
into the algorithms developed and tested in the most diverse languages, the
most perfomatic CUDA was used. In addition, it was possible to obtain a final
count of the votes of the election.
Keywords: CUDA. Server. Validation.
Resumo. A presente pesquisa visa identificar e desenvolver através da
integração das matérias anteriormente estudadas, um servidor capaz de
validar, contar e manipular os dados enviados por cada estado da federação.
O estudo buscou identificar os algoritmos mais performáticos, uma vez que,
o valor de estresse estipulado foi de um bilhão de registros. Para o desen-
volvimento do trabalho foram utilizadas diversas tecnologias, em especial, a
linguagem de programação CUDA para que fosse poss´ıvel aperfeiçoar/otimizar
o tempo tanto de validação como de contagem de votos através do paralelismo
e uso da placa de v´ıdeo como fonte processadora. O reflexo da pesquisa
mostrou que dentre os diversos algoritmos desenvolvidos e testados nas mais
diversas linguagens, o mais performático foi utilizando CUDA. Além disso, foi
poss´ıvel obter a contagem final dos votos da eleição.
Palavras-chave: CUDA. Servidor. Validação.
1. Siglas
• ANSI - American National Standard Institute
• API - Interface de Programação de Aplicação
• BSD - Berkeley Software Distribution
• CPU - Unidade Central de Processamento

• GPGPU - A Unidade de Processamento Gráfico de Propósito Geral
• GPU - Unidade de Processamento Gráfico
• ISA’s - Instruction Set Architecture
• RAM - Memória de Acesso Aleatório
• WSGI - Interface de Porta de Entrada do Servidor Web
• HTML - HyperText Markup Language
• CSS - Cascading Style Sheets
2. Introdução
A cada quatro anos é realizado por todo o pa´ıs uma eleição com o intuito de escolher
candidatos que irão governar durante um determinado per´ıodo de tempo. Dessa forma,
após muitos anos a forma de apuração dos votos serem utilizadas através de papeis e
contados por pessoas, criou-se o atual sistema e mecanismo de voto, o coletor eletrônico
de voto.
O coletor eletrônico de voto, também conhecido como urna eletrônica, é uma
máquina/mecanismo de votação que irá registrar os votos dos eleitores em memórias in-
ternas que posteriormente serão enviadas para um terminal.
Nos centros urbanos, em cada local de votação tem um terminal de acesso ao
sistema interno da Justiça Eleitoral. Através dessa rede que as informações referentes a
cada urna serão enviadas para o Tribunal Regional Eleitoral de cada estado da federação.
Essas informações são transmitidas através de uma estrutura de comunicação própria que
é fornecida pelas operadoras de telefonia. Dessa forma, após o fim do horário eleitoral,
os locais irão se conectar através de uma intranet (rede privada), pela qual as informações
serão transmitidas. [TSE ]
Com as informações no servidor referente a cada urna eletrônica, o mesmo começa
a contagem e processamento dos dados fornecendo ao final, o candidato eleito. No en-
tanto, apesar de possuir especialistas e pessoas extremamente capacitadas que cuidam e
desenvolvem algoritmos e processos inteligentes e rápidos, algumas abordagens podem
passar despercebidas ou até mesmo ignoradas. Dessa forma, o presente artigo irá abordar
diversos algoritmos testados até que chegássemos ao resultado final mais performático
com relação à validação, contagem e processamento desses dados.
2.1. Motivação
O número de trabalhos relacionados a algoritmos de estrutura de dados aplicados à uma
urna é bastante reduzido, dessa forma, com a motivação de contribuir para que a comu-
nidade tenha acesso a diferentes modelos e sistemas de urna eleitoral, foi desenvolvido
o presente artigo. Além disso, o assunto abordado foi motivado e incentivado por nosso
orientador. Por fim, o poder computacional proposto no presente artigo nos motivou ainda
mais em prosseguir com a ideia de usar processamento paralelo e CUDA.
2.2. Hipótese
Antes de se iniciar o desenvolvimento do servidor, conversamos sobre qual abordagem
ir´ıamos seguir, bem como, os poss´ıveis resultados esperados. No entanto, no decorrer do
desenvolvimento do projeto, fomos encontrando pontos e indicativos de que as estratégias
adotadas não seriam as melhores, esses indicativos foram poss´ıveis de serem vistos, uma

vez que, a quantidade de linhas que teriam de ser processadas, bem como, a quantidade de
arquivos recebidos simultaneamente precisaria de um poder computacional muito grande
e através do uso de recursos mais simples isso não seria poss´ıvel. Para resolvermos o
problema utilizamos a integração entre duas linguagens (C e Python) realizando o proces-
samento através da placa de v´ıdeo e o processamento paralelo.
2.3. Objetivos e Desafios da Pesquisa
Durante a pesquisa e desenvolvimento do presente artigo, alguns desafios tiveram de ser
enfrentados, dentre eles a demora em gerar massas de testes, a limitação da memória
RAM dos nossos computadores pessoais dificultando na leitura de grande quantidade
de linhas, a necessidade de integração de duas linguagens distintas (Python e C) e do
estudo/implemenação do CUDA. Além disso, como a comunidade do CUDA ainda é
pequena, então, as soluções para alguns problemas são bastante complexas e dif´ıceis de
serem encontradas, dessa forma, por vezes ficamos impossibilitados de prosseguir no
desenvolvimento tendo de procurar outras sa´ıdas e soluções. A análise da complexidade
dos algoritmos também se tornou um desafio ao longo da pesquisa.
• Objetivo Geral
– Produção de um servidor responsável pela manipulação, validação e con-
tagem dos votos enviados por cada estado da federação.
• Objetivos espec´ıficos
– Analisar os tempos de execução de cada algoritmo desenvolvido;
– Comparar as diferentes tecnologias com a finalidade de encontrar a que
oferece melhor desempenho de acordo com o objetivo geral proposto.
2.4. Contribuições
O presente artigo irá contribuir para testar a integralidade dos arquivos. Além disso,
o nosso trabalho contribuirá para a contabilização total dos votos da eleição simulada,
também será poss´ıvel extrair através desse trabalho, diferentes algoritmos que poderão ser
utilizados para o estudo da matéria estrutura de dados. O presente artigo poderá contribuir
no desenvolvimento de outras aplicações que fazem uso da API CUDA, uma vez que, a
comunidade do CUDA é bastante reduzida, a publicação desse artigo poderia ajudar as
pessoas a criarem suas próprias aplicações/projetos.
2.5. Organização da Dissertação
O trabalho está dividido em cinco cap´ıtulos, os quais se descrevem resumidamente a
seguir:
• Seção 2 – Introdução: aborda a motivação, objetivos e desafios da pesquisa,
hipótese, contribuições e organização da dissertação.
• Seção 3 – Fundamentação Teórica: aborda a fundamentação teórica das tecnolo-
gias usadas e os trabalhos correlatos.
• Seção 4 – Proposta e Desenvolvimento: apresenta a proposta da pesquisa, bem
como, os passos do desenvolvimento do servidor.
• Seção 5 – Experimentos e Análise dos Resultados: apresenta a metodologia usada,
experimentos e a avaliação dos resultados.
• Seção 6 – Conclusão e Trabalhos Futuros: são feitas as considerações finais, além
das propostas de trabalhos futuros.

• Seção 7 – Referências: referências usadas ao longo do desenvolvimento do pre-
sente artigo, bem como, no desenvolvimento da aplicação.
• Seção 8 – Imagens: imagens usadas no presente artigo.
3. Fundamentação Teórica
3.1. Tecnologias
Para que fosse poss´ıvel o desenvolvimento do servidor, foram utilizadas as seguintes tec-
nologias:
• Editor de Código Fonte:
– Visual Studio Code
• Linguagens de programação:
– C
– Python
• API:
– CUDA
• Framework:
– Flask
• Recursos Computacionais:
– Processamento Paralelo
– Processamento Paralelo com API CUDA.
3.2. Editor de Código Fonte Visual Studio Code
O editor de código-fonte foi desenvolvido em 2015 pela Microsoft para Windows, Linux
e macOS, o mesmo inclu´ı suporte para depuração, controle do GIT incorporado, realce
de sintaxe, complementação de código, snippets e refatoração de código. O Visual Studio
Code é baseado no Electron, um framework usado para desenvolver aplicativos Node.js
para o desktop rodando no motor de layout blink. A decisão da escolha pela IDE levou
em conta a compatibilidade com as linguagens que foram usadas no projeto, bem como,
a inteligência da mesma para refatoração de códigos quando necessário, além disso, do
baixo consumo de recursos computacionais durante o uso. [Microsoft ]
3.3. Linguagem de Programação C
A linguagem de programação C foi criada por volta dos anos 70 e implementada em um
computador nomeado de DEC PDP-11 por Dennis Ritchie. O C tem sua origem a partir de
outras duas linguagens: Algol 68 e BCPL. Inicialmente o uso da linguagem era destinado
ao desenvolvimento de sistemas operacionais e compiladores. Essa linguagem foi usada
na construção de uma nova versão do sistema operacional Unix, que inicialmente, foi
escrito em Assembly. Com o grande sucesso desse desenvolvimento, a linguagem ganhou
mais adeptos e, portanto, nos dias atuais, a maiora todos os grandes sistemas operacionais
são constru´ıdos em C.
Apesar de todos os esforços e a grande quantidade de usuários fazendo uso da
linguagem, ela ainda não era uma linguagem padronizada. Por volta dos anos 80 o C já
contava com uma gama de compiladores, no entanto, apesar do grande número ainda ex-
istiam diversas diferenças ocasionando na incompatibilidade entre eles. Nesse momento,
a padronização da linguagem foi iniciada em 1983 pela ANSI e finalizada em 1989.

Utilizaremos a linguagem C, pois como a mesma é uma linguagem de proposito
geral, ou seja, a adaptabilidade na maioria dos projetos é extremamente alta. No entanto,
um segundo e mais importante ponto que analisamos para realizar a escolha foi a sua
velocidade em tempo de execução. O C diferente de outras linguagens é extremamente
rápido em tempo de execução devido à arquitetura em que foi desenvolvida. Isso ocorre,
pois linguagens como Java, Basic, Perl, dentre outras são linguagens a base de byte-
code interpretados por uma máquina virtual, enquanto no C, a interpretação do código
é realizada diretamente pelo processador. Além disso, através do C é poss´ıvel realizar
endereçamentos de memória de maneira bastante parecida como é feito em Assembly.
Dessa forma, em aplicações que exigem tarefas de baixo-n´ıvel, ou seja, que ne-
cessitam do acesso direto a memória, como por exemplo, a cópia de bytes para uma placa
de rede ou de v´ıdeo, só é poss´ıvel através do C. Por fim, o C permite a personalização
de diversos algoritmos pré-implementados, como por exemplo, a alocação de memória,
com o objetivo de melhorar o desempenho ou até mesmo adaptar de acordo com a sua
necessidade.[Schildt 1996]
3.4. Linguagem de Programação Python
A linguagem de programação Python foi criada por volta dos anos 90 por Guido Van
Rossum. O python possu´ı um modelo de desenvolvimento comunitário, aberto e geren-
ciado pela organização Pyhon Software Foundation(https://www.python.org/).
Através do link informado anteriormente, também é poss´ıvel encontrar no site o download
da linguagem, bem como, as diferentes implementações, a documentação, dentre outros
recursos.
A linguagem foi projetada de forma a priorizar e enfatizar a importância do
esforço do programador sobre o esforço computacional, ou seja, a linguagem prioriza
a legibilidade do código sobre a velocidade. Possu´ı uma combinação entre a sintaxe con-
cisa e clara com os recursos poderosos da biblioteca padrão, bem como, os módulos e
frameworks desenvolvidos pela comunidade. Além disso, é uma linguagem de alto n´ıvel,
multi-paradigma, ou seja, suporta paradigma orientado a objetos, imperativo funcional
e procedural. Por fim, é uma linguagem bastante utilizada no processamento de textos,
dados cient´ıficos, dentre outras áreas. [Tulchak and Marchuk ]
Utilizamos a linguagem Python no projeto, pois a mesma oferece um recurso de
integração com a linguagem C, além disso, torna poss´ıvel através do framework Flask, o
desenvolvimento da aplicação web.
3.5. CUDA
Anteriormente, a API CUDA era conhecida por Compute Unified Device Architecture e é
destinada a computação paralela, GPGPU e computação heterogênea criada pela empresa
Nvidia, destinada a placas gráfica com chipset da Nvidia. A plataforma fornece acesso
ao conjunto de instruções virtuais da GPU e também a elementos da computação paralela
para a execução de núcleos de computação.
A API possu´ı um conjunto de instruções CUDA ISA’s, além do mecanismo de
computação paralela na GPU. Ele expõe os tipos de memória da placa de v´ıdeo e torna
obrigatório por parte do desenvolvedor que configure os acessos da memória global,

cache, bem como, a disposição e quantidade dos threads. Por fim, também é de respons-
abilidade do desenvolvedor escalonar as atividades entre a GPU e CPU.
A proposta inicial da Nvidia era que a API fosse destinada a propriedades f´ısicas
em jogos, analisar fluxo do tráfego, visualização de moléculas e identificar placas ocul-
tas em artérias. Entretanto, muitos desenvolvedores ao redor do mundo observaram no
CUDA uma tentativa e oportunidade de aprimorar suas aplicações. Dessa forma, out-
ras áreas começaram a fazer uso da API, como por exemplo: inteligência artificial (o
framework da Google TensorFlow, faz uso do CUDA) e redes blockchain. Nos dias de
hoje, a plataforma CUDA, é das plataformas, de GPGPU mais robustas que existem, jus-
tificando assim o preço mais alto de suas placas gráficas comparadas com as de suas
concorrentes. Por fim, nas versões antigas do CUDA Toolkit, era poss´ıvel fazer uso da
ferramenta mesmo sem possuir uma placa gráfica, através de um emulador, era poss´ıvel
desenvolver. No entanto, a partir da versão 3.0, a Nvidia removeu essa funcionalidade.
[Nvidia ]
Utilizamos a API CUDA no projeto, pois a mesma oferece um poder computa-
cional que em combinação com a programação paralela, aumentará o desempenho da
nossa aplicação.
3.6. Flask
O Flask é um framework web desenvolvido e escrito na linguagem de programação
Python, baseado nas bibliotecas WSGI Werkzeug e Jinja2. Além disso, o Flask é disponi-
bilizado sob os termos da licença BSD. Na página do mesmo, é poss´ıvel encontrar uma
breve descrição sobre a ferramenta, onde através da própria página, ele é chamado de
micro framework, pois mantem um núcleo bastante simplificado, no entanto, estend´ıvel.
Isso ocorre, pois não há uma camada de abstração do banco de dados, validação de for-
mulários, ou outros componentes semelhantes. Dessa forma, o Flask suporta diversas
extensões que são capazes de adicionar e prover tais funcionalidades. [Flask ]
A escolha do micro framework foi bastante clara e objetiva, uma vez que, para que
a parte web da nossa aplicação funcionasse como nós gostar´ıamos, não era necessário um
framework completo com diversos recursos embutidos que acabar´ıamos não utilizando.
Dessa forma, o Flask nos permitiu adicionar somente as extensões e funcionalidades que
de fato utilizamos em nossa aplicação.
3.7. Processamento Paralelo
O processamento paralelo (parallel processing) é uma forma eficiente do processamento
da informação com ênfase na exploração de eventos simultâneos na execução de um soft-
ware. A motivação para o processamento paralelo é a possibilidade de aumentar a capaci-
dade de processamento de uma única máquina. Com a limitação tecnológica da veloci-
dade das máquinas sequenciais, a solução empregada para aumentar o poder de proces-
samento é a utilização de processadores em paralelo. Assim, com o paralelismo torna-se
poss´ıvel ultrapassar as limitações impostas pela utilização de um único processador, tais
como frequência de operação, dissipação de potência e outras.
A utilização do paralelismo nos projetos de arquitetura de computadores tem pos-
sibilitado um aumento significativo na velocidade de processamento devido à execução
simultânea de diversas tarefas. Contudo, os aspectos relacionados ao software paralelo

e à paralelização dos programas são essenciais para o desempenho do sistema paralelo.
[Ferlin 2011]
Além disso, um thread também pode ser entendido como um processo que pode
pertencer a uma aplicação ou a aplicações completamente distintas e independentes.
Sistemas com um único processador podem gerenciar vários threads simultaneamente
através de métodos de Time Slice, fornecendo para cada processo uma fatia de tempo
da CPU (não necessariamente o mesmo tempo para todos os processos). Dito isso, cada
processo pode conter um n´ıvel de prioridade: os threads com alta prioridade podem in-
terromper threads de menor prioridade. No entanto, por melhor que seja o gerenciamento
dos threads por parte da aplicação ou do sistema operacional, o Time Slice sempre pode
trazer certa lentidão/latência, devido o compartilhamento de cache ou a dificuldade de
gerenciamento entre o trânsito de processos. [Tanenbaum 2015]
A escolha de se usar o recurso computacional do processamento paralelo se deu,
uma vez que, quer´ıamos acelerar os procedimentos de validação de CPF, Região e Con-
tagem dos votos.
3.8. Trabalhos Correlatos
O número de pesquisas, trabalhos e artigos voltados para o desenvolvimento ou estudo
do sistema eleitoral é quase que inexistente, a maior parte das buscas realizadas retornam
resultados ligados diretamente ao governo, de forma que, os códigos só estão dispon´ıveis
aos candidatos ao governo e especialistas da área. Dessa forma, a escolha pelo trabalho
correlato levou em conta as ferramentas e tecnologias que usamos no desenvolvimento
do presente artigo, não necessariamente abrangendo algoritmos semelhantes ao usado por
nós, uma vez que, não foi poss´ıvel encontrar trabalhos e pesquisas sólidas na área de
servidores ligados ao sistema eleitoral como um todo.
TensorFlow:
O TensorFlow é uma biblioteca de código aberto com o propósito voltado para
o aprendizado de máquina aplicável a uma ampla variedade de tarefas. Dito isso, é um
sistema para treinamento e criação de redes neurais capazes de detectar e decifrar padrões
e correlações, à forma como humanos aprendem e raciocinam. O TensorFlow foi desen-
volvido pela equipe Google Brain para uso interno na empresa e aos poucos está substi-
tuindo o seu antecessor DistBelief. A biblioteca foi lançada em 2015 sob a licença de
código aberto Apache 2.0.
O TensorFlow está dispon´ıvel nas versões de 64 bits Windows, MacOs, Linux e
computação móvel, incluindo Android e iOS. Dessa forma, apesar da implementação de
referência sugira que a mesma seja executada em dispositivos individuais, a biblioteca
também pode ser executada em múltiplas CPU’s e GPU’s (com extensões opcionais
CUDA para GPGPU). [TensorFlow ]
4. Proposta e Desenvolvimento
4.1. Proposta
Temos como objetivo/proposta o desenvolvimento de uma aplicação, através do uso da
programação paralela juntamente da API CUDA, que será responsável por receber ar-
quivos no formato .txt com um cabeçalho pré-definido e, após o recebimento do arquivo,

iniciar a validação do CPF por eleitor, bem como, o número do candidato escolhido. Por
fim, será feita a contagem total dos votos que indicará o candidato que será eleito.
4.2. Desenvolvimento
Para que o desenvolvimento do presente artigo pudesse ser realizado, foi preciso fazer
uso de tecnologias distintas (citadas na seção 2). Dessa forma, o desenvolvimento da
aplicação foi separado por etapas. São elas:
• Etapa 1 - Protótipo em HTML e CSS da tela web.
• Etapa 2 - Implementação da parte web.
• Etapa 3 - Algoritmo de validação do arquivo.
• Etapa 4 - Algoritmo de validação de CPF.
• Etapa 5 - Algoritmo de validação da Região.
• Etapa 6 - Algoritmo de contagem dos votos.
• Etapa 7 - Fila de processamento.
Para cada etapa listada acima, será definido o modelo de implementação, carac-
ter´ıstica de cada etapa e sua importância no projeto, complexidade do algoritmo, dentre
outras definições.
4.3. Protótipo em HTML e CSS da tela web
No modelo eleitoral existente no Brasil hoje, após o término do horário da eleição, é re-
movido de cada urna uma memória contendo todos os votos realizados. Após a remoção,
os responsáveis pelas urnas se encaminham até uma sala espec´ıfica em cada local de
votação e, através de uma intranet enviam os dados da memória para o servidor.
Para que pudéssemos simular esse mecanismo de envio de dados, optamos por
criar uma página web. Através dessa página, os demais grupos do PI, conseguem enviar
2 arquivos diferentes e selecionar o estado da federação. O primeiro arquivo que deve
ser selecionado na página é referente aos candidatos que concorrem a vagas estaduais. O
segundo arquivo refere-se aos dados dos candidatos com os votos (Figure 1). Por fim,
para que seja poss´ıvel enviar os dados referentes à urna, é preciso clicar no ´ıcone. O
tratamento, bem como, a organização desses arquivos será explicado posteriormente.
O visual da página foi constru´ıdo através do uso do HTML5 e o framework Boot-
strap. Além disso, foi criado um pequeno ”mecanismo” visual de carregamento. Esse
”mecanismo” é ativado no momento em que o usuário clicar no ´ıcone da urna e, enquanto
é feito o upload do arquivo o sistema apresentará esse carregamento.(Figure 2)
4.4. Desenvolvimento da tela web
Após o design de a tela ter sido definido, foi preciso tornar a tela dinâmica, de forma que,
ao clicar no ´ıcone para enviar os dados, a nossa aplicação pudesse receber os arquivos
de forma correta. Dito isso, usamos o micro framework Flask para que pudesse tornar
tal ação viável. A organização e estrutura das pastas ligadas a página web pode ser vista
através da (Figure 6).
Através do uso de boas práticas para programação de páginas web, deixamos
acess´ıvel ao usuário da tela, apenas o necessário e essencial, ou seja, todas as estruturas
de validação de formulário e a lista dos estados da federação (poss´ıvel ser visto através
do SELECT no formulário) estão todos encapsulados no back-end.

4.5. Algoritmo de validação do arquivo
Para que não houvesse nenhum tipo de conflito entre os grupos na hora de gerar o arquivo
com os votos, criou-se um cabeçalho padrão para o arquivo com os dados dos candidatos
e o arquivo com os dados dos eleitores. O formato escolhido inicia-se com o número 1
seguido do separador ’;’ na sequência, é apresentado o t´ıtulo de cada coluna. O número 1
representa o cabeçalho e o número 2 representa os dados (Figure 7) e (Figure 8).
No momento em que o usuário submete os arquivos, o sistema irá validar o ar-
quivo como um todo. Nesse momento, a primeira validação que ocorre, é com relação
a extensão do arquivo. Caso o arquivo esteja em um formato diferente da extensão .txt,
a aplicação irá retornar o status 401 e, consequentemente, será apresentado na tela uma
mensagem de erro.
Caso não apresente nenhum problema com relação à extensão do arquivo, será
feito então, a leitura dos arquivos para identificar se ambos estão no formato correto.
Nesse momento, é criado duas threads, um thread será destinado à validação do arquivo
do candidato e a outra responsável pelo arquivo do eleitor. O algoritmo para verificar se a
estrutura está de acordo com o informado é a mesma para ambos os arquivos. O algoritmo
criado faz a leitura apenas da primeira linha e, através do identificador ’;’ é separado cada
parte do cabeçalho. Com a separação dos t´ıtulos é feita uma verificação um por um para
identificar se o t´ıtulo está correto ou não. Ao final, caso a estrutura de ambos os arquivos
estejam corretas, o arquivo é salvo de acordo com o nome do grupo informado e, então,
seguirá para a próxima validação que é a do CPF de cada eleitor. Caso tenha algum
problema ao longo da verificação, é retornado o status 406 e apresentado uma mensagem
de erro na tela (Figure 4) e (Figure 5).
A validação do cabeçalho é muito importante, uma vez que, caso o cabeçalho
venha com os t´ıtulos na ordem trocada, ou até mesmo, com os nomes incorretos, a prob-
abilidade de que as linhas referentes aos votos ou os dados referentes aos candidatos
também estejam incorretos é bastante alta. Dessa forma, esse procedimento inicial de
validação tenta evitar problemas futuros na hora da validação do CPF e número do can-
didato, bem como, na contabilização dos votos.
A complexidade do algoritmo demonstrado acima é: O(N).
4.6. Algoritmo de validação de CPF
A validação do CPF de cada eleitor é feita após a verificação dos arquivos enviados pelos
estados da federação. Nesse momento, foram desenvolvidos dois algoritmos na tentativa
de identificar o mais performático, dessa forma, o primeiro foi feito usando a linguagem
de programação Python através de um simples FOR percorrendo linha por linha do ar-
quivo e passando os dados de cada linha para a função/método de verificação de CPF
(Código 3).
A complexidade do algoritmo demonstrado acima é: O(N).
O segundo algoritmo desenvolvido, foi usando a API da Nvidia, o CUDA. A partir
desse momento, a complexidade no desenvolvimento da aplicação cresceu exponencial-
mente, ou seja, foi preciso entender muito bem o funcionamento dos blocos na placa de
v´ıdeo, bem como, a transferência das informações do HOST para o DEVICE. Semelhante
ao algoritmo anterior é lido o dado de cada linha do arquivo através de um WHILE, nesse

momento, é feita as devidas alocações de cada linha em um vetor único. Após a alocação
de cada linha do arquivo enviado, é feita a preparação para o CUDA, ou seja, criamos os
ponteiros, bem como, suas alocações. Além disso, é feita a transferência dos dados do
HOST para o DEVICE através da função cudaMemcpy (Código 1).
Após a transferência dos dados para a placa de v´ıdeo, é definido o número de blo-
cos que serão usados (Código 2). Com o número de blocos e a quantidade de threads
definidas, é feita então a chamada da função valida (faz uso do paralelismo). Nessa
função, é feita a identificação do vetor dentro do bloco e, após a identificação, para
cada linha é chamada a função responsável pela validação do CPF (Código 3). Com a
validação finalizada, é feito a cópia dos dados do DEVICE para o HOST. Por fim, caso a
aplicação identifique algum CPF inválido, é adicionado em um vetor de tamanho fixo de
10 posições, o número da linha que contém o problema. No entanto, mesmo tendo lim-
itado o tamanho do vetor em 10 posições, não é poss´ıvel parar a execução da validação,
pois como o arquivo é separado em diversos blocos, não é poss´ıvel saber quais ainda estão
em execução. Dito isso, é retornado para a tela as linhas referentes aos votos que pos-
suem problema com relação ao CPF (Figure 4). Caso não tenha problemas na validação,
é encerrado esse procedimento e seguirá para a próxima validação.
A validação do CPF é de suma importância para a aplicação, uma vez que, para
que um voto seja contabilizado de forma correta e válida, é preciso que o eleitor tenha um
CPF válido. Um detalhe importante a ser descrito, é que como as urnas eleitorais possuem
a funcionalidade de multiplicação dos votos, ou seja, irá ocorrer repetição dos CPF’s para
os diferentes votos, o servidor não faz uma validação de singularidade de voto.
Problemas encontrados pelo uso da abordagem acima:
• Uso de variáveis auxiliares:
– É muito comum ao longo da aplicação encontrar variáveis que sejam aux-
iliares. Dito isso, uma dessas variáveis é a ”idx”, ela é utilizada para
guardar os ´ındices. O problema no uso de uma variável auxiliar utilizando
simultaneamente o processamento paralelo juntamente da API CUDA, é
que o processamento das linhas está ocorrendo de forma simultânea, ou
seja, pode ser que duas linhas apresentem erro simultaneamente e tentem
fazer uso do mesmo ´ındice, nesse momento, como estão tentando acessar
a mesma variável um erro irá sobrescrever o outro.
– Solução: Como a programação em CUDA é feita através do uso da lin-
guagem C, encontramos uma palavra chave na linguagem chamada de
”register”. Os registers são mais rápidos que as memórias de acesso,
dessa forma, como o próprio nome sugere, são variáveis que serão ar-
mazenadas nos registradores e não nas memórias principais. Isso solu-
ciona uma parte do problema, pois agora o acesso à memória é feito de
forma muito mais rápida. Além disso, usamos uma função da API CUDA
chamada de ”atomicAdd”, como as linhas são armazenadas em blocos den-
tro da placa de v´ıdeo, toda vez que uma linha é processada é usada a função
”atomicAdd” que irá realizar uma adição atômica a uma variável (código
4).
• Vetor com o número das linhas que contenham problemas no CPF:
– Como a aplicação foi criada para que fizesse uso do recurso de threads, é
poss´ıvel que durante a validação, dois CPF’s estejam inválidos simultane-

amente provocando na não ordenação das linhas, além disso, não é garan-
tido que ao enviar o mesmo arquivo com problemas de linhas inválidas, a
aplicação retorne as mesmas linhas. Isso ocorre novamente pelo uso dos
threads, pode ser que uma linha seja processada antes da outra e, nesse
momento, a linha a ser inserida no vetor seja diferente.
A complexidade do segundo algoritmo demonstrado acima é: O(N/1024).
1 CUDA_SAFE_CALL(cudaMalloc(&d_lines, next*sizeof(char)));
2 CUDA_SAFE_CALL(cudaMalloc(&d_ind, MAXLINES*sizeof(unsigned))
);
3 CUDA_SAFE_CALL(cudaMalloc(&d_lerror, 10*sizeof(int)));
4
5 CUDA_SAFE_CALL(cudaMemcpy(d_lerror, h_lerror, 10*sizeof(int)
, cudaMemcpyHostToDevice));
6 CUDA_SAFE_CALL(cudaMemcpy(d_lines, h_lines, next*sizeof(char
), cudaMemcpyHostToDevice));
7 CUDA_SAFE_CALL(cudaMemcpy(d_ind, ind, MAXLINES*sizeof(
unsigned), cudaMemcpyHostToDevice));
Código 1 - Transferência e alocação de memória no CUDA.
1 // cont -> Quantidade de linhas do arquivo
2 // n_threads -> Valor fixo de 1024
3 int n_blocos = (cont + n_threads - 1) / n_threads;
Código 2 - Definição da quantidade de blocos.
1 __device__ int validarCPF(char cpf[]) {
2 int i, j, digito1 = 0, digito2 = 0;
3 if(lenght(cpf) != 11)
4 return 1;
5 else if((compare(cpf,"00000000000", 11) == 0) || (compare(
cpf,"11111111111", 11) == 0) || (compare(cpf,"22222222222
", 11) == 0) ||
6 (compare(cpf,"33333333333", 11) == 0) || (compare(
cpf,"44444444444", 11) == 0) || (compare(cpf,"
55555555555", 11) == 0) ||
7 (compare(cpf,"66666666666", 11) == 0) || (compare(
cpf,"77777777777", 11) == 0) || (compare(cpf,"
88888888888", 11) == 0) ||
8 (compare(cpf,"99999999999", 11) == 0))
9 return 1; //se o CPF tiver todos os numeros iguais ele
invalido.
10 else {
11 //digito
1---------------------------------------------------
12 for(i = 0, j = 10; i < lenght(cpf)-2; i++, j--) //
multiplica os numeros de 10 a 2 e soma os resultados
dentro de digito1
13 digito1 += (cpf[i]-48) * j;

14 digito1 %= 11;
15 if(digito1 < 2)
16 digito1 = 0;
17 else
18 digito1 = 11 - digito1;
19 if((cpf[9]-48) != digito1)
20 return 1; //se o digito 1 no for o mesmo que o da
validao CPF invlido
21 else {
22 //digito
2--------------------------------------------------
23 for(i = 0, j = 11; i < lenght(cpf)-1; i++, j--) //
multiplica os numeros de 11 a 2 e soma os
resultados dentro de digito2
24 digito2 += (cpf[i]-48) * j;
25 digito2 %= 11;
26 if(digito2 < 2)
27 digito2 = 0;
28 else
29 digito2 = 11 - digito2;
30 if((cpf[10]-48) != digito2)
31 return 1; //se o digito 2 no for o mesmo que o
da validacao CPF invalido
32 }
33 }
34 return 0;
35 }
Código 3 - Função/Método - Validar CPF.
1 register int idx = atomicAdd(total, r);
Código 4 - Exemplificação do uso da palavra chave register e uso da função atomicAdd.
4.7. Algoritmo de validação da Região
Para a validação da Região pensamos em dois algoritmos diferentes que iriam atender
o nosso propósito, no entanto, umas das abordagens que tentamos não funcionou
corretamente e será descrito mais a frente o porque de não ter dado certo. A abordagem
que desenvolvemos é semelhante a validação do cabeçalho. Inicialmente criamos uma
lista no Python contendo o grupo de estados referentes a cada grupo, segue a lista:
Grupo A: [’PR’,’SC’,’RS’];
Grupo B: [’RN’,’CE’,’PI’];
Grupo C: [’ES’,’BA’,’SE’];
Grupo D: [’AL’,’PE’,’PB’];
Grupo E: [’SP’,’MG’,’RJ’];
Grupo F: [’MA’,’AP’,’PA’];
Grupo G: [’AM’,’AC’,’RR’];
Grupo H: [’DF’,’GO’,’MS’];

Grupo I: [’MT’,’TO’,’RO’].
Após a lista ter sido definida, criamos uma função (código 5) que irá retornar para
um vetor o valor em decimal do estado. Esse valor pode ser consultado através da tabela
ASCII. Com os valores dentro do vetor, é feita a alocação do vetor na memória da placa
de v´ıdeo, assim como na validação do CPF. Após a alocação, é enviado para o método
”valida” todas as informações necessárias para a validação.
Dentro da função ”valida”, criamos um laço de repetição responsável por com-
parar o valor em decimal apresentado pela linha com a lista que criamos anteriormente.
Caso esteja sem nenhum problema na linha vai para o próximo ´ındice, caso algum ´ındice
apresente problema, para que exista uma separação entre problema com o CPF e problema
com o estado, adicionamos o valor da linha com problema com o seu valor negativo.
Com relação a primeira abordagem que ir´ıamos seguir, tentamos criar um vetor e
conforme ´ıamos percorrendo as linhas, verificavámos se o estado já havia sido preenchido
ou não, caso não estivesse no vetor inser´ıamos ele, caso já estivesse, prosseguimos com
a validação. O problema dessa abordagem já foi mencionada anteirormente, como a
aplicação está fazendo uso do processamento paralelo, duas linhas distintas tentavam
acessar simultaneamente o mesmo ´ındice do vetor, no entanto, para essa abordagem não
conseguimos solucionar o problema fazendo uso dos ”registers” ou atomicAdd. Além
disso, o desenvolvimento do primeiro algoritmo citado, funcionou muito bem com a nossa
aplicação, dessa forma, optamos por não prosseguir com essa metodologia.
1 for(int i=0; i<6; i++)
2 h_state[i] = (int)PyFloat_AsDouble(PyList_GetItem(
state_list, i));
Código 5 - Conversão da lista em Pyhon para valor em decimal referente ao estado.
4.8. Algoritmo de contagem dos votos
O procedimento inicial para o desenvolvimento do algoritmo responsável pela contagem
dos votos é um pouco parecido com o algoritmo de validação do CPF. Para que fosse
poss´ıvel a implementação, utilizamos o processamento paralelo juntamente do processa-
mento dos dados na placa de v´ıdeo (API CUDA).
Após todas as validações terem sido efetuadas com sucesso, a contagem dos vo-
tos dos candidatos federais entra em ação. É feita a leitura do arquivo chamado presi-
dentes.txt, que possu´ı a estrutura referente a imagem (Figure 7), essa leitura é feita através
da linguagem de programação Python e, então, é criada uma lista contendo o nome do
candidato juntamente do seu código, após a lista ter sido definida, é enviado por meio da
API de integração entre Python e o C essa lista (código 6). Após a conversão, é feita a
alocação da variável e cópia da varivável auxiliar na memória da placa de v´ıdeo (código
7).
Com todo o estado da placa de v´ıdeo pronto e preparado para iniciar o processa-
mento, é acionada a função ”valida”. Na função valida é feito inicialmente a validação da
Região e posteriormente do CPF e logo em seguida entra a função responsável por fazer a

compração da lista dos candidatos enviada para a placa de v´ıdeo e o dado que está na linha
do arquivo. Como o tamanho do campo ”código do candidato” é fixado em 2 posições, é
criada uma variável que irá armazenar em posições distintas do vetor cada valor do dado.
Com os valores definidos, é feita a conversão dos caracteres e, então, estará pronto para
passar por um laço de repetição varrendo a lista dos candidatos poss´ıveis e incrementando
o vetor de resultados de cada candidato, uma vez que, é feita a paridade entre os códigos.
Problemas encontrados pelo uso da abordagem acima:
• Conversão do código do candidato do arquivo para inteiro:
– Quando chegamos no momento de realizar a comparação entre os códigos
dos candidatos que foram enviados para a placa de v´ıdeo e o valor do
candidato presente no arquivo não sabiamos como iria ser feita essa
comparação, pois o dado que é extra´ıdo do arquivo vem em formato de
um vetor de strings, nesse momento, pensamos em realizar a conversão do
valor do caracter para binário, no entanto, essa abordagem não funcionaria,
uma vez que, o valor em binário do caracter ’9’ é diferente do valor em
binário do número 9. Como essa método descrito não funcionaria, pen-
samos em criar no Python a lista com os valores em string ao invés de
valor inteiro, no entanto, quando fossêmos retornar o vetor de resultados
com os valores em string teriamos problemas em realizar a contabilização
total. Por fim, encontramos a solução que é descrita no (código 8) que
funciona perfeitamente para a nossa proposta.
1 // Candidato
2 int size_tt = PyList_Size(state_list);
3
4 int h_cd[size_tt-6];
5 int h_aux_cd[size_tt-6];
6 int resultado[size_tt-6];
7 int idx_cd = 0;
8
9 for(int i=0; i<size_tt; i++){
10 if(i < 6)
11 h_state[i] = (int)PyFloat_AsDouble(PyList_GetItem(
state_list, i));
12 else{
13 // Candidatos
14 h_cd[idx_cd] = (int)PyFloat_AsDouble(PyList_GetItem(
state_list, i));
15 h_aux_cd[idx_cd] = 0;
16 resultado[idx_cd++] = 0;
17 }
18 }
Código 6 - Conversão da lista em Python.
1 CUDA_SAFE_CALL(cudaMalloc(&d_aux_cd, (size_tt-6)*sizeof(int)
));

2 CUDA_SAFE_CALL(cudaMemcpy(d_aux_cd, h_aux_cd, (size_tt-6)*
sizeof(int), cudaMemcpyHostToDevice));
Código 7 - Alocação e cópia da variável para a placa de v´ıdeo.
1 char cd_federal[2];
2
3 cd_federal[0] = string[cont];
4 cont++;
5 cd_federal[1] = string[cont];
6
7 int cod = (cd_federal[0] - ’0’)*10 + (cd_federal[1] - ’0’);
Código 8 - Conversão dos valores da linha.
4.9. Fila de processamento
Após todos os passos descritos acima, optamos por implementar um mecanismo de fila
de processamento. Desenvolvemos a fila com o intuito de evitar que dois grupos envi-
assem o arquivo para o servidor de forma simultânea e ocasionasse em algum problema
no processamento. Dito isso, a fila funciona da seguinte forma: no momento em que a
aplicação é iniciada o job responsável por ficar verificando se existe algum arquivo para
validar ou não é acionado. Quando um grupo submete um arquivo para a validação e
contagem dos votos, esse arquivo é armazenado em um diretório chamado de ”não val-
idado”, o job fica verificando esse diretório a procura de arquivos para serem validados,
caso encontre algum arquivo no diretório, o job irá enviar o arquivo para os fluxos de
validação e contagem. Caso um grupo tente reenviar um arquivo que ainda está na fila
para ser processado, retornamos uma mensagem de erro na tela (Figure 11).
5. Experimentos e Análise dos Resultados
Nessa seção apresentamos os resultados obtidos pela aplicação de acordo com cada
implementação, bem como, os tipos de experimentos que realizamos com o intuito de
chegarmos a uma conclusão plaus´ıvel com relação aos resultados.
Os testes foram realizados utilizando a aplicação feita em CUDA (processamento
paralelo, integração de linguagens, utilização de processamento dentro da placa de v´ıdeo)
e também realizada no Python (utilização de threads). Os testes não levam em conta o
tempo que a aplicação leva para receber o arquivo (upload), apenas o tempo que leva para
executar os processos de validação e contagem. Os testes realizados foram feitos para
um total de cem, mil, dez mil, cem mil, um milhão, dez milhões e sessenta milhões de
linhas.we
Através da análise das imagens (Figure 9) e (Figure 10) é poss´ıvel chegar a con-
clusão de que a utilização do CUDA para uma massa de testes de até dez mil linhas não
é viável, acima desse valor, o CUDA é extremamente recomendável, pois a perfomance
adquirida é muito superior quando comparado com o Python. A maior discrepância pode
ser vista ao validar e contabilizar os votos de um arquivo de sessenta milhões de lin-
has, enquanto o CUDA realizou o processamento em aproximadamente dez segundos, o
Python levou em torno de 40 minutos.
Observação.: O experimento foi realizado em uma máquina com as seguintes
configurações:

• Processador: I7 7700 3.6 GHz
• Placa de V´ıdeo: GTX 1060 6GB 8008MHz
• Memória Ram: 2x8gb ram 2400MHz
6. Conclusão e Trabalhos Futuros
Diante deste estudo/desenvolvimento de algoritmos com o intuito de comparar os resul-
tados da aplicação em cada tecnologia, o uso da API CUDA juntamente do recurso com-
putacional de programação paralela mostrou-se mais efetivo e eficaz para valores muito
altos. Quando comparados com valores muito pequenos, uma abordagem padrão como
por exemplo, o uso de linguagem C ou Python, é mais efetivo.
Com base nos argumentos apresentados, o projeto integrador proposto vai ao en-
contro do que foi apresentado nas motivações iniciais. Sendo assim, conclu´ımos que é
preciso realizar diversos experimentos até que seja comprovada a eficácia do algoritmo,
bem como, o recurso computacional.
Através dos resultados expressos na seção anterior é poss´ıvel identificar todas as
comparações realizadas e, a partir delas, escolher uma poss´ıvel abordagem de acordo com
a sua aplicação.
Como sugestões de poss´ıveis trabalhos futuros, pode-se apontar a implementação
de novos recursos, tais como:
• Implementação de novo algoritmo responsável pela validação dos candidato;
• Uso de inteligência artif´ıcial com o objetivo de extrair e identificar as informações
extras enviadas pelos grupos;
• Implementação de novo algoritmo responsável pela contabilização dos votos dos
candidatos estaduais;
• Implementação de novo algoritmo responsável pela análise do resultado dos votos,
ou seja, separação de votos por estados, classe econômica.
7. Referência
Segue abaixo as referências usadas ao longo da montagem do artigo/aplicação.
References
Ferlin, E. P. (2011). In O que é Processamento Paralelo? -
http://professorferlin.blogspot.com/2011/08/o-que-e-processamento-paralelo.html.
Flask. In Flask Documentation. Flask 1.0 edition.
Microsoft. In Visual Studio Code - https://code.visualstudio.com/.
Nvidia. In CUDA Toolkit Documentation. 10.0.130 edition.
Schildt, H. (1996). In C - Completo e Total, pages 15–20. Makron Books, 3th edition.
Tanenbaum, A. S. (2015). In Sistemas Operacionais Modernos, pages 50–87. São Paulo,
3th edition.
TensorFlow. In Tensor Flow - https://www.tensorflow.org.
TSE. In Tribunal Superior Eleitoral - http://www.tse.jus.br/.
Tulchak, L. V. and Marchuk, O. A. O. In History of Python, pages 1–3. 1th edition.
8. Imagens

Figure 1. Prot´otipo da tela
Figure 2. Carregamento da tela

Figure 3. Arquivo Enviado com Sucesso
Figure 4. Arquivo Inv´alido - problema com CPF

Figure 5. Arquivo Inválido - problema com estado
Figure 6. Estrutura das pastas - Interface Web
Figure 7. Modelo do cabeçalho - Candidatos
Figure 8. Modelo do cabeçalho - Eleitores

Figure 9. Tempo de processamento em segundos
Figure 10. Preenchimento de ´areas em segundos

Figure 11. Erro reportado ao tentar inserir um novo arquivo para processar que
já está na fila

Servidor com processamento paralelo utilizando CUDA aplicado em uma urna eletrônica

Recomendados

Recomendados

Mais conteúdo relacionado

Semelhante a Servidor com processamento paralelo utilizando CUDA aplicado em uma urna eletrônica

Semelhante a Servidor com processamento paralelo utilizando CUDA aplicado em uma urna eletrônica (20)

Servidor com processamento paralelo utilizando CUDA aplicado em uma urna eletrônica