BIG DATA E ACESSO À INFORMAÇÃO - A LEGALIDADE DO USO DE BOTS (ROBÔS)
Análise do uso de robôs para busca de informações governamentais
frente à Lei de Acesso à Informação e ao Marco Civil da Internet
REINIS, Oliver Alexandre1
RESUMO
A internet apresenta, atualmente, um grande volume de informações disponibilizadas de
maneira descentralizada na rede, sendo que serviços denominados Big Data nasceram
para buscar, organizar filtrar e disponibilizar essa informação ao usuário final, de maneira
mais palatável. Todavia, os websites de órgãos governamentais fazem uso de sistemas de
captcha, para bloquear o acesso de sistemas automatizados de busca destas informações.
O presente artigo analisa a legalidade deste bloqueio, em face da Lei de Acesso à
Informação e do Marco Civil da Internet.
Palavras-chave: Internet; Informação; Marco Civil da Internet; Lei de Acesso à Informação;
Robôs; CAPTCHA, Administração Pública.
INTRODUÇÃO
A internet tem sua origem no final da década de 90 e início do século XXI, sendo
que, com base em pesquisa realizada pelo IBOPE em 2013, tem-se que atualmente o País
já conta com mais de 102,3 milhões de usuários da internet.
Vale esclarecer, neste ínterim, que a internet é um conjunto de redes de
computadores ligados entre si através de roteadores e gateways, cujo principal objetivo é
transmitir informações, diminuindo as distâncias e dissipando as fronteiras traçadas pela
geografia. Com isso, criou-se um processo de globalização da informação e facilitação da
comunicação, e a possibilidade de armazenamento de dados industriais e individuais, dados
relativos a contas bancárias, números de cartões de crédito, senhas de acesso, trocas de
experiências interpessoais, criação e difusão do comércio eletrônico.
Isso levou, com o passar dos anos, a um grande volume de armazenamento de
informações na rede, e à criação de inúmeros serviços - muitos dos quais públicos - de
disponibilização destas mesmas informações.
1
LL.M. em Direito de Negócios, Pós-graduando em Direito Empresarial pelo EBRADI. Bacharel pela Faculdade
de Direito de São Bernardo do Campo FDSBC, Membro do ICC - International Chamber of Commerce. Membro
do IBC - Instituto Brasileiro de Compliance. Membro do IBAP - Instituto Brasileiro de Advocacia Pública. Membro
da ALADA - Academia Latino Americana de Direito Ambiental. Membro da APET – Associação Paulista de
Estudos Tributários. Membro do ISOC - Internet Society.
No Brasil, podemos trazer à lume, ainda, a Lei de Acesso à Informação (Lei nº
12.527/11), que regulamentou a obrigação dos Poderes Públicos em disponibilizar suas
informações de forma clara, transparente e de fácil acesso a qualquer cidadão. E nada mais
fácil do que disponibilizá-las online.
Tais fatos levaram à criação de um novo mercado digital, formado por empresas que
criam sistemas de captura, tratamento e administração de informações em grande volume,
conhecida no meio informático como big data.
Em resumo, tais empresas trabalham com a criação de programas de computador
que buscam grandes volumes de informação na rede, em diversas fontes diferentes, filtram
essa informação, e apresentam a mesma ao usuário final de forma organizada.
Para tanto, elas se utilizam de robôs, que são programas que fazem pesquisas
automáticas em sites que disponibilizam dados públicos fornecidos, em sua grande parte,
pelo governo, e trazem esses dados para seu sistema de filtros e disponibilização.
Muitas vezes, entretanto, as fontes originais das informações são protegidas contra
a ação destes robôs, entre os quais o chamado captcha, e, para conseguir obter a
informação, referidas empresas fazem uso de sistemas de automatização ou desvio dos
sistemas de captcha, utilizados por alguns sites públicos.
O presente artigo visa discutir, justamente, a legalidade destes sistemas de
automatização ou desvio dos sistema de captcha.
CAPTCHA
Captcha é um acrônimo da expressão "Completely Automated Public Turing test to
tell Computers and Humans Apart" (teste de Turing público completamente automatizado
para diferenciação entre computadores e humanos): um teste de desafio cognitivo, utilizado
inicialmente como ferramenta anti-spam.
A idéia original do captcha é, como diz seu nome, diferenciar humanos de robôs,
com o fito de proteger sistemas de hackers, spammers e outros, que teriam como objetivo
ações maliciosas contra o sistema ou website.
Todavia, há muito que este fim resta ultrapassado. Em 2010, as universidades de
Konstanz (Alemanhã) e NUST (Paquistão) publicaram o artigo Breaking e-Banking
CAPTCHAS, no qual, utilizando um conjunto de técnicas de processamento de imagens e
reconhecimento de padrões, quebraram 3 CAPTCHAS usados para validar transações
bancárias e 41 utilizados para login, atingindo taxa próxima a 100% de sucesso.
Em seguida, em 2011, a Universidade de Stanford publicou o artigo Text-based
CAPTCHA - Strengths and Weakness, apresentando resultados do uso de uma ferramenta
cujo algoritmo quebrou 66% dos CAPTCHAS da Visa, 75% do eBay e 70% da Blizzard,
entre outros.
Ou seja, passou o sistema de captcha a ser mais um bloqueio de acesso para
empresas de Big Data e assemelhadas, do que um sistema de defesa contra ataques para
websites. Tornou-se o mesmo, simplesmente, um entrave à livre disseminação e uso de
informação pública, o que faz com que, atualmente, todas as empresas que trabalham com
Big Data sejam obrigadas a fazer uso de sistemas de desvio de captchas.
.
LIVRE ACESSO À INFORMAÇÃO
É importante ressaltar, neste ponto, que esses robôs não invadem dispositivos
informáticos alheios, mediante violação indevida de mecanismo de segurança (o que
configuraria o crime previsto no art. 154-A, do Código Penal - com a redação que lhe deu a
Lei nº 12.732/12, apelidada de Lei Carolina Dieckmann).
Ao contrário, eles buscam somente informação pública, através dos canais de
disponibilização desta informação fornecidos pelo titular da mesma, só que de forma
automatizada – o que torna essa busca mais eficaz e rápida.
Da mesma maneira, tal ato não tem o fim de obter, adulterar ou destruir dados ou
informações sem autorização expressa ou tácita do titular. Ao contrário, o sistema
simplesmente filtra e colaciona essas informações, apresentando-as ipsis literis ao usuário
final, só que de modo organizado, de acordo com a pesquisa feita por este.
É o caso, por exemplo, de sistema na internet que, em website, apresenta listas de
processos em trâmite no Brasil todo, de políticos. O sistema busca essa informação nas
áreas abertas ao público dos sites de cada Tribunal, as agrega, filtra e disponibiliza em lista
única ao usuário final.
Ora, isso não só é permitido, como também incentivado pela nossa legislação.
Basta vermos o disposto no art. 8º, § 2º e § 3º, incisos II e III, da Lei de Acesso à
Informação (Lei nº 12.527/11):
Art. 8o
É dever dos órgãos e entidades públicas promover,
independentemente de requerimentos, a divulgação em local de fácil acesso,
no âmbito de suas competências, de informações de interesse coletivo ou
geral por eles produzidas ou custodiadas.
(...)
§ 2o
Para cumprimento do disposto no caput, os órgãos e entidades públicas
deverão utilizar todos os meios e instrumentos legítimos de que dispuserem,
sendo obrigatória a divulgação em sítios oficiais da rede mundial de
computadores (internet).
§ 3o
Os sítios de que trata o § 2o
deverão, na forma de regulamento, atender,
entre outros, aos seguintes requisitos:
(...)
II - possibilitar a gravação de relatórios em diversos formatos
eletrônicos, inclusive abertos e não proprietários, tais como planilhas e
texto, de modo a facilitar a análise das informações;
III - possibilitar o acesso automatizado por sistemas externos em
formatos abertos, estruturados e legíveis por máquina;
(...)
Ora, a redação de tais dispositivos legais, especialmente do inciso III supra
transcrito, é absolutamente clara: os sistemas governamentais, em todas as suas esferas,
devem possibilitar o acesso automatizado por sistemas externos a suas informações,
legíveis por máquinas.
Ressalte-se que o art. 8º do Decreto nº 7.724/12 repetiu integralmente o disposto na
Lei de Acesso à Informação:
Art. 8o
Os sítios na Internet dos órgãos e entidades deverão, em
cumprimento às normas estabelecidas pelo Ministério do Planejamento,
Orçamento e Gestão, atender aos seguintes requisitos, entre outros:
(...)
III - possibilitar gravação de relatórios em diversos formatos eletrônicos,
inclusive abertos e não proprietários, tais como planilhas e texto, de modo a
facilitar a análise das informações;
IV - possibilitar acesso automatizado por sistemas externos em formatos
abertos, estruturados e legíveis por máquina;
(...)
Assim, a manutenção de sistemas de captcha em websites governamentais que
divulgam informações públicas é, no nosso entender, incongruente com a legislação
vigente.
Não bastando isso, a Lei nº 12.965/14 - Marco Civil da Internet - fixa que:
Art. 4o
A disciplina do uso da internet no Brasil tem por objetivo a promoção:
(...)
III - da inovação e do fomento à ampla difusão de novas tecnologias e
modelos de uso e acesso; e
IV - da adesão a padrões tecnológicos abertos que permitam a comunicação,
a acessibilidade e a interoperabilidade entre aplicações e bases de dados.
A leitura da mesma é clara: o uso da internet no Brasil tem como objetivo a
promoção da inovação e fomento a novos modelos de uso e acesso, e à acessibilidade e
interoperabilidade entre aplicações e bases de dados.
E mais, em seu artigo 24, diz:
Art. 24. Constituem diretrizes para a atuação da União, dos Estados, do
Distrito Federal e dos Municípios no desenvolvimento da internet no Brasil:
(...)
III - promoção da racionalização e da interoperabilidade tecnológica dos
serviços de governo eletrônico, entre os diferentes Poderes e âmbitos da
Federação, para permitir o intercâmbio de informações e a celeridade de
procedimentos;
IV - promoção da interoperabilidade entre sistemas e terminais
diversos, inclusive entre os diferentes âmbitos federativos e diversos
setores da sociedade;
V - adoção preferencial de tecnologias, padrões e formatos abertos e livres;
Não há dúvida que sistemas de Big Data e os aplicativos deles decorrentes
configuram um novo modelo de uso e acesso à informação constante na internet. Desta
feita, os sites governamentais, em obediência ao art. 4º, IV, conjuntamente com o art. 24,
incisos III, IV e V, todos da Lei nº 12.965/14, deveriam fomentar e facilitar o uso de suas
informações por estas empresas, garantindo “a acessibilidade e a interoperabilidade entre
aplicações e bases de dados”, e não obstá-las através de sistemas como os de captcha.
CONCLUSÃO
É nítido que a utilização de sistema de captcha, que tem como único objetivo impedir
o acesso de informações públicas por robôs, não só faz letra morta do art. 8º, § 3º, III, da
Lei de Acesso à Informação, mas também o viola.
Ao mesmo tempo, desrespeita as diretrizes fixadas pelo Marco Civil da Internet (em
seus artigos 4º e 24), para a atuação do entes governamentais brasileiros no
desenvolvimento da internet nacional.
Ao permitir (e fomentar) a manutenção de tais sistemas de captcha, os dirigentes
dos órgãos públicos competentes pela divulgação de informações públicas está claramente
desrespeitando a Lei de Acesso à Informação, sendo seu ato, inclusive, passível de
contestação através de Mandado de Segurança, eis que configura ato ilegal e coator.
BIBLIOGRAFIA
FERRAZ, Reinaldo. Eu não sou uma máquina. Internet -
https://tableless.com.br/eu-nao-sou-uma-maquina/
OLIVEIRA, Andressa Cattafesta de; ZANGANELLI, Margareth Vetis. Compliance,
Governança e Transparência na Administração Pública à luz da Lei de Acesso à Informação
Brasileira, in O Direito atual e as novas fronteiras jurídicas. Instituto Politécnico do Cávado e
do Ave - Centro de Investigação Jurídica Aplicada - Barcelos, Portugal, 1ª ed., p. 499-520,
2017;
SCHIEFLER, Gustavo Henrique Carvalho. Anotações sobre o regime jurídico aplicável às
informações disponibilizadas pela Administração Pública na rede mundial de computadores.
Fórum Administrativo - FA, Belo Horizonte, ano 13, n. 146, p. 36-48, abril 2013;
SOARES, Horácio; SPELTA, Lêda. CAPTCHA, herói ou vilão? Internet -
http://acessodigital.net/art_captcha-heroi-ou-vilao.html

Big data e acesso à informação - A Legalidade do uso de bots

  • 1.
    BIG DATA EACESSO À INFORMAÇÃO - A LEGALIDADE DO USO DE BOTS (ROBÔS) Análise do uso de robôs para busca de informações governamentais frente à Lei de Acesso à Informação e ao Marco Civil da Internet REINIS, Oliver Alexandre1 RESUMO A internet apresenta, atualmente, um grande volume de informações disponibilizadas de maneira descentralizada na rede, sendo que serviços denominados Big Data nasceram para buscar, organizar filtrar e disponibilizar essa informação ao usuário final, de maneira mais palatável. Todavia, os websites de órgãos governamentais fazem uso de sistemas de captcha, para bloquear o acesso de sistemas automatizados de busca destas informações. O presente artigo analisa a legalidade deste bloqueio, em face da Lei de Acesso à Informação e do Marco Civil da Internet. Palavras-chave: Internet; Informação; Marco Civil da Internet; Lei de Acesso à Informação; Robôs; CAPTCHA, Administração Pública. INTRODUÇÃO A internet tem sua origem no final da década de 90 e início do século XXI, sendo que, com base em pesquisa realizada pelo IBOPE em 2013, tem-se que atualmente o País já conta com mais de 102,3 milhões de usuários da internet. Vale esclarecer, neste ínterim, que a internet é um conjunto de redes de computadores ligados entre si através de roteadores e gateways, cujo principal objetivo é transmitir informações, diminuindo as distâncias e dissipando as fronteiras traçadas pela geografia. Com isso, criou-se um processo de globalização da informação e facilitação da comunicação, e a possibilidade de armazenamento de dados industriais e individuais, dados relativos a contas bancárias, números de cartões de crédito, senhas de acesso, trocas de experiências interpessoais, criação e difusão do comércio eletrônico. Isso levou, com o passar dos anos, a um grande volume de armazenamento de informações na rede, e à criação de inúmeros serviços - muitos dos quais públicos - de disponibilização destas mesmas informações. 1 LL.M. em Direito de Negócios, Pós-graduando em Direito Empresarial pelo EBRADI. Bacharel pela Faculdade de Direito de São Bernardo do Campo FDSBC, Membro do ICC - International Chamber of Commerce. Membro do IBC - Instituto Brasileiro de Compliance. Membro do IBAP - Instituto Brasileiro de Advocacia Pública. Membro da ALADA - Academia Latino Americana de Direito Ambiental. Membro da APET – Associação Paulista de Estudos Tributários. Membro do ISOC - Internet Society.
  • 2.
    No Brasil, podemostrazer à lume, ainda, a Lei de Acesso à Informação (Lei nº 12.527/11), que regulamentou a obrigação dos Poderes Públicos em disponibilizar suas informações de forma clara, transparente e de fácil acesso a qualquer cidadão. E nada mais fácil do que disponibilizá-las online. Tais fatos levaram à criação de um novo mercado digital, formado por empresas que criam sistemas de captura, tratamento e administração de informações em grande volume, conhecida no meio informático como big data. Em resumo, tais empresas trabalham com a criação de programas de computador que buscam grandes volumes de informação na rede, em diversas fontes diferentes, filtram essa informação, e apresentam a mesma ao usuário final de forma organizada. Para tanto, elas se utilizam de robôs, que são programas que fazem pesquisas automáticas em sites que disponibilizam dados públicos fornecidos, em sua grande parte, pelo governo, e trazem esses dados para seu sistema de filtros e disponibilização. Muitas vezes, entretanto, as fontes originais das informações são protegidas contra a ação destes robôs, entre os quais o chamado captcha, e, para conseguir obter a informação, referidas empresas fazem uso de sistemas de automatização ou desvio dos sistemas de captcha, utilizados por alguns sites públicos. O presente artigo visa discutir, justamente, a legalidade destes sistemas de automatização ou desvio dos sistema de captcha. CAPTCHA Captcha é um acrônimo da expressão "Completely Automated Public Turing test to tell Computers and Humans Apart" (teste de Turing público completamente automatizado para diferenciação entre computadores e humanos): um teste de desafio cognitivo, utilizado inicialmente como ferramenta anti-spam. A idéia original do captcha é, como diz seu nome, diferenciar humanos de robôs, com o fito de proteger sistemas de hackers, spammers e outros, que teriam como objetivo ações maliciosas contra o sistema ou website. Todavia, há muito que este fim resta ultrapassado. Em 2010, as universidades de Konstanz (Alemanhã) e NUST (Paquistão) publicaram o artigo Breaking e-Banking CAPTCHAS, no qual, utilizando um conjunto de técnicas de processamento de imagens e reconhecimento de padrões, quebraram 3 CAPTCHAS usados para validar transações bancárias e 41 utilizados para login, atingindo taxa próxima a 100% de sucesso. Em seguida, em 2011, a Universidade de Stanford publicou o artigo Text-based CAPTCHA - Strengths and Weakness, apresentando resultados do uso de uma ferramenta
  • 3.
    cujo algoritmo quebrou66% dos CAPTCHAS da Visa, 75% do eBay e 70% da Blizzard, entre outros. Ou seja, passou o sistema de captcha a ser mais um bloqueio de acesso para empresas de Big Data e assemelhadas, do que um sistema de defesa contra ataques para websites. Tornou-se o mesmo, simplesmente, um entrave à livre disseminação e uso de informação pública, o que faz com que, atualmente, todas as empresas que trabalham com Big Data sejam obrigadas a fazer uso de sistemas de desvio de captchas. . LIVRE ACESSO À INFORMAÇÃO É importante ressaltar, neste ponto, que esses robôs não invadem dispositivos informáticos alheios, mediante violação indevida de mecanismo de segurança (o que configuraria o crime previsto no art. 154-A, do Código Penal - com a redação que lhe deu a Lei nº 12.732/12, apelidada de Lei Carolina Dieckmann). Ao contrário, eles buscam somente informação pública, através dos canais de disponibilização desta informação fornecidos pelo titular da mesma, só que de forma automatizada – o que torna essa busca mais eficaz e rápida. Da mesma maneira, tal ato não tem o fim de obter, adulterar ou destruir dados ou informações sem autorização expressa ou tácita do titular. Ao contrário, o sistema simplesmente filtra e colaciona essas informações, apresentando-as ipsis literis ao usuário final, só que de modo organizado, de acordo com a pesquisa feita por este. É o caso, por exemplo, de sistema na internet que, em website, apresenta listas de processos em trâmite no Brasil todo, de políticos. O sistema busca essa informação nas áreas abertas ao público dos sites de cada Tribunal, as agrega, filtra e disponibiliza em lista única ao usuário final. Ora, isso não só é permitido, como também incentivado pela nossa legislação. Basta vermos o disposto no art. 8º, § 2º e § 3º, incisos II e III, da Lei de Acesso à Informação (Lei nº 12.527/11): Art. 8o É dever dos órgãos e entidades públicas promover, independentemente de requerimentos, a divulgação em local de fácil acesso, no âmbito de suas competências, de informações de interesse coletivo ou geral por eles produzidas ou custodiadas. (...) § 2o Para cumprimento do disposto no caput, os órgãos e entidades públicas deverão utilizar todos os meios e instrumentos legítimos de que dispuserem, sendo obrigatória a divulgação em sítios oficiais da rede mundial de computadores (internet).
  • 4.
    § 3o Os sítiosde que trata o § 2o deverão, na forma de regulamento, atender, entre outros, aos seguintes requisitos: (...) II - possibilitar a gravação de relatórios em diversos formatos eletrônicos, inclusive abertos e não proprietários, tais como planilhas e texto, de modo a facilitar a análise das informações; III - possibilitar o acesso automatizado por sistemas externos em formatos abertos, estruturados e legíveis por máquina; (...) Ora, a redação de tais dispositivos legais, especialmente do inciso III supra transcrito, é absolutamente clara: os sistemas governamentais, em todas as suas esferas, devem possibilitar o acesso automatizado por sistemas externos a suas informações, legíveis por máquinas. Ressalte-se que o art. 8º do Decreto nº 7.724/12 repetiu integralmente o disposto na Lei de Acesso à Informação: Art. 8o Os sítios na Internet dos órgãos e entidades deverão, em cumprimento às normas estabelecidas pelo Ministério do Planejamento, Orçamento e Gestão, atender aos seguintes requisitos, entre outros: (...) III - possibilitar gravação de relatórios em diversos formatos eletrônicos, inclusive abertos e não proprietários, tais como planilhas e texto, de modo a facilitar a análise das informações; IV - possibilitar acesso automatizado por sistemas externos em formatos abertos, estruturados e legíveis por máquina; (...) Assim, a manutenção de sistemas de captcha em websites governamentais que divulgam informações públicas é, no nosso entender, incongruente com a legislação vigente. Não bastando isso, a Lei nº 12.965/14 - Marco Civil da Internet - fixa que: Art. 4o A disciplina do uso da internet no Brasil tem por objetivo a promoção: (...) III - da inovação e do fomento à ampla difusão de novas tecnologias e modelos de uso e acesso; e IV - da adesão a padrões tecnológicos abertos que permitam a comunicação, a acessibilidade e a interoperabilidade entre aplicações e bases de dados.
  • 5.
    A leitura damesma é clara: o uso da internet no Brasil tem como objetivo a promoção da inovação e fomento a novos modelos de uso e acesso, e à acessibilidade e interoperabilidade entre aplicações e bases de dados. E mais, em seu artigo 24, diz: Art. 24. Constituem diretrizes para a atuação da União, dos Estados, do Distrito Federal e dos Municípios no desenvolvimento da internet no Brasil: (...) III - promoção da racionalização e da interoperabilidade tecnológica dos serviços de governo eletrônico, entre os diferentes Poderes e âmbitos da Federação, para permitir o intercâmbio de informações e a celeridade de procedimentos; IV - promoção da interoperabilidade entre sistemas e terminais diversos, inclusive entre os diferentes âmbitos federativos e diversos setores da sociedade; V - adoção preferencial de tecnologias, padrões e formatos abertos e livres; Não há dúvida que sistemas de Big Data e os aplicativos deles decorrentes configuram um novo modelo de uso e acesso à informação constante na internet. Desta feita, os sites governamentais, em obediência ao art. 4º, IV, conjuntamente com o art. 24, incisos III, IV e V, todos da Lei nº 12.965/14, deveriam fomentar e facilitar o uso de suas informações por estas empresas, garantindo “a acessibilidade e a interoperabilidade entre aplicações e bases de dados”, e não obstá-las através de sistemas como os de captcha. CONCLUSÃO É nítido que a utilização de sistema de captcha, que tem como único objetivo impedir o acesso de informações públicas por robôs, não só faz letra morta do art. 8º, § 3º, III, da Lei de Acesso à Informação, mas também o viola. Ao mesmo tempo, desrespeita as diretrizes fixadas pelo Marco Civil da Internet (em seus artigos 4º e 24), para a atuação do entes governamentais brasileiros no desenvolvimento da internet nacional. Ao permitir (e fomentar) a manutenção de tais sistemas de captcha, os dirigentes dos órgãos públicos competentes pela divulgação de informações públicas está claramente desrespeitando a Lei de Acesso à Informação, sendo seu ato, inclusive, passível de contestação através de Mandado de Segurança, eis que configura ato ilegal e coator. BIBLIOGRAFIA FERRAZ, Reinaldo. Eu não sou uma máquina. Internet - https://tableless.com.br/eu-nao-sou-uma-maquina/
  • 6.
    OLIVEIRA, Andressa Cattafestade; ZANGANELLI, Margareth Vetis. Compliance, Governança e Transparência na Administração Pública à luz da Lei de Acesso à Informação Brasileira, in O Direito atual e as novas fronteiras jurídicas. Instituto Politécnico do Cávado e do Ave - Centro de Investigação Jurídica Aplicada - Barcelos, Portugal, 1ª ed., p. 499-520, 2017; SCHIEFLER, Gustavo Henrique Carvalho. Anotações sobre o regime jurídico aplicável às informações disponibilizadas pela Administração Pública na rede mundial de computadores. Fórum Administrativo - FA, Belo Horizonte, ano 13, n. 146, p. 36-48, abril 2013; SOARES, Horácio; SPELTA, Lêda. CAPTCHA, herói ou vilão? Internet - http://acessodigital.net/art_captcha-heroi-ou-vilao.html