SlideShare uma empresa Scribd logo
1 de 9
Baixar para ler offline
Um Sistema para Detecção de Plágio em Ambiente de Aprendizado
                              Virtual*

SANTANA, Joseval de Melo (Msc.)                                         Joberto, Sérgio Barbosa Martins (Dr.)
Universidade Católica do Salvador – UCSal e                             Universidade Salvador – UNIFACS - Brasil
Fundação Visconde de Cairu - FVC - Brasil


                                                       RESUMO

        A detecção de plágio é de maneira geral um aspecto importante para os ambientes e
sistemas de aprendizado tanto presencial como virtual. No entanto, a detecção de plágio tem
sido dificultada até então pelo fato de ser comumente realizada através de uma avaliação e
comparação direta não automatizada dos documentos produzidos pelos autores. Este artigo
propõe a adoção de uma estratégia facilitadora da detecção de plágio através da utilização de
uma ferramenta e proposta de modelagem de um sistema de certificação que possa automatizar
parte do processo de detecção de plágio. A solução proposta é portável entre diferentes
ambientes operacionais e mostra-se particularmente relevante no contexto da educação a
distância onde se pressupõe a utilização em larga escala de informações provenientes de
inúmeras fontes (autores) encontradas na Web.


Palavras-chave: Espectrometria, Detecção de Plágio, Documentos Eletrônicos.


1. INTRODUÇÃO                                                       áreas acadêmicas e a educação a distância.
                                                                    Não é rara a dificuldade que os docentes
         O estágio atual do desenvolvimento                         têm em avaliar a autenticidade dos
tecnológico traz à tona uma nova                                    trabalhos dos seus alunos. A falta da
reorganização dos modos de produção e                               autenticidade    gera     descrédito   das
negócios,     e     conseqüentemente       da                       informações e serve como barreira na
economia, da sociedade e da política. Este                          disponibilidade de informações. Na
novo paradigma toma por base a                                      realidade, sem nenhuma proteção de autoria
informação, contrapondo-se às revoluções                            os pesquisadores temem em colocar artigos,
tecnológicas anteriores, que tinha por base                         monografias e outros tipos de documentos a
energia e matéria.                                                  disposição em forma eletrônica o que
         Com a consolidação da Sociedade                            contrapõe, em parte, um dos pilares
da Informação (SI), as informações                                  fundamentais do ensino a distância.
eletrônicas cresceram em projeções                                          A espectrometria, denominação
geométricas hospedando-se nos mais                                  adotada para as técnicas de avaliação de
variados sítios (em rede) e em mídias dos                           documentos quanto à similaridade de seu
mais diversos tipos.                                                conteúdo, é uma análise comparativa de
         O processo acelerado de geração de                         sentenças entre documentos cujo objetivo é
informações eletrônicas decorrentes da                              servir de parâmetro para poder expressar o
Sociedade da Informação tem levado a uma                            grau de autenticidade relativa1 ou não
disseminação caótica das informações.                               autenticidade quantitativa do documento
Questões sobre veracidade e autenticidade                           em análise. Tal métrica vem a servir como
da informação eletrônica começam a se                               um parâmetro essencial para a análise
tornarem indispensáveis sob pena de
comprometer a aceitabilidade e obstruir a
                                                                    1
utilização de documentos originais em                                 A autenticidade é considerada relativa, quando visa
mídia eletrônica.                                                   a garantir a autenticidade somente entre as amostras
                                                                    analisadas. Não infere sobre a originalidade do
         Todas as áreas são afetadas por essa                       documento.
disseminação caótica e em particular as

* Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção
de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
qualitativa que norteará sobre a não                                condição sine qua non para garantir que um
autenticidade e/ou autenticidade relativa de                        certo documento é inautêntico. O método
documentos de maneira geral.                                        de inspeção visual tem sido por muito
         A espectrometria produz resultados                         tempo o único meio de detecção de plágio.
mensuráveis que, numa estratégia de                                 Infelizmente, este método tem se mostrado
detecção de plágio, minimizarão as                                  ineficiente na detecção.
atividades de pesquisas dos analistas ou                                     Métodos de detecção de plágio
observadores. Tal métrica facilita as                               baseado em computadores têm surgido na
análises de qualificação conceitual sobre os                        última década. Contudo, tais sistemas por
conteúdos dos documentos eletrônicos                                serem, na grande maioria, de natureza
(inspeção visual), onde pode ser inferido                           privada têm tornado difícil o acesso a essa
sobre a      não autenticidade relativa e                           tecnologia, principalmente devido aos
veracidade do conteúdo das informações                              custos do serviço de detecção de plágio. Por
nos documentos.                                                     outro lado, também a falta de clareza dos
                                                                    parâmetros utilizados para majoração e
2. O DOCUMENTO ELETRÔNICO                                           qualificação do documento como plagiado,
                                                                    ou não, tem dificultado a aceitação e até
        A evolução tecnológica e científica                         mesmo a utilização de tais métodos.
da humanidade tem se processado mediante                                     Este trabalho propõe uma nova
a transmissão de conhecimentos de geração                           alternativa com intuito de garantir uma
em geração, prática que tem a sua eficácia                          maior eficiência, rapidez e aceitação da
na produção de documentos, ou seja, toda                            detecção de plágio por computador – a
informação contida em um suporte material                           espectrometria. Esta consiste em um
que tenha a propriedade de ser comunicada.                          processo automatizado que divide os
Este suporte consiste em “uma substância                            documentos em partes denominadas de
que permite a fixação dos signos gráficos                           espectros e compara-os com espectros de
no qual é expresso o documento”                                     outros documentos envolvidos neste
(ZAGAMI, 1996, p. 151).                                             processo. O resultado desta comparação
        O processo de documentação da                               serve de parâmetro para a detecção do
informação (pensamento) tem evoluído                                plágio.
desde os ideogramas impressos em rochas                                      A espectrometria se propõe a ser
até a escrita em mídia papel e/ou digital. O                        muito mais do que um método automático
documento, hoje, é a base do conhecimento                           para detecção de plágio. Ela consiste em
colocado à disposição para tornar conhecida                         técnicas, parâmetros e conceitos claros que
a expressão do pensamento, das ações e                              permitem a detecção de plágio em
experiências de seu autor.                                          documentos eletrônicos de forma não
        O autor mantém com seu                                      proprietária, uma vez que possibilita o
documento uma relação de propriedade,                               desenvolvimento de diversas aplicações
mas cabe ressaltar que se trata de uma                              baseada em seus conceitos e técnicas.
propriedade que revela não as posses do                                      Uma nova aplicação, baseada neste
autor, e sim a intelectualidade deste. Como                         novo conceito (espectrometria), foi
em toda propriedade, o documento                                    implementada como um programa de
eletrônico é alvo de ações criminosas que                           computador denominado de espectrômetro.
violam os seus direitos. Nesse caso, tem-se                         Este instrumento, ainda na forma de
o plágio como um tipo específico de crime                           protótipo, foi desenvolvido utilizando uma
praticado contra o patrimônio intelectual.                          linguagem de programação orientada a
        O plágio consiste na produção de                            objetos – JAVA.
um documento subsidiado na cópia, parcial
ou total, de outro(s) documento(s) com                              2.1. O plágio e sua detecção
intuito de se revelar como um documento
autêntico. O pseudo-autor (plagiador), de                                   Com a consolidação da Sociedade
forma ingênua ou intencional, tem                                   da Informação, as informações eletrônicas
cometido        o      plágio     motivado,                         cresceram    em    grandes   proporções,
principalmente, pela idéia da não detecção                          hospedando-se nas mais variadas mídias
do crime cometido. Detectar o plágio é                              magnéticas/ópticas tais como: discos,

* Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção
de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
Compact Disc – Read Only Memory (CD-                                     • Sistema de detecção de plágio por
ROM), Digital Versatile Disks (DVD’s)                                       palavras:
entre outros.                                                              Este tipo de detecção é realizado
         O processo acelerado da geração de                                por cruzamento de palavras
informações eletrônicas tem possibilitado                                  geralmente pré-estabelecido um
uma disseminação sem nenhum tipo de                                        tamanho mínimo de caracteres na
controle sobre a autoria (identificação do                                 palavra.
autor) e veracidade das informações, ou                                  • Sistema de detecção de plágio por
seja, informações verdadeiras sobre o tema                                  sentenças:
que discorre. Este tipo de controle começa a                               Método no qual o cruzamento é
se tornar indispensável sob pena de                                        feito por um conjunto de palavras,
comprometer a aceitabilidade e obstruir a                                  podendo ser ou não delimitada por
materialização de documentos originais em                                  sinal de pontuação. São mais
aporte eletrônico. Em outras palavras, a                                   sofisticados que o sistema de
falta de controle inibe fortemente a                                       detecção de plágio por palavras.
publicação de documentos eletrônicos pelo
receio da não preservação da autoria dos                                    Na      literatura,    encontram-se
mesmos.                                                             soluções diversas para a verificação de
         O Documento Eletrônico (DE)                                plágio como segue:
torna-se alvo fácil do uso impróprio com a                               • CopyCatch Gold – Um programa
intenção de violação da propriedade                                          para computadores standalone ou
intelectual – o plágio.                                                      em rede. O programa faz a
         Os moinhos de documentos                                            comparação dos textos por
eletrônicos (sites que disponibilizam desde                                  sentenças e é obtido por
simples trabalhos escolares até teses de                                     licenciamento      (COPYCATCH,
doutorado)      têm     sido   os    grandes                                 2002, p.1).
incentivadores dos plagiadores que, de                                   • Document Source Analysis (DSA) –
forma intencional, ou mesmo ingênua,                                         Clientes submetem seu trabalho
praticam cada vez mais o crime de plágio.                                    por cópia e colagem via Web. Esta
         Estudos recentes mostram que                                        solução em particular funciona
cerca de 30% dos estudantes devem estar                                      baseado no cruzamento de
plagiando        documentos       eletrônicos                                referências contra uma base de
acadêmicos (PLAGIARISM, 2002, p. 1).                                         dados loca e com outros
         Mesmo diante de conseqüências                                       documentos da Web encontrados
severas que podem ser aplicadas em caso de                                   mediante rastreadores que varrem
comprovação de plágio pelas instituições                                     a internet em busca de possíveis
aos plagiadores, estes não se intimidam e                                    combinações do conteúdo do
apostam na não detecção da violação                                          documento analisado. O cliente
cometida.                                                                    que solicitou a análise recebe após
         O plágio pode ser considerado                                       um prazo de 24 horas um relatório
como uma das mais sérias formas de                                           de originalidade com referências e
violação da conduta acadêmica e                                              links dos documentos pesquisados
profissional.                                                                (TURNITIN, 2002, p. 1).
         O plágio subsiste na cópia, parcial                             • Essay Verification Engine (EVE) –
ou total, de um documento. Detectar o                                        Software baseado em sentenças
plágio somente é possível mediante meios                                     por busca de plágio de documentos
que garantam a distinção dos documentos.                                     no formato texto simples pela
         Na última década, sistemas de                                       Internet (CANEXUS, 2002, p.1).
detecção de plágio surgiram para verificar o                             • Glatt – Programa baseado em
plágio em diferentes circunstâncias                                          sentenças por busca de plágio de
dependendo do tipo de documento                                              documentos em base local e/ou
eletrônico a ser avaliado. De modo geral, os                                 Internet (GLATT, 2002, p.1).
sistemas de detecção de plágio são                                       • IntegriGuard – Solução baseada em
divididos em duas categorias:                                                sentenças por busca de plágio pela


* Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção
de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
Internet. Os documentos são                              documento eletrônico quanto à sua
           submetidos de maneira análoga à                          distinção em relação a outros documentos.
           submissão no sistema DAS                                         Como      em      qualquer   outra
           (INTEGRIGUARD, 2002, p.1).                               espectrometria o conhecimento dos
      •   MOSS – Sistema baseado em                                 elementos que a compõem é fundamental
           palavras para detecção de plágio                         para sua compreensão. Deste modo, faz-se
           em códigos de programas de                               necessária à conceituação de seus
           computadores (MOSS, 2002, p.1).                          elementos como segue:
      •   Plagiserv – Programa baseado em
           busca por sentenças em base local                        Espectro: É o conjunto, finito e não vazio,
           e pela Internet (PLAGISERVE,                             de palavras de um documento (MENEZES,
           2002, p.1).                                              2001, p.21).
      •   YAP – Programa baseado em                                 Amostra: É o conjunto, finito e não vazio,
           palavra      desenvolvido      pela                      de espectros não repetidos de um
           Universidade de Sidney cujo                              documento.
           objetivo é a detecção de plágio em                                A espectrometria baseia-se em
           programa       de      computador                        resultados quantitativos e qualitativos
           (MICHAEL, 2002, p .1).                                   extraídos da análise. A análise quantitativa
      •   WORDCHECK           –     Programa                        revela-se nos parâmetros espectrométricos
           desenvolvido pela Universidade de                        considerados a seguir:
           Nebraska – USA, cujo objetivo é a                        Ocorrências (Oc): São espectros repetidos
           detecção de cópia em códigos                             entre as amostras dos documentos em
           fontes de programa de computador                         análise.
           (COMPUTER, 2002, p. 1).                                  Valor espectrométrico (Ve): É a razão
                                                                    percentual da quantidade de ocorrências
         Os softwares de detecção de plágio                         (qoc) pela quantidade de espectro da
evoluíram desde comparadores de palavras                            amostra (qea) de um documento.
por palavras até analisadores mais
sofisticados, que dividem o documento em                            Ve = (qoc/qea)*100                        (3.1)
partes menores permitindo fazer varreduras
mais rápidas nos documentos armazenados                             Medida espectrométrica (Me): É o maior
em base local e até em sites Web.                                   valor espectrométrico obtido entre os pares
         O Joint Information System                                 das amostras dos documentos e que
Committee (JISC) e o Center for Interactive                         também revelará o grau de distinção entre
System Engineering (CISE) vêm realizando                            esses documentos
pesquisas sobre o plágio com intuito de                             Relação binária (Rb): É a combinação de
motivar a detecção e conscientização da                             pares das n (2 ≥ n< ) amostras dos
utilização do plágio em documentos                                  documentos analisados conforme a
eletrônicos (CULWIN, 2002, p. 4).                                   expressão matemática:
         A proposta apresentada adiante
denominada       de     Espectrometria   de                         Rb = (n-1)*n/2                            (3.2)
Documentos Eletrônicos visa a ser uma
forma de combate ao plágio diferenciando                            Faixa espectrométrica (Fe): É o intervalo,
das soluções existentes pelos seus                                  compreendido entre zero (0) e cem (100%)
conceitos, técnicas e algoritmos.                                   por cento, em que a medida espectrométrica
                                                                    pode se encontrar.
3. ESPECTROMETRIA DE                                                        A análise qualitativa identificará se
DOCUMENTOS ELETRÔNICOS                                              um documento é ou não distinto de um
                                                                    outro documento eletrônico. Esta análise se
        Espectrometria de Documentos                                baseia na análise quantitativa podendo ser
Eletrônicos (EDE), consiste em um                                   subsidiada pela inspeção visual.
processo de detecção de plágio por                                          A espectrometria visa a minimizar
computador com critérios e conceitos                                as inspeções visuais dos documentos, que
transparentes visando à possibilidade de                            tenham como objetivo a detecção de plágio,
padronização no deferimento de um                                   e servir de diagnóstico na distinção de um

* Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção
de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
documento. Ela faz a comparação dos
espectros baseando-se na gramática no
sentido léxico e não leva em consideração a
semântica das palavras.
        A espectrometria é realizada
mediante um processo espectrométrico
descrito a seguir.

3.1. Pré-processamento espectrométrico

        O processamento espectrométrico                                        Figura 4.1 – Espectrômetro
consiste em uma análise comparativa das
amostras dos documentos eletrônicos. Para                                   O protótipo do espectrômetro
tanto, tais documentos têm de passar por                            desenvolvido         apresenta      algumas
uma etapa inicial denominada pré-                                   características básicas como segue:
processamento       espectrométrico    que                              • Os espectros são constituídos de
consiste em:                                                                palavras de tamanho variável
        1. Arquivo texto simples: O                                         definido pelo usuário;
        documento é transformado em texto                               • A ferramenta permite a análise de
        no formato padrão ASCII mediante                                    documentos em texto simples e em
        conversores      de      tipos  de                                  textos transformados via uma
        documentos.                                                         função hash com o algoritmo MD5;
        2. Normalização do documento: É o                               • Aplica espectrometria apenas direta;
        procedimento de criação dos                                     • Analisa documentos apenas em
        espectros (conjunto de palavras) a                                  base local; e
        partir de palavras que tenham um                                • A ferramenta foi desenvolvida para
        determinado número de caracteres e                                  execução        em     computadores
        que pertençam ao arquivo texto                                      convencionais       tipo     desktop
        simples. A normalização cria os                                     utilizando plataforma windows.
        espectros tomando como referência
        um delimitador, ou seja, um sinal                                   Ensaios espectrométricos foram
        de pontuação tal como: o ponto, a                           realizados em documentos eletrônicos de
        vírgula, dois pontos, outros.                               forma a demonstrar a eficiência da solução
        3. Arquivo de texto hash                                    desenvolvida. Em seguida, descreve-se a
        (opcional):                                                 experimentação e os elementos de
         O documento normalizado é                                  composição dos referidos experimentos.
        submetido à função hash. Tal
        transformação é aplicada aos                                Experimento 01:
        espectros do documento mantendo,                                    O experimento 01 foi baseado em
        porém, inteligíveis todos os                                documentos produzidos por alunos cujo
        delimitadores do documento.                                 tema abordava a área de informática tais
                                                                    como, Pirataria de Software, Redes de
4. ESPECTRÔMETRO ELETRÔNICO                                         Computadores, Tecnologia Web e Sistemas
                                                                    Operacionais. A base dos documentos foi
        O espectrômetro (figura 4.1) é uma                          extraída dos trabalhos de pesquisas de 180
máquina de inferência, capaz de executar                            (cento e oitenta) alunos que produziram 60
um algoritmo espectrométrico, que                                   (sessenta) documentos eletrônicos.
possibilita uma análise de vários
Documentos Eletrônicos, permitindo obter                            Experimento 02:
a medida espectrométrica entre os referidos                         O experimento 02 foi baseado em buscas
documentos. Tal medida servirá de                                   efetuadas sobre um mesmo tema na Internet
revelação do grau de distinção destes.                              formando uma base local de 09 (nove)
                                                                    documentos.



* Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção
de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
A análise espectrométrica foi                                  Tabela 4.2 - Medidas espectrométricas
 realizada com as seguintes condições:                                            (experimento 02)
      • Modo direto; e
                                                                          Faixa               DE                 % (Total)
      • Documentos normalizados com                                  Espectrométrica       Quantidade
         espectros    de    duas    palavras                             Me = 0                0                    0,00
         alinhados pelo delimitador vírgula
         (,).                                                            0< Me <=5               1                 11,11
         Os resultados obtidos foram os
 seguintes:                                                            15< Me <=20               1                 11,11

    Tabela 4.1 - Medidas espectrométricas                              20< Me <=25               0                  0,00
              (experimento 01)                                         25< Me <=30               1                 11,11
     Faixa              DE           % (Total DE’S)
Espectrométrica        Quant.                                          30< Me <=40               0                  0,00
    Me = 0               4                  6,67
                                                                       40< Me <=50               0                  0,00
  0< Me <=5               15               25,00

  5< Me <=10              26               43,33
                                                                           Faixa         DE                    % (Total dos
 10<Me <=15                7               11,67                      Espectrométrica Quantidade                  DE’S)
                                                                       50< Me <=60        0                        0,00
 15<Me <=20                0                    0

 20<Me <=25                0                    0                       60< Me <=70              2                 22,22

 25<Me <=30                0                    0                       70< Me <=80              1                 11,11

 30<Me <=40                0                    0                       80< Me <=90              0                  0,00

 40<Me <=50                2                3,33                        90< Me <100              2                 22,22

                                                                          Me =100                0                  0,00

                                                                         Fonte: Dados extraídos do módulo de estatística de
     Faixa         DE                  % (Total)                         documentos analisados – Espectrômetro (protótipo).
Espectrométrica Quantidade
  50<Me <=60        2                     3,33
                                                                             Os resultados produzidos pelo
 60<Me <=70                0                0                        espectrômetro foram, em resumo, como
                                                                     segue:
 70<Me <=80                0                0

 80<Me <=90                0                0                        Experimento 01:
                                                                        • 60 Documentos analisados;
 90< Me <100               0                0                           • 26.907.078 espectros de amostras
                                                                            analisados;
   Me =100                 4              6,67                          • Tempo de espectrometria: 0h 1m
                                                                            42s;
 Fonte: Dados extraídos do módulo de estatística de
 documentos analisados – Espectrômetro (protótipo).                     • Taxa espectrométrica: 263.794,1
                                                                            espectros/s;
                                                                        • Maior medida espectrométrica
                                                                            Me = 100.0%;
                                                                        • Menor medida espectrométrica
                                                                            Me = 0.0%;
                                                                        • 1770 Resultados espectrométricos.




 * Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção
 de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
Experimento 02:                                                          •   Mesmo recorrendo à inspeção
   • 05 documentos analisados;                                               visual   houve     incerteza     na
   • 12.190.362 espectros de amostras                                        determinação de distinção de
       analisados;                                                           alguns documentos.
   • Tempo de espectrometria: 0h 1m e                               4) Na faixa espectrométrica (tabela 4.2),
       19s;                                                         maior que dez (10%) e menor e igual a
   • Taxa espectrométrica: 154.308,0                                vinte (20%), houve dúvida na garantia de
       espectros/s;                                                 distinção dos documentos, mesmo com o
   • Maior medida espectrométrica                                   auxílio da inspeção visual. Este intervalo é
       Me = 99.0 %;                                                 denominado de intervalo crítico e a medida
   • Menor medida espectrométrica                                   espectrométrica pertencente a este intervalo
       Me = 0.0 %;                                                  é chamada de “Me” crítica.
   • 10 Resultados espectrométricos.                                5) Na faixa espectrométrica (tabela 4.2),
                                                                    maior que vinte (20%) e menor e igual a
        Confrontando os resultados obtidos                          vinte e cinco (25%), 02 documentos foram
nos experimentos 01 e 02 com a inspeção                             classificados como não distintos pela
visual dos documentos, conclui-se que:                              inspeção visual.

1) Dos 60 documentos analisados (tabela                                      O resultado da espectrometria de
4.1), constatou-se que, nas faixas de médias                        documentos eletrônicos retratou a realidade
espectrométricas, maiores que vinte (20%)                           esperada      e     comprovada      mediante
e menores e iguais a cem (100%), foram                              confrontação com a inspeção visual. A
encontrados 08 documentos, ou seja,                                 análise espectrométrica, descartando-se os
13,67% do total dos documentos                                      documentos que apresentaram aberrações
considerados não distintos, conforme                                espectrométricas e “Me” dentro do
observação abaixo:                                                  intervalo crítico, comprovou serem distintos
                                                                    os      documentos      eletrônicos     com
    • 04 documentos (6,67%) foram
                                                                    espectrometria maior ou igual a zero (0%) e
        classificados como cópias idênticas
                                                                    menor ou igual a dez (10%) e não distintos,
        (Me igual a 100%).
                                                                    os documentos com espectrometria superior
    • Os outros 04 documentos (6,67%)
                                                                    a vinte (20%).
        classificados como cópia parcial.
                                                                             As faixas espectrométricas que
2) Na faixa espectrométrica, maior ou igual
                                                                    qualificam documentos com distintos (0 a
a zero (0%) e menor e igual a dez (10%),
                                                                    10 %), críticos (10< Me <=20), não
foram verificados distinções entre dezenove
                                                                    distintos (Me > 20) são faixas
documentos.
                                                                    convencionadas tomadas como referência
3) Na faixa espectrométrica maior que dez
                                                                    às análises experimentais, por isso, não
(10%) e menor ou igual a vinte (20%) foi
                                                                    devem ser tomadas como valores precisos.
verificado o seguinte:
                                                                             Nestes experimentos, os melhores
    • Existiu coincidência de espectros
                                                                    resultados espectrométricos foram obtidos
        (referente à bibliografia, palavras-
                                                                    na espectrometria com documentos
        chave, etc.), que não
                                                                    normalizados com o delimitador vírgula (,).
        comprometeram a distinção entre
                                                                    Contudo, a escolha do delimitador deve ser
        os documentos.
                                                                    feita levando em consideração as
    • Documentos com quantidade                                     características do idioma e/ou simulações
        pequena de espectros (menos de                              espectrométricas que revelem as maiores
        20% dos espectros do documento a                            medidas espectrométricas.
        ser comparado, foram considerados
        DE’s não distintos).                                        5. CONCLUSÃO
        A espectrometria nestes
        documentos pode revelar medidas                                     No contexto apresentado, propomos
        espectrométricas que                                        a adoção de uma ferramenta de apoio à
        comprometam a distinção dos                                 detecção de plágio para utilização em
        mesmos, fato denominado de                                  estratégias de aprendizado virtual a
        aberração espectrométrica.                                  distância.

* Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção
de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
Tal ferramenta se propõe a                                  Métodos e Algoritmos. 2. ed. Rio de
simplificar consideravelmente o processo                            Janeiro: Book Express, 2001.
de detecção de plágio, tornando tal processo
acessível para profissionais de maneira                             CANEXUS. EVE2 – Essay Verification
geral usuários de informações provenientes                          Engine. Disponível em:
da Web, como também professores,                                    http://www.canexus.com/eve/index3.shtml.
coordenadores e outros profissionais da                             Acesso em: 11 nov. 2002.
área de educação na solução de problemas
comuns do seu dia-a-dia.                                            COPYCATCH. CopyCatch Gold.
        Algumas das características mais                            Disponível em:
importantes na concepção da ferramenta                              http://www.copycatch.freeserve.co.uk/.
que facilitam a sua utilização e aplicação no                       Acesso em: 11 nov. 2002.
contexto de educação a distância são:
    • Simplicidade de utilização;                                   COMPUTER.ORG. Professors use
    • Efetua a entrada de dados de forma                            Technology to Fight Plagiarism.
        interativa e ergonométrica para                             Disponível em:
        profissionais de ensino não                                 http://www.computer.org/computer/homepa
        totalmente familiarizados com as                            ge/0802/briefs. Acesso em: 20 set. 2002.
        tecnologias computacionais de
        ponta;                                                      CULWIN. Plagiarism, Prevention
    • Apresenta resultados graficamente                             Deterrence & Detection. The institute for
        para o universo de amostragem de                            learning and teaching in higher education -
        documentos considerado;                                     ILTHE. Disponível em:
    • Auxilia a tomada de decisão de                                http://www.ilt.ac.uk/resources/Culwin-
        identificação de plágio baseado em                          Lancaster.htm. Acesso em: 15 nov. 2002.
        métricas que podem ser ajustadas
        por contexto de aplicação da                                GLATT. Glatt Plagiarism Service.
        ferramenta; e                                               Disponível em: http://www.plagiarism.com.
    • Ferramenta         desenvolvida     em                        Acesso em: 15 nov. 2002.
        plataforma Java, possibilitando o
        acréscimo de outras características                         INTEGRIGUARD. IntegriGuard.
        através da construção de objetos.                           Disponível em:
                                                                    http://rfe.org/Teaching/IntegriGuard.html.
        Este artigo apresenta então uma                             Acesso em: 11 nov. 2002.
contextualização da proposta da estratégia
de detecção de plágio para atender a estes                          MENEZES, Paulo Blauth. Linguagens
requisitos, a descrição da ferramenta                               Formais e Autômatos. 4. ed. Porto Alegre:
desenvolvida com este objetivo e um estudo                          Sagra Luzzatto, 2001.
de caso com os resultados apresentados
através do processo de simulação de uma                             MICHAEL. Plagiarism Detection - YAP.
aplicação da ferramenta num ambiente de                             Disponível em:
aprendizagem      virtual,   visando      a                         http://www.cs.usyd.edu.au/~michaelw/yap.
demonstração de sua praticidade.                                    html. Acesso em: 11 nov. 2002.
        Em termos de resultados efetivos já                         MOSS. A System for Detecting Software
obtidos no escopo deste trabalho, a                                 Plagiarism. Disponível em:
ferramenta proposta foi desenvolvida e                              http://www.cs.berkeley.edu/~aiken/moss.ht
prototipada e, além disso, as técnicas e                            ml. Acesso em: 11 nov. 2002.
abordagens        mencionadas        foram                          PLAGIARISM.ORG. Plagiarism.
incorporadas com sucesso num curso de                               Disponível em: http://www.plagiarism.org.
graduação.                                                          Acesso em: 20 set. 2002.

6. REFERÊNCIAS BIBLIOGRÁFICAS                                       PLAGISERVE.COM. Welcome to
                                                                    PlagiServe - Global Academic Integrity
CARVALHO, Daniel Balparda de.                                       Service. Disponível em:
Segurança de Dados com Criptografia.

* Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção
de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
http://www.plagiserve.com. Acesso em: 11                            ZAGAMI, Raimundo.Firme ‘Digitali’ e
nov. 2002.                                                          Validità Del Documento Eletronico.IN “II
                                                                    Diritto dell”informazione e
TURNITIN.ORG. Solutions for a New                                   dell’informatica”,1996, fasc.1, p. 151.
Era in Education. Disponível em:
http://www.turnitin.com. Acesso em: 20                              ZIVIANI, Nivio. Projeto de Algoritmos
set. 2002.                                                          com Implementação em Pascal e C. São
                                                                    Paulo: Pioneira Thomson, 2002.




* Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção
de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.

Mais conteúdo relacionado

Semelhante a Plágio acadêmico

345019962-Tecnicas-Antiforenses-Em-Desktops.pdf
345019962-Tecnicas-Antiforenses-Em-Desktops.pdf345019962-Tecnicas-Antiforenses-Em-Desktops.pdf
345019962-Tecnicas-Antiforenses-Em-Desktops.pdfGuiomarRibeiro3
 
SLIDE MONOGRAFIA JEF LUKA
SLIDE MONOGRAFIA JEF LUKASLIDE MONOGRAFIA JEF LUKA
SLIDE MONOGRAFIA JEF LUKAJef Dias
 
Forense computacional - Estudos Praticos
Forense computacional  - Estudos PraticosForense computacional  - Estudos Praticos
Forense computacional - Estudos PraticosData Security
 
Modelo de Laudo Perícia Digital.pdf
Modelo de Laudo Perícia Digital.pdfModelo de Laudo Perícia Digital.pdf
Modelo de Laudo Perícia Digital.pdfSamuel Queles
 
Gerenciamento eletronico de documentos. Uma abordagem na seguranca
Gerenciamento eletronico de documentos. Uma abordagem na segurancaGerenciamento eletronico de documentos. Uma abordagem na seguranca
Gerenciamento eletronico de documentos. Uma abordagem na segurancaOsvaldo Mwanalezi
 
Forense Computacional
Forense ComputacionalForense Computacional
Forense ComputacionalGrupo Treinar
 
Texto rede ci parreiras
Texto rede ci   parreirasTexto rede ci   parreiras
Texto rede ci parreirasRômulo Barros
 
Sistematização de estratégia de defesa e ataque
Sistematização de estratégia de defesa e ataqueSistematização de estratégia de defesa e ataque
Sistematização de estratégia de defesa e ataqueUrsao Go
 
Forense e Segurança contra Pedofilia
Forense e Segurança contra PedofiliaForense e Segurança contra Pedofilia
Forense e Segurança contra Pedofiliaburtlima
 
Monografia diego dias_0050005813(1)
Monografia diego dias_0050005813(1)Monografia diego dias_0050005813(1)
Monografia diego dias_0050005813(1)diego dias
 
[36717-11301-1-571046][31100-36717]AD4_Envio_versao_final_artigo_apos_defesa
[36717-11301-1-571046][31100-36717]AD4_Envio_versao_final_artigo_apos_defesa[36717-11301-1-571046][31100-36717]AD4_Envio_versao_final_artigo_apos_defesa
[36717-11301-1-571046][31100-36717]AD4_Envio_versao_final_artigo_apos_defesaLuciano Madeira
 
Redes e os princípios da criptografia
Redes e os princípios da criptografiaRedes e os princípios da criptografia
Redes e os princípios da criptografiaUNIEURO
 
Redes e os princípios da criptografia
Redes e os princípios da criptografiaRedes e os princípios da criptografia
Redes e os princípios da criptografiaUNIEURO
 
Competência em informação para o auto-arquivamento em open archives
Competência em informação para o auto-arquivamento em open archivesCompetência em informação para o auto-arquivamento em open archives
Competência em informação para o auto-arquivamento em open archivesRodrigo Moreira Garcia
 
Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...
Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...
Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...Ricardo Rodrigues
 
2012_AlexandreMendesAlvimLepesqueur_ItaloDiegoRodriguesOliveira.pdf
2012_AlexandreMendesAlvimLepesqueur_ItaloDiegoRodriguesOliveira.pdf2012_AlexandreMendesAlvimLepesqueur_ItaloDiegoRodriguesOliveira.pdf
2012_AlexandreMendesAlvimLepesqueur_ItaloDiegoRodriguesOliveira.pdfssuserf3a4df
 

Semelhante a Plágio acadêmico (20)

345019962-Tecnicas-Antiforenses-Em-Desktops.pdf
345019962-Tecnicas-Antiforenses-Em-Desktops.pdf345019962-Tecnicas-Antiforenses-Em-Desktops.pdf
345019962-Tecnicas-Antiforenses-Em-Desktops.pdf
 
SLIDE MONOGRAFIA JEF LUKA
SLIDE MONOGRAFIA JEF LUKASLIDE MONOGRAFIA JEF LUKA
SLIDE MONOGRAFIA JEF LUKA
 
Forense computacional - Estudos Praticos
Forense computacional  - Estudos PraticosForense computacional  - Estudos Praticos
Forense computacional - Estudos Praticos
 
Modelo de Laudo Perícia Digital.pdf
Modelo de Laudo Perícia Digital.pdfModelo de Laudo Perícia Digital.pdf
Modelo de Laudo Perícia Digital.pdf
 
Gerenciamento eletronico de documentos. Uma abordagem na seguranca
Gerenciamento eletronico de documentos. Uma abordagem na segurancaGerenciamento eletronico de documentos. Uma abordagem na seguranca
Gerenciamento eletronico de documentos. Uma abordagem na seguranca
 
Forense Computacional
Forense ComputacionalForense Computacional
Forense Computacional
 
Texto rede ci parreiras
Texto rede ci   parreirasTexto rede ci   parreiras
Texto rede ci parreiras
 
Vpn alan-rafael
Vpn alan-rafaelVpn alan-rafael
Vpn alan-rafael
 
Sistematização de estratégia de defesa e ataque
Sistematização de estratégia de defesa e ataqueSistematização de estratégia de defesa e ataque
Sistematização de estratégia de defesa e ataque
 
Forense e Segurança contra Pedofilia
Forense e Segurança contra PedofiliaForense e Segurança contra Pedofilia
Forense e Segurança contra Pedofilia
 
Direitos de autor
Direitos de autorDireitos de autor
Direitos de autor
 
Monografia diego dias_0050005813(1)
Monografia diego dias_0050005813(1)Monografia diego dias_0050005813(1)
Monografia diego dias_0050005813(1)
 
Computação forense
Computação forenseComputação forense
Computação forense
 
[36717-11301-1-571046][31100-36717]AD4_Envio_versao_final_artigo_apos_defesa
[36717-11301-1-571046][31100-36717]AD4_Envio_versao_final_artigo_apos_defesa[36717-11301-1-571046][31100-36717]AD4_Envio_versao_final_artigo_apos_defesa
[36717-11301-1-571046][31100-36717]AD4_Envio_versao_final_artigo_apos_defesa
 
Redes e os princípios da criptografia
Redes e os princípios da criptografiaRedes e os princípios da criptografia
Redes e os princípios da criptografia
 
Redes e os princípios da criptografia
Redes e os princípios da criptografiaRedes e os princípios da criptografia
Redes e os princípios da criptografia
 
Competência em informação para o auto-arquivamento em open archives
Competência em informação para o auto-arquivamento em open archivesCompetência em informação para o auto-arquivamento em open archives
Competência em informação para o auto-arquivamento em open archives
 
Monografia
MonografiaMonografia
Monografia
 
Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...
Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...
Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...
 
2012_AlexandreMendesAlvimLepesqueur_ItaloDiegoRodriguesOliveira.pdf
2012_AlexandreMendesAlvimLepesqueur_ItaloDiegoRodriguesOliveira.pdf2012_AlexandreMendesAlvimLepesqueur_ItaloDiegoRodriguesOliveira.pdf
2012_AlexandreMendesAlvimLepesqueur_ItaloDiegoRodriguesOliveira.pdf
 

Mais de Ronilson de Souza Luiz

Artigo a didática na formação pedagógica de professores
Artigo   a didática na formação pedagógica de professoresArtigo   a didática na formação pedagógica de professores
Artigo a didática na formação pedagógica de professoresRonilson de Souza Luiz
 
Como númerar páginas no word -Andreucci
Como númerar páginas no word -AndreucciComo númerar páginas no word -Andreucci
Como númerar páginas no word -AndreucciRonilson de Souza Luiz
 
Didática do ensino superior - aula 2
Didática do ensino superior - aula 2 Didática do ensino superior - aula 2
Didática do ensino superior - aula 2 Ronilson de Souza Luiz
 
Didática do ensino superior aula 01 07 08 2013
Didática do ensino superior aula 01 07 08 2013Didática do ensino superior aula 01 07 08 2013
Didática do ensino superior aula 01 07 08 2013Ronilson de Souza Luiz
 
Dissertação gestão estratégica de pessoas1
Dissertação gestão estratégica de pessoas1Dissertação gestão estratégica de pessoas1
Dissertação gestão estratégica de pessoas1Ronilson de Souza Luiz
 

Mais de Ronilson de Souza Luiz (20)

Manual monografia OAB/ESA
Manual monografia OAB/ESAManual monografia OAB/ESA
Manual monografia OAB/ESA
 
Artigo e estrangeiros e adoção
Artigo e estrangeiros e adoção Artigo e estrangeiros e adoção
Artigo e estrangeiros e adoção
 
Norma abnt e artigo científico
Norma abnt e artigo científicoNorma abnt e artigo científico
Norma abnt e artigo científico
 
Espaço aberto
Espaço abertoEspaço aberto
Espaço aberto
 
Artigo andreucci ambiente de suporte
Artigo   andreucci ambiente de suporteArtigo   andreucci ambiente de suporte
Artigo andreucci ambiente de suporte
 
Artigo didática
Artigo   didáticaArtigo   didática
Artigo didática
 
Artigo a didática na formação pedagógica de professores
Artigo   a didática na formação pedagógica de professoresArtigo   a didática na formação pedagógica de professores
Artigo a didática na formação pedagógica de professores
 
Artigo 7 saberes Andreucci
Artigo 7 saberes  AndreucciArtigo 7 saberes  Andreucci
Artigo 7 saberes Andreucci
 
Masetto artigo
Masetto   artigoMasetto   artigo
Masetto artigo
 
Andreucci -aula 1
Andreucci -aula 1Andreucci -aula 1
Andreucci -aula 1
 
Como númerar páginas no word -Andreucci
Como númerar páginas no word -AndreucciComo númerar páginas no word -Andreucci
Como númerar páginas no word -Andreucci
 
Livro e unesco e jaques delors
Livro e unesco e jaques delorsLivro e unesco e jaques delors
Livro e unesco e jaques delors
 
Jaques delors
Jaques delorsJaques delors
Jaques delors
 
Aula esa 11 09 2013 decálogo
Aula esa   11 09 2013 decálogoAula esa   11 09 2013 decálogo
Aula esa 11 09 2013 decálogo
 
Aula 3 esa
Aula 3 esaAula 3 esa
Aula 3 esa
 
Didática do ensino superior - aula 2
Didática do ensino superior - aula 2 Didática do ensino superior - aula 2
Didática do ensino superior - aula 2
 
Didática do ensino superior aula 01 07 08 2013
Didática do ensino superior aula 01 07 08 2013Didática do ensino superior aula 01 07 08 2013
Didática do ensino superior aula 01 07 08 2013
 
Tese gestão estratégica de pessoas
Tese gestão estratégica de pessoasTese gestão estratégica de pessoas
Tese gestão estratégica de pessoas
 
Dissertação gestão estratégica de pessoas1
Dissertação gestão estratégica de pessoas1Dissertação gestão estratégica de pessoas1
Dissertação gestão estratégica de pessoas1
 
Revista direito imobiliário
Revista direito imobiliárioRevista direito imobiliário
Revista direito imobiliário
 

Plágio acadêmico

  • 1. Um Sistema para Detecção de Plágio em Ambiente de Aprendizado Virtual* SANTANA, Joseval de Melo (Msc.) Joberto, Sérgio Barbosa Martins (Dr.) Universidade Católica do Salvador – UCSal e Universidade Salvador – UNIFACS - Brasil Fundação Visconde de Cairu - FVC - Brasil RESUMO A detecção de plágio é de maneira geral um aspecto importante para os ambientes e sistemas de aprendizado tanto presencial como virtual. No entanto, a detecção de plágio tem sido dificultada até então pelo fato de ser comumente realizada através de uma avaliação e comparação direta não automatizada dos documentos produzidos pelos autores. Este artigo propõe a adoção de uma estratégia facilitadora da detecção de plágio através da utilização de uma ferramenta e proposta de modelagem de um sistema de certificação que possa automatizar parte do processo de detecção de plágio. A solução proposta é portável entre diferentes ambientes operacionais e mostra-se particularmente relevante no contexto da educação a distância onde se pressupõe a utilização em larga escala de informações provenientes de inúmeras fontes (autores) encontradas na Web. Palavras-chave: Espectrometria, Detecção de Plágio, Documentos Eletrônicos. 1. INTRODUÇÃO áreas acadêmicas e a educação a distância. Não é rara a dificuldade que os docentes O estágio atual do desenvolvimento têm em avaliar a autenticidade dos tecnológico traz à tona uma nova trabalhos dos seus alunos. A falta da reorganização dos modos de produção e autenticidade gera descrédito das negócios, e conseqüentemente da informações e serve como barreira na economia, da sociedade e da política. Este disponibilidade de informações. Na novo paradigma toma por base a realidade, sem nenhuma proteção de autoria informação, contrapondo-se às revoluções os pesquisadores temem em colocar artigos, tecnológicas anteriores, que tinha por base monografias e outros tipos de documentos a energia e matéria. disposição em forma eletrônica o que Com a consolidação da Sociedade contrapõe, em parte, um dos pilares da Informação (SI), as informações fundamentais do ensino a distância. eletrônicas cresceram em projeções A espectrometria, denominação geométricas hospedando-se nos mais adotada para as técnicas de avaliação de variados sítios (em rede) e em mídias dos documentos quanto à similaridade de seu mais diversos tipos. conteúdo, é uma análise comparativa de O processo acelerado de geração de sentenças entre documentos cujo objetivo é informações eletrônicas decorrentes da servir de parâmetro para poder expressar o Sociedade da Informação tem levado a uma grau de autenticidade relativa1 ou não disseminação caótica das informações. autenticidade quantitativa do documento Questões sobre veracidade e autenticidade em análise. Tal métrica vem a servir como da informação eletrônica começam a se um parâmetro essencial para a análise tornarem indispensáveis sob pena de comprometer a aceitabilidade e obstruir a 1 utilização de documentos originais em A autenticidade é considerada relativa, quando visa mídia eletrônica. a garantir a autenticidade somente entre as amostras analisadas. Não infere sobre a originalidade do Todas as áreas são afetadas por essa documento. disseminação caótica e em particular as * Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
  • 2. qualitativa que norteará sobre a não condição sine qua non para garantir que um autenticidade e/ou autenticidade relativa de certo documento é inautêntico. O método documentos de maneira geral. de inspeção visual tem sido por muito A espectrometria produz resultados tempo o único meio de detecção de plágio. mensuráveis que, numa estratégia de Infelizmente, este método tem se mostrado detecção de plágio, minimizarão as ineficiente na detecção. atividades de pesquisas dos analistas ou Métodos de detecção de plágio observadores. Tal métrica facilita as baseado em computadores têm surgido na análises de qualificação conceitual sobre os última década. Contudo, tais sistemas por conteúdos dos documentos eletrônicos serem, na grande maioria, de natureza (inspeção visual), onde pode ser inferido privada têm tornado difícil o acesso a essa sobre a não autenticidade relativa e tecnologia, principalmente devido aos veracidade do conteúdo das informações custos do serviço de detecção de plágio. Por nos documentos. outro lado, também a falta de clareza dos parâmetros utilizados para majoração e 2. O DOCUMENTO ELETRÔNICO qualificação do documento como plagiado, ou não, tem dificultado a aceitação e até A evolução tecnológica e científica mesmo a utilização de tais métodos. da humanidade tem se processado mediante Este trabalho propõe uma nova a transmissão de conhecimentos de geração alternativa com intuito de garantir uma em geração, prática que tem a sua eficácia maior eficiência, rapidez e aceitação da na produção de documentos, ou seja, toda detecção de plágio por computador – a informação contida em um suporte material espectrometria. Esta consiste em um que tenha a propriedade de ser comunicada. processo automatizado que divide os Este suporte consiste em “uma substância documentos em partes denominadas de que permite a fixação dos signos gráficos espectros e compara-os com espectros de no qual é expresso o documento” outros documentos envolvidos neste (ZAGAMI, 1996, p. 151). processo. O resultado desta comparação O processo de documentação da serve de parâmetro para a detecção do informação (pensamento) tem evoluído plágio. desde os ideogramas impressos em rochas A espectrometria se propõe a ser até a escrita em mídia papel e/ou digital. O muito mais do que um método automático documento, hoje, é a base do conhecimento para detecção de plágio. Ela consiste em colocado à disposição para tornar conhecida técnicas, parâmetros e conceitos claros que a expressão do pensamento, das ações e permitem a detecção de plágio em experiências de seu autor. documentos eletrônicos de forma não O autor mantém com seu proprietária, uma vez que possibilita o documento uma relação de propriedade, desenvolvimento de diversas aplicações mas cabe ressaltar que se trata de uma baseada em seus conceitos e técnicas. propriedade que revela não as posses do Uma nova aplicação, baseada neste autor, e sim a intelectualidade deste. Como novo conceito (espectrometria), foi em toda propriedade, o documento implementada como um programa de eletrônico é alvo de ações criminosas que computador denominado de espectrômetro. violam os seus direitos. Nesse caso, tem-se Este instrumento, ainda na forma de o plágio como um tipo específico de crime protótipo, foi desenvolvido utilizando uma praticado contra o patrimônio intelectual. linguagem de programação orientada a O plágio consiste na produção de objetos – JAVA. um documento subsidiado na cópia, parcial ou total, de outro(s) documento(s) com 2.1. O plágio e sua detecção intuito de se revelar como um documento autêntico. O pseudo-autor (plagiador), de Com a consolidação da Sociedade forma ingênua ou intencional, tem da Informação, as informações eletrônicas cometido o plágio motivado, cresceram em grandes proporções, principalmente, pela idéia da não detecção hospedando-se nas mais variadas mídias do crime cometido. Detectar o plágio é magnéticas/ópticas tais como: discos, * Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
  • 3. Compact Disc – Read Only Memory (CD- • Sistema de detecção de plágio por ROM), Digital Versatile Disks (DVD’s) palavras: entre outros. Este tipo de detecção é realizado O processo acelerado da geração de por cruzamento de palavras informações eletrônicas tem possibilitado geralmente pré-estabelecido um uma disseminação sem nenhum tipo de tamanho mínimo de caracteres na controle sobre a autoria (identificação do palavra. autor) e veracidade das informações, ou • Sistema de detecção de plágio por seja, informações verdadeiras sobre o tema sentenças: que discorre. Este tipo de controle começa a Método no qual o cruzamento é se tornar indispensável sob pena de feito por um conjunto de palavras, comprometer a aceitabilidade e obstruir a podendo ser ou não delimitada por materialização de documentos originais em sinal de pontuação. São mais aporte eletrônico. Em outras palavras, a sofisticados que o sistema de falta de controle inibe fortemente a detecção de plágio por palavras. publicação de documentos eletrônicos pelo receio da não preservação da autoria dos Na literatura, encontram-se mesmos. soluções diversas para a verificação de O Documento Eletrônico (DE) plágio como segue: torna-se alvo fácil do uso impróprio com a • CopyCatch Gold – Um programa intenção de violação da propriedade para computadores standalone ou intelectual – o plágio. em rede. O programa faz a Os moinhos de documentos comparação dos textos por eletrônicos (sites que disponibilizam desde sentenças e é obtido por simples trabalhos escolares até teses de licenciamento (COPYCATCH, doutorado) têm sido os grandes 2002, p.1). incentivadores dos plagiadores que, de • Document Source Analysis (DSA) – forma intencional, ou mesmo ingênua, Clientes submetem seu trabalho praticam cada vez mais o crime de plágio. por cópia e colagem via Web. Esta Estudos recentes mostram que solução em particular funciona cerca de 30% dos estudantes devem estar baseado no cruzamento de plagiando documentos eletrônicos referências contra uma base de acadêmicos (PLAGIARISM, 2002, p. 1). dados loca e com outros Mesmo diante de conseqüências documentos da Web encontrados severas que podem ser aplicadas em caso de mediante rastreadores que varrem comprovação de plágio pelas instituições a internet em busca de possíveis aos plagiadores, estes não se intimidam e combinações do conteúdo do apostam na não detecção da violação documento analisado. O cliente cometida. que solicitou a análise recebe após O plágio pode ser considerado um prazo de 24 horas um relatório como uma das mais sérias formas de de originalidade com referências e violação da conduta acadêmica e links dos documentos pesquisados profissional. (TURNITIN, 2002, p. 1). O plágio subsiste na cópia, parcial • Essay Verification Engine (EVE) – ou total, de um documento. Detectar o Software baseado em sentenças plágio somente é possível mediante meios por busca de plágio de documentos que garantam a distinção dos documentos. no formato texto simples pela Na última década, sistemas de Internet (CANEXUS, 2002, p.1). detecção de plágio surgiram para verificar o • Glatt – Programa baseado em plágio em diferentes circunstâncias sentenças por busca de plágio de dependendo do tipo de documento documentos em base local e/ou eletrônico a ser avaliado. De modo geral, os Internet (GLATT, 2002, p.1). sistemas de detecção de plágio são • IntegriGuard – Solução baseada em divididos em duas categorias: sentenças por busca de plágio pela * Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
  • 4. Internet. Os documentos são documento eletrônico quanto à sua submetidos de maneira análoga à distinção em relação a outros documentos. submissão no sistema DAS Como em qualquer outra (INTEGRIGUARD, 2002, p.1). espectrometria o conhecimento dos • MOSS – Sistema baseado em elementos que a compõem é fundamental palavras para detecção de plágio para sua compreensão. Deste modo, faz-se em códigos de programas de necessária à conceituação de seus computadores (MOSS, 2002, p.1). elementos como segue: • Plagiserv – Programa baseado em busca por sentenças em base local Espectro: É o conjunto, finito e não vazio, e pela Internet (PLAGISERVE, de palavras de um documento (MENEZES, 2002, p.1). 2001, p.21). • YAP – Programa baseado em Amostra: É o conjunto, finito e não vazio, palavra desenvolvido pela de espectros não repetidos de um Universidade de Sidney cujo documento. objetivo é a detecção de plágio em A espectrometria baseia-se em programa de computador resultados quantitativos e qualitativos (MICHAEL, 2002, p .1). extraídos da análise. A análise quantitativa • WORDCHECK – Programa revela-se nos parâmetros espectrométricos desenvolvido pela Universidade de considerados a seguir: Nebraska – USA, cujo objetivo é a Ocorrências (Oc): São espectros repetidos detecção de cópia em códigos entre as amostras dos documentos em fontes de programa de computador análise. (COMPUTER, 2002, p. 1). Valor espectrométrico (Ve): É a razão percentual da quantidade de ocorrências Os softwares de detecção de plágio (qoc) pela quantidade de espectro da evoluíram desde comparadores de palavras amostra (qea) de um documento. por palavras até analisadores mais sofisticados, que dividem o documento em Ve = (qoc/qea)*100 (3.1) partes menores permitindo fazer varreduras mais rápidas nos documentos armazenados Medida espectrométrica (Me): É o maior em base local e até em sites Web. valor espectrométrico obtido entre os pares O Joint Information System das amostras dos documentos e que Committee (JISC) e o Center for Interactive também revelará o grau de distinção entre System Engineering (CISE) vêm realizando esses documentos pesquisas sobre o plágio com intuito de Relação binária (Rb): É a combinação de motivar a detecção e conscientização da pares das n (2 ≥ n< ) amostras dos utilização do plágio em documentos documentos analisados conforme a eletrônicos (CULWIN, 2002, p. 4). expressão matemática: A proposta apresentada adiante denominada de Espectrometria de Rb = (n-1)*n/2 (3.2) Documentos Eletrônicos visa a ser uma forma de combate ao plágio diferenciando Faixa espectrométrica (Fe): É o intervalo, das soluções existentes pelos seus compreendido entre zero (0) e cem (100%) conceitos, técnicas e algoritmos. por cento, em que a medida espectrométrica pode se encontrar. 3. ESPECTROMETRIA DE A análise qualitativa identificará se DOCUMENTOS ELETRÔNICOS um documento é ou não distinto de um outro documento eletrônico. Esta análise se Espectrometria de Documentos baseia na análise quantitativa podendo ser Eletrônicos (EDE), consiste em um subsidiada pela inspeção visual. processo de detecção de plágio por A espectrometria visa a minimizar computador com critérios e conceitos as inspeções visuais dos documentos, que transparentes visando à possibilidade de tenham como objetivo a detecção de plágio, padronização no deferimento de um e servir de diagnóstico na distinção de um * Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
  • 5. documento. Ela faz a comparação dos espectros baseando-se na gramática no sentido léxico e não leva em consideração a semântica das palavras. A espectrometria é realizada mediante um processo espectrométrico descrito a seguir. 3.1. Pré-processamento espectrométrico O processamento espectrométrico Figura 4.1 – Espectrômetro consiste em uma análise comparativa das amostras dos documentos eletrônicos. Para O protótipo do espectrômetro tanto, tais documentos têm de passar por desenvolvido apresenta algumas uma etapa inicial denominada pré- características básicas como segue: processamento espectrométrico que • Os espectros são constituídos de consiste em: palavras de tamanho variável 1. Arquivo texto simples: O definido pelo usuário; documento é transformado em texto • A ferramenta permite a análise de no formato padrão ASCII mediante documentos em texto simples e em conversores de tipos de textos transformados via uma documentos. função hash com o algoritmo MD5; 2. Normalização do documento: É o • Aplica espectrometria apenas direta; procedimento de criação dos • Analisa documentos apenas em espectros (conjunto de palavras) a base local; e partir de palavras que tenham um • A ferramenta foi desenvolvida para determinado número de caracteres e execução em computadores que pertençam ao arquivo texto convencionais tipo desktop simples. A normalização cria os utilizando plataforma windows. espectros tomando como referência um delimitador, ou seja, um sinal Ensaios espectrométricos foram de pontuação tal como: o ponto, a realizados em documentos eletrônicos de vírgula, dois pontos, outros. forma a demonstrar a eficiência da solução 3. Arquivo de texto hash desenvolvida. Em seguida, descreve-se a (opcional): experimentação e os elementos de O documento normalizado é composição dos referidos experimentos. submetido à função hash. Tal transformação é aplicada aos Experimento 01: espectros do documento mantendo, O experimento 01 foi baseado em porém, inteligíveis todos os documentos produzidos por alunos cujo delimitadores do documento. tema abordava a área de informática tais como, Pirataria de Software, Redes de 4. ESPECTRÔMETRO ELETRÔNICO Computadores, Tecnologia Web e Sistemas Operacionais. A base dos documentos foi O espectrômetro (figura 4.1) é uma extraída dos trabalhos de pesquisas de 180 máquina de inferência, capaz de executar (cento e oitenta) alunos que produziram 60 um algoritmo espectrométrico, que (sessenta) documentos eletrônicos. possibilita uma análise de vários Documentos Eletrônicos, permitindo obter Experimento 02: a medida espectrométrica entre os referidos O experimento 02 foi baseado em buscas documentos. Tal medida servirá de efetuadas sobre um mesmo tema na Internet revelação do grau de distinção destes. formando uma base local de 09 (nove) documentos. * Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
  • 6. A análise espectrométrica foi Tabela 4.2 - Medidas espectrométricas realizada com as seguintes condições: (experimento 02) • Modo direto; e Faixa DE % (Total) • Documentos normalizados com Espectrométrica Quantidade espectros de duas palavras Me = 0 0 0,00 alinhados pelo delimitador vírgula (,). 0< Me <=5 1 11,11 Os resultados obtidos foram os seguintes: 15< Me <=20 1 11,11 Tabela 4.1 - Medidas espectrométricas 20< Me <=25 0 0,00 (experimento 01) 25< Me <=30 1 11,11 Faixa DE % (Total DE’S) Espectrométrica Quant. 30< Me <=40 0 0,00 Me = 0 4 6,67 40< Me <=50 0 0,00 0< Me <=5 15 25,00 5< Me <=10 26 43,33 Faixa DE % (Total dos 10<Me <=15 7 11,67 Espectrométrica Quantidade DE’S) 50< Me <=60 0 0,00 15<Me <=20 0 0 20<Me <=25 0 0 60< Me <=70 2 22,22 25<Me <=30 0 0 70< Me <=80 1 11,11 30<Me <=40 0 0 80< Me <=90 0 0,00 40<Me <=50 2 3,33 90< Me <100 2 22,22 Me =100 0 0,00 Fonte: Dados extraídos do módulo de estatística de Faixa DE % (Total) documentos analisados – Espectrômetro (protótipo). Espectrométrica Quantidade 50<Me <=60 2 3,33 Os resultados produzidos pelo 60<Me <=70 0 0 espectrômetro foram, em resumo, como segue: 70<Me <=80 0 0 80<Me <=90 0 0 Experimento 01: • 60 Documentos analisados; 90< Me <100 0 0 • 26.907.078 espectros de amostras analisados; Me =100 4 6,67 • Tempo de espectrometria: 0h 1m 42s; Fonte: Dados extraídos do módulo de estatística de documentos analisados – Espectrômetro (protótipo). • Taxa espectrométrica: 263.794,1 espectros/s; • Maior medida espectrométrica Me = 100.0%; • Menor medida espectrométrica Me = 0.0%; • 1770 Resultados espectrométricos. * Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
  • 7. Experimento 02: • Mesmo recorrendo à inspeção • 05 documentos analisados; visual houve incerteza na • 12.190.362 espectros de amostras determinação de distinção de analisados; alguns documentos. • Tempo de espectrometria: 0h 1m e 4) Na faixa espectrométrica (tabela 4.2), 19s; maior que dez (10%) e menor e igual a • Taxa espectrométrica: 154.308,0 vinte (20%), houve dúvida na garantia de espectros/s; distinção dos documentos, mesmo com o • Maior medida espectrométrica auxílio da inspeção visual. Este intervalo é Me = 99.0 %; denominado de intervalo crítico e a medida • Menor medida espectrométrica espectrométrica pertencente a este intervalo Me = 0.0 %; é chamada de “Me” crítica. • 10 Resultados espectrométricos. 5) Na faixa espectrométrica (tabela 4.2), maior que vinte (20%) e menor e igual a Confrontando os resultados obtidos vinte e cinco (25%), 02 documentos foram nos experimentos 01 e 02 com a inspeção classificados como não distintos pela visual dos documentos, conclui-se que: inspeção visual. 1) Dos 60 documentos analisados (tabela O resultado da espectrometria de 4.1), constatou-se que, nas faixas de médias documentos eletrônicos retratou a realidade espectrométricas, maiores que vinte (20%) esperada e comprovada mediante e menores e iguais a cem (100%), foram confrontação com a inspeção visual. A encontrados 08 documentos, ou seja, análise espectrométrica, descartando-se os 13,67% do total dos documentos documentos que apresentaram aberrações considerados não distintos, conforme espectrométricas e “Me” dentro do observação abaixo: intervalo crítico, comprovou serem distintos os documentos eletrônicos com • 04 documentos (6,67%) foram espectrometria maior ou igual a zero (0%) e classificados como cópias idênticas menor ou igual a dez (10%) e não distintos, (Me igual a 100%). os documentos com espectrometria superior • Os outros 04 documentos (6,67%) a vinte (20%). classificados como cópia parcial. As faixas espectrométricas que 2) Na faixa espectrométrica, maior ou igual qualificam documentos com distintos (0 a a zero (0%) e menor e igual a dez (10%), 10 %), críticos (10< Me <=20), não foram verificados distinções entre dezenove distintos (Me > 20) são faixas documentos. convencionadas tomadas como referência 3) Na faixa espectrométrica maior que dez às análises experimentais, por isso, não (10%) e menor ou igual a vinte (20%) foi devem ser tomadas como valores precisos. verificado o seguinte: Nestes experimentos, os melhores • Existiu coincidência de espectros resultados espectrométricos foram obtidos (referente à bibliografia, palavras- na espectrometria com documentos chave, etc.), que não normalizados com o delimitador vírgula (,). comprometeram a distinção entre Contudo, a escolha do delimitador deve ser os documentos. feita levando em consideração as • Documentos com quantidade características do idioma e/ou simulações pequena de espectros (menos de espectrométricas que revelem as maiores 20% dos espectros do documento a medidas espectrométricas. ser comparado, foram considerados DE’s não distintos). 5. CONCLUSÃO A espectrometria nestes documentos pode revelar medidas No contexto apresentado, propomos espectrométricas que a adoção de uma ferramenta de apoio à comprometam a distinção dos detecção de plágio para utilização em mesmos, fato denominado de estratégias de aprendizado virtual a aberração espectrométrica. distância. * Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
  • 8. Tal ferramenta se propõe a Métodos e Algoritmos. 2. ed. Rio de simplificar consideravelmente o processo Janeiro: Book Express, 2001. de detecção de plágio, tornando tal processo acessível para profissionais de maneira CANEXUS. EVE2 – Essay Verification geral usuários de informações provenientes Engine. Disponível em: da Web, como também professores, http://www.canexus.com/eve/index3.shtml. coordenadores e outros profissionais da Acesso em: 11 nov. 2002. área de educação na solução de problemas comuns do seu dia-a-dia. COPYCATCH. CopyCatch Gold. Algumas das características mais Disponível em: importantes na concepção da ferramenta http://www.copycatch.freeserve.co.uk/. que facilitam a sua utilização e aplicação no Acesso em: 11 nov. 2002. contexto de educação a distância são: • Simplicidade de utilização; COMPUTER.ORG. Professors use • Efetua a entrada de dados de forma Technology to Fight Plagiarism. interativa e ergonométrica para Disponível em: profissionais de ensino não http://www.computer.org/computer/homepa totalmente familiarizados com as ge/0802/briefs. Acesso em: 20 set. 2002. tecnologias computacionais de ponta; CULWIN. Plagiarism, Prevention • Apresenta resultados graficamente Deterrence & Detection. The institute for para o universo de amostragem de learning and teaching in higher education - documentos considerado; ILTHE. Disponível em: • Auxilia a tomada de decisão de http://www.ilt.ac.uk/resources/Culwin- identificação de plágio baseado em Lancaster.htm. Acesso em: 15 nov. 2002. métricas que podem ser ajustadas por contexto de aplicação da GLATT. Glatt Plagiarism Service. ferramenta; e Disponível em: http://www.plagiarism.com. • Ferramenta desenvolvida em Acesso em: 15 nov. 2002. plataforma Java, possibilitando o acréscimo de outras características INTEGRIGUARD. IntegriGuard. através da construção de objetos. Disponível em: http://rfe.org/Teaching/IntegriGuard.html. Este artigo apresenta então uma Acesso em: 11 nov. 2002. contextualização da proposta da estratégia de detecção de plágio para atender a estes MENEZES, Paulo Blauth. Linguagens requisitos, a descrição da ferramenta Formais e Autômatos. 4. ed. Porto Alegre: desenvolvida com este objetivo e um estudo Sagra Luzzatto, 2001. de caso com os resultados apresentados através do processo de simulação de uma MICHAEL. Plagiarism Detection - YAP. aplicação da ferramenta num ambiente de Disponível em: aprendizagem virtual, visando a http://www.cs.usyd.edu.au/~michaelw/yap. demonstração de sua praticidade. html. Acesso em: 11 nov. 2002. Em termos de resultados efetivos já MOSS. A System for Detecting Software obtidos no escopo deste trabalho, a Plagiarism. Disponível em: ferramenta proposta foi desenvolvida e http://www.cs.berkeley.edu/~aiken/moss.ht prototipada e, além disso, as técnicas e ml. Acesso em: 11 nov. 2002. abordagens mencionadas foram PLAGIARISM.ORG. Plagiarism. incorporadas com sucesso num curso de Disponível em: http://www.plagiarism.org. graduação. Acesso em: 20 set. 2002. 6. REFERÊNCIAS BIBLIOGRÁFICAS PLAGISERVE.COM. Welcome to PlagiServe - Global Academic Integrity CARVALHO, Daniel Balparda de. Service. Disponível em: Segurança de Dados com Criptografia. * Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.
  • 9. http://www.plagiserve.com. Acesso em: 11 ZAGAMI, Raimundo.Firme ‘Digitali’ e nov. 2002. Validità Del Documento Eletronico.IN “II Diritto dell”informazione e TURNITIN.ORG. Solutions for a New dell’informatica”,1996, fasc.1, p. 151. Era in Education. Disponível em: http://www.turnitin.com. Acesso em: 20 ZIVIANI, Nivio. Projeto de Algoritmos set. 2002. com Implementação em Pascal e C. São Paulo: Pioneira Thomson, 2002. * Artigo baseado no trabalho de dissertação de mestrado “Espectrometria de Documentos Eletrônicos – Um Processo de Detecção de Plágio” - Mestrado de Redes de Computadores da Universidade Salvador – UNIFACS.