SlideShare uma empresa Scribd logo
Implementação de um Sumarizador Automático de
Partidas de Futebol Baseado em Taxonomia
Érivan F. Silva¹, Patrick Pedreira Silva², Elvio Gilberto da Silva3, Elaine Cecília
Gatto4
Curso de Ciência da Computação – Universidade do Sagrado Coração (USC)
Caixa Postal 17032-254 – Bauru – SP – Brasil
Centro de Ciências Exatas e Sociais Aplicadas
erivanfrank@hotmail.com, patrick.silva@usc.br, egsilva@usc.br,
elaine.gatto@usc.br
Abstract. The Internet continues to grow, driven by ever greater amounts of
online information, in this way the search for sportive content, mainly about
soccer, has increased. Due to rights restrictions, coverage of some events (in
particular live sport) is not available, thus some sites cover, textually, a soccer
match using a person to describe the events as they happen. At the end of the
match a journalist makes a summary about the match, emphasizing the most
important information that have been described. In this context, the aim of this
research is to develop a system that using an taxonomy, matches reports,
production rules and templates, and ultimately creates an automatic summary
of a soccer match.
Resumo. Com o crescimento da Internet, os usuários cada dia mais buscam
informações em diversas áreas, dentre as quais, se pode se destacar a procura
por conteúdos esportivos, principalmente relacionados ao futebol. Sites
esportivos costumam relatar os lances de uma partida, minuto a minuto, de
modo textual. No fim da partida um jornalista faz um resumo referente à
partida, dando ênfase às informações mais importantes que foram descritas
no relato. Neste contexto, o propósito deste trabalho foi desenvolver um
sistema que, com auxílio de uma taxonomia, de relatos de lances, de regras de
produção e de templates, cria um sumário automático de uma partida de
futebol. Os resultados obtidos mostram o potencial de se utilizar essa
abordagem para a criação de sumários automáticos relacionados à partidas
de futebol.
1. Introdução
No âmbito do Processamento Automático das Línguas Naturais (PLN), área de pesquisa
multidisciplinar em que se busca simular computacionalmente competências linguísticas
como, por exemplo, sumarização, os sistemas de PLN geralmente possuem
componentes (bases conceituais) em que está armazenado o “conhecimento”. As bases
conceituais, em especial, contêm um “modelo do mundo” ou uma abstração da
realidade, em que são descritos tipos de objetos, eventos, propriedades e
relacionamentos entre esses tipos (ALLEN, 1995; REITER, DALE, 2000).
Esse tipo de base desempenha um papel fundamental nos sistemas de PLN
porque limita a “visão de mundo” simulada pelo sistema (DIAS-DA-SILVA, 1996). Em
outras palavras, uma base conceitual comumente armazena o que se denomina
“taxonomia”. Uma taxonomia é uma especificação explícita e formal de uma
conceitualização compartilhada (STUDER et al, 1998), que lida com a natureza e a
organização do ser, representando conhecimento simplesmente por meio de uma coleção
de categorias e subcategorias (MAEDCHE, 2002).
Esse termo foi recentemente adotado também pelas comunidades de Inteligência
Artificial e Gestão de Conhecimento para se referir a conceitos e termos que podem ser
usados para descrever alguma área do conhecimento ou construir uma representação
desse (RICH e KNIGHT, 1993; RUSSEL e NORVIG, 1995). No PLN as taxonomias
têm sido amplamente empregadas em várias aplicações com o objetivo de melhorar o
desempenho dos sistemas computacionais nessas tarefas (GUARINO, 2009).
As taxonomias constituem-se, portanto, em uma ferramenta simples e útil que,
dentre suas várias aplicações, podemos citar a criação automática de sumários. A
sumarização, em geral, é uma atividade bastante comum. Quando se narra um evento a
uma pessoa, costuma-se fazer um resumo do que aconteceu e não uma narração
completa e detalhada. Exemplos de sumários escritos incluem notícias de jornais,
artigos de revistas, resumo de textos científicos, entre muitos outros. Por sua utilidade e
frequência, há um grande interesse em automatizar esse processo de geração de
sumários (HOVY e LIN, 1997; RAU e BRANDOW, 1993).
O crescimento cada vez maior do número de usuários que recorrem à Internet
como fonte de informação tem acarretado um aumento substancial da quantidade de
conteúdo relacionado a esportes, dentre os quais se destaca o futebol. Além disso,
provedores de conteúdo têm expandido a disponibilidade de eventos esportivos a serem
transmitidos para todo o mundo em resposta ao significativo aumento de interesse de
audiência. Devido às restrições relacionadas à transmissão ao vivo de imagens, por
conta de direitos de transmissão, sites esportivos usam o recurso de narração textual dos
jogos com relato lance a lance das jogadas e estatísticas.
As partidas de futebol, por exemplo, podem ser acompanhadas pelos usuários
usando este recurso. Assim, essa tendência aponta para a necessidade de
desenvolvimento de ferramentas efetivas e eficientes para coletar, processar e distribuir
essas informações e, deste modo, reduzir esforços de empresas e usuários ao buscar o
que lhes interessa.
Neste projeto foi desenvolvida e utilizada uma taxonomia relacionada ao futebol
na tarefa de gerar sumários que relatem informações referentes à partidas de futebol
narradas textualmente (com base em eventos pré-cadastrados em um banco de dados),
de modo similar ao que é feito em sites esportivos. A hipótese é que a informação
recuperada da taxonomia (estatísticas sobre os jogos) permitirá que o sistema determine
conteúdos relevantes para a geração de um sumário condizente com os fatos relatados
em uma partida de futebol, trazendo uma “análise” do jogo que, em última instância,
poderá substituir os sumários gerados manualmente. O sistema faz a identificação de
fatos relevantes através da contagem de categorias presentes na taxonomia proposta.
2. Referencial Teórico
Uma taxonomia possui um conjunto de termos organizados como uma hierarquia de
categorias e subcategorias, provendo uma estrutura básica na qual se pode construir uma
base de conhecimento (Figura 1) (MAEDCHE, 2002; GÓMEZ-PEREZ, 1999;
NOVELLO, 2002).
Figura 1. Representação taxonômica dos meios de transportes
Segundo Perna et al (2009) o PLN é a área da Ciência da Computação que
estuda o desenvolvimento de programas de computador que analisam, reconhecem ou
geram textos em linguagens humanas. O principal uso do PLN está nas interfaces, com
o intuito de melhorar a comunicação entre aplicativos e usuários (LIDDY, 2003). Esta
técnica de interface permite ao usuário operar aplicativos em linguagens naturais.
Com o grande aumento de informação via Web, torna-se necessário o
desenvolvimento de aplicativos capazes de tratar adequadamente estas informações. A
sumarização automática é uma técnica que lida com esse objetivo e que vem sendo
explorada desde a década de 50, quando começaram a surgir os primeiros métodos para
a produção de extratos (LUHN, 1958).
Todo o processo de sumarização se dá a partir um conjunto de informações que
tratam de um mesmo assunto e, com isto, torna-se possível a produção de um sumário,
ou seja, um resumo do assunto (HUTCHINS, 1987; MAYBURY, 1993).
Preferencialmente a produção de um sumário leva em consideração a coesão e a
coerência na sua geração. Para isso, se faz necessário uma base de conhecimento que
contem a descrição do conteúdo necessário para a sua geração.
Sistemas de produção (ou sistemas de regras de produção) estão fundamentados
na Inteligência Artificial. Estes sistemas analisam um conjunto de regras e
comportamentos, sendo caracterizados como um processo de busca que usa estratégias
de seleção para determinar qual a regra mais apropriada a ser disparada em situação. A
associação de tais sistemas à uma taxonomia podem servir de base para a criação de um
sistema de PLN, como o proposto nesta investigação que, na fase atual, permite apenas
gerar sumários considerando a taxonomia e sua representação em um banco de dados.
3. Trabalhos correlatos
A construção de sumários automáticos baseada em taxonomias é bastante explorada em
diversos trabalhos, por exemplo, Lin (1995) adota essa estratégia para criar sumários de
textos. Ele estende a contagem de palavras, como maneira de identificar os tópicos de
um texto, para a contagem de conceitos, propondo um método para identificar
automaticamente suas ideias centrais. Essa contagem é feita utilizando uma taxonomia
para realizar generalizações, como, por exemplo, inferir que um texto que traga as
palavras laptop e handheld pode tratar do tópico computadores portáteis. Para isso, é
definido um peso para cada conceito e esse peso representa a frequência de ocorrência
dos itens lexicais. No final, as sentenças que possuem os conceitos com maiores pesos
são selecionadas para composição do sumário.
Usando uma metodologia similar de sumarização, Wu e Liu (2003) utilizaram
artigos jornalísticos como corpus para elaborar e construir a taxonomia utilizada na
sumarização dos documentos, que é codificada como uma estrutura em árvore onde cada
nó representa um conceito. Um processo de mapeamento verifica a correspondência
entre as palavras do texto e os conceitos taxonômicos, atribuindo-lhes pesos. O peso de
cada conceito em relação ao texto a ser sumarizado é calculado somando-se a frequência
das palavras que aparecem no documento e que correspondam ao conceito. A seleção de
parágrafos é feita pontuando-os de acordo com a presença de palavras que
correspondem aos conceitos principais identificados: para cada palavra relacionada a um
conceito identificado anteriormente, o parágrafo recebe uma quantidade de pontos
relativa ao peso do conceito considerado.
Tiun et al. (2001) exploraram a taxonomia do Yahoo para a criação de sumários
formados apenas por palavras-chave que representem os tópicos principais de um
documento. Um conjunto de palavras-chave é extraído de sentenças significativas do
documento e, posteriormente, é mapeado no conjunto de seus conceitos taxonômicos.
Essa correspondência é feita comparando-se cada uma delas a um conjunto de itens
lexicais que estão associados a cada conceito da taxonomia. O mapeamento entre
palavras-chave e conceitos visa definir o peso de cada conceito no documento. Esse
peso é calculado pela soma da freqüência das palavras-chave, no texto, coincidentes
com os itens lexicais que descrevem o conceito presentes na taxonomia. Os tópicos com
maiores pesos são exibidos como sumário do documento analisado.
De modo geral, os trabalhos apresentados demonstram o potencial de utilização
de taxonomias para a criação de sumários. A motivação comum a todos eles é a de que a
análise de palavras isoladas em um texto, sem nenhuma consideração sobre o
relacionamento semântico entre elas pode ser um fator limitante no processamento de
documentos. Desta forma, todos eles adotam como elemento fundamental uma
taxonomia. Todos esses aspectos foram observados e considerados para a elaboração da
nossa proposta. A seguir, apresentamos uma síntese das características principais dos
trabalhos descritos, já que eles apresentam estratégias e recursos que foram adaptados
e/ou incorporados às nossas estratégias de sumarização, contribuindo para nossa
investigação.
4. Metodologia
Após terem sido recolhidos todos os conhecimentos e informações relacionadas para a
execução do trabalho, iniciou-se a fase de desenvolvimento da “Taxonomia do Futebol”.
Este desenvolvimento consistiu principalmente na construção de relações entre dados
(categorias e subcategorias), permitindo que os vários conceitos associados ao futebol
pudessem ser representados por meio de uma taxonomia.
Posteriormente, foi implementado um protótipo do sistema que faz uso desta
taxonomia para gerar um resumo automático de partidas de futebol. Para o
desenvolvimento do protótipo foram utilizadas as linguagens de programação
JavaScript, HTML, CSS, PHP e o banco de dados MySql.
Segundo Hutchis (1987), a análise do conteúdo de documentos é uma das
atividades mais importantes de um sistema de informação e entender o modo como
profissionais (indexadores ou sumarizadores humanos) produzem seus textos pode levar
a avanços consideráveis para a automação do processo. Dessa forma, podemos abstrair
que sumarização é retirar dos textos mais complexos informações mais relevantes. A
Figura 2 apresenta um trecho de um exemplo de “relato lance a lance” retirado do site
UOL1
. Este trecho descreve as ações de uma partida em tempo real. Observa-se que ao
final da narração é escrito, por um jornalista, um resumo (sumarização humana,
portanto, manual) onde se descreve em poucas palavras as informações mais relevantes
da partida. A proposta desta investigação foi justamente automatizar essa etapa, já que
as transmissões de eventos esportivos, essencialmente associados ao futebol, são cada
vez mais usuais. Tais transmissões exigem maiores investimentos no seu tratamento
interno, para arquivo e geração de estatísticas no menor tempo possível, demandando
obviamente, cada vez mais recursos humanos.
Figura 2. Relato de Lance-Lance de uma partida de futebol
1
Relato Lance-Lance http://esporte.uol.com.br/futebol/campeonatos/liga-dos-campeoes/pos-
jogo/2012/04/24/chelsea-elimina-o-barca-com-golaco-de-ramires-e-penalti-perdido-de-messi.htm
A automatização do processo relatado consistiu, portanto, em propor e
implementar uma ferramenta em ambiente web (offline), que através de relatos lance a
lance fornecidos como entradas (considerando apenas eventos textuis pré-cadastrados),
é capaz de gerar um sumário automático, a partir de uma taxonomia, templates e regras
de produção, abstraindo as ações das equipes e dos jogadores, durante a partida.
5. Funcionamento da ferramenta proposta
Os dados de entrada da ferramenta foram representados por eventos pré-cadastrados no
sistema. Esses eventos correspondem às ações realizadas por jogadores, técnicos e
juízes durante uma partida de futebol. Posteriormente é feita a distribuição tática das
equipes dentro de campo, com os nomes dos respectivos jogadores pertencentes às
equipes, conforme mostra a Figura 3.
Figura 3. Distribuição dos times na interface do sistema
A escolha das equipes é fundamental para que, posteriormente, o sistema possa
representar tais informações na taxonomia e selecionar, com base em regras e nas
categorias registradas na taxonomia as situações ocorridas durante a partida (pode-se,
por exemplo, saber se um time jogou defensivamente ou ofensivamente, verificando o
número de jogadas ofensivas/defensivas de cada equipe).
Para que ao final da partida um sumário possa ser gerado houve a necessidade de
limitar o que está sendo informado como entrada ao sistema, pois foge do escopo deste
trabalho uma análise em nível mais profundo, envolvendo os aspectos sintáticos,
semânticos e pragmáticos da língua. Sendo assim, foi criado um banco de dados que é
preenchido com informações referentes a um relato lance-lance (eventos) relacionado a
uma partida de futebol. A “narração” textual da partida se dará a partir de eventos que
estão registrados no banco de dados, eventos estes que, posteriormente, serão utilizados
na composição do sumário. Estes eventos estão estruturados de forma a conter sempre
as seguintes informações contidas na Figura 4.
Figura 4. Campos para registrar lances das partidas
Campo 01 – Tempo de jogo – Quando ocorreu a ação (seguindo o padrão europeu de
partidas de futebol que vai 0 a 90 minutos).
Campo 02 – Ações – Estão disponíveis 60 registros (eventos) relacionados a partidas de
futebol, contemplando as ações de gol, falta, cartão, drible, passe, defesa e chute.
Campo 3 – Região - Indica em que região do campo ocorreu certa ação.
Campo 4 – Ataque/Defesa - Distingue se a ação ocorreu no ataque ou na defesa, com
isto é possível identificar a área de maior atuação da equipe.
Campo 5 – Time – Identificação de um dos dois times.
Campo 6 – Jogadores – Identificação do jogador que gerou a ação.
Todos os registros feitos durante uma partida de futebol servem para indicar a
ocorrência de uma categoria/subcategoria da taxonomia para que, posteriormente o
resumo seja gerado, tendo como base um conjunto de regras de produção. Tais
informações poderão dar um diagnóstico da partida e, consequentemente, refletir no
texto do sumário gerado. Tal procedimento é repetido a cada partida. Com os dados
devidamente registrados consegue-se fazer um levantamento das ações de cada time
como, por exemplo, saber qual o número de gols marcados durante a partida. Também é
possível obter informações mais detalhadas como, por exemplo, saber se o gol marcado
por uma equipe foi de pênalti ou de falta.
Com base no levantamento das ações que podem ocorrer durante uma partida de
futebol foi criada a taxonomia representada na Figura 5.
Figura 5. Taxonomia gerada das ações inerentes ao futebol
Desde modo, a partir das informações extraídas do banco de dados, considerando
um dos templates atualmente disponíveis, um sumário é gerado. Os templates são
pequenos textos pré-formatados registrados no banco de dados. Através das estatísticas
que o sistema obtém durante o registro de lances que descrevem a partida é possível, por
meio de um processo automático guiado pelas regras de produção, escolher o melhor
template que se encaixa nas ações registradas. Como exemplo, uma das regras verifica
se um time obteve maior número de gols do que o outro, com isto é possível eliminar
todos os templates referentes a placares de empate, escolhendo outro que descreva a
vitória de uma das equipes. A seguir (Figura 6) é apresentado um exemplo de template.
[TIME A] vence [TIME B] em um jogo com amplo domínio
O [TIME- A] começou a partida indo para cima do [TIME-B] e conseguiu abrir o placar logo no
primeiro tempo com um gol de [JOGADOR-GOL]. O [TIME-B] criou oportunidades, mas não conseguiu
o empate. O ritmo do segundo tempo foi o mesmo, mas em tarde inspirada [JOGADOR-GOL] aproveitou
a oportunidade e aumentou a contagem, com a vantagem ampla no placar o [TIME-A] só segurou o
resultado e esperou o apito do arbitro para vencer a partida.
Figura 6. Template associado à regra de amplo domínio de uma equipe
A seguir é mostrado um exemplo de uma regra de produção associada ao
template anterior (Figura 6). Para que essa regra seja “disparada” é verificado se houve
um vencedor na partida (informação obtida tendo por base o número de gols de cada
equipe) e se a vitória ocorreu com amplo domínio de uma das equipes (obtida com base
no número de passes, faltas, chutes e dribles).
SE VENCEDOR="SIM" E ESTILO_VITÓRIA="AMPLO_DOMÍNIO" ENTÃO
ESCOLHA="TEMPLATE_AMPLO_DOMÍNIO"
Além dos textos-base formulados com a ajuda dos templates, informações
complementares como, por exemplo, jogador que se destacou na partida ou jogador
mais faltoso, podem ser adicionadas ao sumário final, enriquecendo-o. Entretanto, cabe
destacar que no estágio atual da pesquisa essas informações adicionais ainda não são
consideradas pelo sistema.
Deste modo, a combinação de regras com os dados presentes na taxonomia
juntamente com templates pré-definidos, permite ao sistema gerar os sumários com
informações sobre as partidas de futebol. A Figura 7 mostra resumidamente o
funcionamento do sistema.
Figura 7. Resumo do funcionamento do sistema
Observa-se que o sumário é gerado considerando alguns passos principais: 1) o
usuário do sistema deve fornecer o relato lance-a-lance de uma partida de futebol, 2)
estas informações são armazenadas automaticamente na taxonomia representada no
banco de dados, 3) ao final da partida, os dados são recuperados, um dos templates é
escolhido e preenchido pelo sistema, gerando o sumário (relato) da partida.
6. Resultados
Com alguns templates devidamente cadastrados no sistema foi possível obter os
sumários de acordo com a metodologia proposta e, adicionalmente, enriquecê-los
conforme relatado a seguir.
A Figura 8 mostra um resumo gerado pelo sistema, considerando as informações
cadastradas no decorrer da partida e registradas no banco de dados, considerando a
estrutura da taxonomia proposta. A ideia é de que o template seja preenchido após
contagem de frequência de termos usados no registro da partida. Para tornar os sumários
mais informativos, optou-se por inserir em alguns templates informações como, por
exemplo, o jogador que fez o gol e o tempo que isto aconteceu.
Com o intuito de enriquecer ainda mais as informações oferecidas pelo
resumo, também é exibido como resposta do sistema as estatísticas da partida,
considerando a contagem das categorias taxonômicas registradas no banco de dados.
Assim, a Figura 9 mostra as informações detalhadas de duas equipes durante uma
partida como, por exemplo, a quantidade de gols de cada time, faltas cometidas, etc.
Figura 8. Resumo gerado de empate por 0x0
Figura 9. Estatística referente ao resumo gerado
Adicionalmente, existem templates que contemplam situações de empate,
vitórias por placar mínimo (1X0) (Figura 10), vitórias com amplo domínio de uma das
equipes (Figura 11), vitórias com apenas um gol de diferença (Figura 12) e vitórias por
goleada (Figura 13).
Figura 10. Resumo gerado por apenas um gol marcado
Figura 11. Resumo gerado com amplo domínio sobre o adversário
Figura 12. Resumo gerado por vitória apertada
Figura 13. Resumo gerado de placar por goleada
Vale salientar que ao se iniciar o sistema todo o processo é reiniciado,
possibilitando gerar outro resumo contendo outras informações diferentes, ainda que o
template a ser utilizado seja o mesmo.
7. Considerações Finais
O protótipo aqui implementado constitui uma alternativa que visa contribuir para o
desenvolvimento ferramentas que buscam reduzir esforços de empresas e usuários na
sumarização automática. Ele representa as informações de uma partida de futebol por
meio de uma taxonomia implementada em um banco de dados, permitindo a criação de
relatos automáticos com análises de partidas de futebol transmitidas textualmente pela
Internet.
O futebol é um esporte rico em estatísticas, permitindo a extração de
informações como, por exemplo, aquelas referentes à ação de gol e outras jogadas.
Mesmo com esta grande quantidade de informações foi necessária à criação de seis
templates (resumos de partidas de futebol) pré-formatados, que contêm posições-chave
que são substituídas através de métodos computacionais, levando em consideração as
estatísticas levantadas. Tal procedimento visou criar sumários informativos (com textos
coerentes e coesos) que, de algum modo, se assemelhassem à forma de escrita dos
resumos manuais encontrados em sites da Internet.
Com o grande conjunto de informações que o futebol proporciona abre-se um
grande leque de aprimoramento do presente trabalho. Num primeiro momento existe a
possibilidade na melhora da atual aplicação, aumentando as regras e, com isto, obter
sumários mais adequados a cada situação de uma partida disputada. Para que isto seja
possível há a necessidade de aumentar a quantidade de templates disponíveis e também
aumentar tanto os dados (como, por exemplo, táticas que foi usada pelos times e se a
mesma teve mudança durante a partida) quanto às regras para a geração do sumário.
Outra limitação do sistema que será alvo de trabalhos futuros refere-se ao registro ações
envolvendo mais de um jogador, por exemplo, um fez uma falta em outro e por isto foi
expulso. Nesta situação atualmente é necessário cadastrar as duas ações separadamente
(uma para quem fez a falta e foi expulso e outra para quem sofreu a falta).
Como o sistema é offline abre-se a possibilidade de trabalhar com um sistema
on-line em que os dados (relatos lance-a-lance) sejam extraídos automaticamente de
sites esportivos, já que nesta investigação não há PLN em texto livre. Para que isto seja
possível há a necessidade de uma abordagem profunda no processamento da linguagem
e, portanto, também da psicologia cognitiva para gerar a compreensão dos textos-fonte
e, posteriormente, extrair as informações que guiarão a produção dos sumários
correspondentes.
Na aplicação atual todos os dados foram cadastrados diretamente no banco de
dados MySql, com isto fica difícil acompanhar a as evoluções das equipes durante uma
temporada como, por exemplo, a troca de jogadores. Este problema pode ser
solucionado com a implantação de um administrador que consegue realizar qualquer
tipo de alteração na base de dados.
Mesmo com a elaboração de poucos templates e limitações que esta abordagem
superficial oferece, e com a ausência de experimentos e avaliações formais do sistema, o
objetivo inicial do trabalho foi cumprido, mostrando o potencial de se utilizar essa
abordagem para a criação de sumários automáticos relacionado à partidas de futebol.
Referências
DIAS-DA-SILVA, B. C. A face tecnológica dos estudos da linguagem: O
processamento automático das línguas naturais. Araraquara, 1996. 272p. Tese
(Doutorado em Letras) - Faculdade de Ciências e Letras, Universidade Estadual
Paulista, Araraquara.
GOMEZ-PÉREZ, A., Tutorial on Ontological Engineering, Internacional Joint
Conference on Artificial Intelligence – IJCAI, 1999.
GUARINO; N., MASOLO;C., VETERE; G. (1999). Ontoseek: Content-based access to
the web. IEEE Intelligent Systems, 14(3):70–80.
HOVY; E., LIN, C. (1997). Automated Text Summarization in SUMMARIST. In: I.
MANI,MAYBURY; M. (eds.) “Intelligent Scalable Text Summarization”.ACL 1997
Workshop, pp. 39-46. Madrid, Spain.
HUTCHINS, JOHN; (1987). Summarization: Some problems and Methods. In: Jones.
Meaning: The frontier of informatics. Cambridge. London, pp. 151-173.
LIDDY; E. D. (2003). Natural Language Processing. IN: Encyclopedia of Library and
Information Science. New York: Marcel Dekker.
LIN, C. Knowledge-based automatic topic identification. In: ANNUAL MEETING ON
ASSOCIATION FOR COMPUTATIONAL LINGUISTICS,33., 1995, Morristown.
Proceedings… Cambridge: MIT Press, 2004. p. 308-310.
LUHN, H. P.; A Business Intelligence System. IBM Journal of Research and
Development,IBM, v.2, n.4, p. 314 – 319, 1958.
MAEDCHE; A., STAAB; S. Measuring similarity between ontologies. In: Proceedings
of the European Conference on EKAW, 2002.
MAYBURY; M. (1993). Automated Event Summarization Techniques. In: Seminar
Report of Summarizing Text for Intelligent Communication Seminar. Dagstuhl,
Germany
NOVELLO, T. C. Ontologias, sistemas baseados em conhecimento e modelos de banco
de dados. Universidade Federal do Rio Grande do Sul, 2002.
PERNA, C., DELGADO, H., & FINATO, M. (2010). Linguagens especializadas em
corpórea. RIO GRANDE DO SUL: EDPRUCRS.
RAU; L. F. , BRANDOW; R. (1993). Domain-Independent Summarization of News. In:
B. NIGGEMEYER; J. , HOBBS,SPARCK; J. (eds.), Seminar Report of
Summarizing Text for Intelligent Communication Seminar. Dagstuhl, Germany.
RICH, E., KNIGHT, K. Inteligência Artificial. 2. ed. [s.l.] : McGraw-Hill, 1993.
RUSSEL, NORVIG, 1995. Artificial Intelligence: A Modern Approach. Prentice-Hall,
Saddle River, NJ, 1995.
TIUN, S.; ABDULLAH, R.; KONG, T. E. Automatic topicidentification using ontology
hierarchy. In: CICLING: CONFERENCE ON INTELLIGENT TEXT PROCESSING
AND COMPUTATIONAL LINGUISTICS,2., 2001, Mexico City. Proceedings…
Heildelberg : Springer-Verlag, 2001. p. 444-453.
WU, C. W.; LIU, C. L. Ontology-based text summarization for business news articles.
In: ISCA: INTERNATIONAL CONFERENCE ON COMPUTERS ANDTHEIR
APPLICATIONS, 18., 2003, Honolulu. Proceedings… Cary: ISCA, 2003. p. 389-
392.

Mais conteúdo relacionado

Semelhante a Implementação de um Sumarizador Automático de Partidas de Futebol Baseado em Taxonomia

Sistemas de recuperação de informação
Sistemas de recuperação de informação Sistemas de recuperação de informação
Sistemas de recuperação de informação
Célia Dias
 
Big Data, Machine Learning e Text Mining em Economia: Estudos Recentes e Anál...
Big Data, Machine Learning e Text Mining em Economia: Estudos Recentes e Anál...Big Data, Machine Learning e Text Mining em Economia: Estudos Recentes e Anál...
Big Data, Machine Learning e Text Mining em Economia: Estudos Recentes e Anál...
Fernando A. B. Sabino da Silva
 
As fases do Telejornalismo brasileiro
As fases do Telejornalismo brasileiroAs fases do Telejornalismo brasileiro
As fases do Telejornalismo brasileiro
Edna Mello
 
Capítulo 4 sigc
Capítulo 4   sigcCapítulo 4   sigc
Capítulo 4 sigc
Força Aérea Brasileira
 
Análise bibliométrica de produção científica sobre gestão do conhecimento co...
Análise bibliométrica de produção científica sobre gestão do conhecimento  co...Análise bibliométrica de produção científica sobre gestão do conhecimento  co...
Análise bibliométrica de produção científica sobre gestão do conhecimento co...
Angelina Licório
 
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Christiano Avila
 
Acesso `a informação - estratégias
Acesso `a informação - estratégiasAcesso `a informação - estratégias
Acesso `a informação - estratégias
Kelley Cristine Gasque
 
Revisão de metadados para confiabilidade de artigos publicados em acesso aberto
Revisão de metadados para confiabilidade de artigos publicados em acesso abertoRevisão de metadados para confiabilidade de artigos publicados em acesso aberto
Revisão de metadados para confiabilidade de artigos publicados em acesso aberto
Portal de Periódicos UFSC
 
Revisão de metadados para confiabilidade de artigos publicados em acesso aberto
Revisão de metadados para confiabilidade de artigos publicados em acesso abertoRevisão de metadados para confiabilidade de artigos publicados em acesso aberto
Revisão de metadados para confiabilidade de artigos publicados em acesso aberto
Juliana Gulka
 
A14 Pesquisa De Inf E Difusao
A14 Pesquisa De Inf E DifusaoA14 Pesquisa De Inf E Difusao
A14 Pesquisa De Inf E Difusao
fontesbibliotraficas2
 
Xi enancib versão artigo
Xi enancib   versão artigoXi enancib   versão artigo
Xi enancib versão artigo
Elis31
 
Banco de Dados e Contexto
Banco de Dados e ContextoBanco de Dados e Contexto
Banco de Dados e Contexto
Bruno Felipe
 
Aula 1 - Cobertura e indexação das bases de dados
Aula 1 - Cobertura e indexação das bases de dadosAula 1 - Cobertura e indexação das bases de dados
Aula 1 - Cobertura e indexação das bases de dados
Leticia Strehl
 
Novas abordagens da avaliação do comportamento tático no futebol
Novas abordagens da avaliação do comportamento tático no futebolNovas abordagens da avaliação do comportamento tático no futebol
Novas abordagens da avaliação do comportamento tático no futebol
Denis Alves
 
Resenha Crítica
Resenha CríticaResenha Crítica
Resenha Crítica
Sthéfany Cechinel
 

Semelhante a Implementação de um Sumarizador Automático de Partidas de Futebol Baseado em Taxonomia (15)

Sistemas de recuperação de informação
Sistemas de recuperação de informação Sistemas de recuperação de informação
Sistemas de recuperação de informação
 
Big Data, Machine Learning e Text Mining em Economia: Estudos Recentes e Anál...
Big Data, Machine Learning e Text Mining em Economia: Estudos Recentes e Anál...Big Data, Machine Learning e Text Mining em Economia: Estudos Recentes e Anál...
Big Data, Machine Learning e Text Mining em Economia: Estudos Recentes e Anál...
 
As fases do Telejornalismo brasileiro
As fases do Telejornalismo brasileiroAs fases do Telejornalismo brasileiro
As fases do Telejornalismo brasileiro
 
Capítulo 4 sigc
Capítulo 4   sigcCapítulo 4   sigc
Capítulo 4 sigc
 
Análise bibliométrica de produção científica sobre gestão do conhecimento co...
Análise bibliométrica de produção científica sobre gestão do conhecimento  co...Análise bibliométrica de produção científica sobre gestão do conhecimento  co...
Análise bibliométrica de produção científica sobre gestão do conhecimento co...
 
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
 
Acesso `a informação - estratégias
Acesso `a informação - estratégiasAcesso `a informação - estratégias
Acesso `a informação - estratégias
 
Revisão de metadados para confiabilidade de artigos publicados em acesso aberto
Revisão de metadados para confiabilidade de artigos publicados em acesso abertoRevisão de metadados para confiabilidade de artigos publicados em acesso aberto
Revisão de metadados para confiabilidade de artigos publicados em acesso aberto
 
Revisão de metadados para confiabilidade de artigos publicados em acesso aberto
Revisão de metadados para confiabilidade de artigos publicados em acesso abertoRevisão de metadados para confiabilidade de artigos publicados em acesso aberto
Revisão de metadados para confiabilidade de artigos publicados em acesso aberto
 
A14 Pesquisa De Inf E Difusao
A14 Pesquisa De Inf E DifusaoA14 Pesquisa De Inf E Difusao
A14 Pesquisa De Inf E Difusao
 
Xi enancib versão artigo
Xi enancib   versão artigoXi enancib   versão artigo
Xi enancib versão artigo
 
Banco de Dados e Contexto
Banco de Dados e ContextoBanco de Dados e Contexto
Banco de Dados e Contexto
 
Aula 1 - Cobertura e indexação das bases de dados
Aula 1 - Cobertura e indexação das bases de dadosAula 1 - Cobertura e indexação das bases de dados
Aula 1 - Cobertura e indexação das bases de dados
 
Novas abordagens da avaliação do comportamento tático no futebol
Novas abordagens da avaliação do comportamento tático no futebolNovas abordagens da avaliação do comportamento tático no futebol
Novas abordagens da avaliação do comportamento tático no futebol
 
Resenha Crítica
Resenha CríticaResenha Crítica
Resenha Crítica
 

Mais de Elaine Cecília Gatto

A influência da Tecnologia em cada faixa etaria
A influência da Tecnologia em cada faixa etariaA influência da Tecnologia em cada faixa etaria
A influência da Tecnologia em cada faixa etaria
Elaine Cecília Gatto
 
Inteligência Artificial Aplicada à Medicina
Inteligência Artificial Aplicada à MedicinaInteligência Artificial Aplicada à Medicina
Inteligência Artificial Aplicada à Medicina
Elaine Cecília Gatto
 
Além do Aprendizado Local e Global: Particionando o espaço de classes em prob...
Além do Aprendizado Local e Global: Particionando o espaço de classes em prob...Além do Aprendizado Local e Global: Particionando o espaço de classes em prob...
Além do Aprendizado Local e Global: Particionando o espaço de classes em prob...
Elaine Cecília Gatto
 
Apresentação da minha tese de doutorado no EPPC
Apresentação da minha tese de doutorado no EPPCApresentação da minha tese de doutorado no EPPC
Apresentação da minha tese de doutorado no EPPC
Elaine Cecília Gatto
 
entrevista r7.pdf
entrevista r7.pdfentrevista r7.pdf
entrevista r7.pdf
Elaine Cecília Gatto
 
Como a pesquisa científica impacta o mundo real.pptx
Como a pesquisa científica impacta o mundo real.pptxComo a pesquisa científica impacta o mundo real.pptx
Como a pesquisa científica impacta o mundo real.pptx
Elaine Cecília Gatto
 
Empoderamento Feminino
Empoderamento FemininoEmpoderamento Feminino
Empoderamento Feminino
Elaine Cecília Gatto
 
Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Elaine Cecília Gatto
 
Community Detection for Multi-Label Classification - Seminários UFSCar
Community Detection for Multi-Label Classification - Seminários UFSCarCommunity Detection for Multi-Label Classification - Seminários UFSCar
Community Detection for Multi-Label Classification - Seminários UFSCar
Elaine Cecília Gatto
 
Classificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de CorrelaçõesClassificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de Correlações
Elaine Cecília Gatto
 
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
Elaine Cecília Gatto
 
Community Detection Method for Multi-Label Classification
Community Detection Method for Multi-Label ClassificationCommunity Detection Method for Multi-Label Classification
Community Detection Method for Multi-Label Classification
Elaine Cecília Gatto
 
Mulheres na Campus Party assumir o feminismo ou não – Blogueiras Feministas.pdf
Mulheres na Campus Party assumir o feminismo ou não – Blogueiras Feministas.pdfMulheres na Campus Party assumir o feminismo ou não – Blogueiras Feministas.pdf
Mulheres na Campus Party assumir o feminismo ou não – Blogueiras Feministas.pdf
Elaine Cecília Gatto
 
Curtinhas de sábado.pdf
Curtinhas de sábado.pdfCurtinhas de sábado.pdf
Curtinhas de sábado.pdf
Elaine Cecília Gatto
 
Explorando Correlações entre Rótulos usando Métodos de Detecção de Comu...
Explorando Correlações entre Rótulos usando Métodos de Detecção de Comu...Explorando Correlações entre Rótulos usando Métodos de Detecção de Comu...
Explorando Correlações entre Rótulos usando Métodos de Detecção de Comu...
Elaine Cecília Gatto
 
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
Elaine Cecília Gatto
 
Pipeline desdobramento escalonamento
Pipeline desdobramento escalonamentoPipeline desdobramento escalonamento
Pipeline desdobramento escalonamento
Elaine Cecília Gatto
 
Cheat sheet Mips 32 bits
Cheat sheet Mips 32 bitsCheat sheet Mips 32 bits
Cheat sheet Mips 32 bits
Elaine Cecília Gatto
 
Resumo das Instruções de Desvio Incondicionais MIPS 32 bits
Resumo das Instruções de Desvio Incondicionais MIPS 32 bitsResumo das Instruções de Desvio Incondicionais MIPS 32 bits
Resumo das Instruções de Desvio Incondicionais MIPS 32 bits
Elaine Cecília Gatto
 
Como descobrir e classificar coisas usando machine learning sem compilcação
Como descobrir e classificar coisas usando machine learning sem compilcaçãoComo descobrir e classificar coisas usando machine learning sem compilcação
Como descobrir e classificar coisas usando machine learning sem compilcação
Elaine Cecília Gatto
 

Mais de Elaine Cecília Gatto (20)

A influência da Tecnologia em cada faixa etaria
A influência da Tecnologia em cada faixa etariaA influência da Tecnologia em cada faixa etaria
A influência da Tecnologia em cada faixa etaria
 
Inteligência Artificial Aplicada à Medicina
Inteligência Artificial Aplicada à MedicinaInteligência Artificial Aplicada à Medicina
Inteligência Artificial Aplicada à Medicina
 
Além do Aprendizado Local e Global: Particionando o espaço de classes em prob...
Além do Aprendizado Local e Global: Particionando o espaço de classes em prob...Além do Aprendizado Local e Global: Particionando o espaço de classes em prob...
Além do Aprendizado Local e Global: Particionando o espaço de classes em prob...
 
Apresentação da minha tese de doutorado no EPPC
Apresentação da minha tese de doutorado no EPPCApresentação da minha tese de doutorado no EPPC
Apresentação da minha tese de doutorado no EPPC
 
entrevista r7.pdf
entrevista r7.pdfentrevista r7.pdf
entrevista r7.pdf
 
Como a pesquisa científica impacta o mundo real.pptx
Como a pesquisa científica impacta o mundo real.pptxComo a pesquisa científica impacta o mundo real.pptx
Como a pesquisa científica impacta o mundo real.pptx
 
Empoderamento Feminino
Empoderamento FemininoEmpoderamento Feminino
Empoderamento Feminino
 
Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...Explorando correlações entre rótulos para o particionamento do espaço de rótu...
Explorando correlações entre rótulos para o particionamento do espaço de rótu...
 
Community Detection for Multi-Label Classification - Seminários UFSCar
Community Detection for Multi-Label Classification - Seminários UFSCarCommunity Detection for Multi-Label Classification - Seminários UFSCar
Community Detection for Multi-Label Classification - Seminários UFSCar
 
Classificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de CorrelaçõesClassificação Multirrótulo: Aprendizado de Correlações
Classificação Multirrótulo: Aprendizado de Correlações
 
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
 
Community Detection Method for Multi-Label Classification
Community Detection Method for Multi-Label ClassificationCommunity Detection Method for Multi-Label Classification
Community Detection Method for Multi-Label Classification
 
Mulheres na Campus Party assumir o feminismo ou não – Blogueiras Feministas.pdf
Mulheres na Campus Party assumir o feminismo ou não – Blogueiras Feministas.pdfMulheres na Campus Party assumir o feminismo ou não – Blogueiras Feministas.pdf
Mulheres na Campus Party assumir o feminismo ou não – Blogueiras Feministas.pdf
 
Curtinhas de sábado.pdf
Curtinhas de sábado.pdfCurtinhas de sábado.pdf
Curtinhas de sábado.pdf
 
Explorando Correlações entre Rótulos usando Métodos de Detecção de Comu...
Explorando Correlações entre Rótulos usando Métodos de Detecção de Comu...Explorando Correlações entre Rótulos usando Métodos de Detecção de Comu...
Explorando Correlações entre Rótulos usando Métodos de Detecção de Comu...
 
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
EXPLORANDO CORRELAÇÕES PARA O PARTICIONAMENTO DO ESPAÇO DE RÓTULOS EM PROBLEM...
 
Pipeline desdobramento escalonamento
Pipeline desdobramento escalonamentoPipeline desdobramento escalonamento
Pipeline desdobramento escalonamento
 
Cheat sheet Mips 32 bits
Cheat sheet Mips 32 bitsCheat sheet Mips 32 bits
Cheat sheet Mips 32 bits
 
Resumo das Instruções de Desvio Incondicionais MIPS 32 bits
Resumo das Instruções de Desvio Incondicionais MIPS 32 bitsResumo das Instruções de Desvio Incondicionais MIPS 32 bits
Resumo das Instruções de Desvio Incondicionais MIPS 32 bits
 
Como descobrir e classificar coisas usando machine learning sem compilcação
Como descobrir e classificar coisas usando machine learning sem compilcaçãoComo descobrir e classificar coisas usando machine learning sem compilcação
Como descobrir e classificar coisas usando machine learning sem compilcação
 

Último

Sistema de Bibliotecas UCS - Chronica do emperador Clarimundo, donde os reis ...
Sistema de Bibliotecas UCS - Chronica do emperador Clarimundo, donde os reis ...Sistema de Bibliotecas UCS - Chronica do emperador Clarimundo, donde os reis ...
Sistema de Bibliotecas UCS - Chronica do emperador Clarimundo, donde os reis ...
Biblioteca UCS
 
GÊNERO TEXTUAL - POEMA.pptx
GÊNERO      TEXTUAL     -     POEMA.pptxGÊNERO      TEXTUAL     -     POEMA.pptx
GÊNERO TEXTUAL - POEMA.pptx
Marlene Cunhada
 
UFCD_3546_Prevenção e primeiros socorros_geriatria.pdf
UFCD_3546_Prevenção e primeiros socorros_geriatria.pdfUFCD_3546_Prevenção e primeiros socorros_geriatria.pdf
UFCD_3546_Prevenção e primeiros socorros_geriatria.pdf
Manuais Formação
 
slides de Didática 2.pdf para apresentar
slides de Didática 2.pdf para apresentarslides de Didática 2.pdf para apresentar
slides de Didática 2.pdf para apresentar
JoeteCarvalho
 
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
AntnioManuelAgdoma
 
D20 - Descritores SAEB de Língua Portuguesa
D20 - Descritores SAEB de Língua PortuguesaD20 - Descritores SAEB de Língua Portuguesa
D20 - Descritores SAEB de Língua Portuguesa
eaiprofpolly
 
Introdução à Sociologia: caça-palavras na escola
Introdução à Sociologia: caça-palavras na escolaIntrodução à Sociologia: caça-palavras na escola
Introdução à Sociologia: caça-palavras na escola
Professor Belinaso
 
Atividade letra da música - Espalhe Amor, Anavitória.
Atividade letra da música - Espalhe  Amor, Anavitória.Atividade letra da música - Espalhe  Amor, Anavitória.
Atividade letra da música - Espalhe Amor, Anavitória.
Mary Alvarenga
 
Leonardo da Vinci .pptx
Leonardo da Vinci                  .pptxLeonardo da Vinci                  .pptx
Leonardo da Vinci .pptx
TomasSousa7
 
karl marx biografia resumida com suas obras e história de vida
karl marx biografia resumida com suas obras e história de vidakarl marx biografia resumida com suas obras e história de vida
karl marx biografia resumida com suas obras e história de vida
KleginaldoPaz2
 
epidemias endemia-pandemia-e-epidemia (1).ppt
epidemias endemia-pandemia-e-epidemia (1).pptepidemias endemia-pandemia-e-epidemia (1).ppt
epidemias endemia-pandemia-e-epidemia (1).ppt
MarceloMonteiro213738
 
A SOCIOLOGIA E O TRABALHO: ANÁLISES E VIVÊNCIAS
A SOCIOLOGIA E O TRABALHO: ANÁLISES E VIVÊNCIASA SOCIOLOGIA E O TRABALHO: ANÁLISES E VIVÊNCIAS
A SOCIOLOGIA E O TRABALHO: ANÁLISES E VIVÊNCIAS
HisrelBlog
 
Pintura Romana .pptx
Pintura Romana                     .pptxPintura Romana                     .pptx
Pintura Romana .pptx
TomasSousa7
 
Redação e Leitura_7º ano_58_Produção de cordel .pptx
Redação e Leitura_7º ano_58_Produção de cordel .pptxRedação e Leitura_7º ano_58_Produção de cordel .pptx
Redação e Leitura_7º ano_58_Produção de cordel .pptx
DECIOMAURINARAMOS
 
Rimas, Luís Vaz de Camões. pptx
Rimas, Luís Vaz de Camões.          pptxRimas, Luís Vaz de Camões.          pptx
Rimas, Luís Vaz de Camões. pptx
TomasSousa7
 
Testes + soluções_Mensagens12 )11111.pdf
Testes + soluções_Mensagens12 )11111.pdfTestes + soluções_Mensagens12 )11111.pdf
Testes + soluções_Mensagens12 )11111.pdf
lveiga112
 
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
SILVIAREGINANAZARECA
 
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
MessiasMarianoG
 
- TEMPLATE DA PRATICA - Psicomotricidade.pptx
- TEMPLATE DA PRATICA - Psicomotricidade.pptx- TEMPLATE DA PRATICA - Psicomotricidade.pptx
- TEMPLATE DA PRATICA - Psicomotricidade.pptx
LucianaCristina58
 
cronograma-enem-2024-planejativo-estudos.pdf
cronograma-enem-2024-planejativo-estudos.pdfcronograma-enem-2024-planejativo-estudos.pdf
cronograma-enem-2024-planejativo-estudos.pdf
todorokillmepls
 

Último (20)

Sistema de Bibliotecas UCS - Chronica do emperador Clarimundo, donde os reis ...
Sistema de Bibliotecas UCS - Chronica do emperador Clarimundo, donde os reis ...Sistema de Bibliotecas UCS - Chronica do emperador Clarimundo, donde os reis ...
Sistema de Bibliotecas UCS - Chronica do emperador Clarimundo, donde os reis ...
 
GÊNERO TEXTUAL - POEMA.pptx
GÊNERO      TEXTUAL     -     POEMA.pptxGÊNERO      TEXTUAL     -     POEMA.pptx
GÊNERO TEXTUAL - POEMA.pptx
 
UFCD_3546_Prevenção e primeiros socorros_geriatria.pdf
UFCD_3546_Prevenção e primeiros socorros_geriatria.pdfUFCD_3546_Prevenção e primeiros socorros_geriatria.pdf
UFCD_3546_Prevenção e primeiros socorros_geriatria.pdf
 
slides de Didática 2.pdf para apresentar
slides de Didática 2.pdf para apresentarslides de Didática 2.pdf para apresentar
slides de Didática 2.pdf para apresentar
 
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
347018542-PAULINA-CHIZIANE-Balada-de-Amor-ao-Vento-pdf.pdf
 
D20 - Descritores SAEB de Língua Portuguesa
D20 - Descritores SAEB de Língua PortuguesaD20 - Descritores SAEB de Língua Portuguesa
D20 - Descritores SAEB de Língua Portuguesa
 
Introdução à Sociologia: caça-palavras na escola
Introdução à Sociologia: caça-palavras na escolaIntrodução à Sociologia: caça-palavras na escola
Introdução à Sociologia: caça-palavras na escola
 
Atividade letra da música - Espalhe Amor, Anavitória.
Atividade letra da música - Espalhe  Amor, Anavitória.Atividade letra da música - Espalhe  Amor, Anavitória.
Atividade letra da música - Espalhe Amor, Anavitória.
 
Leonardo da Vinci .pptx
Leonardo da Vinci                  .pptxLeonardo da Vinci                  .pptx
Leonardo da Vinci .pptx
 
karl marx biografia resumida com suas obras e história de vida
karl marx biografia resumida com suas obras e história de vidakarl marx biografia resumida com suas obras e história de vida
karl marx biografia resumida com suas obras e história de vida
 
epidemias endemia-pandemia-e-epidemia (1).ppt
epidemias endemia-pandemia-e-epidemia (1).pptepidemias endemia-pandemia-e-epidemia (1).ppt
epidemias endemia-pandemia-e-epidemia (1).ppt
 
A SOCIOLOGIA E O TRABALHO: ANÁLISES E VIVÊNCIAS
A SOCIOLOGIA E O TRABALHO: ANÁLISES E VIVÊNCIASA SOCIOLOGIA E O TRABALHO: ANÁLISES E VIVÊNCIAS
A SOCIOLOGIA E O TRABALHO: ANÁLISES E VIVÊNCIAS
 
Pintura Romana .pptx
Pintura Romana                     .pptxPintura Romana                     .pptx
Pintura Romana .pptx
 
Redação e Leitura_7º ano_58_Produção de cordel .pptx
Redação e Leitura_7º ano_58_Produção de cordel .pptxRedação e Leitura_7º ano_58_Produção de cordel .pptx
Redação e Leitura_7º ano_58_Produção de cordel .pptx
 
Rimas, Luís Vaz de Camões. pptx
Rimas, Luís Vaz de Camões.          pptxRimas, Luís Vaz de Camões.          pptx
Rimas, Luís Vaz de Camões. pptx
 
Testes + soluções_Mensagens12 )11111.pdf
Testes + soluções_Mensagens12 )11111.pdfTestes + soluções_Mensagens12 )11111.pdf
Testes + soluções_Mensagens12 )11111.pdf
 
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
1_10_06_2024_Criança e Cultura Escrita, Ana Maria de Oliveira Galvão.pdf
 
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
759-fortaleza-resultado-definitivo-prova-objetiva-2024-05-28.pdf
 
- TEMPLATE DA PRATICA - Psicomotricidade.pptx
- TEMPLATE DA PRATICA - Psicomotricidade.pptx- TEMPLATE DA PRATICA - Psicomotricidade.pptx
- TEMPLATE DA PRATICA - Psicomotricidade.pptx
 
cronograma-enem-2024-planejativo-estudos.pdf
cronograma-enem-2024-planejativo-estudos.pdfcronograma-enem-2024-planejativo-estudos.pdf
cronograma-enem-2024-planejativo-estudos.pdf
 

Implementação de um Sumarizador Automático de Partidas de Futebol Baseado em Taxonomia

  • 1. Implementação de um Sumarizador Automático de Partidas de Futebol Baseado em Taxonomia Érivan F. Silva¹, Patrick Pedreira Silva², Elvio Gilberto da Silva3, Elaine Cecília Gatto4 Curso de Ciência da Computação – Universidade do Sagrado Coração (USC) Caixa Postal 17032-254 – Bauru – SP – Brasil Centro de Ciências Exatas e Sociais Aplicadas erivanfrank@hotmail.com, patrick.silva@usc.br, egsilva@usc.br, elaine.gatto@usc.br Abstract. The Internet continues to grow, driven by ever greater amounts of online information, in this way the search for sportive content, mainly about soccer, has increased. Due to rights restrictions, coverage of some events (in particular live sport) is not available, thus some sites cover, textually, a soccer match using a person to describe the events as they happen. At the end of the match a journalist makes a summary about the match, emphasizing the most important information that have been described. In this context, the aim of this research is to develop a system that using an taxonomy, matches reports, production rules and templates, and ultimately creates an automatic summary of a soccer match. Resumo. Com o crescimento da Internet, os usuários cada dia mais buscam informações em diversas áreas, dentre as quais, se pode se destacar a procura por conteúdos esportivos, principalmente relacionados ao futebol. Sites esportivos costumam relatar os lances de uma partida, minuto a minuto, de modo textual. No fim da partida um jornalista faz um resumo referente à partida, dando ênfase às informações mais importantes que foram descritas no relato. Neste contexto, o propósito deste trabalho foi desenvolver um sistema que, com auxílio de uma taxonomia, de relatos de lances, de regras de produção e de templates, cria um sumário automático de uma partida de futebol. Os resultados obtidos mostram o potencial de se utilizar essa abordagem para a criação de sumários automáticos relacionados à partidas de futebol. 1. Introdução No âmbito do Processamento Automático das Línguas Naturais (PLN), área de pesquisa multidisciplinar em que se busca simular computacionalmente competências linguísticas como, por exemplo, sumarização, os sistemas de PLN geralmente possuem componentes (bases conceituais) em que está armazenado o “conhecimento”. As bases conceituais, em especial, contêm um “modelo do mundo” ou uma abstração da realidade, em que são descritos tipos de objetos, eventos, propriedades e relacionamentos entre esses tipos (ALLEN, 1995; REITER, DALE, 2000).
  • 2. Esse tipo de base desempenha um papel fundamental nos sistemas de PLN porque limita a “visão de mundo” simulada pelo sistema (DIAS-DA-SILVA, 1996). Em outras palavras, uma base conceitual comumente armazena o que se denomina “taxonomia”. Uma taxonomia é uma especificação explícita e formal de uma conceitualização compartilhada (STUDER et al, 1998), que lida com a natureza e a organização do ser, representando conhecimento simplesmente por meio de uma coleção de categorias e subcategorias (MAEDCHE, 2002). Esse termo foi recentemente adotado também pelas comunidades de Inteligência Artificial e Gestão de Conhecimento para se referir a conceitos e termos que podem ser usados para descrever alguma área do conhecimento ou construir uma representação desse (RICH e KNIGHT, 1993; RUSSEL e NORVIG, 1995). No PLN as taxonomias têm sido amplamente empregadas em várias aplicações com o objetivo de melhorar o desempenho dos sistemas computacionais nessas tarefas (GUARINO, 2009). As taxonomias constituem-se, portanto, em uma ferramenta simples e útil que, dentre suas várias aplicações, podemos citar a criação automática de sumários. A sumarização, em geral, é uma atividade bastante comum. Quando se narra um evento a uma pessoa, costuma-se fazer um resumo do que aconteceu e não uma narração completa e detalhada. Exemplos de sumários escritos incluem notícias de jornais, artigos de revistas, resumo de textos científicos, entre muitos outros. Por sua utilidade e frequência, há um grande interesse em automatizar esse processo de geração de sumários (HOVY e LIN, 1997; RAU e BRANDOW, 1993). O crescimento cada vez maior do número de usuários que recorrem à Internet como fonte de informação tem acarretado um aumento substancial da quantidade de conteúdo relacionado a esportes, dentre os quais se destaca o futebol. Além disso, provedores de conteúdo têm expandido a disponibilidade de eventos esportivos a serem transmitidos para todo o mundo em resposta ao significativo aumento de interesse de audiência. Devido às restrições relacionadas à transmissão ao vivo de imagens, por conta de direitos de transmissão, sites esportivos usam o recurso de narração textual dos jogos com relato lance a lance das jogadas e estatísticas. As partidas de futebol, por exemplo, podem ser acompanhadas pelos usuários usando este recurso. Assim, essa tendência aponta para a necessidade de desenvolvimento de ferramentas efetivas e eficientes para coletar, processar e distribuir essas informações e, deste modo, reduzir esforços de empresas e usuários ao buscar o que lhes interessa. Neste projeto foi desenvolvida e utilizada uma taxonomia relacionada ao futebol na tarefa de gerar sumários que relatem informações referentes à partidas de futebol narradas textualmente (com base em eventos pré-cadastrados em um banco de dados), de modo similar ao que é feito em sites esportivos. A hipótese é que a informação recuperada da taxonomia (estatísticas sobre os jogos) permitirá que o sistema determine conteúdos relevantes para a geração de um sumário condizente com os fatos relatados em uma partida de futebol, trazendo uma “análise” do jogo que, em última instância, poderá substituir os sumários gerados manualmente. O sistema faz a identificação de fatos relevantes através da contagem de categorias presentes na taxonomia proposta.
  • 3. 2. Referencial Teórico Uma taxonomia possui um conjunto de termos organizados como uma hierarquia de categorias e subcategorias, provendo uma estrutura básica na qual se pode construir uma base de conhecimento (Figura 1) (MAEDCHE, 2002; GÓMEZ-PEREZ, 1999; NOVELLO, 2002). Figura 1. Representação taxonômica dos meios de transportes Segundo Perna et al (2009) o PLN é a área da Ciência da Computação que estuda o desenvolvimento de programas de computador que analisam, reconhecem ou geram textos em linguagens humanas. O principal uso do PLN está nas interfaces, com o intuito de melhorar a comunicação entre aplicativos e usuários (LIDDY, 2003). Esta técnica de interface permite ao usuário operar aplicativos em linguagens naturais. Com o grande aumento de informação via Web, torna-se necessário o desenvolvimento de aplicativos capazes de tratar adequadamente estas informações. A sumarização automática é uma técnica que lida com esse objetivo e que vem sendo explorada desde a década de 50, quando começaram a surgir os primeiros métodos para a produção de extratos (LUHN, 1958). Todo o processo de sumarização se dá a partir um conjunto de informações que tratam de um mesmo assunto e, com isto, torna-se possível a produção de um sumário, ou seja, um resumo do assunto (HUTCHINS, 1987; MAYBURY, 1993). Preferencialmente a produção de um sumário leva em consideração a coesão e a coerência na sua geração. Para isso, se faz necessário uma base de conhecimento que contem a descrição do conteúdo necessário para a sua geração. Sistemas de produção (ou sistemas de regras de produção) estão fundamentados na Inteligência Artificial. Estes sistemas analisam um conjunto de regras e comportamentos, sendo caracterizados como um processo de busca que usa estratégias de seleção para determinar qual a regra mais apropriada a ser disparada em situação. A associação de tais sistemas à uma taxonomia podem servir de base para a criação de um sistema de PLN, como o proposto nesta investigação que, na fase atual, permite apenas gerar sumários considerando a taxonomia e sua representação em um banco de dados. 3. Trabalhos correlatos A construção de sumários automáticos baseada em taxonomias é bastante explorada em diversos trabalhos, por exemplo, Lin (1995) adota essa estratégia para criar sumários de textos. Ele estende a contagem de palavras, como maneira de identificar os tópicos de um texto, para a contagem de conceitos, propondo um método para identificar
  • 4. automaticamente suas ideias centrais. Essa contagem é feita utilizando uma taxonomia para realizar generalizações, como, por exemplo, inferir que um texto que traga as palavras laptop e handheld pode tratar do tópico computadores portáteis. Para isso, é definido um peso para cada conceito e esse peso representa a frequência de ocorrência dos itens lexicais. No final, as sentenças que possuem os conceitos com maiores pesos são selecionadas para composição do sumário. Usando uma metodologia similar de sumarização, Wu e Liu (2003) utilizaram artigos jornalísticos como corpus para elaborar e construir a taxonomia utilizada na sumarização dos documentos, que é codificada como uma estrutura em árvore onde cada nó representa um conceito. Um processo de mapeamento verifica a correspondência entre as palavras do texto e os conceitos taxonômicos, atribuindo-lhes pesos. O peso de cada conceito em relação ao texto a ser sumarizado é calculado somando-se a frequência das palavras que aparecem no documento e que correspondam ao conceito. A seleção de parágrafos é feita pontuando-os de acordo com a presença de palavras que correspondem aos conceitos principais identificados: para cada palavra relacionada a um conceito identificado anteriormente, o parágrafo recebe uma quantidade de pontos relativa ao peso do conceito considerado. Tiun et al. (2001) exploraram a taxonomia do Yahoo para a criação de sumários formados apenas por palavras-chave que representem os tópicos principais de um documento. Um conjunto de palavras-chave é extraído de sentenças significativas do documento e, posteriormente, é mapeado no conjunto de seus conceitos taxonômicos. Essa correspondência é feita comparando-se cada uma delas a um conjunto de itens lexicais que estão associados a cada conceito da taxonomia. O mapeamento entre palavras-chave e conceitos visa definir o peso de cada conceito no documento. Esse peso é calculado pela soma da freqüência das palavras-chave, no texto, coincidentes com os itens lexicais que descrevem o conceito presentes na taxonomia. Os tópicos com maiores pesos são exibidos como sumário do documento analisado. De modo geral, os trabalhos apresentados demonstram o potencial de utilização de taxonomias para a criação de sumários. A motivação comum a todos eles é a de que a análise de palavras isoladas em um texto, sem nenhuma consideração sobre o relacionamento semântico entre elas pode ser um fator limitante no processamento de documentos. Desta forma, todos eles adotam como elemento fundamental uma taxonomia. Todos esses aspectos foram observados e considerados para a elaboração da nossa proposta. A seguir, apresentamos uma síntese das características principais dos trabalhos descritos, já que eles apresentam estratégias e recursos que foram adaptados e/ou incorporados às nossas estratégias de sumarização, contribuindo para nossa investigação. 4. Metodologia Após terem sido recolhidos todos os conhecimentos e informações relacionadas para a execução do trabalho, iniciou-se a fase de desenvolvimento da “Taxonomia do Futebol”. Este desenvolvimento consistiu principalmente na construção de relações entre dados (categorias e subcategorias), permitindo que os vários conceitos associados ao futebol pudessem ser representados por meio de uma taxonomia.
  • 5. Posteriormente, foi implementado um protótipo do sistema que faz uso desta taxonomia para gerar um resumo automático de partidas de futebol. Para o desenvolvimento do protótipo foram utilizadas as linguagens de programação JavaScript, HTML, CSS, PHP e o banco de dados MySql. Segundo Hutchis (1987), a análise do conteúdo de documentos é uma das atividades mais importantes de um sistema de informação e entender o modo como profissionais (indexadores ou sumarizadores humanos) produzem seus textos pode levar a avanços consideráveis para a automação do processo. Dessa forma, podemos abstrair que sumarização é retirar dos textos mais complexos informações mais relevantes. A Figura 2 apresenta um trecho de um exemplo de “relato lance a lance” retirado do site UOL1 . Este trecho descreve as ações de uma partida em tempo real. Observa-se que ao final da narração é escrito, por um jornalista, um resumo (sumarização humana, portanto, manual) onde se descreve em poucas palavras as informações mais relevantes da partida. A proposta desta investigação foi justamente automatizar essa etapa, já que as transmissões de eventos esportivos, essencialmente associados ao futebol, são cada vez mais usuais. Tais transmissões exigem maiores investimentos no seu tratamento interno, para arquivo e geração de estatísticas no menor tempo possível, demandando obviamente, cada vez mais recursos humanos. Figura 2. Relato de Lance-Lance de uma partida de futebol 1 Relato Lance-Lance http://esporte.uol.com.br/futebol/campeonatos/liga-dos-campeoes/pos- jogo/2012/04/24/chelsea-elimina-o-barca-com-golaco-de-ramires-e-penalti-perdido-de-messi.htm
  • 6. A automatização do processo relatado consistiu, portanto, em propor e implementar uma ferramenta em ambiente web (offline), que através de relatos lance a lance fornecidos como entradas (considerando apenas eventos textuis pré-cadastrados), é capaz de gerar um sumário automático, a partir de uma taxonomia, templates e regras de produção, abstraindo as ações das equipes e dos jogadores, durante a partida. 5. Funcionamento da ferramenta proposta Os dados de entrada da ferramenta foram representados por eventos pré-cadastrados no sistema. Esses eventos correspondem às ações realizadas por jogadores, técnicos e juízes durante uma partida de futebol. Posteriormente é feita a distribuição tática das equipes dentro de campo, com os nomes dos respectivos jogadores pertencentes às equipes, conforme mostra a Figura 3. Figura 3. Distribuição dos times na interface do sistema A escolha das equipes é fundamental para que, posteriormente, o sistema possa representar tais informações na taxonomia e selecionar, com base em regras e nas categorias registradas na taxonomia as situações ocorridas durante a partida (pode-se, por exemplo, saber se um time jogou defensivamente ou ofensivamente, verificando o número de jogadas ofensivas/defensivas de cada equipe). Para que ao final da partida um sumário possa ser gerado houve a necessidade de limitar o que está sendo informado como entrada ao sistema, pois foge do escopo deste trabalho uma análise em nível mais profundo, envolvendo os aspectos sintáticos, semânticos e pragmáticos da língua. Sendo assim, foi criado um banco de dados que é preenchido com informações referentes a um relato lance-lance (eventos) relacionado a uma partida de futebol. A “narração” textual da partida se dará a partir de eventos que estão registrados no banco de dados, eventos estes que, posteriormente, serão utilizados
  • 7. na composição do sumário. Estes eventos estão estruturados de forma a conter sempre as seguintes informações contidas na Figura 4. Figura 4. Campos para registrar lances das partidas Campo 01 – Tempo de jogo – Quando ocorreu a ação (seguindo o padrão europeu de partidas de futebol que vai 0 a 90 minutos). Campo 02 – Ações – Estão disponíveis 60 registros (eventos) relacionados a partidas de futebol, contemplando as ações de gol, falta, cartão, drible, passe, defesa e chute. Campo 3 – Região - Indica em que região do campo ocorreu certa ação. Campo 4 – Ataque/Defesa - Distingue se a ação ocorreu no ataque ou na defesa, com isto é possível identificar a área de maior atuação da equipe. Campo 5 – Time – Identificação de um dos dois times. Campo 6 – Jogadores – Identificação do jogador que gerou a ação. Todos os registros feitos durante uma partida de futebol servem para indicar a ocorrência de uma categoria/subcategoria da taxonomia para que, posteriormente o resumo seja gerado, tendo como base um conjunto de regras de produção. Tais informações poderão dar um diagnóstico da partida e, consequentemente, refletir no texto do sumário gerado. Tal procedimento é repetido a cada partida. Com os dados devidamente registrados consegue-se fazer um levantamento das ações de cada time como, por exemplo, saber qual o número de gols marcados durante a partida. Também é possível obter informações mais detalhadas como, por exemplo, saber se o gol marcado por uma equipe foi de pênalti ou de falta. Com base no levantamento das ações que podem ocorrer durante uma partida de futebol foi criada a taxonomia representada na Figura 5.
  • 8. Figura 5. Taxonomia gerada das ações inerentes ao futebol Desde modo, a partir das informações extraídas do banco de dados, considerando um dos templates atualmente disponíveis, um sumário é gerado. Os templates são pequenos textos pré-formatados registrados no banco de dados. Através das estatísticas que o sistema obtém durante o registro de lances que descrevem a partida é possível, por meio de um processo automático guiado pelas regras de produção, escolher o melhor template que se encaixa nas ações registradas. Como exemplo, uma das regras verifica se um time obteve maior número de gols do que o outro, com isto é possível eliminar todos os templates referentes a placares de empate, escolhendo outro que descreva a vitória de uma das equipes. A seguir (Figura 6) é apresentado um exemplo de template. [TIME A] vence [TIME B] em um jogo com amplo domínio O [TIME- A] começou a partida indo para cima do [TIME-B] e conseguiu abrir o placar logo no primeiro tempo com um gol de [JOGADOR-GOL]. O [TIME-B] criou oportunidades, mas não conseguiu o empate. O ritmo do segundo tempo foi o mesmo, mas em tarde inspirada [JOGADOR-GOL] aproveitou a oportunidade e aumentou a contagem, com a vantagem ampla no placar o [TIME-A] só segurou o resultado e esperou o apito do arbitro para vencer a partida. Figura 6. Template associado à regra de amplo domínio de uma equipe A seguir é mostrado um exemplo de uma regra de produção associada ao template anterior (Figura 6). Para que essa regra seja “disparada” é verificado se houve um vencedor na partida (informação obtida tendo por base o número de gols de cada equipe) e se a vitória ocorreu com amplo domínio de uma das equipes (obtida com base no número de passes, faltas, chutes e dribles). SE VENCEDOR="SIM" E ESTILO_VITÓRIA="AMPLO_DOMÍNIO" ENTÃO ESCOLHA="TEMPLATE_AMPLO_DOMÍNIO"
  • 9. Além dos textos-base formulados com a ajuda dos templates, informações complementares como, por exemplo, jogador que se destacou na partida ou jogador mais faltoso, podem ser adicionadas ao sumário final, enriquecendo-o. Entretanto, cabe destacar que no estágio atual da pesquisa essas informações adicionais ainda não são consideradas pelo sistema. Deste modo, a combinação de regras com os dados presentes na taxonomia juntamente com templates pré-definidos, permite ao sistema gerar os sumários com informações sobre as partidas de futebol. A Figura 7 mostra resumidamente o funcionamento do sistema. Figura 7. Resumo do funcionamento do sistema Observa-se que o sumário é gerado considerando alguns passos principais: 1) o usuário do sistema deve fornecer o relato lance-a-lance de uma partida de futebol, 2) estas informações são armazenadas automaticamente na taxonomia representada no banco de dados, 3) ao final da partida, os dados são recuperados, um dos templates é escolhido e preenchido pelo sistema, gerando o sumário (relato) da partida. 6. Resultados Com alguns templates devidamente cadastrados no sistema foi possível obter os sumários de acordo com a metodologia proposta e, adicionalmente, enriquecê-los conforme relatado a seguir. A Figura 8 mostra um resumo gerado pelo sistema, considerando as informações cadastradas no decorrer da partida e registradas no banco de dados, considerando a estrutura da taxonomia proposta. A ideia é de que o template seja preenchido após contagem de frequência de termos usados no registro da partida. Para tornar os sumários mais informativos, optou-se por inserir em alguns templates informações como, por exemplo, o jogador que fez o gol e o tempo que isto aconteceu. Com o intuito de enriquecer ainda mais as informações oferecidas pelo resumo, também é exibido como resposta do sistema as estatísticas da partida, considerando a contagem das categorias taxonômicas registradas no banco de dados. Assim, a Figura 9 mostra as informações detalhadas de duas equipes durante uma partida como, por exemplo, a quantidade de gols de cada time, faltas cometidas, etc.
  • 10. Figura 8. Resumo gerado de empate por 0x0 Figura 9. Estatística referente ao resumo gerado Adicionalmente, existem templates que contemplam situações de empate, vitórias por placar mínimo (1X0) (Figura 10), vitórias com amplo domínio de uma das equipes (Figura 11), vitórias com apenas um gol de diferença (Figura 12) e vitórias por goleada (Figura 13). Figura 10. Resumo gerado por apenas um gol marcado
  • 11. Figura 11. Resumo gerado com amplo domínio sobre o adversário Figura 12. Resumo gerado por vitória apertada Figura 13. Resumo gerado de placar por goleada Vale salientar que ao se iniciar o sistema todo o processo é reiniciado, possibilitando gerar outro resumo contendo outras informações diferentes, ainda que o template a ser utilizado seja o mesmo. 7. Considerações Finais O protótipo aqui implementado constitui uma alternativa que visa contribuir para o desenvolvimento ferramentas que buscam reduzir esforços de empresas e usuários na sumarização automática. Ele representa as informações de uma partida de futebol por meio de uma taxonomia implementada em um banco de dados, permitindo a criação de
  • 12. relatos automáticos com análises de partidas de futebol transmitidas textualmente pela Internet. O futebol é um esporte rico em estatísticas, permitindo a extração de informações como, por exemplo, aquelas referentes à ação de gol e outras jogadas. Mesmo com esta grande quantidade de informações foi necessária à criação de seis templates (resumos de partidas de futebol) pré-formatados, que contêm posições-chave que são substituídas através de métodos computacionais, levando em consideração as estatísticas levantadas. Tal procedimento visou criar sumários informativos (com textos coerentes e coesos) que, de algum modo, se assemelhassem à forma de escrita dos resumos manuais encontrados em sites da Internet. Com o grande conjunto de informações que o futebol proporciona abre-se um grande leque de aprimoramento do presente trabalho. Num primeiro momento existe a possibilidade na melhora da atual aplicação, aumentando as regras e, com isto, obter sumários mais adequados a cada situação de uma partida disputada. Para que isto seja possível há a necessidade de aumentar a quantidade de templates disponíveis e também aumentar tanto os dados (como, por exemplo, táticas que foi usada pelos times e se a mesma teve mudança durante a partida) quanto às regras para a geração do sumário. Outra limitação do sistema que será alvo de trabalhos futuros refere-se ao registro ações envolvendo mais de um jogador, por exemplo, um fez uma falta em outro e por isto foi expulso. Nesta situação atualmente é necessário cadastrar as duas ações separadamente (uma para quem fez a falta e foi expulso e outra para quem sofreu a falta). Como o sistema é offline abre-se a possibilidade de trabalhar com um sistema on-line em que os dados (relatos lance-a-lance) sejam extraídos automaticamente de sites esportivos, já que nesta investigação não há PLN em texto livre. Para que isto seja possível há a necessidade de uma abordagem profunda no processamento da linguagem e, portanto, também da psicologia cognitiva para gerar a compreensão dos textos-fonte e, posteriormente, extrair as informações que guiarão a produção dos sumários correspondentes. Na aplicação atual todos os dados foram cadastrados diretamente no banco de dados MySql, com isto fica difícil acompanhar a as evoluções das equipes durante uma temporada como, por exemplo, a troca de jogadores. Este problema pode ser solucionado com a implantação de um administrador que consegue realizar qualquer tipo de alteração na base de dados. Mesmo com a elaboração de poucos templates e limitações que esta abordagem superficial oferece, e com a ausência de experimentos e avaliações formais do sistema, o objetivo inicial do trabalho foi cumprido, mostrando o potencial de se utilizar essa abordagem para a criação de sumários automáticos relacionado à partidas de futebol. Referências DIAS-DA-SILVA, B. C. A face tecnológica dos estudos da linguagem: O processamento automático das línguas naturais. Araraquara, 1996. 272p. Tese (Doutorado em Letras) - Faculdade de Ciências e Letras, Universidade Estadual Paulista, Araraquara.
  • 13. GOMEZ-PÉREZ, A., Tutorial on Ontological Engineering, Internacional Joint Conference on Artificial Intelligence – IJCAI, 1999. GUARINO; N., MASOLO;C., VETERE; G. (1999). Ontoseek: Content-based access to the web. IEEE Intelligent Systems, 14(3):70–80. HOVY; E., LIN, C. (1997). Automated Text Summarization in SUMMARIST. In: I. MANI,MAYBURY; M. (eds.) “Intelligent Scalable Text Summarization”.ACL 1997 Workshop, pp. 39-46. Madrid, Spain. HUTCHINS, JOHN; (1987). Summarization: Some problems and Methods. In: Jones. Meaning: The frontier of informatics. Cambridge. London, pp. 151-173. LIDDY; E. D. (2003). Natural Language Processing. IN: Encyclopedia of Library and Information Science. New York: Marcel Dekker. LIN, C. Knowledge-based automatic topic identification. In: ANNUAL MEETING ON ASSOCIATION FOR COMPUTATIONAL LINGUISTICS,33., 1995, Morristown. Proceedings… Cambridge: MIT Press, 2004. p. 308-310. LUHN, H. P.; A Business Intelligence System. IBM Journal of Research and Development,IBM, v.2, n.4, p. 314 – 319, 1958. MAEDCHE; A., STAAB; S. Measuring similarity between ontologies. In: Proceedings of the European Conference on EKAW, 2002. MAYBURY; M. (1993). Automated Event Summarization Techniques. In: Seminar Report of Summarizing Text for Intelligent Communication Seminar. Dagstuhl, Germany NOVELLO, T. C. Ontologias, sistemas baseados em conhecimento e modelos de banco de dados. Universidade Federal do Rio Grande do Sul, 2002. PERNA, C., DELGADO, H., & FINATO, M. (2010). Linguagens especializadas em corpórea. RIO GRANDE DO SUL: EDPRUCRS. RAU; L. F. , BRANDOW; R. (1993). Domain-Independent Summarization of News. In: B. NIGGEMEYER; J. , HOBBS,SPARCK; J. (eds.), Seminar Report of Summarizing Text for Intelligent Communication Seminar. Dagstuhl, Germany. RICH, E., KNIGHT, K. Inteligência Artificial. 2. ed. [s.l.] : McGraw-Hill, 1993. RUSSEL, NORVIG, 1995. Artificial Intelligence: A Modern Approach. Prentice-Hall, Saddle River, NJ, 1995. TIUN, S.; ABDULLAH, R.; KONG, T. E. Automatic topicidentification using ontology hierarchy. In: CICLING: CONFERENCE ON INTELLIGENT TEXT PROCESSING AND COMPUTATIONAL LINGUISTICS,2., 2001, Mexico City. Proceedings… Heildelberg : Springer-Verlag, 2001. p. 444-453. WU, C. W.; LIU, C. L. Ontology-based text summarization for business news articles. In: ISCA: INTERNATIONAL CONFERENCE ON COMPUTERS ANDTHEIR APPLICATIONS, 18., 2003, Honolulu. Proceedings… Cary: ISCA, 2003. p. 389- 392.