Informação e conhecimento em saúde no tempo das redes sociotécnicas
Prolegomenos de IA
1. DOUTORADO EM CIÊNCIA DA INFORMAÇÃO
ORIENTADORA: Profª: Suzana Pinheiro M. Mueller
ALUNO: Paulo César Rodrigues Borges
UNIVERSIDADE DE BRASÍLIA
FACULDADE DE CIÊNCIAS SOCIAIS APLICADAS
DEPARTAMENTO DE CIÊNCIA DA INFORMAÇÃO E DOCUMENTAÇÃO
1
2. AVALIAÇÃO da SIMILARIDADE SEMÂNTICA entre
CLASSES de ENTIDADES ESPACIAIS, REPRESENTADAS
numa ONTOLOGIA ad-hoc
Área de concentração: Planejamento e Gestão da Informa-
ção e do Conhecimento
2
4. TESE DE DOUTORADO - TEMA Paulo César Rodrigues Borges
TEMA - ESTÍMULO E
MOTIVAÇÃO
Trabalho em linha de produção de mapas e cartas por
mais de 15 anos e o problema da interoperabilidade.
“Linguistic confusion in semantic modelling.” Hans-
Peter Bähr (1996)
Convergência de interesses da CI e do Geoproces-
samento
4
6. TESE DE DOUTORADO - TEMA Paulo César Rodrigues Borges
SIMILARIDADE DE ENTIDADES
ESPACIAIS
Onde estou?
6
7. TESE DE DOUTORADO - TEMA Paulo César Rodrigues Borges
HCI: SIMILARIDADE COMO TENDÊNCIA
Uma saída: ciências cognitivas!
“Pessoas são boas no julgamento de similaridade.”
A similaridade não é precisamente uma relação de
equivalência.
São poucos os resultados de formalização na área de
estudos da similaridade.
A similaridade é essencial para a integração de
informações num SIG
São necessários modelos de similaridade para SIG.
(Max J. Egenhofer)
7
8. INTEGRAÇÃO DA IG
Texto Gráfico
Camada semântica integradora
Texto Gráfico
SIG 1
SIG n
Intercâmbio de objetos se-
manticamente similares
8
9. TESE DE DOUTORADO - TEMA Paulo César Rodrigues Borges
ONTOLOGIA (?)
Φ: Estudo da existência de todos os tipos de entidades (concretas ou
abstratas) que constituem o mundo, assim como das relações entre elas.
Por enquanto...
IA: explicitação das conceituações que cada indivíduo de um grupo têm
com relação a uma parcela do mundo
9
10. TESE DE DOUTORADO - TEMA Paulo César Rodrigues Borges
CIÊNCIA DA INFORMAÇÃO
GEOGRÁFICA - CIGeo
CIGeo: IA, Lingüística Comp., Geoprocessamento, Similaridade
Semântica (SS), Interoperabilidade entre SIs
NCGIA (Centro Nac. de Anál. de Info Espacial) – Univ. do Maine
(EUA)
Financiamento do projeto de SS: Lab. da Força Aérea
Americana, Agência Nacional de Mapeamento, NSF (Fundação
Nacional de Ciência), Empresa Lockheed-Martin (integração de
sistemas, aeronáutica, espaço e TI)
Do Brasil, 2 pesquisadores do INPE (SP) e um da PRODABEL (MG) já
colaboraram com artigos e teses.
10
11. TESE DE DOUTORADO - PROBLEMA Paulo César Rodrigues Borges
MARCO TEÓRICO
Semântica e informação geográfica
(Hans-Peter Bähr – 1996)
Estudos sobre a ambigüidade que afeta
a informação textual (Marisa Bräscher
B. Medeiros – 1999)
Similaridade semântica e toponímia
(María Andrea Rodríguez Tastets - 2000)
11
12. JUSTIFICATIVAS
De ordem teórica:
Necessidade de uma teoria que fundamente o
tratamento (recuperação, análise e disseminação) da IG
em termos mais cognitivos do que formais.
De ordem prática:
Contribuir com a interoperabilidade de SIGs;
Aprimorar as técnicas de produção cartográfica;
Diminuir o vazio cartográfico do Brasil.
TESE DE DOUTORADO - TEMA Paulo César Rodrigues Borges
12
13. TESE DE DOUTORADO - PROBLEMA Paulo César Rodrigues Borges
PROBLEMA (origem)
MUNDO REAL
FOTO IMAGEM ......
PROJEÇÃO
(Instrumentos, técnicas, leis físicas ...)
G
E
N
E
R
A
L
I
Z
A
Ç
Ã
O
MODELAGEM SEMÂNTICA
(Topologia, Lógica, Toponímia,
Gramática, gráficos, Rede Semântica...)
DESCRIÇÃO SIMBÓLICA (mapa)
PROBLEMA
Realidade
Transformação
Nível iconográfico
Transformação
Nível simbólico
13
14. TESE DE DOUTORADO - PROBLEMA Paulo César Rodrigues Borges
O PROBLEMA GERAL
“Como avaliar a similaridade semântica
entre objetos espaciais representáveis
numa base de dados?”
14
15. HIPÓTESE ALTERNATIVA
H-1: ““A utilização de um protótipo para avaliar a
similaridade semântica entre objetos espaciais,
representáveis numa base de dados
cartográficos, é um método automatizado
compatível com o critério humano de julgamento
de similaridade para distinguir entidades
geográficas no mundo-real.”
------------------------------------------------------------
Como avaliar a similaridade semântica entre objetos espaciais representáveis
numa base de dados?”
TESE DE DOUTORADO - HIPÓTESE Paulo César Rodrigues Borges
15
16. TESE DE DOUTORADO - REVISÃO DE LITERATURA Paulo César Rodrigues Borges
Revisão de Literatura
Cartografia
Ciências Cognitivas
16
17. TESE DE DOUTORADO - REVISÃO DE LITERATURA Paulo César Rodrigues Borges
MODELOS DE SIMILARDADE:
CONTRIBUIÇÃO E PÚBLICO-ALVO
CONTRIBUIÇÕES
Recuperação da informação (SRI)
Tratamento semântico de consultas em SIs: AIs de base
ontol. p/ orientar na descoberta de info. no ambiente www
PÚBLICO-ALVO
Produtores e usuários de SRI (em geral);
Produtores e usuários de SIG;
Produtores de SGBDs e QLs;
Pesquisadores de IA (PLN), Lingüística e ciências cognitivas.
17
18. TESE DE DOUTORADO - REVISÃO DE LITERATURA Paulo César Rodrigues Borges
SIMILARIDADE: ENFOQUE SEMÂNTICO DO NCGIA
Métodos de raciocínioMétodos de raciocínio
• Fundamentais (indução e dedução)Fundamentais (indução e dedução)
• Acessórios (Acessórios (modus sciendimodus sciendi))
T = G + d1 + d2 + ... + dn-1 + dn
Modus sciendiModus sciendi
• AnáliseAnálise
• SínteseSíntese
• ClassificaçãoClassificação
• DefiniçãoDefinição
Definiendum: 1º termo
Definiens: 2º termo (1)
Cópula: “ = ”
T: sujeito (termo)
G: gênero
adjuntos ou diferenças (differentiæ)
(1)
: relações semânticas e feições distintivas
==
n
ii
d 1
|
18
19. Classe de entidades {
nome: {ontologia}
descrição: conjunto de regras para descrever uma certa
conceitualização.
===========================================================
é-um: {conhecimento*}
parte-de: { }
todo-de: {regra*}
===========================================================
partes: {{regras}, {especificações}, {definições},
{conceitualizações}}
funções: {descrever}
atributos: {grau de generalidade}}
DE NOVO: ONTOLOGIAS!!!
TESE DE DOUTORADO - REVISÃO DE LITERATURA Paulo César Rodrigues Borges
19
Gênero
Propriedades
20. (GRUBER, 1993), (ALLEN, 1994), (GUARINO, 1995), (USCHOLD, 1996),
(FELLBAUM, 1998), (MEDEIROS, 1999), (RODRÍGUEZ, 2000), (HENRIQUES,
2002), (LEÃO, 2003)
“Uma ontologia pode assumir uma variedade de formas, mas
necessariamente deve incluir um conjunto especificado de termos.
Uma ontologia é virtualmente uma manifestação de um
entendimento compartilhado que se tem sobre um domínio do
conhecimento. Esta concordância no entendimento propicia uma
comunicação mais precisa entre as partes interessadas nesse
domínio, o que acaba por produzir benefícios nos campos da
interoperabilidade de sistemas e da reutilização de idéias.”
DE NOVO: ONTOLOGIAS!!!
TESE DE DOUTORADO - REVISÃO DE LITERATURA Paulo César Rodrigues Borges
20
21. VISÃO DO MUNDO PELA DSG
• AltimetriaAltimetria
• Hidrografia
• Vegetação
• Localidades
• Edificações
• Infra-estrutura
• Transporte
• Limites
• Pontos de referência
TESE DE DOUTORADO - REVISÃO DE LITERATURA Paulo César Rodrigues Borges
21
22. EFEITO DE SUBCONJUNTO OU LEI DE TOBLER
S
Pi
Pj
S: pardal (sujeito)
Pi: pássaro (predicado)
Pj: animal (predicado)
“S é um Pi!”
“S é um Pj!”
“S é um Pi!”
TESE DE DOUTORADO - REVISÃO DE LITERATURA Paulo César Rodrigues Borges
22
23. MODELOS MATEMÁTICOS
TESE DE DOUTORADO - METODOLOGIA Paulo César Rodrigues Borges
23
De cálculo da similaridade semântica:
St ( c1, c2 ) =
[C1 ∩C2 ]#
{ [C1 ∩C2 ]# + α[C1 - C2 ]# + (1 - α) [C1 - C2 ]# }
St (c1, c2) = wp . Sp ( c1, c2 ) + wf . Sf ( c1, c2 ) + wa . Sf ( c1, c2 )
αSt ( c1, c2 ) =
d (c1, c2)
d (c1, l.u.b) (b)
d (c1, c2)
d (c1, l.u.b) (a) d (c1, l.u.b) ≤ d (c2, l.u.b)
1 -
d (c1, l.u.b) > d (c2, l.u.b)
24. MODELOS MATEMÁTICOS
TESE DE DOUTORADO - METODOLOGIA Paulo César Rodrigues Borges
24
Estocásticos (não-paramétricos):
nn
d
R
n
i
i
s
−
−=
∑=
3
1
2
6
1
Correlação de Spearman
n : nº de unidades de observação,
casos ou indivíduos
di : i-ésima diferença entre postos
(posto do resultado do PRONTO e o
posto do caso correspondente)
( )
( )1
1312
22
1
222
−×
+×−
=
∑=
nnk
nnkR
W
n
i
i
Coef. Concord. de Kendall
n : nº de variáveis (estimativa de similaridade
dos indivíduos para os pares de entidades)
k : nº de casos, unidades de observação ou
de indivíduos que respondem ao quest.
Ri : i-ésimo posto de cada caso
1
1
−
−
=
k
kW
Rs ] ]1
0
1
1
WRs
+
−
25. TESE DE DOUTORADO - METODOLOGIA Paulo César Rodrigues Borges
C
A
M
P
O
S
D
E
O
B
S
E
R
V
A
Ç
Ã
O
25
Enfoque de máquina Enfoque cognitivo
( ) Caminhão
( ) Antena
( ) Árvore
(X) Quase-árvore
( ) Caminhão
( ) Antena
(X) Árvore
( ) Quase-árvore
ESTATÍSTICA
“Quase-árvore” “Árvore”
Correlação aceitável?
26. TESE DE DOUTORADO - METODOLOGIA Paulo César Rodrigues Borges
METODOLOGIA - ENFOQUE
VETORIAL PARA A SS
(possui água, vazão, ...)
(possui leito asfáltico,..)
CONCEITO
{Rio, lago}
{Estrada, ferrovia}
Rio, lago
Estrada, ferrovia
Bag of components
26
27. SIMILARIDADE SEMÂNTICA - ENFOQUE VETORIAL
JÁ!
00o
9090o
vOX
vOX
vOX
×
•
=),cos(
OO XX
YY
v ≡ OX
v ≡ OY
qquueeddaa
ddaa ssiimmiil
27
29. TESE DE DOUTORADO - METODOLOGIA Paulo César Rodrigues Borges
METODOLOGIA
(9 fases da manipulação experimental)
Selecionar MC;
Definir os termos;
Estabelecer a estrutura formal (BNF) de organização dos termos;
Determinar o modelo computacional de avaliação da SS;
Optar pela ED (árvore) de representação dos termos num sistema
computacional;
Implementar um programa capaz de percorrer e selecionar da ED
os termos de interesse, bem como calcular a SS entre eles;
Selecionar o gp de indivíduos para responder às questões sobre
SS;
Preparar questões sobre SS para o gp de indivíduos;
Comparar, por meio da Estatística, os resultados do programa de
avaliação de SS com as respostas dos indivíduos.
29
31. TESE DE DOUTORADO - METODOLOGIA Paulo César Rodrigues Borges
METODOLOGIA -
Cont.
(limitações)
DE PESQUISA
Fraca cultura Apple no Brasil (MSS no
Macintosh)
Pré-teste (não houve)
Informação contextual (não houve inserção)
Poucos pesquisadores brasileiros
31
32. METODOLOGIA
(resultados obtidos – 1a
pergunta)
Postos das
Respostas
Postos do
PRONTO
Postos das
Respostas
Rs 1,000 ,835
valor de
prova
, ,001
N 10 10
Postos do PRONTO Rs ,835 1,000
valor de
prova
,001 ,
N 10 10
TESE DE DOUTORADO – RESULTADOS Paulo César Rodrigues Borges
32
Correlação não-paramétrica de Spearman
por postos das respostas dos indivíduos e
dos resultados do PRONTO
33. METODOLOGIA
(resultados obtidos – 1a
pergunta)
Postos das
Respostas
Postos do
PRONTO
Postos das
Respostas
Rs 1,000 ,835
valor de
prova
, ,001
N 10 10
Postos do PRONTO Rs ,835 1,000
valor de
prova
,001 ,
N 10 10
TESE DE DOUTORADO – RESULTADOS Paulo César Rodrigues Borges
33
Correlação Não-Paramétrica de Spearman
Postos: valores médios de cada campo amostral
Média dos postos = 1 => similaridade máxima
Classe de Entidades
R
iac
ho
Pâ
ntan
o
C
a
ch
oe
ira
C
a
n
al
Es
trad
a-d
e-ferro
C
a
m
inh
o
c
arro
ç
áv
e
l
O
lh
o
d
'á
gua
V
a
la
B
o
squ
e
La
g
o
Postos
10
8
6
4
2
0
Postos das Respostas
Postos do PRONTO
RIO
α = 0,01
Simil: Conceito fundamental nas teorias de representação do conhecimento {Campo de estudos das ciências cognitivas que trata das maneiras de transformar o conhecimento em regras programáveis em computador eletrônico (RUSSELL, 1995).} Equivale a um pcp de ordenação. Com base na simil, inds podem classif objs, conceitos de forma e fazer generalizações. Pode ser quantif por vars relacionadas com E-R(reações) no processo de aprendizagem.
No que tange à integração da informação, sintetizando RODRÍGUEZ (2000), há uma diferença primordial em relação à integração de dados, porque a primeira está num nível superior de processamento, selecionando as informações necessárias ao SIG de uma base de dados. As razões da preocupação com a integração de dados estão no surgimento de ambientes distribuídos de dados (Internet), que implicam constante reutilização e compartilhamento desses dados. A heterogeneidade desses acervos é o maior desafio nesta área. As soluções passam pelo entendimento de três arquiteturas de ambientes de dados distribuídos: 1ª) Esquemas globais; 2ª) Sistemas de bases de dados federativas (FDBS) e 3ª) Linguagens para agrupamentos de bases de dados. O que importa é que a variável independente da função de integração destes esquemas está no rigor da coesão entre as bases de dados de cada um: mais rigor implica mais estabilidade na integração das bases, com perda no aspecto da flexibilidade na sua administração (usuário longe do controle, administrador no controle). O problema da SS está na identificação de objetos semanticamente similares e que pertençam a diferentes arquiteturas de base de dados, assim como na resolução de suas diferenças esquemáticas. Nem todos os dados das bases já formadas podem ser integrados, mas só a SS é a ferramenta capaz de promover a integração dos casos possíveis, conforme registrou RODRÍGUEZ (2000), que ainda analisou diversos estudos e propostas ad hoc, assinalando a que é baseada em definições e inter-relacionamento entre os termos descritores de entidades do MR numa base de dados (BD).
1) Uma só ontologia!
2) Várias ontologias!
(Continuação) O cerne desta proposta está em produzir um mapeamento entre os termos da BD e uma ontologia construída, tal que capturasse a visão do mundo segundo a utilização que se quer dar àquela BD. Tal ontologia deveria ter as seguintes características: 1) Propiciar consultas intensionais (conseqüência da finalidade primordial da ontologia: atender a um grupo específico de usuários); 2) Definir o nível semântico do sistema independente do nível de representação de dados (esta é uma métrica tradicional da Engenharia de Software); 3) Reproduzir a relevância dos dados, sem precisar ter acesso a eles. Definida uma ontologia comum, os relacionamentos entre os termos, expressos pelas sentenças lógicas da ontologia, são transformados em similaridades semânticas. Ao se criar uma ontologia comum para SIGs, inicia-se a construção de uma base de conhecimentos (BC), que vai estar pronta para ser ampliada com mais conhecimento oriundo das verificações das informações obtidas das bases de dados com um conjunto de axiomas básicos da BC. RODRÍGUEZ (2000) relata projetos-pilotos nesta área, na Europa e nos EUA. É, portanto, muito importante começar esforços similares no Brasil.
Marco Teórico ou Quadro Referencial
As correntes epistemológicas desse campo de pesquisa estão na Psicologia Cognitiva e Inteligência Artificial, ambas aplicadas aos problemas da Engenharia Cartográfica. Boa parte dos esforços de pesquisa desse campo origina-se do Curso de Engenharia e de Ciência da Informação Espacial da Universidade do Maine (EUA);
Análise dos trabalhos realizados até o momento sobre o fen. em estudo (domínio do fen.);
Obs: depois do levantamento bibliográfico inicial, desenvolver um breve estado-da-arte sobre o tema, que deverá ser aprofundado com interpretações depois da revisão de literatura, antes da enunciação dos problemas específicos de pesquisa, i.e., realizar uma análise crítica sobre as diferentes concepções e perspectivas que se fizeram sobre o fenômeno em estudo.
Formulação do problema geral;
Formulação do objetivo geral;
Formulação da hipótese de pesquisa, que dará origem à hipótese alternativa, depois da revisão de literatura;
Citação das contribuições pretendidas (nos campos teórico e prático)
A justificativa advém da experiência acumulada em cerca de 15 anos no campo da Engenharia Cartográfica. É a concepção de Bertrand Russell de obtenção de conhecimento pela familiaridade (acquaintance), i.e., pelo contacto direto e imediato com as coisas sensíveis. Disso, ficaram evidenciadas dificuldades nos processos de comunicação homem-máquina que produzem efeitos adversos na produção de documentos cartográficos (mapas e cartas).
Segundo PRADO (2000), qto mais próximo do MR (ícone), aumenta a representatividade, pois a leitura está no processo cognitivo de significação (no pensamento individual - há muita ambigüidade; é o mundo “desnormalizado” da fala, tende para a polissemia). Cf. se caminha para o símbolo, passando pelo índice, diminui a representatividade; já se está no domínio mais normalizado da língua, i.e., um sistema, em que a leitura deve se dar sobre um conjunto de símbolos que se relacionam com a realidade por mecanismos lógicos (controla-se a ambigüidade - tende para a monossemia). É aqui, no mundo simbólico, que a definição denotativa ganha importância.
Msg dele: “Vc pode entender um mapa como uma frase. Ele descreve uma região de forma equivalente ao que um parágrafo descritivo o faria. Pode-se dizer que um mapa caracteriza um sintagma (*). Nesse sentido, o mapa é simbólico, por envolver codificações de escala, orientação, etc. Entretanto, o mapa é composto por elementos mais básicos de significação. Um mapa que “diz”: “Aqui existe uma casa” envolve os elementos “aqui” (posição, sistema de coords, para pequenas áreas pode ser suficientemente icônico, mas tb pode ter efeitos estilísticos de exagero ou simplificação na representação) e “casa” (objeto, que suscita maiores possibilidades de representação, parte que trata esta tese: uma foto da casa está mais perto do nível icônico, enqto um “x” do simbólico).
(*): frase < sintagma (und ling dotada de significação) < vocábulo < morfema < sílaba < fonema(und desprovida de significado)
A natural aflição com o óbice citado produziu o interesse pelo tema da Similaridade Semântica entre Classes de Entidades Espaciais, especialmente quando se deram os primeiros contactos com a bibliografia sobre o assunto, em meados da década de 90.
A proposição do problema de pesquisa sobre este assunto tem o intuito de contribuir com os esforços de pesquisa que vêm aprimorando a comunicação homem-máquina, com os conhecimentos que a Psicologia Cognitiva e a Inteligência Artificial vêm produzindo para a Engenharia Cartográfica num processo interdisciplinar muito intenso.
As questões foram muito influenciadas pelos excertos da tese de RODRÍGUEZ (2000) e pelos excertos das concitações a trabalhos futuros de MEDEIROS (1999), ambas guardando certo grau de semelhança em seus teores.
4.3. A inclusão do termo “base de dados” na formulação dos enunciados do problema, do objetivo e da hipótese de pesquisa precisa de maiores explicações.
Originalmente, nos enunciados dos tópicos acima, o verbo iterativo “representar” foi empregado em sua forma nominal do particípio [“representado(s)”], para se referir aos objetos espaciais, presumivelmente armazenados e organizados numa estrutura sistematizada de arquivos, como é o caso de uma base de dados.
Tal cenário, todavia, não se evidenciou, visto que, como será explicado, o custo da pesquisa tornar-se-ia proibitivo em termos materiais, tecnológicos e mesmo legais para sustentar o rigor do emprego do verbo representar na sua forma nominal do particípio (“objetos representados numa base de dados”).
Como ensina ALMEIDA (1994, p. 434), os verbos terminados em “do(a)” são formas nominais adjetivadas, que exprimem uma circunstância de tempo definida ou uma etapa de ação concluída (fim de um estado transitório).
Dessa forma, não seria coerente manter os enunciados desses tópicos com esta forma nominal do verbo “representar”. Os objetivos específicos da pesquisa ficariam comprometidos, já que não se trabalhou com dados estruturados em SGBDs.
Mas o mesmo ALMEIDA (1994, p. 393) forneceu uma solução morfológica para o óbice de um enunciado coerente. O autor também ensina que a classe de adjetivos terminada em ável indica aptidão, estado e possibilidade de praticar ou de receber uma ação, o que se ajusta perfeitamente ao adjetivo “representáveis”[1], que foi a forma escolhida para os enunciados dos tópicos em pauta. Esta forma traduz uma possibilidade e não um fato consumado de representação, o que é mais palpável e exeqüível diante dos meios disponíveis.
[1]: Em virtude dessa minúcia discutida, o vocábulo foi sempre realçado nesses enunciados.
No caso de SRI, i.e., em ambientes dinâmicos como os das redes mundiais, pode ser o caso de implementar agentes que selecionem as ontologias distribuídas pelo espaço www que mais se enquadrem à consulta de um usuário, indicando qual delas seria a mais adequada para responder à sua consulta.
Modus sciendi: processos de disciplinar o raciocínio, de organizar e ordenar idéias com o propósito de sistematizar a pesquisa da verdade (aquisição de conhecimento).
Dedução: mostra como uma conclusão deriva de verdades universais já conhecidas (resolutio formalis).
Indução: mostra como um a conclusão é tirada de experiência sensível (resolutio materialis).
Definir: limitar o conteúdo de um conceito.
Só se definem as classes; as espécies (instâncias), lato sensu, só podem ser descritas ou caracterizadas.
A pesq cient está mais interessada nas definições (base do entendimento). Def denotativa, referencial ou ostensiva (por ref. à coisa denotada pelo signo).
Conceitualização: visão do mundo; conjunto de regras informais que descrevem uma porção do MR; um sistema de conceitos (entidades, processos e atributos), suas definições e suas relações entre si.” (USCHOLD, 1996)
Uma conceitualização pode ser implícita (na mente dum indivíduo) ou embutida num certo software. Neste caso é explícita e, normalmente, no âmbito da IA, é chamada de ontologia.
(*): ponteiro (desvio) para outra formalização de classe de entidade.
Notação de Backus-Naur (BNF)
RELEVÂNCIA
Problemas de aprendizagem (IA)
{feições conceituais} armazenadas numa estrutura de RC predizer se um novo conceito introduzido se encaixa ou não na estrutura (JOHN, 1994)
REPRESENTAÇÃO
Propriedade de um evento ser similar aos congêneres da mesma categoria, que lhe são próximos;
representação = f( similaridade) (TVERSKY, 1977)
A mente é uma máquina abstrata que manipula símbolos; estes “tiram” seu sentido de uma correspondência que a mente (mundo interior) faz com as coisas do mundo exterior; a mente é um espelho da natureza e a razão da primeira espelha corretamente a lógica da segunda. (HENRIQUES, 2002)
Ontologia: conjunto de poucas regras gerais (primitivas), formalizadas por enunciados claros e concisos, que descreve uma certa realidade em termos de um conjunto de classes de objetos e de suas inter-relações (hierárquicas). Em S.I.s modernos, as ontologias “capturam” a semântica das fontes de dados e são a base da recuperação e da integração de informação. A estrutura de uma ontologia deve ser capaz de inferir questões (queries) de busca de informação (recuperação) semanticamente ricas, a ponto de propiciar a melhor conformação possível entre essas questões de busca e os dados contidos em BDs distribuídas. Além disso, a estrutura de uma ontologia deve manter uma base de conhecimentos compartilhada, num ambiente de S.I.s heterogêneos, permitindo o intercâmbio de objetos semanticamente similares (integração). Ontologias serão os “web crawlers” dos próximos anos.
A SS equivale a um critério de ordenação;
Com base na SS, indivíduos podem classificar objetos e fazer generalizações;
A SS pode ser quantificada por variáveis que estejam relacionadas com estímulos e respostas (reações) no processo de aprendizagem;
O conceito de SS pode complementar o modelo de memória semântica de Quillian e ajudar a desenvolver uma teoria sobre reconhecimento de padrões na IA;
A SS está normalmente associada à ordenação de pares de coisas, à busca (seleção) de coisas, ao estabelecimento de graus de semelhança entre associações, à determinação de uma escala de erros em tarefas de substituição e à correlação entre eventos;
Similaridade não é o mesmo que a formal relação de equivalência;
A relação de equivalência obedece a três princípios da Análise Linear:
Segundo KREIDER (1972, p.46), a relação de equivalência, muito comum em diversos ramos da Matemática, atende aos seguintes princípios: 1) Reflexividade: x ~ x, para todo x ε S; 2) Simetria: x ~ y => y ~ x; 3) Transitividade: x ~ y e y ~ z => x ~ z, sendo S um conjunto de pares ordenados (x,y) de elementos de S;
-TVERSKY (1973), adaptando o conceito matemático de equivalência para estudar do fenômeno da SS pelo enfoque geométrico, representou os termos por vetores num espaço euclidiano. Assim, a equivalência foi expressa pelos seguintes axiomas: 1) Minimidade: ; 2) Simetria: ; 3) Desigualdade triangular ou de Cauchy-Schwarz (LIPSCHUTZ, 1972):
- A similaridade, por sua natureza cognitiva, não atende a todos os princípios acima de maneira determinística, o que fez TVERSKY (1977) dar mais atenção ao modelo de feições distintivas (Teoria dos Conjuntos) do que ao da distância geométrica, cuja importância fora resgatada no trabalho de KRUMHANSL (1978);
- T. dos Atributos:<Filos e Lógica (G. Frege): “Um conceito pode ser caracterizado por um cj de atributos de definição” (intensão - cj de atributos q definem o que é nec para se ser um membro deste conceito - e extensão - cj de entidades-membros deste conceito). O significado dum conceito pode ser capturado por uma lista de atributos conjuntivos, que são unds atômicas dos conceitos. Todos os membros do conceito são igualmente representativos. Os conceitos devem distinguir objetos individuais em classes bem definidas. Um conceito específico tenderá a ter mais atributos comuns com o seu superordenado imediato do que com um mais distante.
Crítica: em vermelho acima, por Conrad (1977): “... Certos atributos são mencionados mais freq/ do que outros (mais salientes em termos de estimulação): “Um pardal é muito mais típico como pássaro do que como animal”. Daí, a T. do Protótipo ou da tipicidade.
O efeito de scj é de Lance J. RIPS.
Estímulo variável e estimúlo-padrão < Eleanor Rosch.
Teorias tradicionais do conceito: 1) Atributos de definição e de característica, 2) Protótipo:
- Categorias são organizadas em torno de protótipos centrais;
- O protótipo central é representado pelos atributos característicos que têm diferentes pesos e graus de importância dentro do conceito;
- Um objeto é considerado como sendo membro do conceito se os seus atributos se igualam aos atributos do protótipo, acima de qualquer limiar;
- Um objeto é membro duma categoria na razão direta de semelhança com os melhores exemplos do conceito que a categoria representa;
- Os conceitos têm uma estrutura de protótipos;