Este documento discute aprendizagem supervisionada e não supervisionada em inteligência artificial. Ele define os tipos de aprendizagem, como aprendizagem supervisionada, não supervisionada e por reforço. Também descreve representações de conhecimento como redes semânticas e abordagens declarativas e procedimentais.
5. 5
Quando nos deparamos com temas como este em causa “aprendizagem supervisionada e não supervisionada”,
surgem várias questões na nossa mente, uma delas pode ser o que é aprendizagem? Como o ser humano aprende?
Podem as máquinas aprenderem? Mas o que é realmente aprendizagem supervisionada? E o que significa
aprendizagem não supervisionada? Podemos passar todo o tempo ao longo deste trabalho fazendo perguntas,
contudo precisamos começar por entrar dentro deste assunto respondendo alguma delas.
Este trabalho não tem como foco o estudo sobre os processos de aprendizagem do ser humano, nosso objectivo é
estudar a aprendizagem supervisionada e não supervisionada na concepção da Inteligência Artificial. Porém há aqui
um aspecto importante que, sendo a “aprendizagem” um fenómeno “emprestado” das outras ciências, daremos uma
viagem breve a respeito, e daí pousaremos na colmeia da Inteligência Artificial devorando o tema o máximo que for
possível.
6. 6
DESENVOLVIMENTO
Como já se fez questão de salientar acima, este trabalho não tem como objectivo estudar o processo de
aprendizagem supervisionada e não supervisionada na concepção aplicada ao ser humano, o que se pretende aqui é
estudar este tema aplicado a IA. Contudo como é um fenómeno não primitivo da IA, entende-se que fazer uma
recursão ao conceito primitivo aplicado ao ser humano, seria uma forma sucinta de nos situarmos no tempo e espaço
a respeito do assunto.
APRENDIZAGEM NA CONCEPÇÃO HUMANA.
Aprendizagem é definida como o processo pelo qual as habilidades, conhecimentos, habilidades, comportamento,
valores e competências são adquiridas, modificados, como resultados de estudo, experiência, formação, raciocínio e
observação. Este processo de aprendizagem pode ser estudado segundo diversas perspectivas, de modo que isto faz
com que haja diversas teorias, algumas focando nas funções mentais humanas, algumas nas funções em animais e
outros ainda em sistemas artificiais. O estudo da aprendizagem utiliza os conhecimentos e teorias da
neuropsicologia, educação e pedagogia.
A aprendizagem do ponto vista humanista pode ser resumida segundo o esquema abaixo:
FIGURA 0.0701: PROCESSO DE APRENDIZAGEM NA CONCEPÇÃO HUMANISTA.
APRENDIZAGEM NA CONCEPÇÃO MÁQUINA
Em IA desde o princípio aprende-se um importante conceito que é o dos Agentes. Em IA um agente é qualquer
entidade que percebe o seu ambiente através de sensores e age sobre este meio através de atuadores.
FIGURA 0.0702: CONCEITO DE AGENTE EM IA.
TIPOS DE AGENTE
Quanto ao tipo os agentes reativos podem ser:
Agentes Reativos Simples
Agentes Reativos baseados em modelo
Agentes Cognitivos
7. 7
Agentes baseados em objectivos
Agentes baseados na Utilidade
Como podemos ver, não importa o tipo de agente todos eles possuem sensores e podem atuar sobre o meio que os
rodeia, por meio de sensores os agentes percebem e alguns podem aprender.
APRENDIZAGEM DE MÁQUINA
Em IA um agente estará aprendendo se melhorar o seu desempenho nas tarefas futuras de aprendizagem após fazer
observações sobre o mundo. Os algoritmos de aprendizado de máquina procuram padrões dentro de um conjunto de
dados. Muito se questiona sobre a necessidade de agentes para aprender, a razão pela qual ainda se envida esforço
para desenvolver agentes com a capacidade de aprender é que não possível antecipar todas as combinações
possíveis ou situações e também ninguém tem o poder de antecipar tudo no tempo ou seja projetar todas as
mudanças no tempo e por ultimo os projetistas (os seres humanos) não podem oferecer todas as soluções possíveis
o que implica que não podemos solucionar tudo agora imagine programar tudo.
REPRESENTAÇÃO DO CONHECIMENTO
Quando se trata de representar conhecimento existem duas abordagens tradicionais, a primeira é a Sistematização
da Lógica simbólica (Por John McCarthy) a outra abordagem é a baseada por “frames” que é na verdade uma
combinação de diversas ferramentas e conhecimentos que têm o objectivo de representar a complexidade das
actividades do cérebro humano.
As abordagens referidas acimas elas geralmente são denominadas por abordagem declarativa e abordagem
procedimental.
ABORDAGEM DECLARATIVA DO CONHECIMENTO
O principio mais importante é o do conhecimento declarativo, enunciado por McCarthy nos anos iniciais da
Inteligência Artificial. Este principio afirma que o conhecimento sobre factos e relações no mundo devem ser
codificados explicitamente em um programa inteligente, de modo que permita outros programas raciocinar sobre
este mesmo conhecimento.
VANTAGENS DA ABORDAGEM DECLARATIVA
Sob perspectiva computacional, existem várias vantagens desta abordagem onde inclui:
Cada facto só precisa ser armazenado uma única vez, independentemente das diversas formas que será
utilizada.
A facilidade em acrescentar novos factos no sistema, sem mudar outros factos e pequenos factos.
Uma maneira bem conhecida de representar este tipo de conhecimento é através das formulas de logicas de
predicado de primeira ordem.
Outra maneira de representar este tipo de conhecimento é em termos de “frames”, ou seja, em termos de estruturas
de dados nas quais todo o conhecimento em particular de um objeto ou evento é armazenado junto. Neste tipo de
conhecimento a organização do conhecimento pode ser bastante útil para modularidade e acesso ao conhecimento.
Uma terceira maneira de representar o conhecimento declarativo é através de redes semânticas, estas redes são
como frames no sentido em que o conhecimento é armazenado em função dos objetos que estão sendo descritos,
embora aqui os objetos sejam representados por nodos em um grafo e as relações por arcos rotulados.
ABORDAGEM PROCEDIMENTAL DO CONHECIMENTO
Para que se possa utilizar uma representação declarativa, é preciso estende-a com um programa que especifique o
que deve ser feito com o conhecimento e como faze-lo. A representação procedimental é aquela em que as
informações de controle necessárias ao uso do conhecimento estão embutidas no próprio conhecimento, ou seja, a
maior parte do conhecimento é representada como procedimentos para a sua utilização.
8. 8
Para representação procedimental, é preciso ampliá-lo com um interpretador que siga instruções fornecidas no
conhecimento. Pode-se dizer que a diferença entre as visões declarativas e procedimental do conhecimento está em
onde residem as informações de controle. O conhecimento procedimental reflecte um processo incremental, ou um
conjunto de passos, afim de dar conselhos, diagnosticar problemas, ou encontrar soluções. Este tipo de
conhecimento é usualmente representado em um conjunto de regras ou arvores de decisão.
VANTAGENS DA ABORDAGEM PROCEDIMENTALDO CONHECIMENTO
A facilidade de representar o conhecimento de como fazer as coisas
A facilidade em representar o conhecimento que não se enquadra dentro de muitos esquemas declarativos
simples, como por exemplo, raciocínio por omissão e raciocínio probabilístico.
A facilidade em representar o conhecimento heurística de como fazer eficientemente as coisas.
REDES SEMÂNTICAS
Semântica é o estudo do significado de conceitos utilizados em linguagem. É uma tentativa de descrever os
significados das palavras e as condições sob as quais eles podem interagir para serem compatíveis com outros
aspectos de uma linguagem.
Uma rede é um conjunto ou grafo de nodos conectados por ligações. Os nodos em uma rede semântica usualmente
representam os conceitos ou significados. Portanto, uma rede semântica é uma estrutura para a representação do
conhecimento definida como um padrão de nodos interligados por arcos rotulados. As redes deste tipo não só
captam as definições dos conceitos, mas também, inerentemente, proporcionam ligações com outros conceitos.
Uma variedade de redes semânticas tem sido desenvolvida como variações deste simples padrão.
CONSIDERAÇÕES COMUNS EM NOTAÇÕES SEMÂNTICAS
Nodos na rede representam conceitos de entidades, atributos, eventos e estados
Arcos na rede geralmente chamados de relações conceituais, representam relações mantidas entre os
conceitos. Os rótulos sobre arcos especificam os tipos de relações.
Algumas relações conceituais representam casos de linguística, como agente, paciente, recetor ou
instrumento. Outros, representam concetivos espaciais, temporais, casuais, lógicos. Ainda outros especificam
o papel de uma entidade com relação a outro, como por exemplo, mãe, propriedade, residência.
Só tipos de conceitos são organizados em uma hierarquia de acordo com os níveis de generalidade. Esta
hierarquia é frequentemente chamada de hierarquia de tipo ou hierarquia taxionômica.
Relações mantidas entre todos os conceitos de um determinado tipo são herdados através da hierarquia por
todos os seus subtipos. Por exemplo, se todo animal necessita de oxigénio para sobreviver, então esta
característica será herdada pelos carnívoros, felinos, gatos. etc.
APRENDIZAGEM
Depois de uma breve precursão sobre os conceitos importantes que podem furtivamente condicionar a
compreensão do que realmente é o assunto em carteira, agora vai se debruçar a respeito sobre a aprendizagem
propriamente dito.
APRENDIZAGEM AUTOMATICA E A METODOLOGIA CIENTIFICA
Deforma sucinta a ciência moderna se baseia tecnicamente em explicar os fenómenos e predizer os mesmos os
fenómenos. Este processo por sua vez se baseia no processo empírico que consiste em três aspectos fundamentais
que são:
Observação
Análise
9. 9
Teoria
Previsão
Cada elemento deste trio desempenha um papel importante no processo de aprendizagem. Vai se definir cada
elemento de modo a se ter uma compreensão fundamental do mesmo e do processo em si só.
Observação: este processo começa com um número de observações, uma espécie de recolha de informações
de dados
Análise: o processo de análise consiste em encontrar padrões no fenómeno de recolha de dados que é o de
Observação
Teoria: depois de uma serie de observações de análise de padrões, caso se encontre regularidades nos dados
lidos formula-se uma teoria ou hipótese de modo a se explicar a entrada de dados lidos.
Previsão: Depois de se elaborar uma determinada teoria as predições serão correctas se elas estiverem em
conformidades com os padrões observados, cados se faça formulação de novas teorias e que não estejam em
conformidades com as predições então estar-se-á perante uma previsão errónea.
TIPOS DE APRENDIZAGEM
Segundo a grade e de realimentação de dados.
Segundo o paradigma utilizado.
1-CLASSICAÇÃO DA APRENDIZAGEM SEGUNDO A GRADE DE REALIMENTAÇÃO
Supervisionado vs. não supervisionado
Conhecimento básico vs. conhecimento elaborado
Indutivo vs. dedutivo
Baseado em símbolos vs. baseadas conexões
2-CLASSIFICAÇÃO DA APRENDIZAGEM SEGUNDO A GRADE DE REALIMENTAÇÃO
Aprendizagem supervisionada
(função) classificação
Aprendizagem não supervisionado
Modelado
Aprendizagem por reforço
Feedback
Transdução
Classificação com novas categorias
Aprendizagem multitarefa
Permite interactuar com outros agentes
TIPOS DE APRENDIZAGEM SEGUNDO O PARADIGMA USADO
Aprendizagem indutivo
Aprendizagem analítico dedutivo
Aprendizagem analógico
10. 10
Aprendizagem genético
Aprendizagem conexionista
Agira que já estamos situados em termos tipos de aprendizagens e paradigmas vamos passar exclusivamente para a
aprendizagem supervisionada e não supervisionada.
APRENDIZAGEM EM MÁQUINAS NA CONCEPÇÃO PRÁTICA
Muitas vezes falamos de coisas que nos nem sequer temos uma noção real da coisa, o que faz com que tenhamos
uma noção totalmente obscura da coisa ou nem sequer saibamos o que pensamos que sabemos. Nestes parágrafos
as seguir daremos uma breve lista de onde é realmente usado a aprendizagem de máquinas.
Os usos de aprendizagem de máquinas abrangem desde jogos passando pela detenção fraudes até a análise
estatística da bolsa de valores. É utilizado para construir sistemas como Netflix e Spotify que recomendam mísicas
e/ou vídeos aos usuários com base no seu histórico de acesso, seus favoritos e outros dados, ou sistemas que
encontram todos os artigos de noticias similares em um determinado dia. Também pode ser usada para caracterizar
páginas de Web automaticamente conforme o gênero (esportes, economia, politica, bem-estar e dai em diante) ou
marcar mensagens de e-mail como spam. Os usos da aprendizagem de máquinas são mais numerosos do que se
possa abordar neste trabalho. Agora vai se concentrar esforços em dois dos vários tipos de aprendizagem
mencionados acima que são aprendizagem supervisionado e não supervisionado.
APRENDIZAGEM INDUTIVA
A indução é a inferência de conhecimento a partir dos dados. A aprendizagem indutiva é o processo de construção de
um modelo em que o ambiente é analisado, ou seja, a base de dados, na procura de tendências e padrões. Por
exemplo, objetos com características similares são agrupados em classes e formulados regras em que é possível
prever a classe dos objetos que venham a ser analisados futuramente. Há que ter em atenção que o ambiente é
dinâmico, logo o modelo deve ser adaptativo, isto é, deve ter a capacidade de aprender. A aprendizagem indutiva
pode ser realizada através de duas estratégias distintas: aprendizagem supervisionada e não supervisionada.
FIGURA 0.0703: APRENDIZAGEM INDUTIVA
APRENDIZAGEM SUPERVISIONADO VS NÃO SUPERVISIONADO
Só por questões de conceptualização vai -se definir novamente o conceito de aprendizagem máquina, vou apresentar
duas definições uma informal e outra formal.
Segundo Arthur Samuel aprendizagem máquina é o campo de estudos que da aos computadores a capacidade de
aprender, sem ser explicitamente programados. Esta é a definição informal.
Já Tom Mitchell fornece uma definição mais formal que é: “um programa de computador é dito para aprender com a
experiência e com a relação a alguma classe de tarefas T e medida de desempenho P, se o seu desempenho em
tarefas em T, medida pelo P, melhora com a experiência E”.
Imaginemos que temos um caso em que se joga a damas
11. 11
E = A experiência de jogar muitos jogos de damas.
T = A tarefa de jogar damas
P = A probabilidade de o programa irá ganhar o próximo jogo.
Esta definição é só para darmos uma visão mais situada da coisa, agora vamos directamente ao caso da
aprendizagem supervisionada para começar.
APRENDIZAGEM SUPERVISIONADA
Mas o que é aprendizagem supervisionada? Poderíamos por definir o que é, contudo optamos por lhe situar na
perspectiva: imagine que você tem em sua frente um conjunto de empresas, e a sua missão é classifica-las em
empresas saudáveis e não saudáveis, para fazer isto neste caso você tem uma amostra que associe cada empresa
saudável em uma série de variáveis. Então nestas condições um algoritmo de aprendizagem supervisionado tentaria
usar explicitamente essa informação para o futuro ser hábil para separar as empresas saudáveis e não-saudáveis.
Aprendizado Supervisionado é a técnica na qual o algoritmo de aprendizado (Indutor) recebe um conjunto de dados
(exemplo de treinamento) que definem aquilo que deverá ser buscado pelo algoritmo. Na aprendizagem
supervisionada é feita a partir de exemplos, em que o analista ajuda o sistema a construir o modelo, através da
definição das classes e dos exemplos em cada classe. O sistema tem que determinar a descrição para cada classe, ou
seja, o conjunto de propriedades comuns nos exemplos que lhe são fornecidos. Estando a descrição determinada, é
possível formular a regra de classificação que pode ser utilizada para prever a classe de um objecto que não tenha
sido considerado aquando da aprendizagem.
No aprendizado supervisionado, quando treinamos o algoritmo, utilizamos um conjunto de dados que já são
mapeados para categorias desejadas. Ao associarmos ao algoritmo, este deverá ter a capacidade de verificar o
resultado previsto e o resultado esperado e, conforme a diferença de resultados, ajustar seus parâmetros internos
até obter o resultado esperado.
No aprendizado supervisionado, cada exemplo de treinamento é descrito por um conjunto de atributos que servem
como dados de entrada (geralmente sob forma de vetores) que são associados a um valor de saída (também
chamado de sinal de controle). A partir de um conjunto de entradas e saídas, o algoritmo pode produzir uma função
de inferência capaz de gerar uma saída adequada a partir de uma nova entrada.
O aprendizado supervisionado é a técnica mais comum para treinamento de redes neurais e árvores de decisão. É a
principal técnica para o caso de classificação.
EXEMPLO DE USO DE APRENDIZADO SUPERVISIONADO
Detecção de spam baseados em um conjunto de comportamentos pré-determinados;
Classificação textos em categorias pré-definidas baseadas em palavras-chave e características comuns;
Reconhecimento de faces humanas de outros objectos.
REGRESSÃO E CLASSIFICAÇÃO
O objectivo da adoção de aprendizagem supervisionada é criar, através do algoritmo, um classificador que defina as
classes de novos exemplos.
PROBLEMA DE REGRESSÃO
O objectivo é gerar uma saída de dados em valores contínuos. Por exemplo, baseado em um conjunto de dados,
prever o índice da inflação para um determinado mês. Ou, baseado em um conjunto de dados, calcular a previsão de
produtos a serem vendidos durante um determinado período.
12. 12
PROBLEMA DE CLASSIFICAÇÃO
O objectivo é gerar saída de dados é dada em valores discretos. por exemplo, baseado em um conjunto de dados,
determinar se uma pessoa está com aids ou não. ou baseado na análise de um conjunto de e-mails, saber qual foi
invadido e qual não.
APRENDIZAGEM NÃO SUPERVISIONADA
Continuando com a linha de raciocínio do exemplo de empresa que usamos para abordar a aprendizagem
supervisionada, temos que a aprendizagem não supervisionada não supõe a classificação entre as empresas
saudáveis e não saudáveis em sua base de dados. Eles simplesmente tentariam separar as empresas em questão
usando as variáveis associadas as empresas e não necessariamente separariam as empresas em duas classes. Eles
normalmente associam o seu aprendizado a métricas que devem ser otimizadas. Outras formas de aprendizagem não
supervisionadas são baseadas no objectivo de representar um conjunto de dados através de um modelo de menor
dimensão desse conjunto de dados.
Aprendizagem não supervisionado é a técnica na qual o algoritmo de aprendizagem recebe dados sem classificação
(rótulos) e classifica estes dados de forma autônoma utilizando técnicas convenientes. É utilizado, especialmente,
quando se busca informações de um conjunto de dados sem saber preliminar do que tratam estas informações. É a
técnica recomendada para casos de mineração.
Podemos ainda definir a aprendizagem não supervisionada como a técnica efetuada com base em observação e
descoberta. Não são definidas classe, pelo que o sistema de Data Mining necessita de observar os exemplos e
reconhecer os padrões por si só próprio. Daqui resulta um conjunto de descrições de classe, uma para cada classe
descoberta no ambiente, isto é, na base de dados.
METODOS SUPORTADOS PELA APRENDIZAGEM NÃO SUPERVISIONADA
Clusterização
Associação
Análise de sequenciação
CLUSTERIZAÇÃO
A clusterização é um método de segmentação de dados que partilham tendências e padrões semelhantes. Este tipo
de estudo não tem uma variável dependente. Não se está a efectuar o perfil de uma peculiaridade especifica, à
semelhança do que acontece nos estudos de classificação, por isso, são considerados como aprendizagem não
supervisionada e/ou segmentação.
As técnicas de clusterização procuram semelhanças e diferenças num conjunto de dados e agrupam os registos
semelhantes em segmentos ou clusters, de uma forma automática, de acordo com algum critério ou métrica. Não
necessário definir os grupos nem atributos que devem utilizados para a segmentar o conjunto de dados.
Por exemplo um conjunto de dados pode conter vários clientes ricos sem filhos, e clientes com baixa renda com um
filho. Durante o processo de descoberta, esta diferença poderá ser utilizada para separar os dados em dois
segmentos. No caso de existirem mais semelhanças e diferenças e diferenças do género, o conjunto de dados pode
ser ainda mais subdividido.
ASSOCIAÇÃO
Visam solucionar problemas de análise de cesto de produtos, gerando modelos descritivos que permitem descobrir
regras do género: "Os consumidores que adquirem pizas têm uma probabilidade 3 vezes superior de adquirirem
também queijo, do que aqueles que não compram". Este tipo de abordagem manipula a compra de um conjunto de
produtos, como uma única transacção. O objectivo é o de encontrar tendências nas várias transações analisadas que
possam ser utilizadas para entender e explorar padrões de compra natural. Esta informação pode ser utilizada para
13. 13
ajustar stocks, modificar a disposição física dos produtos, ou lançar campanhas promocionais direccionadas. Ainda
que esta aproximação tenha a sua origem no comércio, pode ser igualmente aplicada a áreas onde se desenvolvam
campanhas de marketing direccionado, ou na determinação de práticas comuns. Por exemplo, no sector financeiro
podem ser utilizadas para identificar conjuntos de serviços que frequentemente sejam adquiridos em conjunto.
ANÁLISE DA SEQUENCIAÇÃO
Variante do problema de análise do cesto de produtos. Nesta situação, não interessa somente a análise da existência
conjunta de determinados itens nas transacções, mas também a ordem em que aparecem nas transacções e o
espaço de tempo entre estas. Permite efectuar previsões de aquisição de um item específico tendo por base um
conjunto anteriormente efectuado de compras.
APLICAÇÕES
Finanças: predição de ações, gerenciamento de risco e portfolio.
Telecomunicações: predição de tráfego
Datamining: fazer uso de grandes conjuntos de dados mantidos por grandes corporações.
Jogos: xadrez, gamão, etc.
Controle: robôs
E muito mais….
DIFERENÇA DA APRENDIZAGEM
SUPERVISIONADA
Sabendo o que se passou no passado, prever o que se segue.
Induzir uma regra dados exemplos.
NÃO SUPERVISIONADA
Dados vários padrões descobrir semelhanças entre eles, agrupa-los
Reduzir número de atributos considerados.
CONCLUSÃO
Viu-se ao longo do trabalho um esforço de tentar enquadrar o conceito de aprendizagem supervisionada e não
supervisionada em relação aos conceitos já estudados, de modo a facilitar a síntese da coisa em si mesmo.
14. 14
Com relação a aprendizagem supervisionada apresentou-se o conceito em si e verificou-se que os sistemas que
levam esta características modificam gradualmente seus parâmetros para ajustar a saída de modo a se aproximar da
saída desejada. Tecnicamente tem-se um conjunto de entradas e saídas para fazer o treinamento no sentido de
efectuar a classificação ou a regressão.
Já na aprendizagem não supervisionada o foco de interesse está em capturar una organização inerente aos dados,
perspetivando na concepção clustering, análise ou associação.
BIBLIOGRAFIA
Russell, Stuart; Norvig, Peter (2003 [1995]). Artificial Intelligence: A Modern Approach (em inglês) 2 ed. [S.l.]:
Prentice Hall.
15. 15
Simon, Phil (Marco, 18, 2013). Too Big to Ignore: The Business Case for Big Data. [S.l.]: Wiley. 89 páginas.
Kohavi, Ron; Provost, Foster (1998). Glossary of terms Machine Learning 30: 271–274
Machine Learning: What it is and why it matters (em inglês). SAS The Power to Know. Consultado em 10 de
outubro de 2016
M. Mitchell, Tom (1997). Machine Learning. [S.l.]: McGraw Hill. 2 páginas.