1. Trabalho desenvolvido por:
Maria Rebelo, aluna 48817
Mestrado em MQDEE – 1º semestre
Prof. Carlos Costa
Ano letivo 2019 - 2020
REDES NEURONAIS
Gestão de Dados
2. O que é uma RNA?
1943: início do estudo da rede neuronal (artificial), com o desenvolvimento do primeiro modelo matemático neurónio
artificial realizada por Warren McCulloch, neurologista, e Walter Pitts, matemático. Foi criado um modelo matemático
computorizado de processamento de informação, inspirado no funcionamento do sistema nervoso biológico.
A rede neuronal constitui uma ferramenta de data mining, uma vez que através da combinação da abordagem neuronal
artificial com a abordagem algorítmica digital, permite extrair e filtrar Big Data, reconhecer padrões e fornecer informação
precisa.
“A neural network is a massively parallel distributed processor made up of simple processing units that has a natural
propensity for storing experiential knowledge and making it available for use. It resembles the brain in two respects:
1. Knowledge is acquired by the network from its environment through a learning process.
2. Interneuron connection strengths, known as synaptic weights, are used to store the acquired knowledge.”
( Haykin, Simon, Neural Networks and Learning Machines)
3. Estrutura de um neurónio
Por analogia ao biológico…
Entrada de atributos/ dados externos - inputs (xj) – encontram-
se associados a uma respetiva capacidade de armazenamento do
dado – pesos sinápticos (wkj).
2
O hard limiter input, ou induced local field (𝒗 𝒌), corresponde ao
somatório entre a combinação linear entre os inputs e os
respetivos pesos sinápticos e enviesamento (bk).
𝒗 𝒌 = 𝒖 𝒌 + 𝒃 𝒌 =
𝒋=𝟎
𝒌
𝒘 𝒌𝒋 ∗ 𝒙𝒋
3
Segue-se o cálculo da função ativação (ϕ(.)) que introduz a
abordagens não linear. O modelo de função mais comum é o
Sigmoid Function dada por:
𝜙 (𝑣) =
1
(1 + 𝑒−𝑎𝑣)
, em que 𝑎 corresponde ao parâmetro de inclinação da função
1
terminais pós-
sinápticos pré-sinápticos
Nodo
4. Estrutura de um neurónio
Por analogia ao biológico…
Um nodo ou nós é a principal unidade de processamento para
o funcionamento da rede, na qual é efetuada a computação de
um determinado output, com base na função ativação, sempre
que se atribui inputs.
5
O output proveniente do neurónio k (𝒚 𝒌 ) é dado por:
𝒚 𝒌 = 𝝓(𝒖 𝒌 + 𝒃 𝒌) = 𝝓(𝒗 𝒌)
6
Ora, uma RNA é composto pela interligação orientada de várias
unidades de processamento simples, os nodos, distribuídas
paralelamente, pelas diferentes camadas.
4
terminais pós-
sinápticos pré-sinápticos
Nodo
5. Estrutura de uma RNA
• A camada de entrada - input layer - é constituída por todos
os nodos de entrada que recebem diretamente os
dados/atributos do mundo real, transmitindo-a para os
nodos ocultos.
• Os nodos das camadas ocultos - hidden layer – se existir:
cada neurónio recebe um sinal/estimulo proveniente da
camada anterior, executa o cálculo e transfere a informação
para a camada seguinte. Destina-se a detetar atributos
específicos de cada observação.
• A camada de saída - output layer - agrupa todos os nodos,
que posteriormente à execução do calcula da função ativação,
transferem a informação obtida para o exterior,
nomeadamente para processadores secundários.
6. Arquitetura
Agrupam-se em duas grandes tipologias, de acordo com o tipo de fluxo e organização de informação:
Feedfoward - O fluxo de informação segue um único sentido: dos nodos de
entrada, pelos nodos oculto, caso existam, para os nodos de saída, sem ciclos ou
loops na rede. Exigem “competition”, um nodo inibe a utilização de um outro nodo da
mesma camada.
• Redes Feedfoward de uma Só Camada (RFSC), constituída apenas pela camada de
entrada e camada de saída. Os nodos de entrada não são contabilizados, uma vez que
não constituem nodos computacionais.
• Redes Feedforward de Camadas Múltiplas (RFMC) incluem redes com um único
sentido e detentora de uma ou mais camadas.
Recorrente ou Feedback - o fluxo de informação bidirecional, a informação obtida nos
nodos posteriores pode retomar/realimentar aos nodos das camadas anteriores ou
camadas laterais/paralelas.
7. Processo de aprendizagem
O processo de aprendizagem compreende um conjunto de treinos e um teste ou validação. Com este processo, os pesos sinápticos são ajustados de forma iterativa, até que se
verifique a minimização do erro cometido, dado pela diferença entre o output gerado pela rede e o output desejado. A fim de minimizar o erro, é necessário treinar a rede através
de um algoritmo, descent gradient usualmente, reajustando os pesos sinápticos dos vários nodos e camadas anteriores. Assim como o sistema neuronal humano, também as redes
neurais artificiais aprendem com o próprio meio (ambiente circundante).
. Ambiente
Supervisor
Erro
Aprendizagem Supervisionado – quando fornecidos à priori o padrão de
correspondência entre os inputs e o output desejado.
Aprendizagem não supervisionada ou self-organized - quando são
fornecidos os inputs, mas desconhecem-se os outputs desejados. O próprio
sistema deverá auto-organizar-se e adaptar-se ao ambiente, a fim de
descodificar o padrão da rede.
REDE
NEURONAL
Ambiente
Erro
REDE
NEURONAL
emaprendizagemporesforço