Introdução a Redes Neurais Recorrentes

•

1 gostou•737 visualizações

O documento discute Redes Neurais Recorrentes (RNNs), que processam sequências de dados ao incluir memória em sua arquitetura recorrente. RNNs são úteis para aplicações que lidam com contexto temporal e ordem de eventos. Embora RNNs clássicas enfrentem desafios como gradientes explodindo/desaparecendo, arquiteturas mais avançadas como LSTMs e GRUs resolveram esses problemas.

Tecnologia

Redes Neurais
Recorrentes
Marlesson Santana

Antes de falar de RNNs, uma rápida
revisão

Rede Neural Artificial Feedfoward
R$ 300.000,00
Características Reconhecimento
de padrões
Resultado
(valor do imóvel)

CNN para classificação de objetos em
imagens
Imagem Extração de Características Classe

Qual o problema com as RNAs e as
CNN?
“estamos sem ar ...“
“para respirar”
“Hoje fez muito calor, infelizmente estamos sem ar ...“
“condicionado”
“depois do futebol”
Qual a próxima
sentença?

Qual o problema com as RNAs e as
CNN?
Uma CNN
consegue
prever o
acidente com
apenas essa
imagem?

Qual o problema com as RNAs e as
CNN?
Em algumas aplicações, o contexto e a ordem dos eventos
são extremamente importantes.
TEMPO...

Análise de Série Temporal
Em uma série temporal, diferentes padrões de comportamento podem estar
associados aos dados no passado.

Processamento de Linguagem Natural
Reconhecimento da Fala
Geração de linguagem natural
Tradução (texto e fala)
Análise de Sentimento

Processamento de Imagem e Vídeo
Carros Autônomos
Legenda de Imagens
Descrição automatizada

Redes Neurais Recorrentes
É uma classe de redes neurais que inclui conceito de
memória ao ser executada de forma recorrente (loop).
Processa informações em sequência tanto na entrada
quanto na saída.

Maneiras de processar sequências
● RNA, CNN...

● Descrição de
Imagem
Maneiras de processar sequências

● Análise de
Sentimento
Maneiras de processar sequências

● Tradução
● Transcrição de
texto por voz
Maneiras de processar sequências

● Classificação de
vídeo (frame a
frame)
● Previsão de série
histórica
Maneiras de processar sequências

Funcionamento de uma RNN
“Eu cresci na França, sou fluente em [ ? ]”
Considere tentar prever a próxima palavra do texto:
cresci França
Francês

Existem problemas com as RNNs
Clássicas
Sofre bastante com o problema do Vanishing/Exploding gradient
● Algoritmo de treinamento Backpropagtion Thougth Time (BPTT)
Dificuldade em lidar com dependências de longo prazo
● “João e Maria estão namorando, a mãe de maria não gosta desse namoro, então joão terminou
com _____”
Dificuldade em lidar com ruídos
● “Eu gostei do filme, a viúva negra é minha personagem favorita, estou ansioso para assistir a
continuação”

Mas são problemas já solucionados...
Arquiteturas de RNNs mais complexas que resolvem os problemas
apresentados nas clássicas
LSTM - Long Short Term Memory GRU - Gated Recurrent Unit
Esquecer é bom...

Implementando no Keras
https://keras.io/layers/recurrent/

Mais conteúdo relacionado

Mais procurados

Introdução à Criação De Páginas Web Aula1marioreis

Banco de Dados II: Conversão do Modelo Conceitual para o Modelo Lógico (aula 6)Gustavo Zimmermann

Banco de Dados I Aula 06 - Generalização e EspecializaçãoLeinylson Fontinele

Quero ser analista de requisitos ou negócios. Por onde eu começo? Venícios Gustavo

Modelagem relacional e normalização de dadosjulianaveregue

Banco de Dados - Introdução - Projeto de Banco de Dados - DERRangel Javier

Banco de Dados Não Relacionais vs Banco de Dados Relacionaisalexculpado

01 banco de dados-basicoAmadeo Santos

Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)Leinylson Fontinele

Banco de Dados I Aula 02 - Introdução aos Bancos de DadosLeinylson Fontinele

Aula1 e aula2 - Analise e Projeto de SistemasGustavo Gonzalez

03 mer2Fabiano Sales

Aula javascriptGabriel Moura

Prototipagem e MVP para startupsJennifer Payne

Timeline Evolução do Banco de DadosMarylly Silva

Metodologias de Desenvolvimento de SoftwareÁlvaro Farias Pinheiro

Tutorial - Criando Banco com MySQL WorkbenchDaniel Brandão

Mer - Modelo Entidade RelacionamentoRademaker Siena

Sistemas de Informação - Aula05 - cap5 bd e business intelligenceCEULJI/ULBRA Centro Universitário Luterano de Ji-Paraná

Extreme Programming (XP) Metodologia ÁgilJaffer Veronezi

Mais procurados (20)

Introdução à Criação De Páginas Web Aula1

Banco de Dados II: Conversão do Modelo Conceitual para o Modelo Lógico (aula 6)

Banco de Dados I Aula 06 - Generalização e Especialização

Quero ser analista de requisitos ou negócios. Por onde eu começo?

Modelagem relacional e normalização de dados

Banco de Dados - Introdução - Projeto de Banco de Dados - DER

Banco de Dados Não Relacionais vs Banco de Dados Relacionais

01 banco de dados-basico

Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)

Banco de Dados I Aula 02 - Introdução aos Bancos de Dados

Aula1 e aula2 - Analise e Projeto de Sistemas

03 mer2

Aula javascript

Prototipagem e MVP para startups

Timeline Evolução do Banco de Dados

Metodologias de Desenvolvimento de Software

Tutorial - Criando Banco com MySQL Workbench

Mer - Modelo Entidade Relacionamento

Sistemas de Informação - Aula05 - cap5 bd e business intelligence

Extreme Programming (XP) Metodologia Ágil

Mais de Marlesson Santana

UFG - Topic Modeling in TextMarlesson Santana

Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana

Data science com python - frameworks e melhores práticasMarlesson Santana

Sistemas de Recomendação - O que são? Como funcionam? Do que se alimentam?Marlesson Santana

Campus Party - Sistemas de RecomendaçãoMarlesson Santana

Machine Learning: Do Notebook ao modelo em produçãoMarlesson Santana

Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana

Deep Learning para Sistemas de RecomendaçãoMarlesson Santana

Training deep auto encoders for collaborative filteringMarlesson Santana

DDC - workshop deep learningMarlesson Santana

Mineração de Dados em Redes SociaisMarlesson Santana

Mais de Marlesson Santana (11)

UFG - Topic Modeling in Text

Ciência de Dados: a revolução na tomada de decisões

Data science com python - frameworks e melhores práticas

Sistemas de Recomendação - O que são? Como funcionam? Do que se alimentam?

Campus Party - Sistemas de Recomendação

Machine Learning: Do Notebook ao modelo em produção

Ciência de Dados: a revolução na tomada de decisões

Deep Learning para Sistemas de Recomendação

Training deep auto encoders for collaborative filtering

DDC - workshop deep learning

Mineração de Dados em Redes Sociais

Introdução a Redes Neurais Recorrentes

1. Redes Neurais Recorrentes Marlesson Santana

2. Antes de falar de RNNs, uma rápida revisão

3. Rede Neural Artificial Feedfoward R$ 300.000,00 Características Reconhecimento de padrões Resultado (valor do imóvel)

4. CNN para classificação de objetos em imagens Imagem Extração de Características Classe

5. Qual o problema com as RNAs e as CNN? “estamos sem ar ...“ “para respirar” “Hoje fez muito calor, infelizmente estamos sem ar ...“ “condicionado” “depois do futebol” Qual a próxima sentença?

6. Qual o problema com as RNAs e as CNN?

7. Qual o problema com as RNAs e as CNN? Uma CNN consegue prever o acidente com apenas essa imagem?

8. Qual o problema com as RNAs e as CNN? Em algumas aplicações, o contexto e a ordem dos eventos são extremamente importantes. TEMPO...

9. Análise de Série Temporal Em uma série temporal, diferentes padrões de comportamento podem estar associados aos dados no passado.

10. Processamento de Linguagem Natural Reconhecimento da Fala Geração de linguagem natural Tradução (texto e fala) Análise de Sentimento

11. Processamento de Imagem e Vídeo Carros Autônomos Legenda de Imagens Descrição automatizada

12. Redes Neurais Recorrentes É uma classe de redes neurais que inclui conceito de memória ao ser executada de forma recorrente (loop). Processa informações em sequência tanto na entrada quanto na saída.

13. Arquitetura de uma RNN RNA RNN

14. Maneiras de processar sequências ● RNA, CNN...

15. ● Descrição de Imagem Maneiras de processar sequências

16. ● Análise de Sentimento Maneiras de processar sequências

17. ● Tradução ● Transcrição de texto por voz Maneiras de processar sequências

18. ● Classificação de vídeo (frame a frame) ● Previsão de série histórica Maneiras de processar sequências

19. Arquitetura de uma RNN Clássica

20. Funcionamento de uma RNN “Eu cresci na França, sou fluente em [ ? ]” Considere tentar prever a próxima palavra do texto: cresci França Francês

21. Existem problemas com as RNNs Clássicas Sofre bastante com o problema do Vanishing/Exploding gradient ● Algoritmo de treinamento Backpropagtion Thougth Time (BPTT) Dificuldade em lidar com dependências de longo prazo ● “João e Maria estão namorando, a mãe de maria não gosta desse namoro, então joão terminou com _____” Dificuldade em lidar com ruídos ● “Eu gostei do filme, a viúva negra é minha personagem favorita, estou ansioso para assistir a continuação”

22. Mas são problemas já solucionados... Arquiteturas de RNNs mais complexas que resolvem os problemas apresentados nas clássicas LSTM - Long Short Term Memory GRU - Gated Recurrent Unit Esquecer é bom...

23. Implementando no Keras https://keras.io/layers/recurrent/

24. Hands on!

Introdução a Redes Neurais Recorrentes

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Mais de Marlesson Santana

Mais de Marlesson Santana (11)

Introdução a Redes Neurais Recorrentes