SlideShare uma empresa Scribd logo

Reinforcement Learning | Um pequeno panorama do Aprendizado por Reforço

Italo Lelis de Carvalho
Italo Lelis de Carvalho
Italo Lelis de CarvalhoArtificial Inteligence and Software Developer, Student at UFMG em Universidade Federal de Minas Gerais

Reinforcement Learning (Aprendizado por Reforço) é um importante método de Machine Learning (Aprendizado de Máquina) na qual um agente aprende a se comportar interagindo com um ambiente e analisando os resultados obtidos. Serão apresentadas algumas técnicas de Reinforcement Learning (com ênfase no Q-Learning) e a sua aplicação em alguns cenários simples.

Reinforcement Learning | Um pequeno panorama do Aprendizado por Reforço

1 de 35
Baixar para ler offline
Reinforcement Learning
Introdução ao Aprendizado por Reforço
Italo Lelis de Carvalho | @italohdc | hello@italolelis.com
. . .
Aprendizado
Supervisionado
Aprendizado
Não-Supervisionado
Aprendizado
por Reforço
> Aprendizado
Supervisionado
> Aprendizado
Não-Supervisionado
> Aprendizado por Reforço
A
AB
B
Treinamento Classificação
A
B
Identificação
B
A
A
B
Aprendizado
Supervisionado
Classificação
Regressão
a saída é uma categoria ( A, B, C... )
a saída é um valor real ( dólar, peso... )
> Aprendizado
Supervisionado
> Aprendizado
Não-Supervisionado
> Aprendizado por Reforço
Maçã
Treinamento Classificação
Maçã
Laranja
Identificação
Aprendizado
Supervisionado
Maçã
Laranja
Laranja
Laranja
Laranja
Maçã
Maçã
> Aprendizado
Supervisionado
> Aprendizado
Não-Supervisionado
> Aprendizado por Reforço
> Aprendizado
Supervisionado
> Aprendizado
Não-Supervisionado
> Aprendizado por Reforço
YOLO 2.0 Open source real-time image recognition

Recomendados

Aprendizagem por reforço
Aprendizagem por reforçoAprendizagem por reforço
Aprendizagem por reforçoLuís Nunes
 
Requisitos Sistemas E-Commerce
Requisitos Sistemas E-CommerceRequisitos Sistemas E-Commerce
Requisitos Sistemas E-CommerceOtaviano Silvério
 
Introdução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaIntrodução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaFernando Palma
 
101545233 exercicios-resolvidos-de-sinais-e-sistemas
101545233 exercicios-resolvidos-de-sinais-e-sistemas101545233 exercicios-resolvidos-de-sinais-e-sistemas
101545233 exercicios-resolvidos-de-sinais-e-sistemasHenrique Farias
 
Treinamento Testes Unitários - parte 1
Treinamento Testes Unitários - parte 1Treinamento Testes Unitários - parte 1
Treinamento Testes Unitários - parte 1Diego Pacheco
 
06 elet pot-convac-dc-trifasicos-contr
06 elet pot-convac-dc-trifasicos-contr06 elet pot-convac-dc-trifasicos-contr
06 elet pot-convac-dc-trifasicos-contrRicardo Godoy
 

Mais conteúdo relacionado

Mais procurados

Apostila Java Web (Servlets e JSPs)
Apostila Java Web (Servlets e JSPs)Apostila Java Web (Servlets e JSPs)
Apostila Java Web (Servlets e JSPs)Ricardo Terra
 
Modelagem e Simulação de Sistemas Produtivos
Modelagem e Simulação de Sistemas ProdutivosModelagem e Simulação de Sistemas Produtivos
Modelagem e Simulação de Sistemas ProdutivosAdeildo Telles
 
Apresentação dos comandos básicos do Scratch
Apresentação dos comandos básicos do ScratchApresentação dos comandos básicos do Scratch
Apresentação dos comandos básicos do ScratchCecifm
 
Conceitos base de programação - parte 2
Conceitos base de programação - parte 2Conceitos base de programação - parte 2
Conceitos base de programação - parte 2João Piedade
 
Tipos de movimento e aceleração
Tipos de movimento e aceleraçãoTipos de movimento e aceleração
Tipos de movimento e aceleraçãoPiedade Alves
 
Lista de exercicios algoritmos resolvida-
Lista de exercicios   algoritmos  resolvida-Lista de exercicios   algoritmos  resolvida-
Lista de exercicios algoritmos resolvida-Mauro Pereira
 
Análise de sinais e sistemas
Análise de sinais e sistemasAnálise de sinais e sistemas
Análise de sinais e sistemasReggae Strong
 
Apostila sobre Controle Digital
Apostila sobre Controle DigitalApostila sobre Controle Digital
Apostila sobre Controle DigitalFernando Passold
 
3 - Modelo Entidade Relacionamento
3 - Modelo Entidade Relacionamento3 - Modelo Entidade Relacionamento
3 - Modelo Entidade RelacionamentoCris Fidelix
 
Criação de formulários e tabelas com HTML
Criação de formulários e tabelas com HTMLCriação de formulários e tabelas com HTML
Criação de formulários e tabelas com HTMLLeonardo Soares
 
Dimensionamento de um sistema fotovoltaico de autoconsumo
Dimensionamento de um sistema fotovoltaico de autoconsumoDimensionamento de um sistema fotovoltaico de autoconsumo
Dimensionamento de um sistema fotovoltaico de autoconsumowhitspirit
 
Java orientação a objetos (associacao, composicao, agregacao)
Java   orientação a objetos (associacao, composicao, agregacao)Java   orientação a objetos (associacao, composicao, agregacao)
Java orientação a objetos (associacao, composicao, agregacao)Armando Daniel
 
Análise essencial
Análise essencialAnálise essencial
Análise essencialTiago Serra
 
Stored Procedures and Triggers
Stored Procedures and TriggersStored Procedures and Triggers
Stored Procedures and Triggersflaviognm
 
4 aula 9 - 4 procura e oferta (meu)
4   aula 9 - 4 procura e oferta (meu)4   aula 9 - 4 procura e oferta (meu)
4 aula 9 - 4 procura e oferta (meu)Jenny Fortes
 
Apostila algebra de boole e mapas de karnaugh com exercicios resolvidos
Apostila algebra de boole e mapas de karnaugh com exercicios resolvidosApostila algebra de boole e mapas de karnaugh com exercicios resolvidos
Apostila algebra de boole e mapas de karnaugh com exercicios resolvidosJean Fabrício Miranda
 

Mais procurados (20)

Sql comandos agregacao
Sql comandos agregacaoSql comandos agregacao
Sql comandos agregacao
 
Apostila Java Web (Servlets e JSPs)
Apostila Java Web (Servlets e JSPs)Apostila Java Web (Servlets e JSPs)
Apostila Java Web (Servlets e JSPs)
 
Exemplo de Plano de testes
Exemplo de Plano de testes Exemplo de Plano de testes
Exemplo de Plano de testes
 
Modelagem e Simulação de Sistemas Produtivos
Modelagem e Simulação de Sistemas ProdutivosModelagem e Simulação de Sistemas Produtivos
Modelagem e Simulação de Sistemas Produtivos
 
Apresentação dos comandos básicos do Scratch
Apresentação dos comandos básicos do ScratchApresentação dos comandos básicos do Scratch
Apresentação dos comandos básicos do Scratch
 
Conceitos base de programação - parte 2
Conceitos base de programação - parte 2Conceitos base de programação - parte 2
Conceitos base de programação - parte 2
 
Classes e Estrutura de Dados
Classes e Estrutura de DadosClasses e Estrutura de Dados
Classes e Estrutura de Dados
 
Tipos de movimento e aceleração
Tipos de movimento e aceleraçãoTipos de movimento e aceleração
Tipos de movimento e aceleração
 
Lista de exercicios algoritmos resolvida-
Lista de exercicios   algoritmos  resolvida-Lista de exercicios   algoritmos  resolvida-
Lista de exercicios algoritmos resolvida-
 
Análise de sinais e sistemas
Análise de sinais e sistemasAnálise de sinais e sistemas
Análise de sinais e sistemas
 
Apostila sobre Controle Digital
Apostila sobre Controle DigitalApostila sobre Controle Digital
Apostila sobre Controle Digital
 
3 - Modelo Entidade Relacionamento
3 - Modelo Entidade Relacionamento3 - Modelo Entidade Relacionamento
3 - Modelo Entidade Relacionamento
 
Criação de formulários e tabelas com HTML
Criação de formulários e tabelas com HTMLCriação de formulários e tabelas com HTML
Criação de formulários e tabelas com HTML
 
Introdução ao SQL
Introdução ao SQLIntrodução ao SQL
Introdução ao SQL
 
Dimensionamento de um sistema fotovoltaico de autoconsumo
Dimensionamento de um sistema fotovoltaico de autoconsumoDimensionamento de um sistema fotovoltaico de autoconsumo
Dimensionamento de um sistema fotovoltaico de autoconsumo
 
Java orientação a objetos (associacao, composicao, agregacao)
Java   orientação a objetos (associacao, composicao, agregacao)Java   orientação a objetos (associacao, composicao, agregacao)
Java orientação a objetos (associacao, composicao, agregacao)
 
Análise essencial
Análise essencialAnálise essencial
Análise essencial
 
Stored Procedures and Triggers
Stored Procedures and TriggersStored Procedures and Triggers
Stored Procedures and Triggers
 
4 aula 9 - 4 procura e oferta (meu)
4   aula 9 - 4 procura e oferta (meu)4   aula 9 - 4 procura e oferta (meu)
4 aula 9 - 4 procura e oferta (meu)
 
Apostila algebra de boole e mapas de karnaugh com exercicios resolvidos
Apostila algebra de boole e mapas de karnaugh com exercicios resolvidosApostila algebra de boole e mapas de karnaugh com exercicios resolvidos
Apostila algebra de boole e mapas de karnaugh com exercicios resolvidos
 

Reinforcement Learning | Um pequeno panorama do Aprendizado por Reforço