O documento discute vários tópicos de aprendizagem de máquina, incluindo classificadores Naive Bayes, reforço de aprendizagem Q(λ), neuroevolução com NEAT e HyperNEAT. É apresentado um resumo dos resultados de um classificador Naive Bayes para detecção de spam em comentários de blog, bem como experimentos com agentes aprendendo em ambientes 2D usando Q(λ)-learning e evolução de redes neurais com NEAT.
softmax (com tau = 0.1), variando entre 5 valores de lambda (0,0.2,0.5,0.8,1)
softmax com decaimento automático de tau, cuja agenda seguiu a seguinte fórmula: 100000/t2, onde t é o número do episódio de 1 a 1000. Permitindo muita exploração no começo (tau = 100000) e uma política mais gulosa ao final (tau = 0.1), o algoritmo conseguiu chegar à solução ótima com lambda = 1
Mesmo resultado dos slides de aula, também com apenas 1 erro em relação ao processo gerador. O algoritmo chega consistentemente, com algo em torno de 5 a 14 iterações, ao mesmo resultado para os centróides, mesmo com pequenas variações na matriz de pertinências (aparentemente diferenças em um ponto são compensadas em outros pontos). O critério de parada foi |U(t) - U(t-1)| < epsilon, com epsilon = 0.1 e um limite de 20 iterações. O expoente utilizado foi m = 2.
Disable
Marcadores de histórico, número de inovação, disjuntos e excesso.
Double-Pole Balancing Derivada das diferenças de ângulo Recorrente http://www.cs.utexas.edu/users/kstanley/regression.avi http://www.cs.utexas.edu/users/kstanley/movies/peonsmaster6.avi