O slideshow foi denunciado.
Seu SlideShare está sendo baixado. ×

Duolingo.pptx

Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio

Confira estes a seguir

1 de 8 Anúncio

Mais Conteúdo rRelacionado

Mais de syou6162 (20)

Anúncio

Mais recentes (20)

Duolingo.pptx

  1. 1. A Trainable Spaced Repe00on Model for Language Learning •  Duolingoの社員がACLという国際会議で発表した論文 –  h:p://www.aclweb.org/anthology/P/P16/P16-1174.pdf •  ユーザーが単語を学習するときに、その単語を次に 出すタイミングはいつがいいか –  計量心理学の分野(忘却曲線) •  Duolingoでユーザーが学習した結果を元に機械学習 (回帰問題)を使うと、忘却曲線の半減期を正しく推定 •  ユーザーがさらにサービスを活用してくれるように •  データとコード公開 –  h:ps://github.com/duolingo/halflife-regression
  2. 2. Duolingoについて •  2012年に立ち上げ。150万ユーザーが使ってい る語学サイト •  21言語のコースがあって、80以上の言語が現在 開発中 •  ユーザーに合わせて動的にレッスンが生成され る –  h:p://www.lifehacker.jp/ 2015/08/150809duolingo_hideki_shima.html –  h:p://www.lifehacker.jp/ 2015/08/150825duolingo_hagiwara1.html
  3. 3. スクリーンショット
  4. 4. 既存手法:ライトナーシステム •  h:ps://ja.wikipedia.org/wiki/ライトナーシステ ム •  1回正解したら次に提示するのは2日後、2回 連続なら4日後、...、4回連続なら`2^4`=16日 後にその単語を提示 図は論文より 引用
  5. 5. 提案手法 •  忘却曲線をベースに、ユーザーが単語を覚えている 確率を回帰で予測する問題に定式化 •  指数の方の部分を線形なモデルで表現 •  パラメータはclosed-formで求められないので、 AdaGradを使ってitera0veに最適化 p: 単語を覚えている確率。実際にはセッショ ン中に単語を正しく覚えていた割合を使う Δ: 前回学習時からの時間 h: ユーザーの長期記憶に対する強度 x: 特徴量ベクトル Θ: パラメータベクトル l: 損失関数 λ: 正則化パラメータ
  6. 6. 特徴量 •  Interac0on features – ユーザーがその単語を何回見たか、何回正解し たか、間違ったか •  Lexeme tag features – 品詞や時制、三単元のSなどをsparseな特徴量と して表現 – マイナーな言語(現在21言語あるらしい)でもでき るようになっているのは言語マニアな社員がたく さんいるからか...
  7. 7. 図は論文より 引用
  8. 8. 結果 •  6週間、100万ユーザーで比較実験 •  Any(crowdsourced transla0ons, online forum discussionsを含む)とLessonが増えて、Prac0ce が減った 図は論文より 引用

×