Enviar pesquisa
Carregar
ジャストシステムの形態素解析技術 その2 機械学習編
•
Transferir como PPTX, PDF
•
38 gostaram
•
11,726 visualizações
JustSystems Corporation
Seguir
ジャストシステムの形態素解析技術 その2 機械学習編
Leia menos
Leia mais
Engenharia
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 35
Baixar agora
Recomendados
形態素解析器 売ってみた
形態素解析器 売ってみた
JustSystems Corporation
ジャストシステムの形態素解析技術
ジャストシステムの形態素解析技術
JustSystems Corporation
形態素解析の実装言語Talk パネルディスカッション
形態素解析の実装言語Talk パネルディスカッション
JustSystems Corporation
JMAT Groonga Tokenizer Talks
JMAT Groonga Tokenizer Talks
JustSystems Corporation
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
Yuya Unno
開発者からみたTensor flow
開発者からみたTensor flow
Hideo Kinami
Development and Experiment of Deep Learning with Caffe and maf
Development and Experiment of Deep Learning with Caffe and maf
Kenta Oono
深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴
Yuya Unno
Recomendados
形態素解析器 売ってみた
形態素解析器 売ってみた
JustSystems Corporation
ジャストシステムの形態素解析技術
ジャストシステムの形態素解析技術
JustSystems Corporation
形態素解析の実装言語Talk パネルディスカッション
形態素解析の実装言語Talk パネルディスカッション
JustSystems Corporation
JMAT Groonga Tokenizer Talks
JMAT Groonga Tokenizer Talks
JustSystems Corporation
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
Yuya Unno
開発者からみたTensor flow
開発者からみたTensor flow
Hideo Kinami
Development and Experiment of Deep Learning with Caffe and maf
Development and Experiment of Deep Learning with Caffe and maf
Kenta Oono
深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴
Yuya Unno
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
Yuya Unno
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCT
Yuya Unno
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
Yuya Unno
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤
Shohei Hido
Jubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組み
JubatusOfficial
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
Toshinori Sato
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
株式会社メタップスホールディングス
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Yuya Unno
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Yuya Unno
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
Yuki Arase
Japan.r ver1.2 20171202_ota
Japan.r ver1.2 20171202_ota
博三 太田
Randomforestで高次元の変数重要度を見る #japanr LT
Randomforestで高次元の変数重要度を見る #japanr LT
Akifumi Eguchi
Pycon jp2017 20170908_ota
Pycon jp2017 20170908_ota
博三 太田
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
株式会社メタップスホールディングス
協調フィルタリング with Mahout
協調フィルタリング with Mahout
Katsuhiro Takata
予測型戦略を知るための機械学習チュートリアル
予測型戦略を知るための機械学習チュートリアル
Yuya Unno
機械学習
機械学習
Hikaru Takemura
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
ArrayListをじっくり読んでみた - JavaコアSDKを読む会を社内でやって気づいたこと -
ArrayListをじっくり読んでみた - JavaコアSDKを読む会を社内でやって気づいたこと -
JustSystems Corporation
メンバーのスキルアップ、どうしてる? − Java 100本ノックで新加入メンバーを鍛えてみた −
メンバーのスキルアップ、どうしてる? − Java 100本ノックで新加入メンバーを鍛えてみた −
JustSystems Corporation
ジャストシステムJava100本ノックのご紹介
ジャストシステムJava100本ノックのご紹介
JustSystems Corporation
ピタジョブの裏側 - クローラ・スクレイパ編 -
ピタジョブの裏側 - クローラ・スクレイパ編 -
JustSystems Corporation
Mais conteúdo relacionado
Mais procurados
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
Yuya Unno
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCT
Yuya Unno
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
Yuya Unno
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤
Shohei Hido
Jubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組み
JubatusOfficial
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
Toshinori Sato
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
株式会社メタップスホールディングス
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Yuya Unno
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Yuya Unno
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
Yuki Arase
Japan.r ver1.2 20171202_ota
Japan.r ver1.2 20171202_ota
博三 太田
Randomforestで高次元の変数重要度を見る #japanr LT
Randomforestで高次元の変数重要度を見る #japanr LT
Akifumi Eguchi
Pycon jp2017 20170908_ota
Pycon jp2017 20170908_ota
博三 太田
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
株式会社メタップスホールディングス
協調フィルタリング with Mahout
協調フィルタリング with Mahout
Katsuhiro Takata
予測型戦略を知るための機械学習チュートリアル
予測型戦略を知るための機械学習チュートリアル
Yuya Unno
機械学習
機械学習
Hikaru Takemura
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
Mais procurados
(18)
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCT
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤
Jubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組み
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
Japan.r ver1.2 20171202_ota
Japan.r ver1.2 20171202_ota
Randomforestで高次元の変数重要度を見る #japanr LT
Randomforestで高次元の変数重要度を見る #japanr LT
Pycon jp2017 20170908_ota
Pycon jp2017 20170908_ota
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
協調フィルタリング with Mahout
協調フィルタリング with Mahout
予測型戦略を知るための機械学習チュートリアル
予測型戦略を知るための機械学習チュートリアル
機械学習
機械学習
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Destaque
ArrayListをじっくり読んでみた - JavaコアSDKを読む会を社内でやって気づいたこと -
ArrayListをじっくり読んでみた - JavaコアSDKを読む会を社内でやって気づいたこと -
JustSystems Corporation
メンバーのスキルアップ、どうしてる? − Java 100本ノックで新加入メンバーを鍛えてみた −
メンバーのスキルアップ、どうしてる? − Java 100本ノックで新加入メンバーを鍛えてみた −
JustSystems Corporation
ジャストシステムJava100本ノックのご紹介
ジャストシステムJava100本ノックのご紹介
JustSystems Corporation
ピタジョブの裏側 - クローラ・スクレイパ編 -
ピタジョブの裏側 - クローラ・スクレイパ編 -
JustSystems Corporation
Groonga meetup20151129
Groonga meetup20151129
JustSystems Corporation
スマイルゼミの裏側(db編)
スマイルゼミの裏側(db編)
JustSystems Corporation
「訴求ファースト」と「こだわり駆動開発」~教育、医療、もの書き市場で戦うプロダクトマネージャーの考え方~
「訴求ファースト」と「こだわり駆動開発」~教育、医療、もの書き市場で戦うプロダクトマネージャーの考え方~
JustSystems Corporation
BIツールActionista!のOLAP集計エンジンJungarian
BIツールActionista!のOLAP集計エンジンJungarian
JustSystems Corporation
Shaping up ATOK to fit to your iPhone / iPad
Shaping up ATOK to fit to your iPhone / iPad
JustSystems Corporation
ATOK Spark のご紹介とJavaによるプラグイン開発について
ATOK Spark のご紹介とJavaによるプラグイン開発について
JustSystems Corporation
人工無脳バトル 1st STEP 回答と解説
人工無脳バトル 1st STEP 回答と解説
JustSystems Corporation
BIツールActionista!のインメモリーデータベースIMDB
BIツールActionista!のインメモリーデータベースIMDB
JustSystems Corporation
タッグ開発の現場 【エンジニアとデザイナー編】
タッグ開発の現場 【エンジニアとデザイナー編】
JustSystems Corporation
UX / UIデザインって何?
UX / UIデザインって何?
JustSystems Corporation
自然言語処理 Word2vec
自然言語処理 Word2vec
naoto moriyama
形態素解析の過去・現在・未来
形態素解析の過去・現在・未来
Preferred Networks
深層学習時代の自然言語処理
深層学習時代の自然言語処理
Yuya Unno
20120126 mnlgy 1
20120126 mnlgy 1
takaoka susumu
日本語形態素解析
日本語形態素解析
Yoshihiro Shimoji
鬱くしい日本語のための形態素解析入門
鬱くしい日本語のための形態素解析入門
Hiroyoshi Komatsu
Destaque
(20)
ArrayListをじっくり読んでみた - JavaコアSDKを読む会を社内でやって気づいたこと -
ArrayListをじっくり読んでみた - JavaコアSDKを読む会を社内でやって気づいたこと -
メンバーのスキルアップ、どうしてる? − Java 100本ノックで新加入メンバーを鍛えてみた −
メンバーのスキルアップ、どうしてる? − Java 100本ノックで新加入メンバーを鍛えてみた −
ジャストシステムJava100本ノックのご紹介
ジャストシステムJava100本ノックのご紹介
ピタジョブの裏側 - クローラ・スクレイパ編 -
ピタジョブの裏側 - クローラ・スクレイパ編 -
Groonga meetup20151129
Groonga meetup20151129
スマイルゼミの裏側(db編)
スマイルゼミの裏側(db編)
「訴求ファースト」と「こだわり駆動開発」~教育、医療、もの書き市場で戦うプロダクトマネージャーの考え方~
「訴求ファースト」と「こだわり駆動開発」~教育、医療、もの書き市場で戦うプロダクトマネージャーの考え方~
BIツールActionista!のOLAP集計エンジンJungarian
BIツールActionista!のOLAP集計エンジンJungarian
Shaping up ATOK to fit to your iPhone / iPad
Shaping up ATOK to fit to your iPhone / iPad
ATOK Spark のご紹介とJavaによるプラグイン開発について
ATOK Spark のご紹介とJavaによるプラグイン開発について
人工無脳バトル 1st STEP 回答と解説
人工無脳バトル 1st STEP 回答と解説
BIツールActionista!のインメモリーデータベースIMDB
BIツールActionista!のインメモリーデータベースIMDB
タッグ開発の現場 【エンジニアとデザイナー編】
タッグ開発の現場 【エンジニアとデザイナー編】
UX / UIデザインって何?
UX / UIデザインって何?
自然言語処理 Word2vec
自然言語処理 Word2vec
形態素解析の過去・現在・未来
形態素解析の過去・現在・未来
深層学習時代の自然言語処理
深層学習時代の自然言語処理
20120126 mnlgy 1
20120126 mnlgy 1
日本語形態素解析
日本語形態素解析
鬱くしい日本語のための形態素解析入門
鬱くしい日本語のための形態素解析入門
Semelhante a ジャストシステムの形態素解析技術 その2 機械学習編
Elastic ML Introduction
Elastic ML Introduction
Hiroshi Yoshioka
MLOpsはバズワード
MLOpsはバズワード
Tetsutaro Watanabe
先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際
Tetsutaro Watanabe
Supervised Machine Learning of Elastic Stack
Supervised Machine Learning of Elastic Stack
Hiroshi Yoshioka
Elasticsearch勉強会_NLPQA.pptx
Elasticsearch勉強会_NLPQA.pptx
shinhiguchi
[データマイニング+WEB勉強会][R勉強会] R言語によるクラスター分析 - 活用編
[データマイニング+WEB勉強会][R勉強会] R言語によるクラスター分析 - 活用編
Koichi Hamada
ChainerでDeep Learningを試す為に必要なこと
ChainerでDeep Learningを試す為に必要なこと
Jiro Nishitoba
perfを使ったPostgreSQLの解析(前編)
perfを使ったPostgreSQLの解析(前編)
Daichi Egawa
SOINN PBR
SOINN PBR
SOINN Inc.
Q a9 for ics(lotus) developers
Q a9 for ics(lotus) developers
賢次 海老原
データサイエンスことはじめ
データサイエンスことはじめ
大貴 末廣
Mackerel Anomaly Detection at PyCon mini Osaka
Mackerel Anomaly Detection at PyCon mini Osaka
syou6162
スクラムプロジェクト準備(公開用) No.31
スクラムプロジェクト準備(公開用) No.31
Sukusuku Scrum
Javaでつくる本格形態素解析器
Javaでつくる本格形態素解析器
Works Applications
組み合わせテストの設計(PictMaster勉強会) 2008年7月17日
組み合わせテストの設計(PictMaster勉強会) 2008年7月17日
Keizo Tatsumi
LLM+LangChainで特許調査・分析に取り組んでみた
LLM+LangChainで特許調査・分析に取り組んでみた
KunihiroSugiyama1
Machine learning 15min TensorFlow hub
Machine learning 15min TensorFlow hub
Junya Kamura
マイニング探検会 #02
マイニング探検会 #02
Yoji Kiyota
ChainerでDeep Learningを試すために必要なこと
ChainerでDeep Learningを試すために必要なこと
Retrieva inc.
mruby×ETロボコン = ?
mruby×ETロボコン = ?
ssuserc1bb39
Semelhante a ジャストシステムの形態素解析技術 その2 機械学習編
(20)
Elastic ML Introduction
Elastic ML Introduction
MLOpsはバズワード
MLOpsはバズワード
先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際
Supervised Machine Learning of Elastic Stack
Supervised Machine Learning of Elastic Stack
Elasticsearch勉強会_NLPQA.pptx
Elasticsearch勉強会_NLPQA.pptx
[データマイニング+WEB勉強会][R勉強会] R言語によるクラスター分析 - 活用編
[データマイニング+WEB勉強会][R勉強会] R言語によるクラスター分析 - 活用編
ChainerでDeep Learningを試す為に必要なこと
ChainerでDeep Learningを試す為に必要なこと
perfを使ったPostgreSQLの解析(前編)
perfを使ったPostgreSQLの解析(前編)
SOINN PBR
SOINN PBR
Q a9 for ics(lotus) developers
Q a9 for ics(lotus) developers
データサイエンスことはじめ
データサイエンスことはじめ
Mackerel Anomaly Detection at PyCon mini Osaka
Mackerel Anomaly Detection at PyCon mini Osaka
スクラムプロジェクト準備(公開用) No.31
スクラムプロジェクト準備(公開用) No.31
Javaでつくる本格形態素解析器
Javaでつくる本格形態素解析器
組み合わせテストの設計(PictMaster勉強会) 2008年7月17日
組み合わせテストの設計(PictMaster勉強会) 2008年7月17日
LLM+LangChainで特許調査・分析に取り組んでみた
LLM+LangChainで特許調査・分析に取り組んでみた
Machine learning 15min TensorFlow hub
Machine learning 15min TensorFlow hub
マイニング探検会 #02
マイニング探検会 #02
ChainerでDeep Learningを試すために必要なこと
ChainerでDeep Learningを試すために必要なこと
mruby×ETロボコン = ?
mruby×ETロボコン = ?
Mais de JustSystems Corporation
Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話
Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話
JustSystems Corporation
「技術内閣制度」〜2年間やってきて得られた事とこれから〜 #devsumi
「技術内閣制度」〜2年間やってきて得られた事とこれから〜 #devsumi
JustSystems Corporation
事業に貢献する商品開発と その成長の仕組み作り ~これからのエンジニアに必要とされるスキルとは~
事業に貢献する商品開発と その成長の仕組み作り ~これからのエンジニアに必要とされるスキルとは~
JustSystems Corporation
現役23名のPM:タイプ別マネジメントパターン
現役23名のPM:タイプ別マネジメントパターン
JustSystems Corporation
JavaでインメモリSQLエンジンを作ってみた
JavaでインメモリSQLエンジンを作ってみた
JustSystems Corporation
DDDとクリーンアーキテクチャでサーバーアプリケーションを作っている話
DDDとクリーンアーキテクチャでサーバーアプリケーションを作っている話
JustSystems Corporation
JustTechTalk#11_スマイルゼミ顧客満足度への貢献
JustTechTalk#11_スマイルゼミ顧客満足度への貢献
JustSystems Corporation
ピュアJavaだと思った?残念androidでした~いつからAndroidをJavaだと錯覚していた?~
ピュアJavaだと思った?残念androidでした~いつからAndroidをJavaだと錯覚していた?~
JustSystems Corporation
最新のJava言語仕様で見るモジュールシステム #jjug
最新のJava言語仕様で見るモジュールシステム #jjug
JustSystems Corporation
「書ける」から「できる」になれる! ~Javaメモリ節約ノウハウ話~
「書ける」から「できる」になれる! ~Javaメモリ節約ノウハウ話~
JustSystems Corporation
JustTechTalk#10 React開発における自動テスト実践
JustTechTalk#10 React開発における自動テスト実践
JustSystems Corporation
JustTechTalk#10windowsアプリでのテスト自動化事例
JustTechTalk#10windowsアプリでのテスト自動化事例
JustSystems Corporation
インパス! あのこれダメッス! ~Javaコードレビューの指摘ポイント10選~
インパス! あのこれダメッス! ~Javaコードレビューの指摘ポイント10選~
JustSystems Corporation
AWS運用における最適パターンの徹底活用
AWS運用における最適パターンの徹底活用
JustSystems Corporation
ジャストシステムのDevOps実例 今後の取り組み
ジャストシステムのDevOps実例 今後の取り組み
JustSystems Corporation
Javaチョットデキルへの道〜JavaコアSDKに見る真似したいコード10選〜
Javaチョットデキルへの道〜JavaコアSDKに見る真似したいコード10選〜
JustSystems Corporation
Kotlin is charming; The reasons Java engineers should start Kotlin.
Kotlin is charming; The reasons Java engineers should start Kotlin.
JustSystems Corporation
CSSレイアウトでなぜ失敗するか?
CSSレイアウトでなぜ失敗するか?
JustSystems Corporation
Selenium WebDriver + python で E2Eテスト自動化
Selenium WebDriver + python で E2Eテスト自動化
JustSystems Corporation
TypeScriptの大規模開発への適用
TypeScriptの大規模開発への適用
JustSystems Corporation
Mais de JustSystems Corporation
(20)
Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話
Spring Boot の Web アプリケーションを Docker に載せて AWS ECS で動かしている話
「技術内閣制度」〜2年間やってきて得られた事とこれから〜 #devsumi
「技術内閣制度」〜2年間やってきて得られた事とこれから〜 #devsumi
事業に貢献する商品開発と その成長の仕組み作り ~これからのエンジニアに必要とされるスキルとは~
事業に貢献する商品開発と その成長の仕組み作り ~これからのエンジニアに必要とされるスキルとは~
現役23名のPM:タイプ別マネジメントパターン
現役23名のPM:タイプ別マネジメントパターン
JavaでインメモリSQLエンジンを作ってみた
JavaでインメモリSQLエンジンを作ってみた
DDDとクリーンアーキテクチャでサーバーアプリケーションを作っている話
DDDとクリーンアーキテクチャでサーバーアプリケーションを作っている話
JustTechTalk#11_スマイルゼミ顧客満足度への貢献
JustTechTalk#11_スマイルゼミ顧客満足度への貢献
ピュアJavaだと思った?残念androidでした~いつからAndroidをJavaだと錯覚していた?~
ピュアJavaだと思った?残念androidでした~いつからAndroidをJavaだと錯覚していた?~
最新のJava言語仕様で見るモジュールシステム #jjug
最新のJava言語仕様で見るモジュールシステム #jjug
「書ける」から「できる」になれる! ~Javaメモリ節約ノウハウ話~
「書ける」から「できる」になれる! ~Javaメモリ節約ノウハウ話~
JustTechTalk#10 React開発における自動テスト実践
JustTechTalk#10 React開発における自動テスト実践
JustTechTalk#10windowsアプリでのテスト自動化事例
JustTechTalk#10windowsアプリでのテスト自動化事例
インパス! あのこれダメッス! ~Javaコードレビューの指摘ポイント10選~
インパス! あのこれダメッス! ~Javaコードレビューの指摘ポイント10選~
AWS運用における最適パターンの徹底活用
AWS運用における最適パターンの徹底活用
ジャストシステムのDevOps実例 今後の取り組み
ジャストシステムのDevOps実例 今後の取り組み
Javaチョットデキルへの道〜JavaコアSDKに見る真似したいコード10選〜
Javaチョットデキルへの道〜JavaコアSDKに見る真似したいコード10選〜
Kotlin is charming; The reasons Java engineers should start Kotlin.
Kotlin is charming; The reasons Java engineers should start Kotlin.
CSSレイアウトでなぜ失敗するか?
CSSレイアウトでなぜ失敗するか?
Selenium WebDriver + python で E2Eテスト自動化
Selenium WebDriver + python で E2Eテスト自動化
TypeScriptの大規模開発への適用
TypeScriptの大規模開発への適用
ジャストシステムの形態素解析技術 その2 機械学習編
1.
JustTechTalk #02 ジャストシステムの形態素解析技術その2 (機械学習編)
2.
CPS事業部開発部 NLPチーム
2003年入社、12年目 関わってきた技術 形態素解析、かな漢字変換、情報検索、情報抽出、 レコメンド、etc 関わってきた商品 JMAT、ATOK、ConceptBase、BONNE、 Listing Auto-Flight、ピタジョブ、etc 自己紹介 2
3.
3 ATOK、ConceptBaseで培ったノウハウと 機械学習を融合した日本語解析エンジン JustSystems Morphological Analysis
Technology ”ジャストシステムの形態素解析技術”
4.
その1の復習 4
5.
辞書追加 >>>>>> 新しい学習手法 5 新規手法開発より辞書 詳細はSlideShareに公開中の前回の資料をご覧ください
6.
今回のテーマは学習手法 6
7.
7 辞書 データ 構造 学習手法 日本語 (人手) 知識 便利 モジュール 前回のテーマ 今回のテーマ
8.
形態素解析の問題設定 8
9.
教師あり形態素解析 辞書と教師データ(学習コーパス)が必要
精度は高いが辞書と教師データの整備が大変 JMATはこちら 教師なし形態素解析 辞書と教師データ不要 まだ研究段階 半教師あり学習という考え方も存在 教師ありと教師なし 9
10.
10 教師あり形態素解析 入力文字列中に含まれうる全単語を辞書を使って 列挙しグラフ構造(ラティス構造)を作成 もっともコストが小さい経路を探索
11.
2つのコストの総和が最小の経路を求める 単語生起コスト
連接コスト コスト推定方法 人手 → JUMAN HMM (隠れマルコフモデル) → ChaSen CRF(条件付き確率場)→ MeCab、JMAT etc 教師あり形態素解析 11
12.
JMATのCRFの使い方 12
13.
ベース学習 小規模なコーパスで学習
能動学習 ベース学習では解析できない事例のみ学習 事例を追加し再学習、評価を繰り返す 部分アノテーション学習 一部分だけタグをつけ学習 分野適応 CRFを使った3つ学習手法 13
14.
1414 ベース学習 Webテキスト コーパス クラスタリング フィルタリング 誤解析しそうな テキスト群 タグ付きコーパス (約1万文) 半自動タグ付け コーパス (約300万文) 能動学習用 コーパス 部分アノテーショ ン学習 フィルタリング能動学習 JMATベース モデル 商品版 JMAT 人手知識
15.
【今回のテーマ】 ベース学習部分で 「なぜ300万文コーパスがあるのに 1万文しかつかわないのか」 15
16.
【注意】 ここから先、精度数値がでてきますが 弊社独自のコーパスでの評価となります 他研究との数値比較は意味を持ちません 16
17.
CRFの性能 17 4万文 同じ学習量ならHMMより CRFの方が高精度
18.
4万文での精度 18 ジャストシステムの 旧エンジンの方が高精度 コーパスを増やせば旧エンジンを超える?
19.
問題:メモリが足りない 19 4万文で約2.7G必要 300万文だと20G~30G必要 メモリにのらないと 現実的な時間で学習ができない
20.
メモリを積む 64GBのマシンを買った
けど、まだ複数の実験を同時にまわせない 裏でかな漢字変換の実験もやってる かな漢字変換はもっとメモリを食う 解決方法その1 20
21.
オンライン学習を使う この検証をはじめたのは2000年代後半
オンライン学習が現実的ではなかった (いまならオンライン学習でやってたかも) 解決方法その2 21
22.
省メモリなCRF学習器をつくる ラティス構造の持ち方を工夫
ノードには様々情報を持たせている 同じノードがいっぱい出現する 共有できる情報は全て共有 つくったCRF学習器の性能 OSSのCRF学習器の約25%のメモリ使用量 学習速度はほぼ同じ スワップにおとさないモードも作成 解決方法その2 22
23.
300万文の精度 23 旧エンジンの精度を超えた! (10万文あたりで超えました 最高精度は50万文学習時) 商品搭載に向けて本格始動?
24.
旧エンジンとの詳細な比較検証 大量の差分がでてる
改善も多いが、改悪も多い・・・ 難しい事例が解析できている! 簡単な事例を誤解析・・・ なぜ誤解析しているか分からない・・・ コーパスを修正すればいい? 300万文も修正できない・・・ 何もしてないのに学習するたびに結果がかわる 辞書チームによる分析 24
25.
分析・洗練作業ができない ジャストシステムの得意技
ジャストシステムのクオリティを保てない ジャストシステムのNLP技術にとっては致命的 この方向での商品化は断念・・・ 辞書チームによる検証 25
26.
CRFは使う 小規模なコーパスで旧エンジンを超える
旧エンジンからの改悪は極力抑える 洗練できる方法を用意する (ついでに語彙・品詞体系も見直す) 方向転換 26
27.
いちから必要なコーパスを検討しなおした 300万文のコーパスの存在はいったん忘れる
タグ付け精度、コンテンツの質 100文ちょっとのコーパスで90%近い精度がでる 必要なコンテンツとは? 言い回しコーパス 標準的な機能表現を網羅したコーパス 徹底的なクロスチェック 高精度なタグ付けコーパス 約1万文の学習コーパスを整備 小規模コーパス 27
28.
言い回しコーパスでの精度 28 ※ 語彙・品詞体系、評価コーパスの見直して いるため 旧エンジンの精度も前のスライドと異なり ます 旧エンジンの精度を1万文で超えた! (旧コーパスでは10万文必要) ただ、まだ旧エンジンからの改悪を抑える対策が未完・・・
29.
300万文コーパス 旧エンジンの解析結果を利用
人手修正もしている(旧エンジンより高精度) このコーパスを旧エンジンの解析結果と仮定 (エセ)能動学習を実施 300万文コーパスから間違い事例を追加し再学習 本当の能動学習はタグなしコーパスから行う 本当の能動学習では精度はあがるが改悪多数・・・ 旧エンジンの長所を継承(概要のみ) 29
30.
能動学習の精度 30 さらに精度向上を実現! 改悪もかなり抑えられた 使ったコーパスは約3万7千文 残された問題は、洗練手法だけ!
31.
旧エンジンでの洗練手法 人手でコストを調整
コーパスを直す (ルールで潰す) コスト人手調整は職人技が必要(CRFでは不可能) 部分アノテーション学習による洗練 文中の教えたい部分のみアノテーション 洗練・分野適応 (評価コーパスの)精度をさげずに適応可 洗練手法(概要のみ) 31
32.
3232 ベース学習 Webテキスト コーパス クラスタリング フィルタリング 誤解析しそうな テキスト群 タグ付きコーパス (約1万文) 半自動タグ付け コーパス (約300万文) 能動学習用 コーパス 部分アノテーショ ン学習 フィルタリング能動学習 JMATベース モデル 商品版 JMAT 人手知識 商品版JMATはさらに高精度です!
33.
JMATはCRFを使っている ベース学習、能動学習、部分アノテーション学習
教師あり学習のキモはコーパスの質 質の悪い大規模コーパスより小規模でも高品質コーパス ただし、超大規模になると性質かかわるかも 数値評価のみでは使える商品にならない まとめ 33
34.
最後に(宣伝) 34
35.
35 ピタジョブ、始めました! https://lets.pitajob.jp/
Baixar agora