Enviar pesquisa
Carregar
アヒルヤキを変換してみよう
•
0 gostou
•
1,949 visualizações
Masahiko Hashimoto
Seguir
アヒルヤキを、JUMAN, MeCab, FreeWnn, Cannaで変換してみました。
Leia menos
Leia mais
Tecnologia
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 22
Baixar agora
Baixar para ler offline
Recomendados
Nginxで日本語入力を遊んでみよう!
Nginxで日本語入力を遊んでみよう!
Masahiko Hashimoto
おーぷん万葉プロジェクトとは
おーぷん万葉プロジェクトとは
Masahiko Hashimoto
京都発祥日本語入力「FreeWnn」は(今度こそ)どこまで賢くなれるか?
京都発祥日本語入力「FreeWnn」は(今度こそ)どこまで賢くなれるか?
Masahiko Hashimoto
ホットな日本語技術の(ちょっとした)お勉強。
ホットな日本語技術の(ちょっとした)お勉強。
Masahiko Hashimoto
ホットな日本語入力技術のお勉強。〜 OSC 2016 Hamanako 編 〜
ホットな日本語入力技術のお勉強。〜 OSC 2016 Hamanako 編 〜
Masahiko Hashimoto
おーぷん万葉プロジェクトの進捗とIzumoのその後
おーぷん万葉プロジェクトの進捗とIzumoのその後
Masahiko Hashimoto
TrieとLOUDS??
TrieとLOUDS??
Masahiko Hashimoto
かな漢字変換ソフト「Genji」をつくってみた
かな漢字変換ソフト「Genji」をつくってみた
Masahiko Hashimoto
Recomendados
Nginxで日本語入力を遊んでみよう!
Nginxで日本語入力を遊んでみよう!
Masahiko Hashimoto
おーぷん万葉プロジェクトとは
おーぷん万葉プロジェクトとは
Masahiko Hashimoto
京都発祥日本語入力「FreeWnn」は(今度こそ)どこまで賢くなれるか?
京都発祥日本語入力「FreeWnn」は(今度こそ)どこまで賢くなれるか?
Masahiko Hashimoto
ホットな日本語技術の(ちょっとした)お勉強。
ホットな日本語技術の(ちょっとした)お勉強。
Masahiko Hashimoto
ホットな日本語入力技術のお勉強。〜 OSC 2016 Hamanako 編 〜
ホットな日本語入力技術のお勉強。〜 OSC 2016 Hamanako 編 〜
Masahiko Hashimoto
おーぷん万葉プロジェクトの進捗とIzumoのその後
おーぷん万葉プロジェクトの進捗とIzumoのその後
Masahiko Hashimoto
TrieとLOUDS??
TrieとLOUDS??
Masahiko Hashimoto
かな漢字変換ソフト「Genji」をつくってみた
かな漢字変換ソフト「Genji」をつくってみた
Masahiko Hashimoto
DeepLearning入門以前
DeepLearning入門以前
Masahiko Hashimoto
C言語なWebSocketの遊び方。
C言語なWebSocketの遊び方。
Masahiko Hashimoto
自作かな漢字変換「Genji」をつくったよ
自作かな漢字変換「Genji」をつくったよ
Masahiko Hashimoto
TeXで多言語文書作成! (2011年ごろの資料)
TeXで多言語文書作成! (2011年ごろの資料)
Bizan Nishimura
Tensorflow
Tensorflow
Daisuke Yamashita
はてブ未読管理
はてブ未読管理
kiki utagawa
もっとドキュメントが日本語になりますように
もっとドキュメントが日本語になりますように
Takako Miyagawa
底から見上げるデブ(Dev) 〜俺と執事と自動化と〜
底から見上げるデブ(Dev) 〜俺と執事と自動化と〜
Kazuhito Miura
joint_seminar
joint_seminar
Tomoyuki Kajiwara
Linuxデスクトップのお手軽セミナー 〜クラウドとかも使いこなしちゃえ〜
Linuxデスクトップのお手軽セミナー 〜クラウドとかも使いこなしちゃえ〜
Masahiko Hashimoto
僕がLasta flute選んだ理由
僕がLasta flute選んだ理由
Yuichiro Kawano
We are OSS Communities: Introduction of Start Python Club
We are OSS Communities: Introduction of Start Python Club
Takeshi Akutsu
秘伝:クラウドに開発環境をえいっ!と構築する方法
秘伝:クラウドに開発環境をえいっ!と構築する方法
Masahiko Hashimoto
個人のタスク管理方法について考える
個人のタスク管理方法について考える
nekotank
S28 t0 introduction
S28 t0 introduction
Takeshi Akutsu
090704 Dev Do
090704 Dev Do
smokey monkey
20150702文章読解支援のための日本語の語彙平易化システム
20150702文章読解支援のための日本語の語彙平易化システム
Tomoyuki Kajiwara
30歳過ぎてもエンジニアでいるためにやったこと
30歳過ぎてもエンジニアでいるためにやったこと
onozaty
第59回 WordBench大阪 WordPress の翻訳システム「GlotPress」を使ってみよう!
第59回 WordBench大阪 WordPress の翻訳システム「GlotPress」を使ってみよう!
Kitani Kimiya
鹿児島らぐはじめました(オープンソースカンファレンス2015大分LT)
鹿児島らぐはじめました(オープンソースカンファレンス2015大分LT)
Kenichiro MATOHARA
Ikuijxit20150701
Ikuijxit20150701
Yoshimasa Kawano
CLSイベント企画について
CLSイベント企画について
Masafumi Ohta
Mais conteúdo relacionado
Mais procurados
DeepLearning入門以前
DeepLearning入門以前
Masahiko Hashimoto
C言語なWebSocketの遊び方。
C言語なWebSocketの遊び方。
Masahiko Hashimoto
自作かな漢字変換「Genji」をつくったよ
自作かな漢字変換「Genji」をつくったよ
Masahiko Hashimoto
TeXで多言語文書作成! (2011年ごろの資料)
TeXで多言語文書作成! (2011年ごろの資料)
Bizan Nishimura
Tensorflow
Tensorflow
Daisuke Yamashita
はてブ未読管理
はてブ未読管理
kiki utagawa
もっとドキュメントが日本語になりますように
もっとドキュメントが日本語になりますように
Takako Miyagawa
底から見上げるデブ(Dev) 〜俺と執事と自動化と〜
底から見上げるデブ(Dev) 〜俺と執事と自動化と〜
Kazuhito Miura
joint_seminar
joint_seminar
Tomoyuki Kajiwara
Linuxデスクトップのお手軽セミナー 〜クラウドとかも使いこなしちゃえ〜
Linuxデスクトップのお手軽セミナー 〜クラウドとかも使いこなしちゃえ〜
Masahiko Hashimoto
僕がLasta flute選んだ理由
僕がLasta flute選んだ理由
Yuichiro Kawano
We are OSS Communities: Introduction of Start Python Club
We are OSS Communities: Introduction of Start Python Club
Takeshi Akutsu
秘伝:クラウドに開発環境をえいっ!と構築する方法
秘伝:クラウドに開発環境をえいっ!と構築する方法
Masahiko Hashimoto
個人のタスク管理方法について考える
個人のタスク管理方法について考える
nekotank
S28 t0 introduction
S28 t0 introduction
Takeshi Akutsu
090704 Dev Do
090704 Dev Do
smokey monkey
20150702文章読解支援のための日本語の語彙平易化システム
20150702文章読解支援のための日本語の語彙平易化システム
Tomoyuki Kajiwara
30歳過ぎてもエンジニアでいるためにやったこと
30歳過ぎてもエンジニアでいるためにやったこと
onozaty
第59回 WordBench大阪 WordPress の翻訳システム「GlotPress」を使ってみよう!
第59回 WordBench大阪 WordPress の翻訳システム「GlotPress」を使ってみよう!
Kitani Kimiya
鹿児島らぐはじめました(オープンソースカンファレンス2015大分LT)
鹿児島らぐはじめました(オープンソースカンファレンス2015大分LT)
Kenichiro MATOHARA
Mais procurados
(20)
DeepLearning入門以前
DeepLearning入門以前
C言語なWebSocketの遊び方。
C言語なWebSocketの遊び方。
自作かな漢字変換「Genji」をつくったよ
自作かな漢字変換「Genji」をつくったよ
TeXで多言語文書作成! (2011年ごろの資料)
TeXで多言語文書作成! (2011年ごろの資料)
Tensorflow
Tensorflow
はてブ未読管理
はてブ未読管理
もっとドキュメントが日本語になりますように
もっとドキュメントが日本語になりますように
底から見上げるデブ(Dev) 〜俺と執事と自動化と〜
底から見上げるデブ(Dev) 〜俺と執事と自動化と〜
joint_seminar
joint_seminar
Linuxデスクトップのお手軽セミナー 〜クラウドとかも使いこなしちゃえ〜
Linuxデスクトップのお手軽セミナー 〜クラウドとかも使いこなしちゃえ〜
僕がLasta flute選んだ理由
僕がLasta flute選んだ理由
We are OSS Communities: Introduction of Start Python Club
We are OSS Communities: Introduction of Start Python Club
秘伝:クラウドに開発環境をえいっ!と構築する方法
秘伝:クラウドに開発環境をえいっ!と構築する方法
個人のタスク管理方法について考える
個人のタスク管理方法について考える
S28 t0 introduction
S28 t0 introduction
090704 Dev Do
090704 Dev Do
20150702文章読解支援のための日本語の語彙平易化システム
20150702文章読解支援のための日本語の語彙平易化システム
30歳過ぎてもエンジニアでいるためにやったこと
30歳過ぎてもエンジニアでいるためにやったこと
第59回 WordBench大阪 WordPress の翻訳システム「GlotPress」を使ってみよう!
第59回 WordBench大阪 WordPress の翻訳システム「GlotPress」を使ってみよう!
鹿児島らぐはじめました(オープンソースカンファレンス2015大分LT)
鹿児島らぐはじめました(オープンソースカンファレンス2015大分LT)
Semelhante a アヒルヤキを変換してみよう
Ikuijxit20150701
Ikuijxit20150701
Yoshimasa Kawano
CLSイベント企画について
CLSイベント企画について
Masafumi Ohta
Wikipedia15周年イベントのお知らせ
Wikipedia15周年イベントのお知らせ
Shinji Enoki
【2021年7月】平成生まれのためのUNIX&IT歴史講座
【2021年7月】平成生まれのためのUNIX&IT歴史講座
法林浩之
FLOSS Stories Project in Japan
FLOSS Stories Project in Japan
Jun Iio
oscooヤラナイカ?
oscooヤラナイカ?
Akihiko Kigure
Ubuntuの前に、Linuxってそもそも何?
Ubuntuの前に、Linuxってそもそも何?
Hidetsugu Takahashi
神戸→東京→日本
神戸→東京→日本
法林浩之
オープンデータ京都実践会ってなんだろう
オープンデータ京都実践会ってなんだろう
Katsuyuki Sakanoshita
【2021年3月】平成生まれのためのUNIX&IT歴史講座
【2021年3月】平成生まれのためのUNIX&IT歴史講座
法林浩之
BrowserMob-Proxyのお話
BrowserMob-Proxyのお話
Masahiko Hashimoto
【2020年11月大阪編】平成生まれのためのUNIX&IT歴史講座
【2020年11月大阪編】平成生まれのためのUNIX&IT歴史講座
法林浩之
東海道らぐへのお誘い 2015年版
東海道らぐへのお誘い 2015年版
shimadah
第0回徳島スマホアプリ開発勉強会
第0回徳島スマホアプリ開発勉強会
健一 辰濱
[参考情報]OSC広島のお知らせ
[参考情報]OSC広島のお知らせ
Yoshitake Takata
オンライン・ワークショップで最新のスキルを共有しよう。
オンライン・ワークショップで最新のスキルを共有しよう。
Tsuyoshi Motobe
ようこそ東海道らぐへ (2016年版)
ようこそ東海道らぐへ (2016年版)
shimadah
統一Qtコミュニティー
統一Qtコミュニティー
Yikei Lu
Open Access: A Primer
Open Access: A Primer
Yutaka HAYASHI
2016-03-01 研究の進め方を改善しよう
2016-03-01 研究の進め方を改善しよう
Yoshiki Sato
Semelhante a アヒルヤキを変換してみよう
(20)
Ikuijxit20150701
Ikuijxit20150701
CLSイベント企画について
CLSイベント企画について
Wikipedia15周年イベントのお知らせ
Wikipedia15周年イベントのお知らせ
【2021年7月】平成生まれのためのUNIX&IT歴史講座
【2021年7月】平成生まれのためのUNIX&IT歴史講座
FLOSS Stories Project in Japan
FLOSS Stories Project in Japan
oscooヤラナイカ?
oscooヤラナイカ?
Ubuntuの前に、Linuxってそもそも何?
Ubuntuの前に、Linuxってそもそも何?
神戸→東京→日本
神戸→東京→日本
オープンデータ京都実践会ってなんだろう
オープンデータ京都実践会ってなんだろう
【2021年3月】平成生まれのためのUNIX&IT歴史講座
【2021年3月】平成生まれのためのUNIX&IT歴史講座
BrowserMob-Proxyのお話
BrowserMob-Proxyのお話
【2020年11月大阪編】平成生まれのためのUNIX&IT歴史講座
【2020年11月大阪編】平成生まれのためのUNIX&IT歴史講座
東海道らぐへのお誘い 2015年版
東海道らぐへのお誘い 2015年版
第0回徳島スマホアプリ開発勉強会
第0回徳島スマホアプリ開発勉強会
[参考情報]OSC広島のお知らせ
[参考情報]OSC広島のお知らせ
オンライン・ワークショップで最新のスキルを共有しよう。
オンライン・ワークショップで最新のスキルを共有しよう。
ようこそ東海道らぐへ (2016年版)
ようこそ東海道らぐへ (2016年版)
統一Qtコミュニティー
統一Qtコミュニティー
Open Access: A Primer
Open Access: A Primer
2016-03-01 研究の進め方を改善しよう
2016-03-01 研究の進め方を改善しよう
Mais de Masahiko Hashimoto
OSSかな漢字変換『Egoistic Lily』の紹介&今後の展望
OSSかな漢字変換『Egoistic Lily』の紹介&今後の展望
Masahiko Hashimoto
DNNを使用した新しいかな漢字変換『EgoisticLily』 その仕組みとは?
DNNを使用した新しいかな漢字変換『EgoisticLily』 その仕組みとは?
Masahiko Hashimoto
Dockerいろいろ使って思うこと
Dockerいろいろ使って思うこと
Masahiko Hashimoto
あひるに焼かれた話と今後のおーぷん万葉について
あひるに焼かれた話と今後のおーぷん万葉について
Masahiko Hashimoto
C++アプリをCmakeとEclipseで開発するお話
C++アプリをCmakeとEclipseで開発するお話
Masahiko Hashimoto
続・Cannaをフォークしてみた
続・Cannaをフォークしてみた
Masahiko Hashimoto
Cannaをフォークしてみた
Cannaをフォークしてみた
Masahiko Hashimoto
AzureとSUSE Studioのあつ~い関係
AzureとSUSE Studioのあつ~い関係
Masahiko Hashimoto
X window managerで遊んでみた
X window managerで遊んでみた
Masahiko Hashimoto
オープンソースで始める「超」VPN 構築術
オープンソースで始める「超」VPN 構築術
Masahiko Hashimoto
自分色のLinuxホームサーバーを作ってみよう
自分色のLinuxホームサーバーを作ってみよう
Masahiko Hashimoto
Mais de Masahiko Hashimoto
(11)
OSSかな漢字変換『Egoistic Lily』の紹介&今後の展望
OSSかな漢字変換『Egoistic Lily』の紹介&今後の展望
DNNを使用した新しいかな漢字変換『EgoisticLily』 その仕組みとは?
DNNを使用した新しいかな漢字変換『EgoisticLily』 その仕組みとは?
Dockerいろいろ使って思うこと
Dockerいろいろ使って思うこと
あひるに焼かれた話と今後のおーぷん万葉について
あひるに焼かれた話と今後のおーぷん万葉について
C++アプリをCmakeとEclipseで開発するお話
C++アプリをCmakeとEclipseで開発するお話
続・Cannaをフォークしてみた
続・Cannaをフォークしてみた
Cannaをフォークしてみた
Cannaをフォークしてみた
AzureとSUSE Studioのあつ~い関係
AzureとSUSE Studioのあつ~い関係
X window managerで遊んでみた
X window managerで遊んでみた
オープンソースで始める「超」VPN 構築術
オープンソースで始める「超」VPN 構築術
自分色のLinuxホームサーバーを作ってみよう
自分色のLinuxホームサーバーを作ってみよう
Último
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Último
(7)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
アヒルヤキを変換してみよう
1.
アヒルヤキを変換してみよう はしもとまさひこ 2015/2/28 オープンソースカンファレンス 2015 Tokyo/Spring
2.
2 自己紹介 ● 東海道らぐとかやってます。 – 日本openSUSEユーザ会もたまにやってます。 ● 「おーぷん万葉」プロジェクトを始めました! – 日本文学文化学科卒なので、その経験を活かしたいと。
3.
3 おーぷん万葉プロジェクトとは? ● 目的「自由な日本語入力環境を手に入れよう!」 ● 現状の問題点: – ビックデータと叫ばれる時代に、開発がアクティブで 自由にコミットメントできる日本語入力システムがない? ● 例:
mozc, Anthy... (但し、SKKを除く!) → そんな現状を打破したい!てのが目的です。
4.
4 そそ、東海道らぐも紹介しないとね ● 大阪、京都、名古屋、浜松…などを中心に活動する 東海道らぐ(Tokaido Linux User
Group)です! http://tokaidolug.colorfultime.net ● ほぼ小江戸らぐの丸ぱくり。 ● 参加団体(というより主な参加者): – おーぷんここん – Ejectコマンドユーザ会(の名古屋支部?) – Netwalker実験所 – Linux Mint Japan(の浜松の方)
5.
5 東海道らぐに期待の新星現る! ● 名前: あひるさん ( @ahiru3net
) ● 職業: 名古屋の学生さん ● 主に、Ejectコマンドユーザ会に出没 – あひるさんをいろんなイベント(勉強会)に誘う 「あひる釣り師」という職業があるらしい そそ、あひるさんには有名なニックネームがありますね ちょっとアイコンを拡大してみましょう! 注:本人使用許可承諾済み
6.
6 焼かれてます!!! これが世に言う「あひる焼き」というやつです。
7.
7 ところで、「あひる焼き」って… ● どんな日本語なのでしょう??? ● 品詞は??? – 動詞 or
名詞 or 形容詞? – そもそもこれって「単語」なの? 「アヒルヤキ」って日本語変換できますか?
8.
8 今回のお題。 ● 「アヒルヤキ」を形態素解析 or
かな漢字変換します ● 形態素解析 or かな漢字変換する文: – 「アヒルヤキ」 期待値「あひる焼き」 – 「アヒルヤキタイ」 期待値「あひる焼きたい」 – 「アヒルヤキタベタイ」 期待値「あひる焼き食べたい」 ● 今回使用するツール: – Juman、Mecab、FreeWnn、Canna
9.
9 形態素解析器① JUMAN ● 京都大の黒橋・河原研究室で開発 – http://nlp.ist.i.kyoto-u.ac.jp/index.php?JUMAN ●
最新バージョンは 7.0.1 (2014/12/22) – 古くからありますが、結構更新されてますね ● Web版が公開されてるので試してみましょう! – http://lotus.kuee.kyoto-u.ac.jp/nl-resource/cgi-bin/juman.cgi
10.
10 結果: JUMAN ● あひるやき – あひる
普通名詞 代表表記:家鴨/あひる – や 接続助詞 – き 動詞 代表表記:着る/きる ● あひるやきたい 「あひるやき」まで同上 – たい 接尾辞 代表表記:たい/たい ● あひるやきたべたい 「あひるやき」まで同上 – たべ 動詞 代表表記:食べる/たべる – たい 接尾辞 代表表記:たい/たい 注:出力は途中省略してます。 詳しくは自分で試してみてください!
11.
11 考察: JUMAN ● 「やき」って単語が登録されていないようですorz –
辞書ファイルには「おこのみやき」「めだまやき」などは 入っていましたが、「やき」自体はありませんでした。
12.
12 形態素解析器② MeCab ● 現在最も使用されている形態素解析器 http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html ● 開発はGoogle日本語入力
& mozcの工藤拓氏 ● GPL, LGPL, BSDライセンスのオープンソース ● 「和布蕪(めかぶ)」は開発者の好物らしい。。。 ● 辞書は国立国語研究所が開発している Unidicを使用します。
13.
13 結果: Mecab ● あひるやき – あひる
家鴨 名詞-普通名詞-一般 – やき 焼き 接尾辞-名詞的-一般 ● あひるやきたい – あひる 家鴨 名詞-普通名詞-一般 – やき 焼く 動詞-一般 五段-カ行 連用形-一般 – たい たい 助動詞 終止形-一般 ● あひるやきたべたい 「あひるやき」まで「あひるやき」と同じ – たべ 食べる 動詞-一般 下一段-バ行 連用形-一般 – たい たい 助動詞 終止形-一般
14.
14 考察: MeCab ● さすがですね・・・(^^) ●
「あひるやき」を、「あひる(名詞)」「やき(接尾辞)」に 分割しています。 – JUMANはこれができていませんでした… – 接尾辞= 「〜さん」のような辞(単独で文節にならない) ● JUMANでは「たい」を接尾辞としていましたが MeCabでは「たい」を助動詞としています – 文法的にはどちらも正解ですが、統一できないものかしら? – Unidicには「形状詞」(=形容動詞?)という品詞も出てきて 個人的には許せない(笑)
15.
15 かな漢字変換① FreeWnn ● 京都大・オムロン等が開発したWnnのオープンソース版 http://www.freewnn.org/ OSC京都で話をするとめちゃくちゃ盛り上がります(笑) ● 名称の由来は 「わたしの(W)なまえは(N)なかのです(N)」 ●
FreeWnnプロジェクトのサーバーがあるとかないとか… – いろいろあって放置してます…ごめんなさい(^^;;;;; ● 辞書は付属のPubdicPlusを使用します
16.
16 結果: FreeWnn ● あひるやき: アヒルや 気 ● あひるやきたい: アヒルや
気 対 ● あひるやきたべたい: アヒルや 気 食べたい 注)スペースは文節区切りで、意図的に追加しています 本来は追加されていません
17.
17 考察: FreeWnn ● まぁこんなもんですよね・・・ – フォローするようですが、Wnnの開発開始が1987年 –
辞書語彙数= 44330語 ● 「アヒルや」というように「名詞+接続助詞」で 区切っている点は、JUMANと同じですね ● 「あひる」をそのまま「あひる」とせずに 「アヒル」とカタカナ変換してしまったのは かな漢字変換システム的に興味深い点
18.
18 かな漢字変換② Canna ● NECが開発していたものをオープンソース化 http://canna.sourceforge.jp/ MITライセンス ● 最近は開発がストップしてしまっています。。。 –
最後のリリースが 2004/5/20 – 現在フォークして「Izumo」を開発中です。。。 https://github.com/hashimom/Izumo ● 辞書は付属のPubdicPlusを使用します
19.
19 結果: Canna ● あひるやき あ 昼
焼き ● あひるやきたい あ 昼 焼きたい ● あひるやきたべたい あ 昼や 気 食べたい 注)スペースは文節区切りで、意図的に追加しています 本来は追加されていません
20.
20 考察: Canna ● なんだかビミョ〜だ – 開発開始=
1991年・・・FreeWnnの2年後ですね ● 実は、FreeWnnと同じPubdicPlusでも 語彙数はCannaの方が若干少ない – Canna= 42001語 (FreeWnn= 44330語) – 「あひる」はCannaの方には含まれていない ● 「やき」はどうやって「焼き」と変換できたのか? – 辞書には見当たらない? 要調査!
21.
21 まとめ ● 「あひる焼き」を「あひる」と「焼き」とに 分けられるか?というのがポイントだった ● やっぱし語彙数 – mecabで使用したUnidicは単純計算で756463語ある – FreeWnnやCannaは語彙数を増やすとばけるかも?
22.
22 皆さんで一緒に、自由な辞書を作りましょう!!! ご清聴、ありがとうございましたm(_ _)m
Baixar agora