SlideShare uma empresa Scribd logo
1 de 11
Baixar para ler offline
Debian勉強会の資料のePUB化を試みた
まえだこうへい
2013 年 8 月 17 日
eBook使ってます?
ePUB化の動機
when: ePUB フォーマットの書籍購入し始めたころから
why: PDF だとフォントサイズの変更でページが自動的にリ
サイズされない 1
how: Debian 勉強会の資料の HTML 版を変換すれば楽そう 2
1
特にスマホとか不便
2
http://tokyodebian.alioth.debian.org/html/
今回ePUB化を試すにあたり
Debian 勉強会資料の HTML 化の方法が不明 (一昨日見
つけた)
LATEX から直接変換できた方が流れはきれい
LATEX → DVI → PDF のどこからでも ePUB 化はできる
のではないか?と思って調べてみた
LATEXから ePUB への変換のフロー
XML,
HTML
ePUB
2)-2
LaTeX
2)-a
DVI
platex
1)
2)-b
PDFdvipdfmx 3)
検証したツールとその結果
パターン ツール名 入力 出力 結果
A3 B4
1) Pandoc5 LATEX ePUB NG OK
1) latex2epub6 LATEX ePUB NG OK
2)-a LATEXML LATEX XML NG OK
2)-b TEX4ht DVI HTML NG NG
2)-b htplatex7(TEX4ht) TEX HTML OK NG
3) Pandoc HTML ePUB OK N/A
4) Calibre PDF ePUB OK OK
3
Debian 勉強会の資料
4
latex2epub のサンプル
5
input/output とも様々なフォーマットに対応した変換ツール
6
武藤さんが作成したツール
7
上川さんが作成した Debian 勉強会の HTML 化スクリプト
生成されたePUBは?
htplatex & Pandoc の場合
表示が崩れる箇所あり
tabular が table に変換されず、表にならない
表紙の画像が追加されない
TEX4ht で追加されるナビゲートのメニューが残る
夏・冬号が含む月の資料よりも先に変換すると、その
中の画像がコピーされず、pandoc 実行時に失敗する
TEX4ht で HTML 変換時に自動生成される画像のファイ
ル名が異なり、pandoc 実行時に失敗することがある
生成されたePUBは?
Calibre の場合
目次のレイアウトが崩れる
デフォルトでは行間が広すぎる
図が表示されない場合もある
tabular が表として表示されない
変換時に次のオプションを入れると多少マシ。
”ヒューリスティック処理を有効にする”
”外観”→”段落の間の間隔を削除する”
他のサンプルや他のツールでの検証
pandoc で LATEX を変換した場合
includegraphics が image という文字列になったり、
underline の中が表示されない
multicol, newpage, minipage など未対応
dancersection などのマクロ展開できない
セクションタイトルが文字化け
listing でもコードブロックがうまく表示されず
LATEXML は commandline がダメ
latex2html は jsarticle は未対応。utf8 にしたら日本語 LATEX でも変換できるが
HTML の出力は文字化け (charset が入らないため。エンコード指定すれば表示さ
れる)
Hermes8 はフォント関連のエラー
ePUB reader でも、fbreader なら画像表示されるのに Calibre では表示されなかっ
たり
8
http://hermes.roua.org/
htplatex & pandocでの変換用スクリプト
$ sudo apt-get install dvi2ps-fontdata-a2n dvi2dvi 
dvipng pandoc
$ htplatex -e debianmeetingresume201308.tex 
jp,2,sections+
$ ls epub/
debianmeetingresume201308.epub
※ PDF をビルドするときは、dvi2ps-fontdata-a2n をアンイ
ンストールしておくこと。
まとめ
LATEX を使っていても、 Debian 勉強会とそれ以外では
同じやり方で変換できるわけではない
Debian 勉強会の資料を ePUB 化には、htplatex での
HTML の編集の調整が必要
TEX4ht コマンド (HChar や HCode を指定している箇
所など) のカスタマイズなど 9
Calibre は GUI & 変換のカスタマイズの自由度が低いの
で無理ゲー
最初から PDF および ePUB 生成に対応したドキュメン
トジェネレータ (例えば、ReVIEW10
) に切り替える、と
いうのも手段としてはあるけど、どうなんでしょうね。
9
http://osksn2.hep.sci.osaka-u.ac.jp/~naga/
miscellaneous/tex4ht/tex4ht-howtose4.html#x5-150004.3
10
https://github.com/kmuto/review

Mais conteúdo relacionado

Mais de Kouhei Maeda

Git pyfes201207-presen
Git pyfes201207-presenGit pyfes201207-presen
Git pyfes201207-presen
Kouhei Maeda
 
Goodby Hatena, hello Sphinx
Goodby Hatena, hello SphinxGoodby Hatena, hello Sphinx
Goodby Hatena, hello Sphinx
Kouhei Maeda
 
Debian JP会長就任の挨拶
Debian JP会長就任の挨拶Debian JP会長就任の挨拶
Debian JP会長就任の挨拶
Kouhei Maeda
 
Debianでできる簡単監視システム
Debianでできる簡単監視システムDebianでできる簡単監視システム
Debianでできる簡単監視システム
Kouhei Maeda
 
CouchDB on Androidでスタンドアローンアプリ。
CouchDB on Androidでスタンドアローンアプリ。CouchDB on Androidでスタンドアローンアプリ。
CouchDB on Androidでスタンドアローンアプリ。
Kouhei Maeda
 
エンジニアのための痔の話
エンジニアのための痔の話エンジニアのための痔の話
エンジニアのための痔の話
Kouhei Maeda
 

Mais de Kouhei Maeda (13)

ldapvi & python-ldap で stress-free life
ldapvi & python-ldap で stress-free lifeldapvi & python-ldap で stress-free life
ldapvi & python-ldap で stress-free life
 
Git pyfes201207-presen
Git pyfes201207-presenGit pyfes201207-presen
Git pyfes201207-presen
 
Lxc cf201207-presen
Lxc cf201207-presenLxc cf201207-presen
Lxc cf201207-presen
 
Goodby Hatena, hello Sphinx
Goodby Hatena, hello SphinxGoodby Hatena, hello Sphinx
Goodby Hatena, hello Sphinx
 
インフラエンジニアのためのGit入門
インフラエンジニアのためのGit入門インフラエンジニアのためのGit入門
インフラエンジニアのためのGit入門
 
僕の疑問に答えてください。
僕の疑問に答えてください。僕の疑問に答えてください。
僕の疑問に答えてください。
 
Debian JP会長就任の挨拶
Debian JP会長就任の挨拶Debian JP会長就任の挨拶
Debian JP会長就任の挨拶
 
Debianでできる簡単監視システム。
Debianでできる簡単監視システム。Debianでできる簡単監視システム。
Debianでできる簡単監視システム。
 
Debianでできる簡単監視システム
Debianでできる簡単監視システムDebianでできる簡単監視システム
Debianでできる簡単監視システム
 
CouchDB on Androidでスタンドアローンアプリ。
CouchDB on Androidでスタンドアローンアプリ。CouchDB on Androidでスタンドアローンアプリ。
CouchDB on Androidでスタンドアローンアプリ。
 
あいぽん落としたと聞いたので!
あいぽん落としたと聞いたので!あいぽん落としたと聞いたので!
あいぽん落としたと聞いたので!
 
エンジニアのための痔の話
エンジニアのための痔の話エンジニアのための痔の話
エンジニアのための痔の話
 
S2s websrv201011-presen
S2s websrv201011-presenS2s websrv201011-presen
S2s websrv201011-presen
 

Último

Último (7)

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

Debian勉強会の資料のePUB化を試みた