情報知識学会誌 2010 Vol. 20, No. 4

電子書籍フォーマットの動向と学術情報流通への課題 Overview of Electronic Format and Academic Publication

原田隆史 Takashi HARADA

:慶應義塾大学文学部図書館・情報学専攻 School of Library and Information Science, Keio University 〒108-8345 東京都港区三田 2-15-45 Email: [email protected]

日本で用いられている電子書籍フォーマットとしては, EPUB, .Book, XMDF, PDF など,さまざまな観点から 標準化された電子書籍フォーマットが存在する。本稿では,各種の電子書籍フォーマットについては概観する とともに,その学術情報流通への課題について検討する。

There are a lot of electonic book format in Japan, for example EPUB, .BOOK, XMDF, PDF . In this article, I overview the electronic book format and the academic publication.

1. 電子書籍フォーマット ト。作成した文書のオリジナルのレイアウトを, 電子書籍フォーマットとひとくちに言っても, 表示するコンピュータの環境によらず,かなり正 電子書籍の作成から利用に至る各過程において, 確に再現することが可能である。作成には同社の さまざまな形で電子的な形式の資料が作成され (または互換ソフト),閲覧には る。それら各段階で目的や特徴が異なる形式が求 Adobe Reader が必要。 められている。たとえば,電子書籍の制作会社, 2) EPUB (Electronic Publication) 出版社,配信会社では,それぞれ素材用,原稿用, アメリカの電子書籍標準化団体である IDPF 交換用など異なるフォーマットのファイルを作 (International Digital Publishing Forum) が 成している。出版社が作成した交換用文書を,配 2007 年 9 月に発表した電子書籍フォーマット。 信会社ではデジタル著作権処理などを行って配 XML をベースとした規格で,XHTML などで作成し 信用文書として配信するということが行われて たコンテンツを,画像や CSS などとともに ZIP いる 1)。 形式で圧縮したファイルである。オープンスタン 電子書籍用フォーマットという語は,広義には ダードな規格として公開されており,近年,急速 これらの各種のフォーマットを含むものとして に利用が拡大している。 用いられる場合もあるが,一般的には出版社から 日本においても,日本電子出版協会が 2009 年 配信会社への交換用文書または配信会社が利用 11 月から EPUB の日本での普及啓発と,日本語組 者に配信する配信用文書のフォーマットを意味 版の実装への働きかけを行っている。 することが多い。 3) TTX および ドットブック(.book) 現在,用いられている代表的な電子書籍フォー ボイジャーが開発した商業出版向けの電子書 マットとしては,以下があげられる。 籍フォーマット。オーサリングツールなどでの編 1) PDF (Portable Document Format) 集に用いられる記述フォーマットが TTX,配信時 Adobe Systems が開発した電子書籍フォーマッ に用いられるのが.book である。再生には同社の

-383- 情報知識学会誌 2010 Vol. 20, No. 4

ビューワーソフト「T-Time」が必要となる。TTX れていないが,紙媒体の資料 JPEG などをデジタ は HTML 形式でテキストを中心に扱うことができ ル化してビットマップ画像を作成し,これを ZIP る。 形式などで圧縮したものとして,CBZ(Comic Book 4) XMDF(ever-eXtending Mobile Document Format Zip), CBR(Comic Book RAR)がある。その名称通 から派生した呼称) りにコミックの閲覧などに使われている。 シャープが開発した主に PDA,PC 向けの電子書 籍フォーマット 2)3)。 2 静的レイアウトと動的レイアウト 携帯電話端末用の書籍を中心に日本国内で多 現在策定されている配信用フォーマットは非 くの電子書籍が既に販売されている。画像,音声, 常に多様であるが,これらは静的レイアウトと動 動画が扱え,ルビ,字下げ,縦書きなどを含む, 的レイアウトに分けることができる。このうち静 原稿イメージに近いレイアウトを再現すること 的レイアウトは,ページ単位のデザインを保持す が可能。 る方式であり,段組や写真の位置などのレイアウ XMDF では,コンテンツそのものおよびレイア トを作成者と読者が共有することが可能である。 ウトなどを指定する組版の仕様以外に,XML で記 PDF や CBZ などがその例てあり,ラスタライズ方 述されたデータ群を表示するための独自の実行 式,ベクトル方式などとも呼ばれる。紙媒体の書 形式,実行形式のファイルに DRM を施し著作権を 籍や雑誌などと同様のレイアウトを再現するこ 保護した上で配布するためけのフォーマットも とから,作成者のイメージにあわせた提供を行い 含んでいる。 たい場合などに適している。 5) AZW それに対して動的レイアウトは,HTML を用い Amazon.com が採用している 用の て記述された Web ページなどと同様に,文字サイ 電子書籍フォーマット。2005 年に Amazon が買収 ズや画面サイズの変更によって自動的にレイア したフランスの 社が開発した MOBI ウトが変更される方式である。リフロー方式とも という電子書籍フォーマットをベースにつくら 呼ばれる。 れている。 使用するデバイス(電子書籍リーダーなど)な 6) DAISY(Digital Accessible Information ど読者の環境に応じて読みやすい表示が可能と System) なる,自分の読みたい文字サイズで本が読むこと デイジーコンソーシアムが開発を行っている, が可能となるなどの特徴がある。一方,作成時の 主に視覚障害者等が利用するデジタル録音図書 レイアウトは必ずしもを忠実に再現されない。 のフォーマット。XML ベースの規格で,テキスト また,レイアウトが変更された結果として電子 の音声読み上げや,文字のハイライト表示,文字 書籍の編集段階で文頭に閉じ括弧や「,」,「。」が の拡大・縮小,色の反転などを容易におこなうこ 来ないように禁則処理を行っている場合でも,そ とができる。欧米では電子教科書や電子書籍のフ れが有効に機能しないこともありえる。ただし, ォーマットとしても採用されている。 動的レイアウトであれば全て禁則処理が無効に 7) その他 なるということではなく,フォーマットの規定に その他,イーブック・イニシアティブ・ジャパ よる。たとえば,EPUB は日本語の禁則処理,縦 ンが開発した ebi.jp(),セルシス,インフ 書きなどは考慮されていないシンプルなフォー ォシティ,ボイジャーで共同開発された携帯電話 マットであるため,現状ではこれを回避する方法 向け書籍フォーマットである BookSurfing など, はないのに対して,XMDF や.book では日本語の特 多数の電子書籍フォーマットが存在している。 徴に対応するように規格が策定されているため, また,販売のためのフォーマットとしては使わ リフロー後も禁則処理などを有効にすることが

-384- 情報知識学会誌 2010 Vol. 20, No. 4

できる。 BiDi(左右両方向横書きテキストの環境)は表現 できない。このような EPUB を中間フォーマット 3. 電子書籍の標準中間フォーマットの とした場合,日本語の縦書きなどの追加情報は記 規格化と配信フォーマット 録されないことになってしまい,将来的に縦書き 3.1 電子書籍の標準中間フォーマットの必要 などのフォーマットが策定された場合に対応で 性 きないことになる。その意味で,中間フォーマッ 前述のように,多数の配信用電子書籍フォーマ トには,将来的な拡張なども検討した上で,既存 ットが併存している状況では,出版社は異なるデ の配信用電子書籍フォーマット以上に情報を含 バイスを持つ利用者に電子書籍を利用してもら んだフォーマットが求められているということ うために,多数の異なる電子書籍フォーマットで ができよう。 作られたファイルを作成する必要がある。 電子書籍の制作過程において,制作者や出版社 3.2 デジタル・ネットワーク社会における出 では素材ファイルから直接配信用の電子書籍フ 版物の利活用の推進に関する懇談会報告 ァイルが作成されているわけではなく,各制作者, 総務省,文部科学省,経済産業省共催による「デ 出版社ごとに異なるフォーマットのファイルが ジタル・ネットワーク社会における出版物の利活 作成され,それをもとにして配信用の電子書籍フ 用の推進に関する懇談会」(以下,三省懇と略す) ァイルを作成している。したがって同じ EPUB で は,『デジタル・ネットワーク社会における出版 電子書籍を刊行する出版社でも,製作途中のデー 物の利活用の推進に関する懇談会報告』をまとめ タのフォーマットは EPUB とはもちろん,それぞ ている 12)。その中で,日本語表記に係る中間(交 れ異なる違うということは十分にありえる。 換)フォーマットの標準を確立することが提案さ このように各出版社が異なるフォーマットの れている。これによって,出版物のつくり手にと データを作成するということは,電子出版制作が ってコストの削減や,電子出版をリリースするま 非効率であることを意味する。すなわち,出版物 での期間の短縮。様々な電子出版端末・プラット のつくり手は,新しい表示デバイスや新しいプラ フォームでの提供・利用等,大きな効果が期待で ットフォームが登場するたびにそれぞれに最適 きるとまとめている。さらに,この報告書では実 化したフォーマットに作り直す必要があり,一つ 際の中間フォーマット作成の道筋として以下の の作品に対していくつものファイルを作らなく ように述べている 12)。 てはならない状況にある 4)。 『日本語表現に実績のあるファイルフォーマッ このような状況を改善するためには,様々なプ トである「XMDF」(シャープ)と「ドットブック」 ラットフォーム,端末が採用する多様な閲覧ファ (ボイジャー)との協調により,出版物のつくり イルフォーマットに変換対応が容易に可能とな 手からの要望にも対応するべく,我が国におけ る交換用中間フォーマット(以下,中間フォーマ る中間(交換)フォーマットの統一規格策定に ットとする)を策定し,これを関係する各社が使 向けた大きな一歩が踏み出された。』 用することが考えられる 5)-11)。 この報告書の記述は,現実的で納得できる内容 その際,EPUB をはじめとする現在の配信用電 であると思われる。特に,一対多のフォーマット 子書籍フォーマットそのものを中間フォーマッ 変換を行う際に中間フォーマットを制定するこ トとすることは必ずしも適切ではない。たとえば, とは有効である。中間フォーマットを利用するこ 現在の EPUB では日本語における縦書きの問題や, とで最終生成物の仕様の細かな差を吸収し,ワン 日本・中国・台湾などで必要とされるルビの問題, ソース・マルチユース(ひとつのデータを複数の 中東のライティングシステムで必要とされる 目的やメディアで利用すること)をはかるという

-385- 情報知識学会誌 2010 Vol. 20, No. 4

ことは,電子書籍に限らず携帯コンテンツの作成 となっている 19)。 など,多くの場所で用いられている 13)。 この報告書に対する否定的なもうひとつの意 この報告書が 2010 年 6 月 28 日に発表されて以 見は,ドットブックと XMDF を基礎にした日本語 後,その内容に関わる意見が新聞,雑誌,ブログ, のローカルなフォーマットを変換するための規 ツイッターなど,さまざまな場所で表明されてい 格が,果たして国際規格として適格と言えるのか, る。しかし,その内容は否定的なものも多い。そ また提案のような中間フォーマットが本当に必 れらの否定的な意見は,中間フォーマットと配信 要なのかについて指摘するものである 13),20)-22)。 フォーマットを誤解したものと,標準規格として 前者の指摘としては,デファクト標準としての の適格性・実現性と必要性に疑義をはさむものに EPUB の存在および EPUB と進化を続ける Web 環境 大別できる。 (XHTML+CSS)との親和性を強く意識する論調が多 三省懇の報告書で標準化をはかり,国際標準規 い 20),22)。時には「国際標準に背を向けている」 格にすることをめざしているのは,あくまで中間 という誤解に基づくコメントが寄せられること フォーマットであるとされている。この標準化さ もある。しかし,実際には国際標準規格に収録さ れた中間フォーマットから各種の配信フォーマ れているのは,EPUB ではなく XMDF の方である。 ットを作り出すことができる。しかし,報告書本 この点については次節で述べる。 文には,国際標準化規格をめざすのが何であるの 規格の適格性と実現性に関する否定的な意見 かについては明確には記述されておらず,三省懇 としては,その有効性と同時に,このような規格 の下部組織で技術的な分野の審議を行っている 策定に税金を投入することの是非とをあわせて 「技術に関するワーキングチーム」の配付資料や, 指摘している 20),22)。 ワーキングチームメンバーの講演資料などを見 一方,台湾や韓国では EPUB の標準化に国家が ないとはっきりとしない。 積極的に関与しているともされる 23)24)。また,そ そのためか,三省懇で標準化をはかろうとして もそも EPUB の前身である Open eBookというフォ いるのが配信フォーマットそのものであるとい ーマットは,米国の商務省の機関である う誤解が多数生まれる結果となった 13)。これら National Institute of Standards and の誤解は,EPUB をはじめとするデファクトスタ Technology (NIST) が活動を支援した。このよう ンダードとは別に,日本国内でのみ通用する配信 に必要に応じて国が支援することの必要性を強 用電子書籍フォーマット規格を策定することへ 調する意見も多い。 の懸念を示すものであり,ガラパゴスと揶揄され 実現性については,既にいつかの配信プラット る携帯電話の規格策定時の問題に言及するもの フォームが立ち上がっている中で,出版社側だけ が多い 14)-18)。 でなく複数の配布フォーマット,配信プラットフ しかし,何度も述べるように三省懇の報告書で ォームの関係者が満足するものを作成すること 目指すのは中間フォーマットであり,ワーキング は可能なのかという疑問などが指摘される。柔軟 チームメンバーでもある植村八潮の作成した資 性が高く汎用性の広い優れたフォーマットの策 料によれば,統一規格は多様なジャンルの出版物 定が必要であるが,それが日本語の書籍を主たる の「日本語の基本表現部分」だけを規定するもの 対象とした既存の XMDF とドットブックをベース だとされる。すなわち,構成が複雑な雑誌や芸術 としは実現が困難なのではないかという,基礎と 書などについては,新たにジャンルごとの拡張中 なる規格に対する不安を示す意見もみられる 21)。 間フォーマットを作ることを想定しているとさ また,中間フォーマットが複数の機関での利用 れる。さらには独自のハウスルールに基づく各社 を想定する場合,編集段階での共通化が計られる 版拡張中間フォーマットを規定することも可能 などがなければ中間フォーマットは,「中間」で

-386- 情報知識学会誌 2010 Vol. 20, No. 4

はなく,それ自体が最終生成物となってしまう可 題である。三省懇が IEC 62448 の改訂案として 能性がある。そうなった時,中間フォーマットの XMDF とドットブックを中心とした理由のひとつ 利用に関してなんらかの「縛り」や「利点」がな も既に縦書きを含む日本語の規格が定まってい いかぎり,中間フォーマットの作成を省略して最 たため,それらを利用するという側面もある。ま 終フォーマットをつくり始める出版社が続出す た,EPUB の国際化を進めるサブグループ るのではないか,そのような中間フォーマットは 「Enhanced Global Language Support」(EGLS) 本当に必要なのかという指摘がある 25)。 でも日本語の縦書きやルビなどを含む機能不足 を解消すべく作業を進めており,2011 年 5 月に 3.3 国際標準規格と標準規格 は縦書きやルビを含む仕様策定が完了する見通 電子書籍フォーマットに関する国際標準規格 しであるとされる。 としては,IEC(International Electrotechnical Commission : 国際電気標準会議)の IEC62448 が 3.4 デジタル著作権処理 ある。IEC 62448 の附属書 B には XMDF がいれら 標準中間フォーマットと配信用フォーマット れている(附属書 A は SONY の BeBB)。三省懇が目 を考える時,デジタル著作権処理(DRM)の問題も 指しているのは,ドットブックと XMDF の記述フ 検討する必要があるだろう。 ォーマットを統一して,この IEC 62448 の改訂版 たとえば,EPUB は標準規格であり,EPUB ファ としようとするものである。ただし,改訂とは附 イルの間であれば,互換性があるとされる。しか 属書 B の改訂なのか,それとも新たに附属書 C し,同様に EPUB を用いていたとしても,実際に を追加しようというものなのか,今のところまだ 販売されている電子書籍ではその販売する各社 分からない。植村の資料では IEC 62448 の改訂案 ともに DRM 付きのファイルを使用しているはず として中間(交換)フォーマットを今年 12 月に委 である 27)。Adobe も EPUB 向けの DRM ソリューシ 員会提出,来年第 4 四半期に最終投票案提出,そ ョンでビジネスを展開している。ビジネスモデル して再来年 2012 年の第 3 四半期に制定されるこ に違いはあるが,EPUB から先は各社のビジネス とを目指すという 19)。ただし,中東のライティ 領域になっている。ということは,結局それらの ングシステムがサポートする BiDi(左右両方向 間にはひとつも互換性がないともいえるかもし 横書きテキストの環境)の未整備など改訂版の国 れない 27)。 際標準が認められるまでには,いくつかのハード 国内,XMDF の場合も,記述フォーマットから ルがあるという意見もある 21)。 先はシャープのビジネス領域として,独自の(省 一方,世界の電子書籍市場で主流になりつつあ メモリが実現できる)データ構造に変換し,DRM る EPUB は現時点では国際標準規格ではなく, を付与して配信フォーマットとしている。したが IDPF(International Digital Publishing Forum) って,EPUB が「電子書籍の世界標準」という表 が業界の標準規格として推進しているものであ 現は配信用ファイルが完全に互換であることを る。IDPF には,近年 Apple や Google などの企業 意味してはいない。あくまで標準的な規格は中間 も続々と参加してきている 26)。EPUB についても, フォーマットに関しての話と意識しておくべき 国際標準の中で文書の記述と処理の言語に関す であろう。 る標準化の委員会 ISO/IEC JTC 1/SC 34 と IDPF とが協議を行って国際規格とするという活動も 4. 学術情報流通への課題 はじまっている。 武田英明は学術情報流通におけるコンテンツ 日本語の電子書籍という観点が見た場合,この の性質を以下のようにまとめている 28)。 両者で話題になっているのは,縦書きとルビの問 ・記事(論文)単位に独立している

5 -387- 情報知識学会誌 2010 Vol. 20, No. 4

・レイアウトを気にしない 変更されることにともなうリンク先の問題であ - 著者フォーレイアウトもある(TeX など) る。例えば,kindle で大学の授業を行うことが ・誌面のクオリティはあまり気にしない できるかという実験が米国の大学で行われたが, (例外:生物医学等の詳細写真つき論文) その中では「XXX という書籍の YYY ページ」が ・外部のリソースへのリンク(参考文献や kindle では全く分からなかったという指摘があ supplement data など)も重要 る 30)。新しいデバイスと紙の学術雑誌が混在す その上で,学術情報の電子化の最も大きなメリ るような状況で,このようなリンク先をどのよう ットが,検索容易性,本文到達性にあること,さ に考えるかについては,まだほとんど検討されて らに,利用者にとって柔軟な購読スタイル(多様 いないのが現状である 27)30)。 な端末など)もメリットのひとつであると述べて 2) 多様な配信フォーマットと中間フォーマット いる。逆に,電子化のデメリットとしては,購読・ これら電子書籍フォーマットの問題は,武田も 利用方式の出版社依存が高まること,未来に渡る 指摘する購読・利用への出版社依存を高め,また コンテンツの保存(長期的な保存)の問題,寡占化 出版社の寡占化につながる可能性を高めること の可能性を指摘している 28)。 につながることが予想される。 これら学術情報流通の特質と,電子書籍フォー ただし,この問題は電子書籍フォーマットのみ マットの問題についていくつかの視点から検討 に関わる問題ではなく,電子書籍リーダーなどの したい。 デバイスや,電子書籍を販売するプラットフォー 1) レイアウト ム(電子書籍の書店など)も含めて考える必要が 武田も述べるように,学術情報流通においては, ある。歴史的に電子書籍フォーマットの進化は電 雑誌誌面の再現性などは要求されないことが多 子書籍リーダーの進化と密接に関わっている。ま い。その意味では,レイアウトに関しては一般的 た,ある種の電子書籍リーダーでは,図書や雑誌 な雑誌で問題になるような現在の EPUB 程度の表 の販売を特定のプラットフォームに限定するこ 現力であっても 29),学術情報流通においては大 ともありえる。 きな問題とはならない可能性が高い。ただし,レ また,販売が特定のプラットフォームに限定さ イアウトの問題に関しては,読みやすさなどの観 れなかったとしても,提供される書籍や雑誌が特 点ではなく他の視点から2つの問題があると考 定のプラットフォームに集中した場合,事実上, えられる。 そのプラットフォーム以外からの販売は困難に 問題点のひとつは,学術情報が多くの著者によ なることもありえよう。技術的には,最近の電子 って直接生み出されているという点である。会議 書籍リーダーは OS を搭載しており,起動するア 録をはじめとして,著者が作成した版下をそのま プリケーションを切り替えることができる。その ま利用する形で電子出版のファイルとすること 意味で,多様な配信フォーマットに全て対応する は多い。現在,そのような場合には PDF ファイル デバイスを開発すること自体は,それほど大きな が事実上の標準として用いられている。しかし, 問題ではないと思われる。その意味で,この問題 前述のように現在の主要な電子書籍フォーマッ は社会システムの問題ということもできよう。 トの多くは,動的レイアウトを採用しており,こ 中間フォーマットがめざすワンソースマルチ のようなフォーマットが定着した場合に,多くの ユースが実現されれば,このような状況は改善す 研究者が現在までとは違うソフトウェアに対応 るかもしれない。また,資料の保存という意味で できるのか,また対応する必要があるのかは不透 も有効であろう。しかし,たとえ規格が定まった 明である。 としても,それがどの程度利用されるかが不透明 また,もうひとつの問題はレイアウトが動的に であるのは前述の通りである。

-388- 情報知識学会誌 2010 Vol. 20, No. 4

3) デジタル著作権 5)植村八潮. 電子書籍と国際標準フォーマット. デジタル著作権を設定できることは,エンバー

-389- 情報知識学会誌 2010 Vol. 20, No. 4

15)鎌田博樹.「日の丸電書フォーマット」と EPUB. 9%E6%BA%96%E5%8C%96%E3%81%AE%E7%8A%B6/.( (EBook2.0 Forum) 2010 年 6 月 9 日, 参照 2010-09-10) (http://www.ebook2forum.com/2010/06/j-fo 24)EPUB 日中韓の動向と CJK 拡張に向けての今 rmat-vs-/)(参照 2010-10-20) 後の動き ? 5/12 の JEPA 村田真氏の発表資料 16)新野淳一. 電子書籍の政府での議論が心配だ. より. CHINESE E-CHUBAN BLOG. (publickey). 2010 年 6 月 29 日, (参照 2010-10-20) 0%91%E3%81%91%E3%81%A6%E3%81%AE%E5%8B%95 17)中村祐介. 日本の電子書籍は,ガラケーと同 %E5%90%91%E3%81%AB%E3%81%A4%E3%81%84%E3% じ道をたどるのか?(NETMarketing Online). 81%A6-512%E3%81%AE%E6%9D%91%E7%94%B0%E7% (http://business.nikkeibp.co.jp/article/ 9C%9F%E6%B0%8F%E3%81%AE%E7%99%BA/> nmg/20100810/215764/)(参照 2010-10-20) (参照 2010-09-10) 18)池田信夫. 電子書籍でも失敗を繰り返すメデ 25)海上忍. 電子書籍の中間フォーマットは日本 ィア業界の「ガラパゴス病」 のガラパゴス化を進めるか? (参照 2010-10-20) 010/story/0,3800103623,20416869-2,00.htm 19)植村八潮. 電子書籍中間(交換)フォーマッ > (参照 2010-10-30) ト統一案と IEC62448 改訂. 26)海上忍. Apple や Google も標準化団体に加盟 (参照 2010-10-20) 010/story/0,3800103623,20419045,00.htm> 20)林雅之. 電子書籍の中間フォーマットについ (参照 2010-09-10) て. ついて(泥船湾日誌) (参照 2010-10-20) (参照 2010-09-10) 国際標準化(デジュール標準). 28) 武田英明.学術情報流通の現状. (参照 2010-10-20) al_network/gijutsu_04/pdf/shiryo4_1.pdf> 22)ろす. 中間フォーマットってどうやって使う (参照 2010-10-20) の? 29)EPUB というファイルフォーマットでは雑誌 (参照 2010-10-20) 23)台湾における電子書籍フォーマットの標準化 ((参照 2010-09-10) の状況について". CHINESE E-CHUBAN BLOG. 30) Haruka Ueda. 米大学が講義にKindle を導入 http://kzakza.wordpress.com/2010/08/03/% してみるも,不満集中 E5%8F%B0%E6%B9%BE%E3%81%AB%E3%81%8A%E3%8 (参照 2010-10-10) %E7%B1%8D%E3%83%95%E3%82%A9%E3%83%BC%E3% 83%9E%E3%83%83%E3%83%88%E3%81%AE%E6%A8%9

-390-