小説のファイルフォーマットについての雑感

今出川潤です。
最初に告知だけ。明日の Comic Communication 14 にサークル参加します。
混凝土の隙間と奇譚集をお求めの方はぜひお越し下さい!

ver.T 参加イベント

オールジャンル即売会

Comic Communication 14

Comic Communication 14

開催:2010年 6月6日

インテックス大阪にて

参加: H-18b


さて僕は、一応は文芸サークル ver.T の代表で、編集作業や DTP やらあれこれを、素人なりに四苦八苦しながら日々勉強しているのですが、今回の記事では、その悩みをちょっとずつ記録してみます。
小説を発表するフォーマットについての雑感を、つらつらと書いていきます。
あ、ちなみに、今回はかなり長いです。

ウェブで小説を発表するのにわりと適しているフォーマットはだいたい次の五種類くらいだと思います。

PDF
ePub
XHTML
青空文庫テキスト
プレーンテキスト

iPhone アプリ形式や、エキスパンドブック形式など、作るのにライセンス料みたいなものがかかる形式は除外しています。
では、これらの良い所と悪い所を順番に見ていきます。

PDF ( Portable Document Format )

知名度:A
リーダ:必要。多種類存在。
誰もが知ってる PDF 。ウェブでの嫌われ者。クリックした瞬間に描画が始まると、ああやっちゃった、って気分になる。
ただ、最近は PC の性能が上がったり、リーダが軽くなったりで、個人的にはそんなに負担に感じたことはないです。
Adobe システムズ社が開発。仕様は公開されている。

フォント再現:可能。埋め込み。
文字セット:十分
書式の再現:完全
行の折り返し再現:固定
禁則処理:制御可能。
自分が使いたいフォントを埋め込むことができる。
文字セットは Unicode が使えるので十分。
縦書き、下付き、ルビ、組文字、縦中横などの書式の再現は完全に可能。ただし、組版できるソフトがあれば。僕は QuarkXPress 8 を使っています。
行の折り返しは固定。なので、文字を大きくするとページ全体が大きくなる。

ファイルの重さ:重
重い、といっても、これから比較する対象と比べての話。工夫次第で軽くできる。
音楽や動画に比べれば……。

XHTML

知名度:S
リーダ:多種類存在
ウェブでは、ほとんど無くてはならない存在。
このファイルフォーマットだと、インターネットブラウザさえあれば見ることができる。
なので、見る人にファイルフォーマットをほとんど意識させずに作品を見せることができる。

フォント再現:一部可能
文字セット:十分
書式の再現:完全
行の折り返し再現:可変
禁則処理:リーダ依存
フォント指定をすることは可能。しかし、ユーザ側にあることが前提。
文字セットは Unicode が使えるので十分。
縦書き、下付き、ルビ、などの書式の再現は一部可能。しかし、無理矢理やるとブラウザ間の互換性に問題が起きるので、最大公約数的な表現にとどめるのがいいのかもしれない。
行の折り返しは可変。文字を大きくすると、場合によっては行あたりの文字数が変わる。禁則処理はブラウザが勝手にやってくれたり。完全じゃないけど。

ファイルの重さ:中
重い、といっても、これから比較する対象と比べての話。工夫次第で軽くできる。

ePub

知名度:C
リーダ:少数
最近出てきたフォーマット。英語圏ではだいぶ前から少しずつ広まっていたらしいです。
iPad 上での本屋さんで買える形式はこれらしいです。
まだ詳しくは知らなかったりします。
Wikipediaこことかこことかを参考にしています。

フォント再現:可能。埋め込み
文字セット:十分
書式の再現:完全?
行の折り返し再現:可変
禁則処理:リーダ依存?
フォントは埋め込むことができるらしいです。
文字セットは Unicode が使えるので十分。
ePub は XHTML がベースになっているらしいので、書式の再現は一部可能。

しかし、 ePub フォーマットは、そもそも日本生まれではないため、日本語の組版を記述しようとすると、いろいろと問題が起きます。そのために、いま出版業界全体で標準を作っている最中らしいです。
で、そのような標準が定まっていないうちから、新人同人作家の僕らがヘタに手を出してデータを配りまくったら、規格を荒らすことになりかねないかもしれません。
ePub データを作るソフトは既にいくつかあるらしいですけど、それで組版をどれだけ再現できるかは疑問が残ります。
ということで僕は、 ePub で作品を発表するのはしばらくやらないつもりです。
それに僕らは作品データを無料で発表・配布している現状で、リーダが少なく知名度もまだない ePub を採用するメリットは少ないですし。
ちなみに、行の折り返しやレイアウトは可変らしいです。
こんな感じで、いろいろ便利そうです。

ファイルの重さ:?
いろいろやったら、 XHTML よりも重く、 PDF よりも軽い、くらいになるんじゃないかと予想。
が、 XHTML をベースに Zip 圧縮するから実際は軽くなる?
いや、本当にわかんないです。

青空文庫テキスト

知名度:中
リーダ:多数。書式無しならかなり沢山。
ここ数年でずいぶん知名度が上がってきたような印象があるフォーマット。 iPad 用のリーダがあったり
元々(?)は青空文庫で配布される文章の書式を記述するためのもの。文法はこちら青空工作員マニュアルより)。
しかし個人的には、青空文庫対応リーダのサンプル文書から文法を調べた方が早いと思います。
青空文庫対応リーダは、いろんな環境にあります。 PC に限らず、携帯やスマートフォンにもあるらしい。なので、マルチプラットフォーム。
しかし、詳しくは後述する対応テキストエンコーディング問題があります。
ちなみに、僕が好きなリーダは AIR 草紙です。 Adobe AIR を使っているので、だいたいの PC で使用可能。テキストのエンコーディングを選べるのも良いです。
うっすらと次のページの文字が透けて見えるあたりの演出がニクい。お勧め。

フォント再現:リーダ依存
文字セット:だいたい
書式の再現:一部可能
行の折り返し再現:リーダ依存
禁則処理:リーダ依存
元々テキストファイルなのでフォントはリーダに依存します。指定する文法もなかったハズ。
先ほど触れた、対応テキストエンコーディング問題。実はこれは、僕が勝手に今命名したものです。
青空文庫用のリーダは多数あれど、その全てが あらゆるテキストエンコーディングに対応しているわけではない、という問題です。
ぶっちゃけて言えば、 Unicode UTF-8 とかで青空文庫形式テキストを作ってしまうと一部のリーダでは開けなくなってしまいます。
なので、青空文庫形式で配布する時は、大体のリーダが対応している Shift_JIS でエンコーディングにした方が良いです。
しかしそうすると、 Unicode に収録されている一部の文字が、 Shift_JIS では使えなくなってしまいます。
……とは言っても、使えなくなる文字なんて本当に一部の文字なので、気にしなくても問題なさそうです。
行の折り返しは可変。リーダによって調整可能。っていうかリーダ依存です。
禁則処理もリーダ依存。

ファイルの重さ:軽い
Shift_JIS で配るなら、とっても軽くなります。多分、この中で一二を争うくらいです。

プレーンテキスト

知名度:S
リーダ:最多数
全て(?)の基本。 PC 使うならまず開けないことはないファイルフォーマット形式。
リーダがないコンピュータはない。
ただし、正しく開こうと思うと、いろいろ面倒なことがあります。
Wikipedia の文字化けの項目も参照。

っていうか、この問題を調べ出すと、本当にキリがないです。
コンピュータの歴史に密接に関わりあってきたため、負の遺産も多く受け継いでいます。
ある意味、一番避けた方がいいファイルフォーマット形式。

フォント再現:リーダ依存
文字セット:だいたい
書式の再現:不可能
行の折り返し再現:リーダ依存
禁則処理:リーダ依存
フォント情報、書式の再現、行の折り返し、禁則処理など、あらゆる情報がリーダ依存。
なので、利用者側で自由にいじれる、というのは利点の一つかもしれないです。
使用可能な文字セットは、テキストエンコーディングによります。ただし、 Shift_JIS だと Mac と Windows の機種依存文字が問題になります。

で、 Shift_JIS を避けると、 Unicode になります。その中でも、個人的には UTF-8 が良いんじゃないかなーと思っています。いや、もっともな根拠は特にないんですけど。
Windows メモ帳でデフォルトで開けるし。 Mac ではちょっと設定しないと、すんなりとは開けないけど。

余談ですが、 Mac で入力できる【  】林檎マークは Unicode に収録されているし、 Windows で表示できないのはフォントに文字が収録されていないだけで、機種依存文字とは違うんじゃないの? と思ってたら、どうもそうじゃないらしい……。よくわかんないけど。

改行コードも問題になってきます。でも Windows 標準の CR+LF でいいんじゃないかな、と思っています。

テキストに関しては、気にし出したらとにかく問題が大きくなり過ぎるので、ある程度は問題を区切って思考停止しないとやってられないんじゃないかな……。

ファイルの重さ:軽い
とは言っても、もしテキストエンコーディングを Unicode UTF-8 にすると、ひらがなや漢字などの部分のサイズが Shift_JIS の1.5倍になります。
それでも、PDF や ePub に比べればまだ軽い方なのかもしれないです。

まとめっぽいもの

以上が、ファイルフォーマットの比較です。
今のところ、 ver.T では PDF を採用しております
以前は XHTML と青空文庫形式も採用しておりました。 XHTML はまた近いうちに復活するかもしれません。
青空文庫形式は……もしかしたらまた作るかも。

こちらでいろいろ手を加えて、なるべく高い完成度で見てもらうように PDF を用意するなら、
それに対してなるべく軽く、ユーザがある程度は調整可能なファイルフォーマットとして XHTML 形式を用意するのは、ありだなと思っています。
いたずらに形式を増やしても、ユーザビリティというか、使いにくくなりそうだし。

ただ、近い将来にどんなファイルフォーマットが出てくるかわからないし、また、今あるファイルフォーマットの問題が解決するかもしれないので、要するにどうなるかわかりません。
これから先、小説はどうなってしまうのでしょうか。
時代の動向から目が離せません。

Leave a Reply