第3回 ちょっと見ぬまのユニコード|学会誌・学術印刷全般・学会業務受託など、文化学術の発展に貢献する中西印刷

第3回 ちょっと見ぬまのユニコード

 いつものようにインターネットで何かを調べていた。何を調べていたかはもう忘れたが、あるページのかたすみに見覚えのある文字を見つけた。タミル文字である。何年か前インドのチェンナイ(旧名マドラス)の印刷業者を訪ねた時、さんざん眼にした文字だ。ちょっと丸っぽくてユーモラス、梵字の元になったインド北部のデーバナーガリー文字とは全く印象が違う。一時話題になったインド映画「ムトゥ踊るマハラジャ」にでてくる文字だ。日本ではインド映画オタクでもない限り眼にすることは決してない。


 タミル文字を画像で貼ってあるのかなと思ったが、どうもそうではない。調べてみると、ちゃんとしたテキストである。ちなみにコピーペーストしてみたら、一太郎に取り込めてしまう。特殊文字のインストールなどもしていない何の変哲もないパソコンでである。その気になって探してみると、イスラエルのヘブライ文字であろうが、イスラム圏のアラビア文字であろうが、何でもテキスト表示できてしまっているではないか。


 ユニコードなのであった。


 懐かしいなという感をもたれる方も多いと思う。もう10年近く前になろうか、ユニコード論争というのがあった。これには印刷業界もずいぶんふりまわされた。全世界のすべての文字を統一基準で表現しようとしたユニコードが漢字コード制定についてあまりに乱暴だといって大激論となったのだ。批判的な意見が多かったように思う。日本語と中国語と韓国語にでてくる漢字を全部まとめて一律なコードをふってしまう性急さに違和感の表明があいついだ。


 私もこの時代の論争には辟易させられたことがあるのだが、この論争によって漢字コードそのものの持つ問題点が次々と明らかになり、解決策が試みられるようになったのは事実である。商売柄、漢字コードには苦労してきた。電算写植の時代、使える漢字が少なくて困ったことは忘れられない。今で言うJIS第2水準ですらまともに提供されていなかったし、JISコード自身も混乱していた。「灌漑」と入力したつもりが「潅漑」と表記されたというようなことも日常茶飯事で、いつもクライアントからクレームがついた。それが今ではあれほど苦労した「髙」と「高」の区別も楽々入出力できてしまう。文字コードそのものに対する理論が精緻なものとなり、結果として昔ほど漢字コードについての論争は聞かなくなった。


 文字コードの雄ユニコードも当然進化する。ユニコードは漢字だけでなく、全世界のあらゆる文字を統一基準にのっとって表記するわけだから、ありとあらゆる文字が簡単に表記できるようになったわけだ。調子にのって、一太郎でユニコードを使って色々な文字を表記してみた。おそるべきことに全世界の文字はほとんど、いや、すべて網羅されているといっていい状態になっている。ただ、あまりに日本で馴染みのない文字についてはフォントの提供がなされていない。それでも、そこにコードがあり、表示できない文字として「□」が表示されている。ということはいずれすべて表示するつもりなのだろう。


「ユニコードちょっと見ぬまに大進化」というところか。もちろん、日本語でも論争になったぐらいで各文字の表記とコードのあり方については議論が続いているようだ。それでも全世界の全文字をという執念には脱帽せざるをえない。みなさんは線文字Bをご存じだろうか。今から3500年前にクレタ島で使われて、当然、紀元前にして使われなくなった文字なのだ。これにまで、ユニコードは丁寧に字形とコードを載せている。むろんすべてのコンピュータに線文字Bのフォントが載るのは近い未来とはいいがたいにしても、とりあえずユニコードに拍手。



ページの先頭へ