sos の 作業メモ

プログラミングや英会話学習、マイルや旅行、日常生活など。最近はWebFormなASP.NETのお守りがお仕事です。

日々の生活にhappyをプラスする|ハピタス Gポイント

文字コード超研究 13章〜14章

文字コード「超」研究 改訂第2版

文字コード「超」研究 改訂第2版

前回の続き

13章 JIS X 0212

1990年に制定。JIS X 208と同じ構造を持つが、ほぼ重複のないように作られており、補助漢字セットとして用いられる。

SHIFT_JISやISO-2022-JPでは使えず、EUC-JPやISO-2022-JP2でのみだったため、長い間普及しなかったが、Unicodeで取り入れられ、徐々に使われるようになってきた。と思ったのもつかの間、2000年にJIS X 0213が制定され、新しい字の追加等はそちらで行われるようになった。

文字種

  • 1区 - 未定義
  • 2区 - ダイアクリティカル・マーク(分音記号)とその他の記号
  • 3〜5区 - 未定義
  • 6区 - 分音記号付ギリシア文字
  • 7区 - 分音符号付キリル文字/リガチャー(合字)
  • 8区 - 未定義
  • 9〜11区 - 分音符号付ラテン文字/リガチャー(合字)
  • 12〜15区 - 未定義
  • 16〜77区 - 補助漢字(いわゆるCJK統合漢字)
  • 78〜94区 - 未定義

14章 JIS X 0213

2000年に制定。JIS X 0212と異なり、JIS X 0208を増強して置き換えるスーパーセット。ISO 2022に準拠。2004年に改訂されたため、オリジナルを JIS X 0213:2000, 改訂版を JIS X 0213:2004、短縮してJIS2000,JIS2004と呼ぶ事もある。(0208は87JISや97JISなのに、なぜこちらは数字が後なのかは謎)

Unicodeと同様に、JIS X 0208の区点の上に面の概念を導入し、1面はJIS X 0208と同じ文字が定義されている。漢字を特定するのには、面区点の三次元のコードが必要となった。

第1面のJIS X 0208の空き領域に第3水準、第2面のJIS X 0212の空き領域に第4水準が新たに収容されている。

JIS X 0208JIS X 0212JIS X 0213

表外漢字字体表

2000/12/8に、表外漢字表という印刷用の漢字の字体のガイドラインが示された。本来 JIS X …は、文字概念と数字のマッピングを定めるだけで、細かな字形はフォントメーカーが決めてきたのだが、政府からの表外漢字表が権威となり、JISの例示字形にもこの表の字形が取り込まれることとなった。

既存の例示字形を変更した168文字と、第3/第4水準として追加された10文字。後者は、既にUnicodeに表外漢字表への対応後の文字が存在していたため、表外漢字UCS互換として新たに追加されることになった。

表外漢字UCS互換

一点之繞と二点之繞の辻は包摂基準で同じ字体とされるように、噓(表外漢字UCS互換)と嘘もJIS的には同じ字体。ただUnicodeに両方が存在したためという理由で、JIS X 0213では別のコードが割り当てられたというだけ。

WindowsのJIS2004対応

JIS2004に対応するために、Vistaにはメイリオという新しいフォントが導入された。"明瞭"が由来だそうだ。

第1面

JIS X 0208と、空き領域に追加された漢字や記号、特殊文字等の第3水準漢字が設定されている。

13区には①等のNEC特殊文字が追認されている。完全に同じ物ではないため、安易に使うのはよくないが、JIS X 0213で認められた文字に関しては、機種依存文字として声高に排除してはいけなくなったっぽい。

第2面

JIS X 0212で使われていない領域に、第4水準漢字が設定されている。 元々 JIS X 0212と 第3/第4水準漢字は重複するものが多いため、第1面と違ってJIS X 0212の漢字は設定されてはいない。

また、JIS X 0212JIS X 0213は同時に使ってはならない。領域がかぶらないように配置されているのは、EUC-JPとEUC-JIS-2004を簡単に見分けるため。


JIS X 0213がこんなに柔軟になっていたとは知りませんでした。 Shift_JISからUnicodeへと主役が変わりつつあるのを感じたのでしょうか?

次回へ続く