sos の 作業メモ

プログラミングや英会話学習、マイルや旅行、日常生活など。最近はWebFormなASP.NETのお守りがお仕事です。

日々の生活にhappyをプラスする|ハピタス Gポイント

文字コード超研究 20章〜21章(最終章)

文字コード「超」研究 改訂第2版

文字コード「超」研究 改訂第2版

前回の続き

20章 文字セットにはない文字を表現する方法

システム外字

割り当てられていないコードポイントを、利用者の合意によって自由に使う事を規格が許している場合は外字領域として使用できる。これをシステム外字領域と呼ぶ。 JIS X 0208:1997 / JIS X 0213:2000では以下のように規定されている。

  • すでにJIS X 0208で定義されている字を再割り当てしないこと
  • 同じ字を複数箇所に割り当てないこと
  • ISO 2022の終端バイト/改訂バイトのコードポイントを使わないこと
  • コードポイントと字形の一覧を公表すること

これらを守れば、空き領域の使用が許される

ユーザー外字

内輪だけでひっそりと使うものをユーザー外字と呼ぶ。どうしても使わなければならない時の最後の手段とする。

21章 インターネットと文字コード

インターネットでどのように文字情報をやりとりするかの簡単な解説。

FTPのバイナリ/テキストモード、メールのMIMEBase64,quoted-printable、HTMLの文字参照等、エンジニアとしては常識とも言える内容。


ということで、660ページにも及ぶ大作を読み終えました。こういった知識を拡げても、それが即仕事に繋がるわけではありませんが、長く喰っていけるエンジニアになるには、たまには寄道をしておくのも良いものです。 とりあえず文字コードに関しては当分大丈夫そう。

さてさて、Objective-C フレーズブックが読みかけのまま放置中なので、次はこれでも片付けましょうかね…