sos の 作業メモ

プログラミングや英会話学習、マイルや旅行、日常生活など。最近はWebFormなASP.NETのお守りがお仕事です。

日々の生活にhappyをプラスする|ハピタス Gポイント

iOS7で使われているUnicodeの絵文字と3キャリア絵文字の対応状況

Unicodeの絵文字(とキャリア絵文字のマッピング)といえば、

emoji4unicode - Emoji for Unicode: Google Emoji private use mapping data and tools - Google Project Hosting

何はともあれこのサイトが筆頭になるのですが、残念ながら最新の状況はサポートされておらず、いろいろと抜けもでているため、最新のものがどんな風にマッピングされているのかをちょっと調べてみました。

iOS7で一般的に入力可能な絵文字

List of iOS Emoji

このサイトに掲載されているように、現時点で絵文字のところで入力可能なものはこれだけあります。

別のアプリを使えばSoftBankがPUAに定義しているU+E001〜等も入力でき、utf-8なメールやSoftBank経由のキャリアメールでも昔ながらのSoftBank絵文字になってくれたりするのですが、そっちは機械的にSoftBank絵文字に変換すれば良いのでここでは対象外とします。

調査方法

3キャリアのiPhoneで試したところ、au版のキャリアメールからが一番良さそうだったので、これを元にします。

ということで、キャリア各社のマッピングではなく、auのマッピングテーブルになります。DoCoMoはUnicode絵文字なutf-8メールを投げるとemoji4unicodeレベルで変換されたメールがガラケーに届くのですが、SBの方はNG。記憶が朧げですが、ここのutf-8なメールはPUAな絵文字コードじゃないとダメなんでしたっけ?

あとはこれをプログラムで処理してマッピングテーブルを作成。

一部 〓 や [ほげほげ]といった代替の文字列になりますが、キャリア側に対応する絵文字がないので仕方ないですよね。

テストでいくつか選んで照合してみましたが、emoji4unicodeのものをちゃんと拡張したものになりそうな感じです。

これで某サービスのiOSな絵文字メールへの対応の目処が立ちました。

ガラケー時代のものとあわせて、E000~E7FFとF000~F29FのPUAを食いつぶしているので、この先の拡張に若干不安が残りますが…

 


キャリアが公開しているものでもないし、データ自体の公開は控えます。ごめんなさい。