携帯の絵文字のUnicodeへの収録

先ほど，日本の携帯で使われている「絵文字」のUnicodeへの収録を検討していることと，そのためのデータがGoogleのブログで発表された．詳細は以下を見て頂きたい．
Emoji for Unicode: Open Source Data for the Encoding Proposal（Google Code）
Googleの日本語ブログでも，もうすぐ日本語訳（？）を公開するそうである（追記：公開された．）．この案は，将来的にISO/IEC JTC 1/SC 2に提案することになると思われる．
この提案で誤解して欲しくないことは，この提案は，既存の携帯の変更を伴わないことである．つまり，この提案は，例えばGmailのような複数の携帯キャリアの絵文字を扱わねばならないシステムを意図したものであり，従来私用領域（Private Use Area）に割り当てていた文字を正式に符号化すると共に，その相互変換のためのマッピングも定義する．これらのツール類やデータは無償で公開される予定である．
この作業で一番難しいのは，各キャリアの絵文字の対応付けであろう．これに関してはかなり苦労したようだが，基本的に一意に決定するのが難しく，現在同様な目的のために各社で使われている変換表も必ずしも同一ではない．日本では，直接仕事に影響がある開発者は多いので，ぜひレビューして，その結果を彼らにフィードバックして頂きたい．どうかよろしく．