UTF-8 History

Unicode MLで,まだJava Modified UTF-8の議論は続いているのだが,その中にUTF-8の発展の歴史に関する情報があったので,紹介しておこう.


http://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt


今ではPlan 9はどうなっているのだろうと思ったが,まだ結構活発に活動しているようだ.素晴らしい.

あと,CESU-8(Compatibility Encoding Scheme For UTF-16: 8-Bit)の話が出ている.


UTR #26: Compatibility Encoding Scheme for UTF-16: 8-Bit (CESU-8)


JSR-204ではCESU-8はサポートしていない.