I18N

「Java 6 でIVSを比較すると何が起こるか」の記事の誤り(続編)

先日のエントリで「ざっとチェックした限りでは,それらにはまだIVSがらみの変更はないようだが,もし見落としがあれば教えて頂きたい」と書いておいたら,さっそく仕様書に記述はないが,Unicode DatabaseのDUCET(Default Unicode Collation Element Table…

「Java 6 でIVSを比較すると何が起こるか」の記事の誤り

以下の記事に誤りが散見されるが,それが広まるのは望ましくないので,ここで誤りを指摘しておく. 「Java 6 でIVSを比較すると何が起こるか」(yanok.net) まず,Javaの文字列の同一性判定の話である. これは想像通りですね。単にcharの列を比較しただけ…

樋浦秀樹さんを送る会(西麻布・クリニカ・ガストロノミカ・エスペリア)

ガンで亡くなられた樋浦秀樹氏を送る会が開催されたので,私も行ってきた. 確か15年ぐらい前に私の発言に関して直接メールを頂いたのがきっかけで,それからはいろいろ面倒を見て頂き,私の著書のレビューなどもお願いしたことがあったし,アメリカや日本で…

常用漢字表のUnicode補助文字問題

京大の安岡先生が常用漢字表でUnicode補助文字(Unicode Supplementary Character)の領域に割り当てられている文字がレガシーなシステムでうまく扱えないことを問題にしている. どうして常用漢字表を改定するハメになったのか(yasuokaの日記) まあ,Shift-…

ことえりユーザ辞書からGoogle辞書への変換

ことえりのユーザ辞書からGoogle日本語入力の辞書フォーマットに変換するプログラムを作ってみた.使い方は以下の通り. % javac DicConverter.java % java DicConverter ことえりの辞書.txt Googleの辞書.txt 注意点は以下の通り. ことえりのユーザ辞書は…

「「絵文字の議論は、これでいいのだろうか。」へのお答え」へのコメント

小形克宏氏は,残念ながら山本太郎氏が「絵文字の議論は、これでいいのだろうか。」で言いたかった真意を誤解しているように見える. 「絵文字の議論は、これでいいのだろうか。」へのお答え(もじのなまえ) 山本氏の指摘にもあるように,実は小形氏の発言…

携帯の絵文字の符号化の提案のパブリックレビュー開始

以前にお伝えした携帯の絵文字の符号化の提案だが,ついに2009年2月のUTCミーティングに向けてのパブリックレビューを開始した.詳しくは,GoogleグループのMarkus Schererの次の投稿を見て頂きたい. "Emoji: Public Review December 2008"(Googleグループ…

絵文字の符号化は何が難しいのか?

安岡先生から,さっそく「以前『ケータイの絵文字と文字コード』(情報管理, 2007年5月)を書いたときに、ざっと対応表を作りかけて、結局、挫折した覚えがあるんですけど…。だって、動く絵文字があるんですもの。」という素晴らしい的確な突っ込みが入った.…

携帯の絵文字のUnicodeへの収録

先ほど,日本の携帯で使われている「絵文字」のUnicodeへの収録を検討していることと,そのためのデータがGoogleのブログで発表された.詳細は以下を見て頂きたい. Emoji for Unicode: Open Source Data for the Encoding Proposal(Google Code) Googleの…

Web上でついにUnicodeがASCIIを越える

Mark Davisのブログの記事「Moving to Unicode 5.1」によると,Web上で使われる文字符号化の割合として,UTF-8が,ASCIIやISO-8859-1/CP-1252を越えたらしく,その様子がErik von der Poelが作成したグラフでわかる. すでに,かなり前から既にOSやシステム…

キーボード配列QWERTYの謎(NTT出版)

ある日,会社の机の上にあった小包を開けると,中に安岡先生のブログを見て興味を持っていたこの本が!…安岡先生,どうもありがとう!!キーボード配列QWERTYの謎作者: 安岡孝一,安岡素子出版社/メーカー: NTT出版発売日: 2008/03/01メディア: 単行本購入: 1…

Fonts & Encodings(Oreilly & Associates, Inc)

オライリージャパンの某編集者に,今度こういう書籍が出たんですけど…と,次の本を献本して頂いた.Fonts & Encodings: From Advanced Typography to Unicode and Everything in Between作者: Yannis Haralambous出版社/メーカー: O'Reilly Media発売日: 200…

「Vistaの新文字セットが引き起こすトラブル」特集

IT Proに特集ページができている.http://itpro.nikkeibp.co.jp/99/vista/index.html私は,次の3つの段階で問題が発生すると予想している. 文字の表示(フォント変更に伴う字体変更) 内部でレガシーエンコーディングを用いたシステムの入・出力(新しく追…

Windows Vistaの登場で顕在化する問題

C#言語のJIS改訂作業の委員会に出ていて,もうすぐWindows Vistaがリリースされるために現在各社で懸命に検証作業をおこなっているが,その中で見つかったという興味深い問題の話を某氏に聞いた.なお,私自身はまだ使っていないので,伝聞の話として読んで…

フラ・ニーニャに見る新しいインターフェースのアイデア

Excite Bitコネタで次の現役ばりばりの気象予報士によるフラ・ニーニャというフラ・ユニットの記事を見つけてから,彼女らのポッドキャストを見ているが,かなり面白いアイデアなのではないかと思い始めた.http://www.excite.co.jp/News/bit/00031152493449…

番号記号とシャープ

C# Language Specificationには,「C#」の読み方については「The name C# is pronounced “C Sharp”.」と書かれている.つまり,「しーしゃーぷ」と読めばいい.しかし,この後に表記について「The name C# is written as the latin capital letter C (U+0043…

プログラミング言語における新しいUnicodeの活用法

東京大学でおこなわれた,Sun Microsystems LaboratoriesのGuy Steeleの"The Fortress Programming Language"という講演を聴いてきた.当日は,著名な先生方が沢山集まっただけでなく,そもそも用意した部屋のキャパの確実に二倍以上集まりすぎて,急遽大教…

OSS における統一したレガシーエンコーディングの変換機能の開発(OSC2006)

以下のように資料が公開されている.http://sourceforge.jp/docman2/?group_id=2198なお,ここで指摘されている"YEN SIGN Problem"は,どちらかと言えば問題は正しく説明しているとは言えない.正しくは,以下の資料を参照して欲しい.http://www.opengroup.…

レガシーエンコーディングの問題

id:hyoshiokさんのところで,次のように,OSS関係ソフトウェアにおけるレガシーエンコーディングの問題を解決しようという試みに関する記事が投稿されている.http://d.hatena.ne.jp/hyoshiok/20060316これはオープンソースソフトウェア活用基盤整備事業とし…

近刊「文字符号の歴史ー欧米と日本編ー」(共立出版)

三上喜貴さんの「文字符号の歴史 アジア編」は名著である.それまでは,なぜ"Japanese Information Processing"を書いたのが日本人ではなく,Ken Lundeだったのか?と残念に思っていたので,この本を見て感激した.文字符号の歴史 アジア編作者: 三上喜貴出…

Globalization Gochas

Mark Davisの書いた,Unicodeを使ったグローバライゼーションの落とし穴に関する考察.興味深い事項が簡潔に指摘されている.http://macchiato.com/slides/gotchas.htmlこれは次のUnicode Conferenceの発表のドラフトらしいが,Unicode MLだけでなく,W3C I1…

人材募集

Unicode MLに人材募集を投稿するのは禁止されているのだが,代わりにUnicode Consortiumのホームページに人材募集ページができた.http://www.unicode.org/jobs/現在,Microsoft,Google,Apple Computerで国際化エンジニアを募集しているようだ.

Thank you for your work and see you again, Norbert!

Norbert Lindenberg is a famous I18N engineer at Sun Microsystems. Unfortunately he says farewell to us on his blog.http://blogs.sun.com/roller/comments/norbert?anchor=farewellHe have solved huge problems in Java's I18N area. He wrote their…

Windows VistaにJIS X 0213:2004対応フォント搭載!

前から聞いていたが,ついに発表.http://pc.watch.impress.co.jp/docs/2005/0729/ms.htmWindowsで本格的に使えるようになると,BMPの外にある補助漢字や,合成文字で表現されるアイヌ文字が普通に使われるようになってくるだろう.ということで,Unicode Su…

Using to Link to Localized Content

W3Cの,Webサイトをプロダウンメニューを使ってローカライズする場合に関する記事.http://www.w3.org/International/questions/qa-navigation-select

IDN問題,その後

すっかり失念していたが,HOTWIREDの記事によると,ICANNはIDNの採用を先延ばしにしたらしい(本当は翻訳記事より生の情報を読むベキなのだが).http://hotwired.goo.ne.jp/news/culture/story/20050719206.htmlここで興味深いのは,Unicodeは字体(glyph)で…

Java SE 6の国際化の変更

Norbertが,ものすごい勢いでブログを更新しているが,特に注目したいのが,国際化がどのように変わるかということだ.ぜひコメントしてあげて欲しい. ロケール回りの変更 New Supported Locales http://blogs.sun.com/roller/page/norbert?entry=new_suppo…

ルピのチュートリアル

XHTMLのルビに関するチュートリアルが後悔された.http://www.w3.org/International/tutorials/ruby/

Ken Lunde講演

…というわけで,行ってきた.kyukaの予想通り,濃そうな人が何人もいて負けた(笑)ただ,最後の彼の家族の紹介やら,彼の自宅のプール(うらやましい)の写真とかは面白かった(←何を見てるんだっ).…だけで済ますのもアレなので,少し気が付いた点などを…

Ken Lunde氏の講演(中継)

「日本語情報処理」と「CJKV日中韓越情報処理」の著者であるKen Lunde(ケン・ランディ)が,5月27日にシリコンバレーにある法政大学アメリカ研究所で講演する.嬉しいことに,それを5月28日(土)の10:30〜13:00に法政大学の九段校舎に中継してくれるらしい…