2004-11-06から1日間の記事一覧

文字符号化検出と言語検出

ちょうどW3Cのwww-international MLで,character encoding detectionとlanguage detectionの話が出ていた. たとえば,WebのHTMLファイルを処理しようとしても,必ずしもどのような文字符号化なのか,どのような言語なのかが明示されているわけではなく,し…