2023-05-13 (Sat)

今日は昼過ぎから雨だったが、午前中はベランダに洗濯物を干せて、ズボンやチョッキ以外はなんとか乾いた。

中華フォント

昨日、中華フォントについてツイートしたら、いろいろ思想強めなリプライやエアリプがついてきて、精神的にしんどくなった。言語や方言の区別が政治的・社会的な影響を受けるのは知ってたけど、何を同じ文字とみなすかについてもいろいろあるんだなあ……

別字衝突はそれはそれで問題だが、いわゆる中華フォント問題については、同じ文字コードを異なる言語のフォントで表示したときに元の言語において別の意味を持つ文字に化けてしまうケースが問題。そういう文字はどのくらいあるのだろうか。

(実際には違うが、仮に)「機」と(その簡体字である)「机」が同じ Unicode 番号だったとすると、「機上」と書いたつもりが、別のフォントで表示したら「机上」とレンダリングされ、日本語にはどちらの単語も存在するから大変困る。一方、中華フォント問題でよく例に出される「刃」などについては、点の位置が多少変わったところで日本語として見たとき異なる意味になることがないというのが最初に言いたかったこと。

特に、今回の Google Bard の発表の「日本語」の「語」のフォントについては、ごんべんの点が批判されているようだが、文化庁「常用漢字表の字体・字形に関する指針(報告)」の代表音訓索引 によると日本語の字体として許容範囲内であるように見える。 とはいえ、日本語用にデザインされたフォントのほうが日本語話者にとって自然で美しく感じられるのは間違いないから、フォントを切り替えてほしいという意見に反対するつもりはない。

とりさん自身は、CJK 統合の正当化について "Unicode Technical Note #26 ON THE ENCODING OF LATIN, GREEK, CYRILLIC, AND HAN" で説明されている Unicode の立場に説得力を感じた。ここからリンクされている Unicode standard 18 章の "Distinguishing Han Character Usage Between Languages" に、言語情報を保持するのは Unicode の担当範囲外であると明示されている。

読んだ

アニメ

  • 「私の百合はお仕事です!」5 話を見た。安定して興味深い。
    「さっさと腹を割って話せよ」って感じの引き伸ばしになるとしんどいけど、今のところ問題ない。主人公の他人に好かれたいという強迫観念は何に由来しているんだろう。見捨てられ恐怖が強いようにも見えないけれど。