[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
2001/06/24 02:28 from msyk
Title: [teenbbs:1159] Re:1153)web-based news server (1)

No.   : 1159
Sender: msyk
URL   : 
Title : Re:1153)web-based news server (1)

>本文も同様に文字化けしているのですが, この文字化けをちょっと検証してみて
>判明したのは, netnews ですから日本語だと元の文字コードは当然 ISO-2022-JP
>ですが, これを web-based ( つまり HTML) 化する時に JIS コード文字列中に
>ある <, >, ", & を文字参照に変換してしまっているということです.

mee で "Accept-Language: ja" を "en" 等に変更するか全く送信しないように
すると本文は ISO-2022-JP で表示されることになるのですが, それを見ると
上記のような単純な文字参照への変換は行なわれていなくて, 悪いことにもっと
酷いバグバグな不可逆性の変更(変換?)が行なわれているようです.
それが文字化けの原因になっていて単純に sed で元に戻したりはできないのでした.

groups.google.com は過去記事の膨大なアーカイヴを持っているので
なんとか日本語で読めれば嬉しいのになぁ(;_;)

[レスを書く]