ブログ - ~と〜
~と〜の違い.
~と〜
ですよ.
~〜です.
わかりやすい様に,ファイルに保存して中身を確認.
答えは,これ.
つまり,1文字目の「~」は0xEFBD9Eで,2文字目の「〜」は0xE3809Cなのである.〜が~に変換される問題だと誤解していたけれど,この問題は,一言で言うと
SJISにある「〜」をUTF-8に変換する際に「~」にするか「〜」にするかは実装次第
普通の人には関係ない.でもこれ,大問題.
あま~いアイス
おいし〜いアイス
表示上,人間の目だとどっちでも良いけれど,あいまい検索で「〜いアイス」としたら「おいし〜いアイス」しか引っかからないよね.
他にも,ー—―とか,-‐‑–−ーとかがあって.これは,仕様策定時のミスらしいけれど,将来的にエンジニアの「専門家」としての地位確保のための布石なんだとおもうね.2000年問題よりも巧妙だな.まぁ,SJISが撲滅すれば良いのだろうけれど,だいぶなくなったけれど.
~と〜
ですよ.
~〜です.
わかりやすい様に,ファイルに保存して中身を確認.
MBA13:~ $ cat wave.txt
~〜
MBA13:~ $
MBA13:~ $ hexdump wave.txt
0000000 ef bd 9e e3 80 9c 0a
0000007
MBA13:~ $
SJISにある「〜」をUTF-8に変換する際に「~」にするか「〜」にするかは実装次第
普通の人には関係ない.でもこれ,大問題.
あま~いアイス
おいし〜いアイス
表示上,人間の目だとどっちでも良いけれど,あいまい検索で「〜いアイス」としたら「おいし〜いアイス」しか引っかからないよね.
他にも,ー—―とか,-‐‑–−ーとかがあって.これは,仕様策定時のミスらしいけれど,将来的にエンジニアの「専門家」としての地位確保のための布石なんだとおもうね.2000年問題よりも巧妙だな.まぁ,SJISが撲滅すれば良いのだろうけれど,だいぶなくなったけれど.