UJP - ~と〜

Life is fun and easy!

不正IP報告数

Okan Sensor
 
メイン
ログイン
ブログ カテゴリ一覧

  • カテゴリ ハウツー の最新配信
  • RSS
  • RDF
  • ATOM

ブログ - ~と〜

~と〜

カテゴリ : 
ハウツー
ブロガー : 
ujpblog 2016/9/2 1:19
 ~と〜の違い.

~と〜
ですよ.

~〜です.
わかりやすい様に,ファイルに保存して中身を確認.
MBA13:~ $ cat wave.txt
~〜
MBA13:~ $
答えは,これ.
MBA13:~ $ hexdump wave.txt
0000000 ef bd 9e e3 80 9c 0a
0000007
MBA13:~ $
 つまり,1文字目の「~」は0xEFBD9Eで,2文字目の「〜」は0xE3809Cなのである.〜が~に変換される問題だと誤解していたけれど,この問題は,一言で言うと

 SJISにある「〜」をUTF-8に変換する際に「~」にするか「〜」にするかは実装次第

 普通の人には関係ない.でもこれ,大問題.


あま~いアイス
おいし〜いアイス

 表示上,人間の目だとどっちでも良いけれど,あいまい検索で「〜いアイス」としたら「おいし〜いアイス」しか引っかからないよね.

 他にも,ー—―とか,-‐‑–−ーとかがあって.これは,仕様策定時のミスらしいけれど,将来的にエンジニアの「専門家」としての地位確保のための布石なんだとおもうね.2000年問題よりも巧妙だな.まぁ,SJISが撲滅すれば良いのだろうけれど,だいぶなくなったけれど.

トラックバック


広告スペース
Google