文字コードについて

『「Unicode」に変換』ってのと『「UTF8」に変換』ってヤツの意味合いとか

作成日:2020-01-06, 更新日:2020-01-06

経緯

・文字コードを変換する際に『「UTF8」や「SJIS」に変換』は失敗、『「Unicode」に変換』は成功ってコトがあった。
→そもそも「Unicode」って何?という疑問を抱いたので調べてみた。

まとめ

詳しく知りたいわけじゃなない。なんとなくざっくりとした感じで分かれば良いので深く調べていない。

符号化文字集合:Unicodeとか
「人が使う文字」と「文字に割り当てたID」の対応表
文字符号化方式:UTF8とか
「文字に割り当てたID」と「コンピューターが使う数字(0、1の2進数)」の対応表

「OSは人とコンピューターの通訳さん」って聞いたことがある。
「人が使う文字」と「コンピューターが使う数字」を相互に翻訳してくれるってコトでOSが通訳さんってコト?

Unicodeに変換

テキストエディタとかで「UTF8」や「SJIS」、「Unicode」に変換という設定もあったりする
→このときの「Unicode」は「符号化文字集合」ではなく「文字符号化方式」という扱いで「UTF16」を指すらしい。