はじめに「~」などの文字が SJIS と UTF-8 で変換すると文字化けをします。調べると【なんとなく】わかるのですが、しばらくすると、いつもわからなくなりこんがらがるので、まとめておきます。文字化けす…
C++でWindowsアプリを作る場合に、マルチバイト文字列(std::string)とワイド文字列(std::wstring)の間で変換しなければならないことがあります。今回は、Windows API の MultiByteToWideChar() と WideCharToMultiByte() を使って変換を行うライブラリ(ヘッダーオンリー)を作ってみました(文末の str...
JEFCA : 文字コード変換を行う場合に、JIS第1水準/第2水準の範囲を、字体を意識せずに変換します。旧字体<->新字体の変換になります。ただし、83JISの改定にてJIS第1水準/第2水準を入れ替えた文字に関しては、入れ替えた文字と変換を行います。 製品・サービス区分 Interstage 製品・サービ...
ここからは解決方法にいたるまでのほかの失敗したアプローチを書き残す。 なお、行わなかったアプローチとしてはicovを利用した変換も提案されていたことを記しておく。 スクリプトファイルの文字コード変換 SJISが期待されている場所にUTF-8の文字列が渡されることが問題なので、ソースコー...