はじめに「~」などの文字が SJIS と UTF-8 で変換すると文字化けをします。調べると【なんとなく】わかるのですが、しばらくすると、いつもわからなくなりこんがらがるので、まとめておきます。文字化けす…
参考:How to convert a file to utf-8 in Python? 備考1 冒頭の部分は自分が付け足しています。 # srcfile:対象のファイルパス trgfile:変換&生成されるファイルパスsrcfile='./sample_sjis.csv'trgfile='./sample_utf8.csv'# 変換後の文字コードを指定(今回の場合は、「utf-8」)to_codec=...
UTF-8,UTF-16は、Unicodeを実装した符号化方式です。 BOMは、Unicodeで符号化したテキストの先頭に付与される数バイトのデータです。 文字コードの詳細を説明するのはとても大変です。 WEBを探したところ、詳しく分かりやすく説明しているページがありましたので紹介しておきます。
shebang(シバン) ではない。Python に限ったものではないので、それはわかる。知りたいのは Python の教科書などで「ソースの文頭に書け」と言われる、冒頭に記述する utf-8 …