「デコード出来ねーぞ」ってお怒りの模様。 Excel作成のCSVは文字コードが「shift-jis」なので、一応読み込みのencodingでを指定してみますが、 importpandasasimportpdpd.read_csv("file/to/path",encoding="shift-jis") やっぱりエラー。ですよね。 UnicodeDecodeError:'shift_jis'codeccan't decode ...
df = pd.read_csv("input.csv", header=0, index_col=0, encoding="SHIFT-JIS") data = df.to_numpy() すると、下のような「data」というnumpy配列が出来たと思います。 ここで重要なのが、「nan」は文字ではなく実数(float64)として読み込まれていることです。
なお、読み込み可能なファイル形式は、csvもしくはtxt(カンマ区切り)のみになります。 ファイル読み込みの設定としてEncoding format(utf-8もしくはcp932)、Line number to start reading(読み込み開始行数)の指定があります。読み込み開始行数については、例えば、最初の2行が空白で3行目から...
df=pd.read_excel(filepaths[0],engine='openpyxl')...dfに対しての色々な処理(省略)...# test.csvとして出力 encodingに"shift-jis"を指定。上と同じ。df.to_csv("test.csv",encoding="shift-jis") 発生したエラー File "pandas/_libs/writers.pyx", line 49, in pandas._libs.writers.write_...