Pandasで「UnicodeDecodeError」エラーが出た時の対処法

blue click pen near white document papers on top of brown wooden table

最近、任天堂スイッチの桃鉄を買ってテンションが上がっているshinです。

今回は今勉強中である、Pythonを使ったデータ分析のpandasを使った時に発生したエラーが発生したので、対処法の備忘録として残しておきます。

目次

環境

  • Windows10
  • jupyter notebook
  • pandas 1.1.5

やったこと

pandasでやったことはごく普通のCSVファイルの読み込みです。
コードは以下です。

df = pd.read_csv("notebooks/data/test.csv")
df

エラー内容

エラー内容としては次のエラーが発生していました。

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x94 in position 0: invalid start byte

ユニコードデコードエラーと出ているので、ユニコードが問題なんだなと思い、大体こんな時は日本語が読み込めていないんだなと思い。

グーグル先生に、「UnicodeDecodeError pandas 日本語」と検索すれば、先人たちの知恵が詰まってますので、その知恵を拝借します。

とりあえず日本語を読み込みたい場合は、「encoding=”shift-jis”」を、read_csvの引数に設定すればいいみたいです。

対処法

というわけで先ほどの、コードに「encoding=”shift-jis”」を追加します。

df = pd.read_csv("notebooks/data/coconara.csv", encoding="shift-jis")
df

これで実行すると、無事日本語で表示されました。

ググると何でも解決できるから助かります。
今回は以下のサイトを参考にさせていただきました。ありがとうございます。

めも
エラー解決:pandas.read_csvで日本語を含んだcsvを読み込めない - めも エラー内容 原因 解決法 解決法1:オプションで指定 解決法2:エラーを放置してshift-jisに変換 関連ページ エラー内容 例えば、以下のようなエラーメッセージが表示され...

以上です。ありがとうございました。

勉強中の参考書はこちらです。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

30歳未経験からネットワークエンジニアに転職し、運用→構築→設計の仕事をやってます。色んな機器(Cisco、YAMAHA、Fortigate、PaloAlto)を触らせてもらいとても楽しい仕事です!

現在は派遣にて主にCiscoを中心としたネットワーク設計~構築をしております。

また、2023年より副業で個人事業主や小規模企業からのパソコン設定~ネットワーク作業の仕事を請け負っておりますので、もしお困りの方がいましたらお気軽にお問い合わせください。

●今までの作業履歴
- パソコンの新旧入れ替え
- 拠点間のインターネットVPN接続(YAMAHA-Fortigate)

コメント

コメントする

目次