Python

【Pandasで簡単データ解析】行指定してCSVファイルを読み込む

データの用意

データは財務省貿易統計からコーヒー生豆の輸入についてデータを取得します。

品目コードは090111000です。

データはcsvでダウンロードできます。

pandasのインポート

import pandas as pd

pandasのread_csvやread_excelを使うとcsvやxlsx/xlsmなどのファイルを読み込むことができます。

df = pd.read_csv('sample.csv',encoding='shift_jis')

日本語を使用するときはencording=’shift_jisをオプションでつけてください。

skiprowsを使う

skiprowsのオプションで行を指定して読み込むことができます。

また、列を指定するusecolsも便利なので一緒に覚えておきましょう。

1~3列目を読み込む場合:usecols=[1, 3]

skiprows=8で9行目からデータが読み込まれます

df = pd.read_csv('sample.csv',encoding='shift_jis',skiprows=8)

実際にデータの中身を見てみましょう。

これで読み込みは完了です。

csvファイルで出力する

df.to_csv('2020.csv',index=False, encoding="shift-jis") 

これで完了です。

簡単にデータの読み込み・保存ができたと思います。

pandasには他にも便利な使い方があるので、ぜひ使えるようになってください。

↓続いては読み込んだデータの結合をしてみましょう。

【Pandasで簡単データ解析】CSVファイルを結合する データの準備 2020年度のコーヒー生豆輸入量のcsvデータを使用します。 事前に不要なデータを削除しています。 行削除につい...
ABOUT ME
Mickey@コーヒー好きエンジニア
【コーヒー×科学×AI×ものづくり】趣味は①家庭用ロースターで自家焙煎コーヒー作り②アプリ開発です。 Wordpressブログ、note、Instagramやっています♪ ブログでは自家焙煎の実例や実践的なプログラミングの例文紹介、noteではコーヒーの海外論文(主に焙煎理論)やAIに関する情報の発信をしています。