Python

【Pandasで簡単データ解析】CSVファイルを結合する

データの準備

2020年度のコーヒー生豆輸入量のcsvデータを使用します。

事前に不要なデータを削除しています。

行削除については下記記事を参考にしてください。

【Pandasで簡単データ解析】行指定してCSVファイルを読み込む データの用意 データは財務省貿易統計からコーヒー生豆の輸入についてデータを取得します。 品目コードは0901110...

データ結合について

本記事では2019年度のデータと2020年度のデータを結合してみます。

まずはpandasをインポートします。

import pandas as pd

結合するcsvを読み込みます。

encoding=’shift_jis’で日本語を対応させます。

df_2019 = pd.read_csv('2019.csv',encoding='shift_jis')
df_2020 = pd.read_csv('2020.csv',encoding='shift_jis')

元データには年度の情報が抜けてしまうので新しく年度の情報を列に加えます。

df_2019['年度']=2019
df_2020['年度']=2020

concatを使った結合

pd.concat([データフレーム1,データフレーム2])で1と2のデータフレームを結合することができます。

その際、列名は共通化されるので簡単にデータ解析に移行できます。

df_concat = pd.concat([df_2019, df_2020])

今回は必要ないですが、右に連結したい場合はaxis=1を追加します。

df_concat = pd.concat([df_2019, df_2020], axis=1)

データの可視化

import plotly.express as px
import plotly.io as pio

fig = px.bar(df_concat, x="国名", y="累計金額",facet_row="年度")
fig.show()

ABOUT ME
Mickey@コーヒー好きエンジニア
【コーヒー×科学×AI×ものづくり】趣味は①家庭用ロースターで自家焙煎コーヒー作り②アプリ開発です。 Wordpressブログ、note、Instagramやっています♪ ブログでは自家焙煎の実例や実践的なプログラミングの例文紹介、noteではコーヒーの海外論文(主に焙煎理論)やAIに関する情報の発信をしています。