Mickey's Life

今月の人気記事

Python

【Pandasで簡単データ解析】CSVファイルを結合する

Mickey@コーヒー好きエンジニア 2020年10月27日 / 2020年11月3日

目次

データの準備

データの準備

2020年度のコーヒー生豆輸入量のcsvデータを使用します。

事前に不要なデータを削除しています。

行削除については下記記事を参考にしてください。

【Pandasで簡単データ解析】行指定してCSVファイルを読み込むデータの用意データは財務省貿易統計からコーヒー生豆の輸入についてデータを取得します。品目コードは0901110...

データ結合について

本記事では2019年度のデータと2020年度のデータを結合してみます。

まずはpandasをインポートします。

import pandas as pd

結合するcsvを読み込みます。

encoding=’shift_jis’で日本語を対応させます。

df_2019 = pd.read_csv('2019.csv',encoding='shift_jis')
df_2020 = pd.read_csv('2020.csv',encoding='shift_jis')

元データには年度の情報が抜けてしまうので新しく年度の情報を列に加えます。

df_2019['年度']=2019
df_2020['年度']=2020

concatを使った結合

pd.concat([データフレーム1,データフレーム2])で1と2のデータフレームを結合することができます。

その際、列名は共通化されるので簡単にデータ解析に移行できます。

df_concat = pd.concat([df_2019, df_2020])

今回は必要ないですが、右に連結したい場合はaxis=1を追加します。

df_concat = pd.concat([df_2019, df_2020], axis=1)

データの可視化

import plotly.express as px
import plotly.io as pio

fig = px.bar(df_concat, x="国名", y="累計金額",facet_row="年度")
fig.show()

【製造×プログラミング×AI】

Mickey@コーヒー好きエンジニア

【製造業×プログラミング×AI】ロボット×画像処理×AI×3現主義が得意な生産技術者｜Python/VBAを活用した業務改善、Streamlit/Plotly/PySimpleGUIなどを活用したアプリ開発について初心者向けに発信中｜趣味は自家焙煎コーヒー作り｜noteでは焙煎理論を発信｜ココナラではPython/iOS/VBA開発の支援,就職/転職相談などのサービスもやっています↓

【plotlyチュートリアル】<<前談>>plotlyで簡単プログラミング

2020年8月12日 Mickey@コーヒー好きエンジニア

【plotlyレイアウト応用編】<<第2回>>Hover label活用

2020年12月14日 Mickey@コーヒー好きエンジニア

【Signate練習問題】決定木とランダムフォレストを使った健診データによる肝疾患判定

2020年6月17日 Mickey@コーヒー好きエンジニア

【StreamlitでWebアプリ作成】<<第7回>>マルチセレクト機能を使う

2021年1月11日 Mickey@コーヒー好きエンジニア

【StreamlitでWebアプリ作成】<<第2回>>動的なグラフを表示する

2020年12月11日 Mickey@コーヒー好きエンジニア

【PySimpleGUIでメモアプリ開発】<<第3回>>データベースを作成

2021年3月30日 Mickey@コーヒー好きエンジニア

【はじめての重回帰分析】アワビの年齢予測

2020年6月23日 Mickey@コーヒー好きエンジニア

【plotlyチュートリアル】<<第10回>>平行座標プロット作成

2021年3月22日 Mickey@コーヒー好きエンジニア

【Pandasで簡単データ解析】行指定してCSVファイルを読み込む

【plotlyチュートリアル】<<第6回>>ガントチャート