Python

【Pandasで簡単データ解析】DataFrame/Index/Seriesについて

DataFrameとは

DataFrameとは、データ行列を扱うクラスです。

本記事ではDataFrameとIndexの関係、Seriesについて解説します。

DataFrameの中身

plotly.expressで簡単に使えるDataFrameを使って解説します。

plotly.expressのインストールについてはこちらの記事を読んでください。

【plotlyチュートリアル】<<前談>>plotlyで簡単プログラミング はじめに 本記事では「プログラミングを簡単に学びたい」「クリエイティブなグラフを作りたい」方向けの講座になります。 特にpyth...
import plotly.express as px
df = px.data.medals_long()

data.medals_long()というデータフレームをdfという変数に代入します。

早速、dfの中身を見てみましょう。

DataFrame中の構造

IndexやSeriesは図のような関係にあります。

DataFrameは行名と列名も管理しており、Indexクラスと呼ばれます。

図では0、1、2、3、4が行名、国、国名、数量、金額が列名のインデックスです。

Seriesとは

Seriesは一次元のデータ列(リストのような順序を持った)と、そのデータが何かを示す見出しを格納するオブジェクトです。

先ほどの青く囲ったそれぞれがSeriesのデータとなります。

ABOUT ME
Mickey@コーヒー好きエンジニア
【製造×プログラミング×AI】 趣味は自家焙煎コーヒー作り。Python、VBAでの業務改善を得意とする。最近はStreamlit、Plotly、Pythonista 3にハマり中。 note、Twitter、Instagramやっています♪ noteではコーヒーの海外論文(主に焙煎理論)やAIに関する情報の発信をしています。