DataFrameとは、データ行列を扱うクラスです。
本記事ではDataFrameとIndexの関係、Seriesについて解説します。
plotly.expressで簡単に使えるDataFrameを使って解説します。
plotly.expressのインストールについてはこちらの記事を読んでください。
import plotly.express as px
df = px.data.medals_long()
data.medals_long()というデータフレームをdfという変数に代入します。
早速、dfの中身を見てみましょう。
IndexやSeriesは図のような関係にあります。
DataFrameは行名と列名も管理しており、Indexクラスと呼ばれます。
図では0、1、2、3、4が行名、国、国名、数量、金額が列名のインデックスです。
Seriesは一次元のデータ列(リストのような順序を持った)と、そのデータが何かを示す見出しを格納するオブジェクトです。
先ほどの青く囲ったそれぞれがSeriesのデータとなります。