Mickey's Life

今月の人気記事

Python

【PandasGUIで簡単データ解析】インストールから操作まで

Mickey@コーヒー好きエンジニア 2021年3月6日

PandasGUIはノーコード（プログラミングなし）で、データ解析・可視化が可能な使い勝手の良いツールです。

フィルタリングやピボットなどデータ整理にも使えるツールもそろっているので、プログラミング初心者だけでなく、機械学習やデータサイエンスに興味がある方にもオススメです。

本記事ではPandasGUIのチュートリアルを解説している海外記事を参考に作成しています。

それでは早速解説していきます。

目次

起動までの手順
機能紹介

起動までの手順

AnacondaのインストールとJupyter notebookの準備

Anacondaのインストールがまだの方はこちらの記事を参考に準備してください。

Jupyter notebookの起動と使い方まで紹介しています。

【2020年版、Python3をはじめよう！(Mac&Win対応)】AnacondaとJupyter notebookの始め方はじめに Jupyter notebookとは Jupyter notebook（ジュピター・ノートブック）はブラウザ上で...

インストール方法

Jupyter notebookを起動して下記コマンドを実行します。

pip install pandasgui

インポートについて

必要なライブラリをインポートします。

pandasgui.datasetsからtitanicをインポートするとタイタニックの生存データを読み込めます。

KaggleやSignateのような機械学習コンテストのチュートリアルで良く使用されるデータセットです。

import pandas as pd
from pandasgui import show
from pandasgui.datasets import titanic

show()でPandasGUIが起動します。

gui = show(titanic)

下記写真のようなPandasGUIアプリが起動します。

右上のタグから5つの用途を選択できます。

①DateFrame・・・読み込んだデータの中身が表示される
②Filters・・・フィルタリングしたい内容を入力
③Statistics・・・統計的なデータを表示可能
④Grapher・・・グラフ作成が可能
⑤Reshaper・・・pivot(ピボット)/melt(溶かす)などデータ整理が可能

それでは一つ一つ解説していきます。

機能紹介

①DateFrame（データフレーム）

データフレームにデータの一覧が表示されます。

タイタニックのデータでは下記内容のようなデータが入っています。

PassengerId: 乗客のID
Survived: 生存(1)、死亡(0)
Pclass: 乗客の階級
Sex: 性別
Age: 年齢
SibSp: 兄弟、姉妹、義兄弟、義姉妹、夫、妻の数
Parch: 母親、父親、息子、娘の数
Fare: 乗船料金
Embarked: 乗船場

次に説明するFiltersで好きなデータのみ表示するようにカスタマイズできます。

②Filters（フィルター）

図のようにFiltersのタグをドラッグ＆ドロップで移動してみましょう。

フィルタの設置画面とデータフレームの画面が分かれるので同時にみられるようになります。

フィルタリングしたい条件を追加していき、Add Filterを入力します。

index部分を見るとわかりますが、表示されるデータがフィルタした内容で絞られていきます。

③Statistics（統計データ）

Type: データ型
Count: データ数
N Unique: 項目の種類
StdDev: 標準偏差
Min: 最小値
Max: 最大値

といった統計的データが一望できます。

④Grapher（グラフ可視化）

グラフは好みのアイコンをクリックして、右下窓に表示されるxやyに左下窓からデータ列をドラッグ＆ドロップで移動させます。

セットが終わったら右下のFinishをクリックするとグラフが表示されます。

グラフの可視化ではplotlyが使われています。

気に入ったグラフが作れそうな場合にレイアウトなどを整えたくなると思います。

プログラミングが必要ですが、下記を参考にする事で資料やプレゼンで使えるこだわりのグラフも作成できます。

https://cafe-mickey.com/category/python/plotly/

⑤Reshaper　（整理）

PivotとMeltが使用できます。

Pivotはエクセルのピボットテーブルのようなもの、Meltは溶けるの意味ですが良くわかりません。

便利機能紹介

最後にちょっとした便利機能の紹介です。

データはコピー＆ペーストでエクセルなどに簡単に貼り付け可能です。

CSVのデータをドラッグ＆ドロップで簡単にインポートできます。

Image for post

いかがでしたか？

操作も簡単でシンプルなので使い勝手良いと感じています。

データの中身をチェックして簡単に可視化したいときに気軽に使えて良いツールだと思いうのでまだインストールしていない方はぜひ一度使ってみてください。

【製造×プログラミング×AI】

Mickey@コーヒー好きエンジニア

【製造業×プログラミング×AI】ロボット×画像処理×AI×3現主義が得意な生産技術者｜Python/VBAを活用した業務改善、Streamlit/Plotly/PySimpleGUIなどを活用したアプリ開発について初心者向けに発信中｜趣味は自家焙煎コーヒー作り｜noteでは焙煎理論を発信｜ココナラではPython/iOS/VBA開発の支援,就職/転職相談などのサービスもやっています↓

【Docker環境構築】Pythonとplotlyを共有する方法

2020年9月20日 Mickey@コーヒー好きエンジニア

【Plotlyの使い方】 Jupyter notebookでグラフを作る一番簡単な例を紹介します

2020年3月8日 Mickey@コーヒー好きエンジニア

【毒キノコの分類】get_dummiesによるエンコーディングと決定木を用いた例

2020年6月21日 Mickey@コーヒー好きエンジニア

【StreamlitでWebアプリ作成】<<第7回>>マルチセレクト機能を使う

2021年1月11日 Mickey@コーヒー好きエンジニア

【Signate練習問題】機械学習の基本手法を使用した国勢調査からの収入予測

2020年6月19日 Mickey@コーヒー好きエンジニア

【はじめての重回帰分析】アワビの年齢予測

2020年6月23日 Mickey@コーヒー好きエンジニア

【StreamlitでWebアプリ作成】<<第5回>>複数の画像を表示する

2020年12月26日 Mickey@コーヒー好きエンジニア

【Signate練習問題】アワビの年齢予測を解く簡単な手順

2020年6月14日 Mickey@コーヒー好きエンジニア

【plotlyチュートリアル】<<第9回>>ペアプロット図（散布図行列）...

【pandas-profilingでデータ解析】インストールから分析結果...