Section 11 groupbyを使ったデータのグループ化

データサイエンス体験動画「データサイエンス チュートリアル 猫のタロー編」の第13回目は、Section 11「groupbyを使ったデータのグループ化」です。

特定の列の値ごとにグループを作成する「groupby()」について解説します。

解説するプログラムは、次の2つです。

 ㉖ データ名.groupby(“列名”).count()

 ㉗ データ名.groupby(“列名1”)[“列名2”].max()

「groupby()」で作ったグループは、pandasの特殊なオブジェクトになっているので中身を確認することができません。しかし、関数と組み合わせることによって、グループごとの計算が一気にできます。

ここでは、顧客ごとの購入期間を算出する例を説明しています。よく使う例ですので、しっかりと身に付けていきましょう!


概要を理解したい方は、下記の動画(6分16秒)をご覧ください。PC操作画面を確認できます!

PowerPoint(パワポ)でじっくりと理解したい方は、下記のスライドを参照してください。

コメント