Section 28 ピボットテーブル(2)

さて、「2nd STEP 集計とグラフ描画」は、最後の動画となります。

ここまで読んでいただき、ありがとうございました。

データサイエンティストが、どのようなプログラムを書いているのか、試行錯誤も含めて、伝わったかなぁと思います。プログラムを書くという作業の背景を理解して、ビジネスの現場でデータ思考を心がけていただくことを期待します。

また、このブログで、データサイエンスに興味を持ち、もっと高度なプログラムを書いてみたいと思った方もいることでしょう。ブログの参考図書を参考に、データサイエンスの大海原に漕ぎ出していきましょう。

本セクションでは、円グラフに現れている数値が本当に価格帯ごとの比率(%)になっているかどうかをピボットテーブル+αで確認していきます。

グラフで傾向をつかむだけでなく、その数値を把握することを求められるケースがしばしばありますので、ピボットテーブルで求めたクロス集計表にひと手間加えて、比率(%)がわかる表の作り方を身に付けましょう。「pivot_table」では、欠損値を含めないで集計しますので、欠損値を確認したり、データ型を変えたり、結構、手間がかかります。

また、一気に、比率を求めてしまう方法として、データフレームの各行に対して関数を適用する「apply」と1行で記載できる関数を定義する「lambda」を組み合わせることも身に付けていきましょう。


76 データ名[データ名.isna().any(axis=1)]

77 データ名.replace(“元の要素”, “新しい要素”)

78 データ名.apply(関数, axis=1)

79 lambda 引数:処理内容


まとめとして、データを「見える化」するための「グラフ・集計表の目的別手法」も掲載しました。復習の意味で、参考にしてください。


まずは、概要を理解したい方は、下記の動画(15分31秒)をご覧ください。




PowerPoint(パワポ)でじっくりと理解したい方は、下記のスライドを参照してください。


コメント