Section 18 データを分割するビニング
Section 17では、データに含まれていた時間の「ドリルダウン」、すなわち「年」から「年月」への「ドリルダウン」を行いましたが、このセクションでは、「ドリルダウン」するための数値を新たに作っていきます。
「商品」に属する「UnitPrice(単価)」を、顧客の特徴をよく表すように分割(これを「ビニング」と言います)する方法を身に付けましょう。
それらを実現するプログラムは下記の7つです。
㊺ pd.cut( データ名[“列名”], 分割数, precision=□, right=True )
㊻ pd.cut( データ名[“列名”], 分割数 ). value_counts()
㊼ pd.cut( データ名[“列名”], [数字1, 数字2, 数字3] )
㊽ pd.cut( データ名[“列名”], [数字1, 数字2, 数字3]
, labels=[ラベル1, ラベル2, ラベル3] )
■まずは、概要を理解したい方は、下記の動画(6分47秒)をご覧ください。
■PowerPoint(パワポ)でじっくりと理解したい方は、下記のスライドを参照してください。
●ビニングに関しては、Smart-Hintが運営している「データをビニング(ビン分割)する方法|cut」がとってもわかりやすかったので、参考にしてみてはいかがでしょうか。
https://smart-hint.com/python/cut/
●フリーランスのサウンドクリエータ「パンダの中のパンダ」さんがやっている「【AIプログラミング】 ビニングでボストン住宅価格の回帰」が役に立つと思いますので、下記を参考にしてみてくださいね。
https://panda-clip.com/binnning-boston/
コメント
コメントを投稿