#39 マスタを使って新たな列を追加
今回は、私、小次郎が作成した都道府県別番号マスタを使って、都道府県別番号を都道府県名に変換していきます。
元データとマスタのように、2つのデータを共通な列名で結合する場合、「merge(マージ)」を使って、下記のようにプログラムを書きます。
●pd.merge(データ1, データ2, on=“列名”, how=‘結合方法’)
「データ1」を「left」、 「データ2」を「right」と呼び、「on=」の次の列名には「left」と「right」に共通な列名を指定します。この共通な列名を「キー」と呼びます。
また、マージによる結合の仕方には、「キー」以外の列の要素(行)に関して、それぞれの行をどのように残すかにより次の4種類に分類できます。
① inner join(内部結合)→これはデフォルトとなります。
② left join(左結合)
③ right join(右結合)
④ outer join(外部結合)
■まずは、下記の動画(8分30秒)をご覧ください。
■リンク先等を見たり、自分のペースで見たい方は、下記のスライドを参照してください。
コメント
コメントを投稿