投稿

11月, 2024の投稿を表示しています

Translate

#40 都道府県別人口データを作成

イメージ
 今回は、政府統計の総合窓口「e-stat」から、令和2年国勢調査の都道府県別人口を探して、それを基に都道府県毎の人口データを作っていきます。e-statには、様々なオープンデータが保管されていますので、日々の業務で使うことがこれから出てくると思います。 ■ 政府統計の総合窓口「e-Stat」 https://www.e-stat.go.jp/ ■ 令和2年度(2020年)の都道府県別人口(国勢調査) https://www.e-stat.go.jp/stat-search/file-download?statInfId=000032142402&fileKind=0 また、ブーリアンインデックスを用いたデータの抽出や、各要素から任意の文字を抽出する方法を用い、都道府県別人口データを作成します。使用するプログラムは、下記になります。 ● データ名[“列名”].str.contains(“文字列”) ● データ名[データ名[“列名”].str.contains(“文字列”)] ● データ名["列名"].str[数字1:数字2] ■ まずは、下記の 動画 (11分19秒)をご覧ください。 ■ リンク先等を見たり、自分のペースで見たい方は、 下記のスライドを参照してください。 #40 都道府県別人口データを作成 by @Cat_Taro

#39 マスタを使って新たな列を追加

イメージ
今回は、私、小次郎が作成した都道府県別番号マスタを使って、都道府県別番号を都道府県名に変換していきます。 元データとマスタのように、2つのデータを共通な列名で結合する場合、「 merge ( マージ )」を使って、下記のようにプログラムを書きます。 ●pd.merge(データ1, データ2, on=“列名”, how=‘結合方法’) 「データ1」を「left」、 「データ2」を「right」と呼び、「on=」の次の列名には「left」と「right」に共通な列名を指定します。この共通な列名を「キー」と呼びます。 また、マージによる結合の仕方には、「キー」以外の列の要素(行)に関して、それぞれの行をどのように残すかにより次の4種類に分類できます。 ① inner join( 内部結合)→これはデフォルトとなります。 ② left join (左結合) ③ right join (右結合) ④ outer join (外部結合) ■ まずは、下記の 動画 (8分30秒)をご覧ください。 ■ リンク先等を見たり、自分のペースで見たい方は、 下記のスライドを参照してください。 #39 マスタを使って新たな列を追加 by @Cat_Taro