#35 データの結合

前回取り込んだ24個のExcelファイルを、年度ごとの推移を分析するために「concat」を使って、結合していきます。

その過程で、ワイルドカードforループリスト内包表記という便利な機能も使っていきますので、しっかりと身に付けていきましょう。


特定のファイルのパス名とファイル名を取得する

   85. glob.glob(‘ファイルのパス/ファイル名.ファイル形式’)

データを単純に結合する

   86. pd.concat([データ名1, データ名2, …],  ignore_index=True)

繰返し処理する

   87. for イテレーター in イテラブルオブジェクト:
                  処理1
                  処理2
                  ・・・

末尾(最後)に要素を追加する

   88. リスト名.append(引数) 

リスト内包表記

   pd.concat((pd.read_csv(i) for i in all_files), ignore_index=True)


************


まずは、下記の動画(8分24秒)をご覧ください。




次にプログラムの解説を自分のペースで読みましょう。下記のスライドを参照してください。

import glob
all_files = glob.glob('/content/drive/MyDrive/Colab Notebooks/医療/データ/*.csv')
all_files

list = []
for i in all_files:
  list.append(pd.read_csv(i))
df_all = pd.concat(list, ignore_index=True)
df_all

df_all2 = pd.concat((pd.read_csv(i) for i in all_files), ignore_index=True)
df_all2

コメント