第7回NDBオープンデータのデータクリーニングを行ったソースコードを載せます。 今回の元データは収縮期血圧 二次医療圏別性年齢階級別分布です。 元データは以下のようなエクセルファイルです。 図1 クリーニング前のデータ データ解析しやすいように、血圧のクラスは列に設定しました。 下のコードの年齢と性別の部分を変えれば、自由にエクセルファイルに出力が可能です。 例として、40~44歳の男性の二次医療圏別性年齢階級収縮期血圧分布をデータクリーニングしてみます。 〜 import numpy as np import pandas as pd # 収縮期血圧のデータ読み込み df_sbp = pd.…