第7回NDBオープンデータのデータクリーニングを行ったソースコードを載せます。 今回の元データは 特定健診によって得られたデータである、LDLコレステロール 二次医療圏別製年齢階級別分布です。 元データは以下のようなエクセルファイルです。 図1 クリーニング前のデータ データ解析しやすいように、LDLコレステロールのクラスは列に設定しました。 下のコードの年齢と性別の部分を変えれば、自由にエクセルファイルに出力が可能です。 例として、男性の全年齢階級合計(中計)の二次医療圏別性年齢階級LDLコレステロール分布をデータクリーニングしてみます。 〜 import numpy as np impor…