前回の記事で機械学習用のデータとしてQM9のデータを活用した分子体積データの作成について紹介させていただきました。ただ、Rdkitモジュールを利用した場合計算に少し時間がかかってしまいQM9ぐらのデータ数(10万以上)となるとPCのスペックにもよりますが、かなり時間がかかってしまいます。今回は体積計算にRdkitモジュールを利用せずにより短時間で算出できるコードを紹介します。 分子体積の計算は過去の論文の報告例(The Journal of Organic Chemistry, 68(19), 7368--7373, 2003)を利用しています。各原子の体積を元に結合数や環構造などを考慮しなが…