dom,xpathを使ったデータ抽出について説明する。 1.「小学生の基礎英語」のWEBページ 小学生の基礎英語の2月第1週を例に説明する。 WEBページ https://www.nhk.or.jp/gogaku/basic0/202302/1/ より関係個所のhtmlのソースを抜粋する。 これを見ると3つのデータがあることがわかる。 div classに注目すると、divタグでclassがnol_audio_playerを探せばいい。また、タイトルはdata-title、m3u8データはdata-hlsurlで得られることがわかる。 <div class="nol_audio_player"…