結論 Scrapy で長いURLを対象にするときは、設定ファイルのsettings.pyにURLLENGTH_LIMITを書いてURLの最大長を記載する。 自分がやったときはURLの長さが3,800文字だったので、4,000文字に設定した。 # URL LENGTH URLLENGTH_LIMIT = 4000 ログレベルについて あるサイトを対象にScrapyしてたとき、次のページを取らないというバグが発生する。 ログを眺めているとDEBUGの文字とともにURLが長いからリンクを無視と出ている。 [scrapy.spidermiddlewares.urllength] DEBUG: Igno…