pdfからテキストを剥ぐ場合の文字化けは、闘っても無駄なときもあります。その場合は、今時、OCRでしょう。 一瞬+α(二瞬)で、ocrが使えます。 コメント pdfからテキストを剥ぐ場合の文字化けは、闘っても無駄なときもあります。その場合は、今時、OCRでしょう。 pdfからテキストを剥ぐ場合の文字化け フォントとか、 文字コードとか、 そもそも、pdfにどうデータが格納されているか いろいろあって、テキストに素直にならない場合は、沢山あります。 一瞬+α(二瞬)で、ocrが使えます。 ワタシは、windows10です。 from PIL import Image import pyocr i…