GoogleがOSSとして発表したlangextract。非構造化なテキストから構造化情報を得ることができます。structured outputとかでうまく収得することもできるので、敢えて必要なのかな・・・と思いつつ試してみました。Colabで試してみます。LLMは「Qwen3-4B-Instruct-2507-gguf」を利用します。4Bモデルだとエラー続発・・・なんてことになるのでしょうか。 github.com 少し悩ませたのが、ollamaで利用すると、長文を処理させるとtimeout起因エラーが起きます。調べると、今時点の実装では現状ソースコード弄るしかありませんでした。そこで、m…