遺伝子の機能予測は生物学の理解に不可欠である。しかし、これらの予測は、実験的に特徴付けられた遺伝子の大規模なコレクションに依存しており、そのコンパイルには労力と時間がかかるだけでなく、科学文献の量と多様性を考慮すると不可能に近い。ここでは、Generative Pre-trained Transformer (GPT)のテキストマイニング能力を活用し、100,000以上の植物生物学のアブストラクトを処理することで、この課題に取り組む。その結果、遺伝子、代謝産物、組織など、さまざまな生物学的実体の間に約40万もの機能的関係が発見され、その精度は85%以上という驚くべきものであった。著者らはこれら…