計量文献学

計量文献学とは?

  • 文献の特徴を数値化→統計的にその文献の分析・比較を行う方法または学問
    • 「書き手によって文章に現れる言葉は違うのではないか?」に注目
    • 文体(文章などのスタイル、和文・漢文、ですます・である調など)に注目=計量文体学
  • 著者が同じ人か否かや時代などの推定、文体と内容・思想の関係性などを解析するのが目的
  • 注目したりするのは、
    • 単語または文の長さ(3文字単語、4文字単語など)
    • 音節
    • 特定の単語または品詞の使用率、出現率
    • 同義語や異なり語、漢字、名詞、接続詞など
    • 読点(「、」や「。」)の付け方
    • 文頭、文末の表現、単語使用率
    • 主語、述語、修飾語などの構文情報
    • 直喩、暗喩
    • 話題や引用文の内容
    • など

応用

  • 著者推定
    • 犯罪捜査(脅迫文など)
    • 聖書の著者問題
    • シェークスピア戯曲の真の作者はベーコン?
    • メールの送信者分類