このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

真面目に「arXiv vs. viXra」、そしてトンデモ判定器

昨日、viXraはもとよりarXivにもトンデモは混じってるよ、と書きました。もちろん、平均的な質はarXivのほうが高いのは間違いありません。

arXivとviXraの比較を真面目にやっている人達がいました。その報告がarXivに載っています。

  • Title: A Scienceographic Comparison of Physics Papers from the arXiv and viXra Archives (5 Nov 2012)
  • Authors: David Kelk, David Devine
  • Pages: 9p
  • URL: https://arxiv.org/abs/1211.1036

タイトルにあるscienceographicはscienceography(サイエンセオグラフィー)の形容詞で、scienceographyは、科学の文献(書かれたもの)を科学する分野だそうです。ここで使われている手法は、比較対象である論文の意味内容には立ち入らず、ページ数、著者の人数、図版や定理の数、参照している文献数のような外形的特徴(メトリック)だけで論文群を比較するものです。

上記Comparison報告では、arXivとviXraの意義やら優劣やらには一切言及せずに、淡々と比較結果が報告されています。有意と思える差が出てますが、「そりゃそうだろな」という感じで驚くような結果はありません。例えば、viXraは単独著者が多いとか、文献の引用・参照の形式がイイカゲンだとか。

このComparisonの調査は何のために行われたのでしょうか? 単にscienceographyを適用する対象データとして適当だった、というだけかも知れません。でも、別な意図があったようにも思えます。うがった見方をすれば、(Comparison報告の著者達はおくびにも出してないが)トンデモ論文を意味解析なしに判定する関数を探しているんじゃないだろうか。

Comparison報告内に"Metrics Identifying Source Archive"という節があるのですが、source archiveとは「arXivかviXraのどちらか」ということで、サンプリングした論文をうまいメトリック関数に渡すと、「arXivかviXraのどちらか」を判定できるといいな、という背景(隠れた意図)が感じられます(僕の感覚では)。

二値の判断はどうせ無理ですが、「かなり香ばしい」とか「まともである可能性が高い」といった“傾向としての判断”は出来そうな気がします。