Hatena::ブログ(Diary)

翻訳論その他

2016-10-19

「AIが翻訳の不可能性に気付く日」へのトラックバックのご紹介(追記あり)

11:22

AIが翻訳の不可能性に気付く日 - 翻訳論その他」という以前のエントリにトラックバックいただいたのでご紹介しておきます。どっちも面白い。

少し前の「ちゃんとした自動翻訳はやっぱり無理じゃね?」という懐疑論も面白かった。

AIに何ができるか、何をしてほしいか?…とりあえずの感想や期待(2016年版) - 見えない道場本舗

そんなある日、AIが翻訳の不可能性に気付く日というブログ記事を見つけた。率直に言えば、懐かしさすら覚えるひどい代物。ここ2、3年ほどの機械翻訳研究をまったく追わないまま、聞きかじった話を適当に組み合わせるとこうなるのだろう。

ニューラル機械翻訳と記号幻想の死 - murawaki の雑記 - rekkenグループ


●以下2016年10月23日追記

上で2つ紹介した記事のうち、「ニューラル機械翻訳と記号幻想の死」のほうについて簡単に感想を。ちょうどいま考えていることにいくらか関係しているので(「いま考えていること」は近日中に文章化する予定)。

この記事に書いてあること。機械翻訳で、記号はもう相手にしなくていい。記号はスルー。統辞構造も基本的にはスルー。なにが起きているのかわからないが、それでうまく行きそうだと。つまり、現状正体不明の「意味」という形而上学的存在を扱わなくても大丈夫になった。これは端的にすごい。

けれど、こちらとして面白いと思ったのは、次の部分。

入力の各単語は、まず連続空間表現 (分散表現) に変換される。(-1.26, 0.23, 0.92, ..., -0.54) のような、500次元くらいの実数値の羅列。(中略)この数値列が実際のところ何を表しているのかよくわからない。ただ、「私」の連続空間における近傍を探すと「僕」が見つかったりする。意味的に似た単語が近くにくる傾向は確認できるので、何らかの意味を表しているのだろうと推測できる。

出力直前の処理はこの反転で、システムが数値列を作って、それに近似した数値列を持つ単語を選んで、それで出力する。つまり「システムはまず次に出力したい『意味』を作って、次にそれを一番うまく近似する単語を選んでいることになる」。

なにが面白いかというと、これ、この数値列が「意味」の正体ということになるのではないかと。ウィトゲンシュタインの言葉が思いだされる。「文の意味とは霊的なことがらではない」「それは、意味の説明が求められたときの答えとなるものである」。この数値列が「答え」なのではないか。人間に聞くと記号の答えが返ってくるから堂々巡りになる。けれどシステムならそうならない。

さらにいえば、これって、システムが「意味」を掴んでいることにならないか? 人間そっちのけで。

あと、記号への暴力という事態の捉え方も興味深い。ロラン・バルトはじめ、これまで記号の暴力性みたいなものに対する批判(というか嫌悪)があった。記号が暴力にさらされるという「最近の流行」は、記号にとって自業自得?

話変わって、いま、蓮實重彦の昔の文章「「魂」の唯物論的な擁護にむけて」を読みなおしている。

蓮實氏は、ソシュールの記号概念、シニフィアンシニフィエの結合としてのシーニュという考え方に批判的である。記号を暴力的に扱おうとしているのか? そうではない。蓮實氏は、ある種の記号概念は批判するが、「記号」という言葉そのものは手放そうとしない。「露呈する記号」といった言い方で「記号」を温存する。これを「怪物」とかいう文学的メタファーで呼び換えたりもする。これはひとつには、人間は記号の外に出られないという前提があるからだ。でもいまや、意味や文脈が、数値列として可視化されようとしている。だとしたら、人間も記号の外に出られるかもしれない。気の早い見方かもしれないが。

トラックバック - http://d.hatena.ne.jp/nakaii/20161019/1476843729