Hatena::ブログ(Diary)

雑記/えもじならべあそび このページをアンテナに追加 RSSフィード Twitter

様々な文字入力手法を「運指動画」でご覧頂くことが出来ます。
「シャドータイピング50音順式タッチタイピング練習法」、ひっそりと公開中。
Advanced W-ZERO3[es]ctrlswapminiかえで携帯配列(圧縮ポケベル打ち入力)を利用中。
普通のキーボード用にNICOLA(親指シフト)を圧縮?した、「かえであすか」を利用中。
はてスタの色識別性が改善されるまでの間、私ははてスタ捨て場にカラースターを捨てます。

【注意】この日記に出てくる「運指(最適化)」という語はほぼ、タイパーさんが表現するところの
「ワード(最適化)」のことを指し示しています
……表現間違いをなくすために、現在訓練中です。

2006年01月29日 日曜日 ほんやくするだけか。

日韓翻訳→韓日翻訳を通して「解りづらい表記を探す」テスト。

(未来:機械翻訳を「機械翻訳しやすい表現かどうかのチェック」に使えるようになった。 - 雑記/えもじならべあそび)

 この問題はAMIKAIの誤訳というよりも「文章が翻訳に適していない(一般的ではない語句や言い回しを使用している・そもそも言葉遣いを練りきっていない)」点が問題なので、AMIKAIに文句を言おうという趣旨ではありません。

 本稿では(なるべく多くの)機械翻訳に通る文章へと書き換えることで、「より読みやすく、専門知識を持たない人にも平易に読める文章を目指す」ことが主目的です。

 というか、勝手に訳文を掲載してすみませんです……

 飛鳥配列 - Wikipedia を日韓翻訳。

 そのテキストを少しずつ韓日翻訳してみています。

 日韓翻訳・韓日翻訳は(言語構造が似ているらしく?)精度が高いということで、とりあえずそれをまず使ってみることにしてみた次第で。


 まず、「飛鳥配列」はバッチリ通る模様。漢字もそのままなので、ハングルしか読み書きできない方にとっても、その意味は何とか通るのかもしれません。

 (ひらがなの「あすかはいれつ」が「飛鳥は入れて犬」に逆変換されている事からして、漢字を含まない語句とは明らかに異なる訳出がされているらしく)


 誤訳されやすいのはひらがなの連続ですな……というか、和文では意味が通っている気もするので、これは単なる誤訳かも。いや本当は機械翻訳できちんと通る方がいいのですが……。

 とりあえず、誤訳されうる表現と誤訳結果の対応をリスト化してみました。

 (注:リスト自体は排除しました(2006年1月29日22:56:44))


 ……というか、これを全部直さないとまともに機械翻訳は通らないんですね……一気に直すのは難しいなぁ。

ちなみに……

 上記結果を元に表現を見直すテストを実施中。

 作業自体はこんな感じでやっています。

f:id:maple_magician:20060129194727p:image

 ……ってゆーか、なにげにデスクトップがめちゃくちゃですな^^;

jisx6004jisx6004 2006/01/30 02:32 ひらがなの「は」が助詞の「は」と認識されるんでしょうかね。

maple_magicianmaple_magician 2006/01/30 04:14  どうにもそれっぽいですね……。
 原文では(あすか はいれつ)と分かち書きされているものの、日韓翻訳の時点で分かち書きが無視されている可能性は高そうです。

tastieratastiera 2008/01/28 15:10
こんにちはー。おもしろい試みですね。ただ、機械翻訳に「通りやすい」文章をつくることで、人間に「通りにくい」文章になってしまう局面もあると思うんですが(たとえば、人間が自然に理解できる修飾関係を、機械でも解釈できるようにイチイチ細かく書いてやったり。その結果、人間にとってはゴチャゴチャして読みづらくなったり)、その辺の両面的な評価も必要でしょうね。

ようするに、機械に読ませる文章をつくるのか、人間に読ませる文章を作るのか、という問題です。このあたりは、機械翻訳の今後のカイゼンに理想的な希望をかけ、双方がいずれ合致することを前提としていらっしゃる、ということなんでしょうか?

maple_magicianmaple_magician 2008/01/29 11:48  機械翻訳でキレイに翻訳できる文章を書くと、日本語的には「悪文」になる……というパターンなどは、かなりありそうですね。
 英語の直訳文を作ってしまうととんでもないことになる……というあたりと、まるっきり事情が被っていそうです。
 人間が読むにはいらないけれど、機械翻訳には必要……という言葉を、HTMLコメントの中に決められた書式で埋め込む(→翻訳時に活用する)とか、そういう規格があると便利かもなぁ……などと考えてしまいました。

 正直、「プロの翻訳家さん並の翻訳」までは望まないにせよ、「意味を間違えることなく理解できる」ような翻訳精度が出る時が来ることは期待したいもので、できればYoutubeのコメント欄に書かれているような会話体(チャット体?)がズバッと翻訳できてほしいなぁ……というのが、今の切実な願いだったりします^^;。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト

コメントを書くには、なぞなぞ認証に回答する必要があります。