Plagger::Plugin::Filter::GuessLanguage

Plaggnetを公開するときなど、各国語が入り乱れたフィードをまとめて翻訳するときに有効 かもしれない プラグイン

使い方はこんな感じで。

global:
  timezone: Asia/Tokyo

plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://planet.catalystframework.org/atom.xml

  - module: Filter::GuessLanguage
    config:
      languages:
        - en
        - de
        - pt
      target: both (またはfeedないしentry)

  - module: Filter::Babelfish
    config:
#     source: English
      destination: Japanese
      service: Google

  - module: Publish::***

GuessLanguageを通した時点でフィード(やエントリ)のlanguage情報が推測したものに書きかわり、その書き変わったlanguage情報をもとにBabelfish/Google翻訳をする、という流れ。

ただし、実際にはこのようにyaml指定しても期待した結果にはなりません。本当に期待した結果を得るためには一度英語に翻訳したフィードをさらに日本語化する、という非常にイヤな手順を踏む必要があります。

判定部分もかなり横着していますので、パッチ歓迎。1万何千円だかする本にもちょっとだけ心引かれたのですが、さすがにこれのためだけには買えませんでした。

CJKV日中韓越情報処理

CJKV日中韓越情報処理