コメント

コメントどうもです。
最近すっかりがんばっていません。x264の場合は規模が大きいのでどの処理ブロックをSPEにさせるか難しいです。
当初はとにかくSPEのLSに押し込んで、これを7つのSPEで並列に走らせるつもりでしたが、8段のパイプラインのように処理させた方がよいかもしれないと考えはじめ、そうするとx264のオリジナルコードをそのままとはいかずちょっとめげています。

CUDA対応のTMPGEncも苦労しているようですが、難しいですね。あちらは自前のコードですし、仕事ですからだんだんこなれてくるんでしょうね。

LarrabeeはCellに似てますが、メモリ管理はCPUがやってくれるのが羨ましい。SPEはDMAでまいどまいど転送するのが面倒くさい。

最近我が家のPS3もすっかりDVDプレーヤーと化しているです。もちべーしょんがあがったらまたがんばります。