週1でも日記

  • このサイトに書かれていることは間違っているかもしれませんので、ご注意ください。
  • 非推奨環境: フォントの大きさが Unreadable な xterm 上のテキストブラウザ
2005][07][08][09][10][11][12][
2006][01][02][03][04][05][06][07][08][09][10][11][12][
2007][01][02][03][04][05][06][07][08][09][10][11][12][
2008][01][02][03][04][05][06][07][08][09][10][11][12][
2009][01][02][03][04][05][06][07][08][09][10][11][12][
2010][01][02][03][04][05][06][07][08][09][10][11][12][
2011][01][02][03][04][05][06][07][08][09][10][11][12][
2012][01][02][03][04][05][06][07][08][09][10][11][12][
2013][01][02][03][04][05][06][07][08][09][10][11][12][
2014][01][02][03][04][05][06][07][08][09][10][11][12][
2015][01][02][03][04][05][06][07][08][09][10][11][12][
2016][01][02][03][04][05][06][07][08][09][10][11][12][
2017][01][02][03][04][05][06][07][08][09][10][11][12][
2018][01][02][03][04][05][06][07][08][09][10][

2013年28週196日星期1 12:00:00 AM 00:00:00

ループアンローリングだかストリップマイニングだか 22:17 ループアンローリングだかストリップマイニングだかを含むブックマーク

用語が正確かどうかはさておき、行列ベクトル積を手動最適化

最適化方法gcc [秒]dmd [秒]
ベースgemv1_c.c 0.51gemv1_d.d 0.74
上+ストリップマイニングgemv2_c.c 0.42gemv2_d.d 0.76
上+ループ展開gemv3_c.c 0.42gemv3_d.d 0.64
上+一時変数を別々にgemv4_c.c 0.42gemv4_d.d 0.47

gcc さんが最適化してくれるような所でも dmd さんは最適化してくれなかったりするみたいですが、mixin を使うなりして頑張れってことでしょうか。

トラックバック - http://d.hatena.ne.jp/yshl/20130715
2005)(07)(08)(09)(10)(11)(12)(
2006)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2007)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2008)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2009)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2010)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2011)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2012)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2013)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2014)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2015)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2016)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2017)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(11)(12)(
2018)(01)(02)(03)(04)(05)(06)(07)(08)(09)(10)(
458561