Was this with tossing the partial sums code into the optimised bangs program? Weird. I wonder if profiling will help explain why? In any case, If nobody comes up with any other tweaks, I'll probably submit the optimised bangs version to the shootout this weekend.
<br><br>--S<br><br><div class="gmail_quote">On Nov 30, 2007 1:30 PM, Richard Kelsall &lt;<a href="mailto:r.kelsall@millstream.com">r.kelsall@millstream.com</a>&gt; wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="Ih2E3d">Sterling Clover wrote:<br>&gt; I&#39;m still curious if the pre-calculation of partial sums that I did<br>&gt; works well across processors, as I don&#39;t see why it shouldn&#39;t. My<br>&gt; less-strictified version of Don&#39;s code is attached, and below are the
<br>&gt; functions you&#39;ll need to insert/replace to make the partial-sums<br>&gt; optimization work.<br><br></div>Hello Sterling, I&#39;ve timed your new Fasta with optimised bangs - it&#39;s<br>the fastest so far. But the pre-calculated partial-sums version seems
<br>to go a bit slower for some unknown reason.<br><br> &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; Seconds<br>Optimised bangs program &nbsp; &nbsp;11.20 &nbsp; &nbsp;compiled ghc --make<br>Optimised bangs program &nbsp; &nbsp;10.73 &nbsp; &nbsp;compiled with -O -fglasgow-exts<br>
<div class="Ih2E3d"> &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;-optc-mfpmath=sse -optc-msse2<br> &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;-optc-march=pentium4<br></div>Partial-sums program &nbsp; &nbsp; &nbsp; 11.97 &nbsp; &nbsp;compiled ghc --make<br>
Partial-sums program &nbsp; &nbsp; &nbsp; 11.14 &nbsp; &nbsp;compiled with -O -fglasgow-exts<br><div class="Ih2E3d"> &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;-optc-mfpmath=sse -optc-msse2<br> &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;-optc-march=pentium4
<br><br></div>This is on my GHC 6.6.1, W2K, Intel Core 2 Duo 2.33GHz machine - same<br>as for the previous timings I gave in this thread.<br><font color="#888888"><br><br>Richard.<br><br></font></blockquote></div><br>