Is it possible to automate this process rather than manually clicking and downloading  using Haskell ?<div><br></div><div>Thank You<br>Mukesh Tiwari</div><div><br><div class="gmail_quote">On Thu, Sep 8, 2011 at 6:11 PM, Max Rabkin <span dir="ltr">&lt;<a href="mailto:max.rabkin@gmail.com">max.rabkin@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">This doesn&#39;t answer your Haskell question, but Wikpedia has<br>
PDF-generation facilities (&quot;Books&quot;). Take a look at<br>
<a href="http://en.wikipedia.org/wiki/Help:Book" target="_blank">http://en.wikipedia.org/wiki/Help:Book</a> (for single articles, just use<br>
the &quot;download PDF&quot; option in the sidebar).<br>
<br>
--Max<br>
<br>
On Thu, Sep 8, 2011 at 14:34, mukesh tiwari<br>
&lt;<a href="mailto:mukeshtiwari.iiitm@gmail.com">mukeshtiwari.iiitm@gmail.com</a>&gt; wrote:<br>
&gt; Hello all<br>
&gt; I am trying to write a Haskell program which download html pages from<br>
&gt; wikipedia   including images and convert them into pdf . I wrote a<br>
&gt; small script<br>
&gt;<br>
&gt; import Network.HTTP<br>
&gt; import Data.Maybe<br>
&gt; import Data.List<br>
&gt;<br>
&gt; main = do<br>
&gt;        x &lt;- getLine<br>
&gt;        htmlpage &lt;-  getResponseBody =&lt;&lt; simpleHTTP ( getRequest x ) --<br>
&gt; open url<br>
&gt;        --print.words $ htmlpage<br>
&gt;        let ind_1 = fromJust . ( \n -&gt; findIndex ( n `isPrefixOf`) .<br>
&gt; tails $ htmlpage ) $ &quot;&lt;!-- content --&gt;&quot;<br>
&gt;            ind_2 = fromJust . ( \n -&gt; findIndex ( n `isPrefixOf`) .<br>
&gt; tails $ htmlpage ) $ &quot;&lt;!-- /content --&gt;&quot;<br>
&gt;            tmphtml = drop ind_1 $ take ind_2  htmlpage<br>
&gt;        writeFile &quot;down.html&quot; tmphtml<br>
&gt;<br>
&gt; and its working fine except some symbols are not rendering as it<br>
&gt; should be. Could some one please suggest me how to accomplish this<br>
&gt; task.<br>
&gt;<br>
&gt; Thank you<br>
&gt; Mukesh Tiwari<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Haskell-Cafe mailing list<br>
&gt; <a href="mailto:Haskell-Cafe@haskell.org">Haskell-Cafe@haskell.org</a><br>
&gt; <a href="http://www.haskell.org/mailman/listinfo/haskell-cafe" target="_blank">http://www.haskell.org/mailman/listinfo/haskell-cafe</a><br>
&gt;<br>
</blockquote></div><br></div>