<div class="gmail_quote">On Tue, Aug 17, 2010 at 12:39 PM, Bulat Ziganshin <span dir="ltr">&lt;<a href="mailto:bulat.ziganshin@gmail.com">bulat.ziganshin@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">

Hello Tom,<br>
<div class="im"><br>
Tuesday, August 17, 2010, 2:09:09 PM, you wrote:<br>
<br>
&gt; In the first iteration of the Text package, UTF-16 was chosen because<br>
&gt; it had a nice balance of arithmetic overhead and space.  The<br>
&gt; arithmetic for UTF-8 started to have serious performance impacts in<br>
&gt; situations where the entire document was outside ASCII (i.e. a Russian<br>
&gt; or Arabic document), but UTF-16 was still relatively compact<br>
<br>
</div>i don&#39;t understand what you mean. are you support all 2^20 codepoints<br>
in Data.Text package?<br></blockquote></div><br>Yes, UTF-16 can represent all Unicode code points, using surrogate pairs.<br><br>-- Johan<br><br>