<div>Hi Colin,</div><div><br></div>On Sun, Aug 15, 2010 at 9:34 AM, Colin Paul Adams <span dir="ltr">&lt;<a href="mailto:colin@colina.demon.co.uk">colin@colina.demon.co.uk</a>&gt;</span> wrote:<br><div class="gmail_quote">

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">But UTF-16 (apart from being an abomination for creating a hole in the<br>
codepoint space and making it impossible to ever etxend it) is slow to<br>
process compared with UTF-32 - you can&#39;t get the nth character in<br>
constant time, so it seems an odd choice to me.<br></blockquote><div><br></div><div>Aside: Getting the nth character isn&#39;t very useful when working with Unicode text:</div><div><br></div><div>* Most text processing is linear.</div>

<div>* What we consider a character and what Unicode considers a character differs a bit e.g. since Unicode uses combining characters.</div><div><br></div><div>Cheers,</div><div>Johan</div><div><br></div></div>