On Wed, Oct 31, 2012 at 10:39 PM, wren ng thornton <span dir="ltr">&lt;<a href="mailto:wren@freegeek.org" target="_blank">wren@freegeek.org</a>&gt;</span> wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

The one thing I worry about using \x1680 as the threshold[1] is that I&#39;m not sure whether every character below \x1680 has been allocated or whether some are still free. If any of them are free, then this will become incorrect in subsequent versions of Unicode so it&#39;s a maintenance timebomb. (Whereas if they&#39;re all specified then it should be fine.) Can someone verify that using \x1680 is sound in this manner?<br>
</blockquote><div><br></div><div>According to GHCi:</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
Prelude Data.Char&gt; length $ filter ((== NotAssigned) . generalCategory) [&#39;\0&#39;..&#39;\x1680&#39;]<br>830</blockquote></div>