<div class="gmail_quote">On Wed, Sep 8, 2010 at 7:18 AM, Ian Lynagh <span dir="ltr">&lt;<a href="mailto:igloo@earth.li">igloo@earth.li</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<div class="im"><br></div>Hmm, wouldn&#39;t you want to be able to break on<br>
    either<br>
        &lt;a-with-umlaut&gt;<br>
    or<br>
        &lt;a&gt; &lt;umlaut combining character&gt;<br>
in that case?<br></blockquote><div><br></div><div>No. For cases like that, you&#39;d normalize and perhaps case-fold the text and pattern first, then break on a specific string. (Normalization is handled via text-icu.)</div>
</div>