<html><body><div><blockquote type="cite"><div class="msg-quote" style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; " _mce_style="word-wrap: break-word;"><div><blockquote type="cite"><div>I think it's predictable, isSpace (which words is based on) is based on generalCategory, which returns the proper Unicode category:</div><div><br></div><div><div>λ&gt; generalCategory '\xa0'</div> <div>Space</div></div></blockquote><br></div><div>I agree, and I also agree that it would make sense the other way (not breaking on non-breaking spaces). &nbsp;Perhaps it would be a good idea to add a remark to the documentation which specifies the treatment of non-breaking spaces.</div></div></blockquote><span>&nbsp;</span></div><div><span><br></span></div><div><span>I note that Java has two distinct properties concerning whitespace:</span></div><div><span><br></span></div><div><span>Character.isSpaceChar('\xA0') &nbsp;== True</span></div><div><span>Character.isWhitespace('\xA0') == False</span></div><div><span><br></span></div><div><span>Contrast with</span></div><div><span><br></span></div><div><span>&nbsp;-- \x20 is ASCII space</span></div><div><span><div><span>Character.isSpaceChar('\x20') &nbsp;== True</span></div><div><span>Character.isWhitespace('\x20') == True</span></div><div><span><br></span></div><div><span><div><span>&nbsp;-- \x2060 is the word-joiner (zero-width non-breaking space)</span></div><div>Character.isSpaceChar('\x2060') &nbsp;== False&nbsp;</div></span></div><div><span><div>Character.isWhitespace('\x2060') == False</div><div><br></div><div>&nbsp;-- \x202F is the narrow non-breaking space</div><div><div><span>Character.isSpaceChar('\x202F') &nbsp;== True</span></div><div><span>Character.isWhitespace('\x202F') == False</span></div></div><div><span><br></span></div><div><span>&nbsp;&nbsp;-- \x2009 is the thin space</span></div><div><span><div><span>Character.isSpaceChar('\x2009') &nbsp;== True</span></div><div><span>Character.isWhitespace('\x2009') == True</span></div><div><span><br></span></div><div><span><br></span></div></span></div></span></div></span></div></body></html>