<br>Yitzchak Gale wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div class="im">Sean Leather wrote:<br>
&gt; Which one do you use for strings in HTML or XML in which UTF-8 has become<br>
&gt; the commonly accepted standard encoding?<br>
<br>
</div>UTF-8 is only becoming the standard for non-CJK languages.<br>
We are told by members of our community in CJK countries<br>
that UTF-8 is not widely adopted there, and there is no sign that<br>
it ever will be. And one should be aware that the proportion of<br>
CJK in global Internet traffic is growing quickly.<br></blockquote><div><br>So then, what is the standard? Being not familiar with this area, I googled a bit, and I don&#39;t see a consensus. But I also noticeably don&#39;t see UTF-16. So, if this is the case, then a similar question still arises for CJK text: What format/library to use for it (assuming one doesn&#39;t want a performance penalty for translating between Data.Text&#39;s internal format and the target format)? It appears that there are no ideal answers to such questions.<br>

<br>Regards,<br>Sean<br></div></div>