Java中文问题详解(高手必读)

higuang

贡献于2012-01-09

字数:4292 关键词: Java开发 Java

作者:blackwhites 日期:2000-10-18 17:26:02 我来说一下tomcat如何实现JSP的你就明白了。 预备知识:  1.字节和unicode   Java内核是unicode的,就连class文件也是,但是很多媒体,包括文件/流的保存方式   是使用字节流的。 因此Java要对这些字节流经行转化。char是unicode的,而byte是字节.   Java中byte/char互转的函数在sun.io的包中间有。其中ByteToCharConverter类是中调度,   可以用来告诉你,你用的Convertor。其中两个很常用的静态函数是    public static ByteToCharConverter getDefault() ;    public static ByteToCharConverter getConverter(String encoding);   如果你不指定converter,则系统会自动使用当前的Encoding,GB平台上用GBK,EN平台上用   8859_1      我们来就一个简单的例子:      "你"的gb码是:0xC4E3 ,unicode是0x4F60      你用:      --encoding="gb2312";      --byte b[]={(byte)'\u00c4',(byte)'\u00E3'};      --convertor=ByteToCharConverter.getConverter(encoding);      --char [] c=converter.convertAll(b);      --for(int i=0;i0xC4,0x00E3->0xE3,因此0xC4,0xE3被放进了  --文件 ---- 1.对于JSP正文的解释: --Tomcat首先看一下你的叶面中有没有"<%@page include的符号。有,则在相同 --地方设定response.setContentType(..);按照encoding的来读,没有他按照8859_1 --读取文件,然后用UTF-8写成.java文件,然后用sun.tools.Main去读取这个文件, --(当然它使用UTF-8去读),然后编译成class文件 --setContentType改变的是out的属性,out变量缺省的encoding是8859_1 2.对Parameter的解释 --很不幸Parameter只有ISO8859_1的解释,这个质料可以在servlet的实现代码中找到。 3.对include的解释 格式的,但是很不幸,由于那个写"org.apache.jasper.compiler.Parser"的人 在数组JspUtil.ValidAttribute[]忘记加了一个参数:encoding,因此导致不支 持这种方式。你完全可以编译源代码,加上对encoding的支持 总结: 如果你在NT底下,最简单的方法就是欺骗java,不加任何Encoding变量: 你好<%=request.getParameter("value")%> http://localhost/test/test.jsp?value=你 结果:你好你 但这种方法局限性较大,比如对上传的文章分段,这样的做法是死定的,最好的 解决方案是用这种方案: <%@ page contentType="text/html;charset=gb2312" %> 你好<%=new String(request.getParameter("value").getBytes("8859_1"),"gb2312")%>

下载文档,方便阅读与编辑

文档的实际排版效果,会与网站的显示效果略有不同!!

需要 8 金币 [ 分享文档获得金币 ]
1 人已下载

下载文档

相关文档