在使用<%@ include page=""%> 指令包含一个html页面(b.html)时中文乱码。 乱码问题 首先想到的就是这两个文件的编码是否统一
在仔细检查了一遍后 发现没问题 都是UTF-8的。 既能编码一致 那为什么还好出现乱码呢。
于是就把html的内容重新放到一个jsp文件(c.jsp)中去 inlude 该jsp文件 没无问题 正常 显示 那是啥问题了 ⊙﹏⊙b汗
也是 仔细比较了b.html 和c.jsp 文件 发现这两个文件 除了meta标签里面的内容不同的话 就是 c.jsp 文件比b.html 多了行代码
<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>
是不是和这有关呢 把这复制到b.html 页面中 刷新 中文正常显示了 Ooo
问题是解决了 但是为啥呢 得仔细分析分析 <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> 这行代码了
这行代码中有两个指定编码格式的指令 charset 和 pageEncoding 其中 html页面的<meta>中已经有了 charset 所以 这行代码可以简写为
<%@ page language="java" pageEncoding="UTF-8"%>
下面我们分析下 pageEncoding和contentType两种属性的区别:
1)pageEncoding是jsp文件本身的编码
2)contentType的charset是指服务器发送给客户端时的内容编码
jsp 从用户发送请求到相应给用户中间要经历三个阶段
一:jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。
二:是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。
三: Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效
而include指令就是在第一阶段之前执行的,注意这个是在第一阶段之前,所以,如果包含文件和被包含文件的文件编码不一致,那么,该指令就会工作不太正常,不能正确的把被包含的文件从原来编码转换为包含文件的编码,就会出现乱码现象.
所以这时候得指定html页面的pageEncoding 属性 虽能html文件不识别这个属性 但是最后include到jsp文件中 他会发挥作用的。
没有设置<%@ page language="java" pageEncoding="UTF-8"%>属性的时候
页面源码:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>Insert title here</title>
</head>
<body>
b.html 中文乱码问题 未加 pageEncoding="UTF-8"%
</body>
</html>
include 到jsp页面后运行的效果
生成的java文件部分代码
在html页面加入<%@ page language="java" pageEncoding="UTF-8"%>后
源码:
<%@ page language="java" pageEncoding="UTF-8"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>Insert title here</title>
</head>
<body>
b.html 中文乱码问题 未加 pageEncoding="UTF-8"%
</body>
</html>
运行效果
生成的java文件部分代码
都正常显示。
网上还有一种方法 就是修改项目的web.xml 文件 在web-app标签中加入如下内容
<jsp-config>
<jsp-property-group>
<description>html encoding example</description>
<display-name>JSPConfiguration</display-name>
<url-pattern>*.html</url-pattern>
<el-ignored>true</el-ignored>
<page-encoding>UTF-8</page-encoding>
<scripting-invalid>false</scripting-invalid>
<include-prelude></include-prelude>
<include-coda></include-coda>
</jsp-property-group>
</jsp-config>
重新部署下项目就好了
其实仔细观察代码 他也是设置include的html/jsp页面的编码。思路是一样的。