A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© 黑马伍仪华 中级黑马   /  2012-3-3 20:39  /  1339 人查看  /  1 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文


我的一个Java爬虫程序,爬取网页并存储在本地磁盘。这个程序一开始写在本地程序里,测试成功后移到web程序,部署到tomcat上并用quartz定时调度其运行,代码没有任何变动,但是爬取的网页与本地程序爬取的网页不一样,见下图:

本地程序爬取网页部分源码:  



Html代码  
1.<td class="style2" align="right">  
2.    日       期 :</td>  
3.<td>  



web程序爬取网页部分源码:



Html代码  
1.<td class="style2" align="right">  
2.    日? ?????期 :</td>  
3.<td>  



这只是截取一小段源码,其他有空格的地方,很多处都出现空格变"?"的情况,请问这是什么原因导致?

1 个回复

倒序浏览
乱码问题!本地存储使用的编码可能和你编程语言使用的编码可以不一样!
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马