A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© 王起 中级黑马   /  2013-3-11 15:43  /  1116 人查看  /  1 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

如何获得http报文内容,并且通过报文内容进行分析,能不能给网站分类成黑白名单?

评分

参与人数 1技术分 +1 收起 理由
张文 + 1

查看全部评分

1 个回复

倒序浏览
1. Http是请求,响应的模型,服务器不会来读取浏览器的网页,能够得到的就是客户端网页提交过来的数据;
2。Http是“请求-响应”的工作方式,因此页面会不断刷新,如果不希望页面刷新则要使用AJAX技术;
3。连接(Connection):浏览器和服务器之间传输数据通道。一般请求完毕就关闭,不会保持连接;
4.  请求(Request):浏览器向服务器发送的“我要***”的消息,包含请求的类型,请求的数据,浏览器的信息(语言,浏览器版本等);
5.  响应(Response):服务器对浏览器请求的返回的数据,包含是否成功,错误码等。
6。GET/HTPP/1.1表示向服务器用GET方式请求首页,使用HTTP/1.1协议;
7。Accept-Encoding gzip,deflate表示浏览器支持gzip,deflate两种压缩算法;
8。Accept-Language zh-cn表示浏览器支持的语言,很多进入后自动就是中文界面的国际网站就是通过读取这个头的值实现的;
9。Connection Keep-Alive.一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了Connection:keep-alive,则TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。
10。Cookie是浏览器向服务器发送和当前网站关联的Cookie,这样在服务器端也能读取浏览器端的Cookie了;
11。User-Agent为浏览器的版本信息。通过这个信息可以读取浏览器是IE还是FireFox, 支持的插件, .Net版本等。





评分

参与人数 1技术分 +1 收起 理由
张文 + 1

查看全部评分

回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马