本文简单列举下HTTP协议中的Content-type,用以判断传输过程中的文件类型。
Content-type是HTTP协议中一个头域字段,其表示的含义是传输数据的文件类型,例如文本,图片,视频等格式。对于文本格式,到底是采用GBK编码的文本还是UTF-8编码的文本,都会通过该字段加以说明。用来指导应用层解析器,比如浏览器对于内容的解析显示外汇隔夜利息www.fx61.com/interest.html。Content-Type: text/html; charset=utf-8是大家最常见的HTTP的一个头域形式,表示的是UTF8编码的HTML格式文件。
如下是一个实际传输的HTTP报文头:
GET /c_zoom,h_213/c_cut,x_21,y_13,w_937,h_625/os/news/607c944a4097c3b8d1bc806f2a8777ed.jpg HTTP/1.1
Host: 29e5534ea20a8.cdn.sohucs.com
Connection: keep-alive
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.119 Safari/537.36
Accept: image/webp,image/apng,image/*,*/*;q=0.8
Referer: http://www.sohu.com/
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9
HTTP/1.1 200 OK
Server: NWS_TCloud_S1
Connection: keep-alive
Date: Sun, 20 May 2018 12:47:41 GMT
Cache-Control: max-age=7776000
Expires: Sat, 18 Aug 2018 12:47:41 GMT
Last-Modified: Sun, 20 May 2018 12:26:45 GMT
Content-Type: image/jpeg
Content-Length: 39134
X-NWS-LOG-UUID: 8d1c2505-a31b-42fa-887f-1befa2aa9be0 0c2871257850ac0afafd12d27e322d4b
X-Cache-Lookup: Hit From Disktank3
Access-Control-Allow-Origin: *
X-Daa-Tunnel: hop_count=1
X-Cache-Lookup: Hit From Inner Cluster
根据Content-Type: image/jpeg就可以大致的判断本次传输的数据是一个jpeg格式的图片文件。因此Content-Type在分析文件传输类型十分的有用。同时对于从这种从传输数据中还原传来的文件数据,也是可以通过对应的文件解析器加以打开的
|
|