用c#中的正则表达编程提取标题

宋天琪

本帖最后由赵鹏程于 2012-6-4 13:25 编辑

用c#中的正则表达式编程提取url为http://cancer.39.net/a/2012531/2036560.html 的标题也就是提取“一个癌症家属的真实感人催泪剖白！_39健康网_癌症"

赵鹏程 · 赵鹏程

有木有人能搞定呢。
我的意想是写个函数通过一个函数来获取URL指向网页的HTML内容，然后再提取title的内容，我的正则式是：.*<title>(^[<]+)</title>*. 就想问下怎么提取所有的HTML内容还有正则式这个该怎么写呢

牛景亮 · 牛景亮

你用下HttpWebRequest和HttpWebResponse
具体实现我也不清楚

钟广雄 · 钟广雄

你想写采集器吗，要获取全部的字符串：想要采集别的筛选字符，自己用正则筛选，。貌似采集器都是这样的思路，一个站一个站的采集方法也不同，
HttpWebRequest request;
HttpWebResponse response;
StreamReader reader;

request = WebRequest.Create("http://bbs.kukupig.com/") as HttpWebRequest;
response = (HttpWebResponse)request.GetResponse();
reader = new StreamReader(response.GetResponseStream());//这里面可以重载encoding,对应网页编码方式
string returnText = reader.ReadToEnd();

帐号		自动登录	找回密码
密码			加入黑马

用c#中的正则表达编程提取标题

评分

3 个回复

评分

评分

浏览过的版块