java 网页抓取几种方法
1、httpclient
HttpClient 是 Apache Jakarta Common 下的子项目,感觉就是模拟一个客户端请求数据,没有对html 解析的支持.
相关地址:http://renjie120.iteye.com/blog/1727933
http://dongwei.iteye.com/blog/1756394
超时设置:
HttpClient httpclient = new DefaultHttpClient();
HttpParams params = httpclient.getParams();
HttpConnectionParams.setConnectionTimeout(params, 10*1000);//设置连接超时10秒
HttpConnectionParams.setSoTimeout(params, 10*1000); //设置读取超时10秒
2、jsoup
比较好用的,可以远程请求数据,支持html 的解析。
相关地址:中文 http://www.open-open.com/jsoup/
官方 http://jsoup.org/
下载 jsoup-1.6.2
3、HTMLParser
不太了解
相关地址:http://htmlparser.codeplex.com/
用户今天 : 3
用户昨天 : 15
用户最近的7天 : 69
用户最近的30天 : 283
用户这个月 : 229
用户这一年 : 4357
合计用户 : 6149
查看今天 : 7
查看昨天 : 15
查看最近7天 : 74
查看最近30天的 : 306
查看这个月 : 242
查看这一年 : 4829
合计查看 : 7484
谁是在线的 : 0