Java Web爬虫 - ItSucks
ItSucks是一个Java Web爬虫开源项目。可灵活定制,支持通过下载模板和正则表达式来定义下载规则。提供一个控制台和Swing GUI操作界面。
功能特性:
</div>
- 多线程
- 正则表达式
- 保存/载入的下载工作
- 在线帮助
- HTTP/HTTPS 支持
- HTTP 代理 支持
- HTTP身份验证
- Cookie 支持
- 可配置的User Agent
- 连接限制
- 配置HTTP响应代码的行为
- 带宽限制
- Gzip压缩
本文由用户 jopen 自行上传分享,仅供网友学习交流。所有权归原作者,若您的权利被侵害,请联系管理员。
转载本站原创文章,请注明出处,并保留原始链接、图片水印。
本站是一个以用户分享为主的开源技术平台,欢迎各类分享!