一个简单的网络爬虫 - SharkCrawler

最近需要通过网络爬虫来收集点数据，想找一些简单易用的开源版本，总是要么配置起来有点复杂，要么功能上不太容易扩展。还是自己实现一个简单的版本更容易扩展相应的功能。这个版本的实现完全参照wiki上面对于webcrawler的架构来设计类型。

实现了一些简单的功能

由于只是用来收集比较少的数据，很多高级的功能没有实现，

爬虫运行起来的样子，

一个简单的网络爬虫 - SharkCrawler

输出目录

一个简单的网络爬虫 - SharkCrawler

安装包和代码下载放在了Codeplex，

如果有人需要爬网页或者进行一些数据分析，可以直接更改这个方法SharkCrawler.Scheduler.DefaultScheduler.ThreadProc()进行相应的扩展。

本文由用户 jopen 自行上传分享，仅供网友学习交流。所有权归原作者，若您的权利被侵害，请联系管理员。

转载本站原创文章，请注明出处，并保留原始链接、图片水印。

本站是一个以用户分享为主的开源技术平台，欢迎各类分享！