| 注册
请输入搜索内容

热门搜索

Java Linux MySQL PHP JavaScript Hibernate jQuery Nginx
jopen
9年前发布

p2pspider - DHT Crawler + BT Client = P2P Spider

介绍

p2pspider 是一个 DHT 爬虫 + BT Client 的结合体, 从全球 DHT 网络里"嗅探"人们正在下载的资源, 并把资源的metadata(种子的主要信息)从 远程 BT 客户端下载, 并生成资源磁力链接. 通过磁力链接, 你就可以下载到资源文件.

用途

你可以使用 p2pspider 打造私人种子库, 也拿它做资源数据挖掘与分析.

安装

git clone https://github.com/Fuck-You-GFW/p2pspider

使用

请确保你的node版本是4.X.X. 初次使用前, 请执行npm install安装依赖包. 执行node example.js便可运行程序. 执行后, 需要等待一段时间才会有数据输出, 等待多久看你的网络环境. 建议放在公网主机上运行, 在局域网里几乎没效果, 最好是国外的.

定制

你可以修改example.js文件对爬取到的数据进行处理/保存. 详情请看example.js的例子, 很简单滴.

待做

  • 完全 ES6 化
  • 效率优化
  • 数据保存
  • 跨平台 GUI 化
  • 数据共享
  • 资源下载
  • 视频流媒体播放

目标

打造成人人都能用的神器, 可以用它搜索种子; 下载资源; 共享数据库; 如果是视频, 可边下载边播放; 打造成分布式快播是可以有滴. :)

感谢

在开发这个项目时, 从 bittorrent-protocolut_metadata 借鉴了一些实现代码. 非常感谢其作者 @feross 指点迷津.

交流

如果你对此项目感兴趣, 不管你是不是开发者, 都可加 QQ 群(145234507)进行实时交流. 虽然 QQ 群看起来很 Low, 但不得不说, 特别适合快速交流.

提醒

不要拿这个爬虫爬取的数据分享到互联网, 因为很多敏感资源; 你懂滴资源; 侵权资源. 否则后果自负喔.

许可证

MIT

项目地址: https://github.com/Fuck-You-GFW/p2pspider

 本文由用户 jopen 自行上传分享,仅供网友学习交流。所有权归原作者,若您的权利被侵害,请联系管理员。
 转载本站原创文章,请注明出处,并保留原始链接、图片水印。
 本站是一个以用户分享为主的开源技术平台,欢迎各类分享!
 本文地址:https://www.open-open.com/lib/view/open1456737163609.html
p2pspider 网络爬虫