| 注册
请输入搜索内容

热门搜索

Java Linux MySQL PHP JavaScript Hibernate jQuery Nginx
jopen
9年前发布

PHP爬虫库:Page Scraper

易于使用的Web页面数据提取PHP类库,只需要几行代码。使用XPath 或 CSS Selector可以从任意网站抓取数据。示例:

$page = new Page('https://news.ycombinator.com');  $builder = new PageBuilder($page);  $builder->setDataConfig(array(      'side_links' => array('css' => '.title .comhead'), // use CSS Selector      'titles'     => '//td[@class="title"]//a/text()', // use XPath      'links'      => '//td[@class="title"]//a/@href', // use XPath  ));  $director = new PageBuilderDirector($builder);  $director->buildPage();  $data = $page->getData();

项目主页:http://www.open-open.com/lib/view/home/1418132786573

 本文由用户 jopen 自行上传分享,仅供网友学习交流。所有权归原作者,若您的权利被侵害,请联系管理员。
 转载本站原创文章,请注明出处,并保留原始链接、图片水印。
 本站是一个以用户分享为主的开源技术平台,欢迎各类分享!
 本文地址:https://www.open-open.com/lib/view/open1418132786573.html
网络爬虫 Page Scraper