在命令行解析HTML:pup
pup是一个命令行工具,用于处理HTML。它从标准输入读取,打印到标准输出,并允许用户使用CSS选择器过滤页面的某些部分。
基本使用方法:
$ cat robots.html | pup .mw-headline text{} History About the standard Disadvantages Alternatives Examples Nonstandard extensions Crawl-delay directive Allow directive Sitemap Host Universal "*" match Meta tags and headers See also References External links
本文由用户 jopen 自行上传分享,仅供网友学习交流。所有权归原作者,若您的权利被侵害,请联系管理员。
转载本站原创文章,请注明出处,并保留原始链接、图片水印。
本站是一个以用户分享为主的开源技术平台,欢迎各类分享!