JS的HTML/XML/RSS解析器 - NodeHtmlParser
node-htmlparser 是一个 JavaScript 的 HTML/XML/RSS 解析器。
A forgiving HTML/XML/RSS parser written in JS for both the browser and NodeJS (yes, despite the name it works just fine in any modern browser). The parser can handle streams (chunked data) and supports custom handlers for writing custom DOMs/output。
示例代码:
var htmlparser = require("htmlparser"); var rawHtml = "Xyz <script language= javascript>var foo = '<<bar>>';< / script><!--<!-- Waah! -- -->"; var handler = new htmlparser.DefaultHandler(function (error, dom) { if (error) [...do something for errors...] else [...parsing done, do something...] }); var parser = new htmlparser.Parser(handler); parser.parseComplete(rawHtml); sys.puts(sys.inspect(handler.dom, false, null));
本文由用户 jopen 自行上传分享,仅供网友学习交流。所有权归原作者,若您的权利被侵害,请联系管理员。
转载本站原创文章,请注明出处,并保留原始链接、图片水印。
本站是一个以用户分享为主的开源技术平台,欢迎各类分享!