由于对爬虫的喜欢,以及xpath对html强有力的解析,还有从浏览器中查找html节点的方便性,使得xpath用作爬虫的分析就很给力了
查阅xpath教程,都是写xpath对xml的解析示例,而且基本都是copy 再三
本教程的章节不会太多,主要讲解xpath的语法,以及讲解如何最快的获取html中需要的数据
主要内容都是用xpath分析html的页面结构
XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。
在您继续学习之前,应该对下面的知识有基本的了解: - HTML / XHTML - XML / XML 命名空间
什么是 XPath? - XPath 使用路径表达式在 XML 文档中进行导航 - XPath 包含一个标准函数库 - XPath 是 XSLT 中的主要元素 - XPath 是一个 W3C 标准
XPath 路径表达式 XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
XPath 是 W3C 标准 - XPath 于 1999 年 11 月 16 日 成为 W3C 标准。 - XPath 被设计为供 XSLT、XPointer 以及其他 XML 解析软件使用。