递归检索包含子串的所有文本节点的最快方法

文化 2024-10-24 10:05 中国香港

在Web开发中，高效检索文本节点对于实现关键词高亮等功能至关重要，尤其是在处理动态加载内容的页面时。本文将深入探讨几种检索HTML元素中所有子文本节点的方法，并通过性能测试找出最优解。

检索方法概述

使用childNodes递归
TreeWalker
NodeIterator
document.evaluate()配合XPath

性能测试

测试代码基于一个由多个流行网站HTML代码组合而成的样本文档。以下是几种主要的检索方法实现：

// childNodes递归
function recursiveChildNodes(el) {
    var nodes = [];
    function traverse(el) {
        for (var i = 0; i < el.childNodes.length; i++) {
            var node = el.childNodes[i];
            if (node.nodeType == Node.TEXT_NODE) {
                nodes.push(node);
            } else traverse(node);
        }
    }
    traverse(el);
    return nodes;
}

// TreeWalker
function useTreeWalker(el) {
    const walker = document.createTreeWalker(el, NodeFilter.SHOW_TEXT);
    const nodes = [];
    while (walker.nextNode()) nodes.push(walker.currentNode);
    return nodes;
}

// NodeIterator
function useNodeIterator(el) {
    const iterator = document.createNodeIterator(el, NodeFilter.SHOW_TEXT);
    const nodes = [];
    let node;
    while (node = iterator.nextNode()) nodes.push(node);
    return nodes;
}

// XPath
function useXPath(el) {
    let iterator = document.evaluate("//text()", el, null, XPathResult.UNORDERED_NODE_ITERATOR_TYPE);
    const nodes = [];
    let node;
    while (node = iterator.iterateNext()) nodes.push(node);
    return nodes;
}

测试结果显示，TreeWalker、NodeIterator和XPath方法的性能相近，均比基于childNodes的递归方法快约5倍。

包含特定子串的文本节点检索

对于需要查找包含特定子串的文本节点，比较了两种方法：

使用TreeWalker获取所有文本节点后过滤
直接使用XPath表达式查找包含特定字符串的文本节点

// TreeWalker + 过滤
function treeWalkerWithFilter(el, text) {
    const walker = document.createTreeWalker(el, NodeFilter.SHOW_TEXT);
    const nodes = [];
    while (walker.nextNode()) {
        if (walker.currentNode.nodeValue.includes(text)) {
            nodes.push(walker.currentNode);
        }
    }
    return nodes;
}

// XPath直接查找
function xpathDirectSearch(el, text) {
    let iterator = document.evaluate(`//text()[contains(.,'${text}')]`, el, null, XPathResult.UNORDERED_NODE_ITERATOR_TYPE);
    const nodes = [];
    let node;
    while (node = iterator.iterateNext()) nodes.push(node);
    return nodes;
}

测试结果表明，使用TreeWalker获取所有节点后再过滤的方法比直接使用XPath条件查询更快。

结论与最佳实践

对于检索所有嵌套文本节点，document.createTreeWalker()和document.createNodeIterator()是最佳选择。
当需要查找包含特定子串的文本节点时，先使用TreeWalker获取所有文本节点，然后进行过滤是更高效的方法。

这些优化技巧对于实现高性能的文本搜索和高亮功能尤为重要，特别是在处理大型、复杂的Web应用时。通过选择合适的方法，可以显著提升页面的响应速度和用户体验。

最后：

http://mp.weixin.qq.com/s?__biz=MzI0NDQ0ODU3MA==&mid=2247524317&idx=1&sn=34ed6b0da47c9461dcf58d16937e188e

大迁世界

掘金LV8，思否10万+的作者。一个热爱前端的创业者。

最新文章

Zustand 让 React 状态变得太简单

18.useLocalStorage

19.useSessionStorage

20.useMediaQuery

写还是不写？作为一个团队，如何权衡自研与开源库

通过覆盖原型属性拦截 XMLHttpRequest 响应

新 JavaScript 管道操作符：将任何内容转化为单行代码

Svelte 5 是一种兴奋剂

释放 PWA 的力量：2024 年的现代Web应用｜React + TypeScript 示例

类型别名与接口的较量：深入理解TypeScript 2024中的差异

15.useIntersectionObserver

16.useForm

17.useCopyToClipboard

getHTML() - 替代 innerHTML 的最佳方法

向服务器端渲染说再见。Prerender.io - 兼顾搜索引擎优化的 SPA。

这个简单的窍门能大大改善 React 开发体验

我不知道如何在 JS/TS 中创建深度克隆

[Next.js14] NextAuth v5 (3) - Google 登录

React 19 编译器：2024 年最受欢迎的性能优化利器

13.useTimeout

14.useDebounce

如何在 2024 年为分布式团队编写一致的代码 | React + Typescript Cheatsheet

React v19 革新功能：2024 年需要了解的所有信息

React Native 0.76 重大更新：新架构全面启用

Next.js 15 改变游戏规则

以为自己了解 Async、Defer 和Module？这 5 个误解会让你大吃一惊

10月准备跳槽的兄弟注意了。。。

[Next.js14] NextAuth v5 (1) - 登录/登出

[Next.js14] NextAuth v5 (2) - Session/Update

2024 年最前沿的 5 大 CSS 功能 | 高级 CSS

谷歌是如何偷偷记录你的每次点击的？

在 Next.js 中使用 URL 参数进行状态管理

递归检索包含子串的所有文本节点的最快方法

Styled Components 可能在 2024 年过时

又是阿里前端组带出来的风气！

工作 7 年后放弃 Redux？还是Zustand 好用

10.useError

11.useComponentDidMount

MutationObserver 回调是作为任务或微任务同步或异步调用的？如果出现异常怎么办？

还在使用对象吗？发现 JS/TS 中 Map() 改变游戏规则的力量

如何在浏览器控制台中执行 JavaScript 模块

新颖的 setTimeout() 替代方案

为什么说 AI 其实更适合前端人？

使用 React Query 时还需要 Redux 吗？| 状态管理 2024

37. 悬停时的图像叠加效果 & 鼠标光标渐变跟踪

38.带浮动分区标题的列表 & 移动卡片

这一新前端UI框架将会改变游戏规则

我们在 JavaScript 中真正使用的 5 大设计模式 | 高级 JS/TS

每个开发人员都应了解的 2024 年 6 大 ECMAScript 功能 | 高级 JavaScript

前端市场复苏了!

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉