准实时前端监控探索

文摘科技 2024-03-25 20:43 北京

实时数据能立即反映线上业务情况，对业务来说能很快看到业务变化带来的实时影响，对技术人员来说能实时观察线上出现的一些波动，有利于及时发现线上问题。

数据埋点上报经过数据部门处理后，有两个离线表，天表和小时表，天表是第二天才能看到前一天的数据，小时表是可以看到当天过去的时间内的数据，为了更早看到数据效果，尝试采用小时表来进行数据监控。

流程基本如下：

unsetunset过程介绍unsetunset

架设服务基于Egg.js，Egg 对定时任务支持很好，新建一个定时任务文件在app/schedule 下即可，每个文件都是一个独立的定时任务。

const Subscription = require('egg').Subscription;

class ScheduleTask extends Subscription {
 static get schedule() {
  return {
   interval: '5m', // 每5分钟执行一次任务
   type: 'worker',
  };
 
 }
 // subscribe 是真正定时任务执行时被运行的函数
 async subscribe() {
  const pageTypes = getConfig(); // 加载录入的埋点
  await this.ctx.service.task.runData(pageTypes);
  this.ctx.service.task.refreshTask(); // 刷新任务，获取查询结果
 }
}

module.exports = ScheduleTask;

查询结果

查询每个小时埋点结果前，先要确定从哪个时间节点开始查询，这里手动指定一个，查询当前时间2个小时前的数据，比如当前是12点，我们就从10点开始查。

注意用这个时间作为游标，需要缓存起来，后面移动游标的时候需要用到。

在 task 这个service 中，执行 sql 查询，sql如下：

const sql = `
SELECT
  pagetype,
  hour,
  count(token) as c
FROM
  page_action_1h
WHERE
  pagetype in ('${pageTypes.join('\',\'')}')
  and actiontype='pv'
  and dt='${dateCursor.format('YYYY-MM-DD')}'
  and hour='${queryHour < 10 ? '0' + queryHour : queryHour}'
group by hour, pagetype
`;

dateCursor 就是缓存的游标，page_action_1h 是表名，表中有用户标识token，pagetype，actiontype，dt，hour等字段。

注意这里是一条 sql 查询多个 pagetype，任务提交后并不会立即返回所有数据，可能单独一个pagetype 有结果后就返回，所以需要循环查询任务执行进度，只有所有的页面结果都返回后才可以执行数据处理，间隔时间根据服务执行效率灵活调整，这里间隔时间设置1分钟。

数据处理

假设sql执行请求的到了如下结果：

[
  [ 'page1', '10', '4818' ],
  [ 'page2', '10', '2932' ],
  [ 'page3', '10', '1474' ]
]

10点这个时段的数据查询出来了，然后就可以对时间游标 dateCursor 加 1，这样下一次定时任务查询的就是下一个小时的数据了，本次的数据先存储起来，然后进行对比。

存储方式选择存储到redis中，redis存储结构如下：

monitor_key:

{
  "page1": {
    "10": "4818",
    "11": "5945"
  },
  "page2": {
    "10": "2932",
    "11": "1509"
  },
  "page3": {
    "10": "1474",
    "11": "3438"
  }
}

当下一个小时数据执行完成时，就有了两个时段的数据，对比两个时段的数据量就能看到数据变化趋势，并进行报警。

数据存储一个key中，因为是以小时时段存储的，没有记录日期，所以依赖的是任务不断执行，不断刷新下一个小时的数据，以当前时间为节点，只有当前时间之前的数据查询返回之后才进行下一个时段的查询。

另一个方案是每个小时存储一个key，设置24小时过期时间，直接查询所有匹配的小时即可，保留下来的数据就是一天的数据量。

报警规则

我们可以指定当数据量下降一定比例的时候，上升一定比例的时候发送报警信息。基于已有数据还可以指定其他报警规则：

区间段内的平均值
区间段内的尖刺值
最大值预警，最小值预警

unsetunset上线效果unsetunset

数据累计之后便可以绘制页面访问量级趋势图，报警的时候一并发送会更直观得观察趋势异常情况。

线上持续运行后，发现一个关键问题，小时表的数据生成时间很不稳定，可能是数据量计算所占任务时间长短不一，有时候可以一小时内生成上一个小时的数据，有时候则需要两三个小时甚至更长时间。这对于一个本身实时性不那么强的报警来说，时效性又打了一层折扣。最终效果并没有达到预期。

通过以上的探索，我们尝试了准实时前端监控的方案，利用小时表来获取更快的实时数据反馈。我们搭建了定时任务来定期查询并存储数据，利用 Redis 存储结构来对比数据变化趋势，并设置报警规则来实时监测异常情况。

然而，在线上实践中发现了小时表数据生成时间不稳定的问题，导致实时性不如预期。这对于一个实时性要求不高的报警系统来说，影响并不是很大，但也暴露了需要进一步优化的空间。

所以在未来我们将需找其他方式的实时数据报警，以提供更准确、实时的数据反馈和监控功能，助力业务发展和故障排查。

想了解更多转转公司的业务实践，点击关注下方的公众号吧！

http://mp.weixin.qq.com/s?__biz=MzU0OTExNzYwNg==&mid=2247498564&idx=1&sn=ec8825932d7a321639c21b7ebdbdc18c

大转转FE

定期分享一些团队对前端的想法与沉淀

最新文章

转转前端周刊第131期: AIGC在活动业务中的探索与应用

转转前端周刊第130期: 2024 前端现状

转转前端周刊第129期: 大前端：Taro 鸿蒙技术内幕系列如何将 React 代码跑在 ArkUI 上

不小心把线下数据配到线上？试试它

转转前端周刊第128期: 大前端：如何突破动态化容器的天花板？

客服工作台的实践总结

转转前端周刊第127期: Vue.js 作者宣布成立 VoidZero - 下一代 JavaScript 工具链

转转前端周刊第126期: B站前端错误监控实践

揭秘海报生成技术

《WebRTC 探索：前端视角下的实时通信解析》（下）

《WebRTC 探索：前端视角下的实时通信解析》（中）

转转前端周刊第125期: Rspack 1.0 发布了！

《WebRTC 探索：前端视角下的实时通信解析》（上）

转转前端周刊第124期: 大模型训练实战经验总结

探索第三方授权登录，领略OAuth2.0的魅力

转转前端周刊第123期: 前端在线代码编辑器技术杂谈

【AI神助攻】用"v0"，自然语言秒变网站！

转转前端周刊第122期: Node.js v22.6.0 发布，可以直接运行 TS 了！

一文读懂JavaScript原型链

转转前端周刊第121期: GitHub 助力 AI：免费体验，轻松部署

那些你不知道的隐式类型转换

转转前端周刊第120期: AI Code 在团队开发工作流的融合思考

转转前端周刊第119期: Chrome 居然提供了可以直接调用 LLM 的 API！

转转前端周刊第118期: 尤雨溪在VueConf CN 2024 分享了面向未来的Vue 和 Vite

转转 APP HarmonyOS Next 开发之旅

转转前端周刊第117期: 腾讯文档前端工程架构改造实践

转转搭建平台-魔方数据中心实战

解密Lego:客户端日志系统的演进

转转前端周刊第115期: React 19 差点拖慢整个互联网！核心团队紧急叫停

转转前端周刊第114期: Web AI：下一代 Web 应用的新模型、工具、API

转转前端周刊第113期: 苦等三年，React Compiler 终于能用了。使用体验：很爽，但仍有瑕疵]

重新认识 TypeScript类型系统

转转前端周刊第112期: 全网独家-万字长文入门前端全球化

前端视角看上门履约：从用户下单到履约完成

转转前端周刊第111期: React19 她来了，她来了，他带着礼物走来了

转转前端周刊第110期: Virtual DOM（虚拟DOM）的地位再一次被挑战！！！

助你效率翻倍的VS Code插件

转转前端周刊第109期: rust 正在全面入侵前端

Webcodecs音视频编解码与封装技术探索

转转前端周刊第108期: 大模型下B端前端代码辅助生成的思考与实践

转转前端周刊第107期: NPM 依赖管理的复杂性

转转前端周刊第106期: 终于等到你！JS全新API支持关闭页面时安全发送网络请求

准实时前端监控探索

转转前端周刊第105期: 来自 rust 生态的强烈冲击？谈谈 Leptos 在语法设计上的精妙之处

这Proxy能干啥？

转转前端周刊第104期: 还学的动吗？号称最快的 JS 运行时 WinterJS 发布！

转转fe增量代码覆盖率统计实现方案

前端视角解读新媒体投放

转转前端周刊第103期

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉