记一次加密数据的解密分析过程

科技科技 2024-02-21 12:30 山西

投稿作者：c4rt1y（信安之路的老朋友）

爬虫（crawler）和反爬虫（anti-crawler）技术之间的对抗是一场持续的猫鼠游戏。爬虫是自动化的网络机器人，它们浏览互联网上的网站，以收集信息和数据。而反爬虫技术则是网站管理员用来阻止或限制爬虫收集数据的技术和策略。

爬虫技术

爬虫技术的目的是高效地收集网络上的信息。以下是一些常见的爬虫技术：

用户代理伪装：通过修改HTTP请求的用户代理字符串，爬虫可以伪装成不同的浏览器或设备，避免被简单的用户代理过滤器识别。
IP代理：使用代理服务器或VPN，爬虫可以更换IP地址，避免因为来自同一IP地址的大量请求而被封禁。
请求频率控制：通过限制请求的频率，爬虫可以模仿正常用户的行为，以减少被检测的机会。
分布式爬虫：使用多台机器或云服务来分散请求，使得跟踪和封禁变得更加困难。
header 信息和 Cookie的管理：合理设置HTTP header 信息和 Cookie，以模拟真实用户的行为。
动态网页抓取：使用工具如 Selenium 或 Puppeteer 来执行 JavaScript，可以抓取动态加载的内容。

反爬虫技术

反爬虫技术旨在识别和阻止不受欢迎的爬虫。以下是一些常用的反爬虫策略：

用户代理分析：检查用户代理字符串，拦截已知的爬虫或不正常的用户代理。
IP 地址监控：监控来自单一IP地址的请求频率，如果超过一定限额，则封禁该IP。
验证码：使用图形或文本验证码来阻止自动化的请求。
动态令牌：网页加载时生成动态令牌，并在后续请求中验证，以防止爬虫模拟请求。
行为分析：分析用户行为，如鼠标移动、点击模式等，以识别非人类行为。
内容和链接混淆：故意在页面中添加一些陷阱链接或信息，当爬虫尝试访问这些内容时，被识别并封禁。
限制头部信息：要求合法请求必须包含某些特定的头部信息，例如正确的 Referer 或 Cookies。
前端JS加密：对前端请求数据的 JS 代码进行加密，增加分析难度，从而提升数据爬取的难度

对抗策略

适应性：爬虫开发者需要不断更新他们的策略，以适应新的反爬虫措施。
机器学习：使用机器学习算法来更好地模仿人类行为，或者识别反爬虫的模式。
协议级别的混淆：通过 TLS/SSL 层面的混淆来隐藏爬虫流量。

爬虫和反爬虫之间的对抗是一个动态平衡，随着技术的发展，双方都在不断进化。网站管理员希望保护其内容和用户数据不被滥用，而数据科学家和市场分析师等职业可能需要收集网站数据以进行合法的分析和研究。因此，这场对抗往往也涉及到法律、伦理和隐私的问题。

本文将以分析获取某企业网站的企业名称为例，分析其反爬策略，编写自动脚本，完成自动化。

1、分析数据请求过程

打开页面，发现是返回数据加密，字段为 encrypt_data：

2、定位关键文件

方法一：Initiator中发现文件

方法二：搜索按钮

3、调试代码

单步到此处

4、分析代码

核心代码为如下内容

function s(e) {            return JSON.parse(o("5e5062e82f15fe4ca9d24bc5", a.a.decode(e), 0, 0, "012345677890123", 1))        }

查找 o() 函数信息

将 o() 函数缩小，然后整行复制

解决扣代码问题 a.a.decode() 其实就是 decode:

双击进去，找到 decode，同时发现，存在多个变量:

最终的解密的 js 代码已上传星球，有需要的可以直接前往获取，测试效果如图：

5、将 JS 代码转为 python 脚本

使用浏览器的调试功能，将请求的数据包复制为 curl 命令：

接下来将复制的 curl 命令导入到 postman 中：

最后选择要转换到脚本语言类型，最后复制代码即可：

最终测试代码已上传星球，有需求的直接前往获取，效果如图：

本文仅作为技术交流之用，严禁用户非法用途！‍‍‍

http://mp.weixin.qq.com/s?__biz=MzI5MDQ2NjExOQ==&mid=2247499186&idx=1&sn=7f65188cc63b1785185668e250afc141

信安之路

坚持原创，专注信息安全技术和经验的分享，致力于帮助十万初学者入门信息安全行业。

最新文章

一键检测 17 个蓝凌 OA 历史漏洞

抓 Windows 密码，这 7 种技术够不够用！

预编译为什么可以防御 SQL 注入？

一款综合Java漏洞平台

Nacos 综合利用工具推荐

想进步，但是又迷茫、懒惰、自制力差，我该怎么办?

一键检测 PbootCMS 历史漏洞

白帽子手机APK渗透神器（实测）

POC系统配套自动化工具发布

在校生福利课程，五天直播了解 “信安” 全景

文库体系重大更新

后门对抗技术，与管理员躲猫猫，敌进我退，敌退我进

突发|系统更新引发全球 Windows 系统蓝屏

上新了，玩儿转靶场系列

渗透人员信息收集的捷径，一步到位

四川大学不要信息安全专业啦？

为什么走安全这条路？因为。。。

一键资产收集，秒出报告

阿里这么一搞，更卷了……

新品发布，渗透必备，限时开放注册

网传 php 0day ？

穿越防火墙建立网络通道的新姿势

Nmap 结果也能可视化？效果还真不错！

大考将至，注意识别黑中介，避免累死累活，最后还得维权讨薪

黑客们最喜欢的操作系统，速来围观

一文搞懂 PHP 运行环境

执行命令绕 WAF 的 3 个小技巧

月入过万的副业机会来了，重点解决失业焦虑问题

分享 4 个信息安全领域的经典语录

网络空间部队成立，失业的网络安全从业者能够加入，迎来第二春？

360、阿里这么一搞，找工作更难了

2023 互联网寒冬，失业、降薪、0 年终，风波不断

历时八个月，获得 15000+$ 的故事

你来许愿，我来实现，共享技术的盛宴

小米造车，不仅带火了智能汽车，还给信息安全带来了新机会

聊聊从事信息安全行业如果只考取一个证书的话，考哪个最值得？

潜伏三年，只为注入后门，差点通杀

邮件域名防止伪造的三种方式

摄像头攻击实战之突破环境限制拿权限

你失业了吗？？？

一键审计 web 日志

一键查询 Github 用户邮箱

国内白帽子能赚多少钱？有多少白帽子全职挖洞能养活自己？本文给你答案

记一次加密数据的解密分析过程

华莱士领券活动漏洞，任意用户可领取免费套餐券，官方已报警

第一期监督学习成长群

Nday 漏洞的价值

破解答题环节

我想参与抽奖，但是，题目不会做

API 暴力发现

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉