深入理解 C 语言流缓冲:setlinebuf 到 setvbuf函数详解

文摘   2024-11-08 08:58   广东  

点击上方【蓝字】关注博主

 C 语言流缓冲机制是程序与底层 I/O 设备之间数据传输的重要桥梁,它通过在内存中创建缓冲区来优化数据传输,提升程序效率。本文将深入解析 C 语言流缓冲机制中setlinebuf、setbuffer、setbuf 和 setvbuf 四个函数的用法,帮助你掌握流缓冲机制的控制技巧,提升程序性能。

01

流缓冲机制的概念

C 语言流缓冲机制对于程序性能和效率至关重要。它是一种在程序和底层 I/O 设备之间建立数据传输桥梁的机制,通过在内存中创建缓冲区来优化数据传输,减少系统调用次数,从而提升程序运行效率。

数据流向:

  1. 程序写入数据: 当程序使用 printf 等函数向文件写入数据时,数据首先被写入到内存中的缓冲区。

  2. 缓冲区填满: 缓冲区被填满后,操作系统会将缓冲区中的数据一次性写入到文件系统或设备中。

  3. 程序读取数据: 当程序使用 scanf 等函数从文件读取数据时,操作系统会先将文件数据读取到缓冲区,然后程序再从缓冲区中读取数据。

缓冲区管理: 操作系统负责管理缓冲区,并在适当的时候将缓冲区中的数据写入文件或设备。

缓冲机制的优点

  • 缓冲区可以临时存储数据,减少频繁的磁盘读写操作,显著提升程序运行速度。

  • 缓冲区可以将多个数据合并成一个大的数据块进行传输,减少系统调用的次数,降低系统开销。

  • 流缓冲机制提供了一层抽象,简化了对 I/O 操作的管理,方便程序员进行数据读写操作。

  • 不同的操作系统和硬件平台可能具有不同的 I/O 操作方式,流缓冲机制提供了一层抽象,使代码更具可移植性。

C 语言中的流缓冲机制主要分为三种类型:全缓冲、行缓冲和无缓冲。它们在数据写入到磁盘或从磁盘读取数据的时机上有所区别,影响着程序的性能和效率。

  1. 全缓冲:

  • 特点: 当缓冲区填满后,数据才会一次性写入到磁盘或从磁盘读取。

  • 适用场景: 适用于数据量较大、需要更高效率的场景,例如文件操作、网络传输等。

  • 优点: 可以减少系统调用的次数,提高程序的性能。

  • 缺点: 数据写入到磁盘或从磁盘读取的时间会延迟,导致程序的响应速度变慢。

  • 行缓冲:

    • 特点: 每遇到换行符 \ 时,数据就会写入到磁盘或从磁盘读取。

    • 适用场景: 适用于交互式程序,例如命令行程序,需要及时显示用户输入或输出结果。

    • 优点: 可以及时显示数据,提高程序的交互性。

    • 缺点: 频繁的磁盘操作会降低程序的性能。

  • 无缓冲:

    • 特点: 数据会立即写入到磁盘或从磁盘读取,不使用任何缓冲区。

    • 适用场景: 适用于需要实时操作的场景,例如错误处理、调试信息等。

    • 优点: 能够及时地写入或读取数据,确保数据的实时性。

    • 缺点: 频繁的磁盘操作会降低程序的性能,并且会造成系统性能瓶颈。

    在 C 语言中可以通过以下四个函数来控制流缓冲的行为:setlinebuf,setbuffer,setbuf,setvbuf

    setlinebuf 用于将流设置为行缓冲模式。setbuffer 和 setbuf 用于设置自定义缓冲区。setvbuf 提供更灵活的缓冲控制,可以指定缓冲类型和大小。

    02

    setlinebuf 函数详解 

    setlinebuf 函数原型:

    void setlinebuf(FILE *stream);
    参数类型解释
    streamFILE *要设置缓冲类型的流指针。

    功能:setlinebuf 函数将指定流 stream 设置为行缓冲模式。

    • 当程序遇到换行符 \ 时,数据就会被写入磁盘或从磁盘读取。

    • 提高程序的交互性,因为每次遇到换行符,数据就会被立即输出,方便用户查看结果。

    示例:

    #include <stdio.h>

    int main() {
    FILE *fp = fopen("test.txt", "w");
    if (fp == NULL) {
    perror("fopen");
    return 1;
    }

    // 设置流为行缓冲模式
    setlinebuf(fp);

    fprintf(fp, "Hello, ");
    fprintf(fp, "world!\
    "
    ); // 遇到换行符,数据被写入磁盘
    fclose(fp);

    return 0;
    }

    注意:

    • setlinebuf 函数只能用于标准 I/O 流,例如 stdinstdoutstderr 等。

    • setlinebuf 函数不能用于文件指针,因为文件指针默认使用全缓冲模式。

    • setlinebuf 函数会影响后续对该流的所有操作,直到再次使用 setbuf 或 setvbuf 函数修改缓冲模式。


    03

    setbuffer 和 setbuf 函数详解 

    setbuffer 函数原型:

    void setbuffer(FILE *stream, char *buf, size_t size);
    参数类型解释
    streamFILE *要设置缓冲类型的流指针。
    bufchar *自定义缓冲区指针。
    sizesize_t缓冲区大小。

    功能:setbuffer 函数为指定流 stream 设置一个大小为 size 的缓冲区 buf,用于数据传输。

    效果:

    • 使用自定义缓冲区,可以提升程序性能,因为数据可以批量传输,减少系统调用次数。

    • 需要手动管理缓冲区,因为数据不会自动写入磁盘或从磁盘读取,需要调用 fflush 函数或程序结束时自动刷新缓冲区。

    setbuf 函数原型:

    void setbuf(FILE *stream, char *buf);
    参数类型解释
    streamFILE *要设置缓冲类型的流指针。
    bufchar *自定义缓冲区指针。

    功能:setbuf 函数与 setbuffer 功能类似,但默认缓冲区大小为 BUFSIZ,一个预定义的常量。

    效果:

    • 使用自定义缓冲区,可以提升程序性能,因为数据可以批量传输,减少系统调用次数。

    • 需要手动管理缓冲区,因为数据不会自动写入磁盘或从磁盘读取,需要调用 fflush 函数或程序结束时自动刷新缓冲区。

    示例:

    #include <stdio.h>

    int main() {
    char buffer[1024]; // 自定义缓冲区

    FILE *fp = fopen("test.txt", "w");
    if (fp == NULL) {
    perror("fopen");
    return 1;
    }

    // 设置流使用自定义缓冲区
    setbuffer(fp, buffer, sizeof(buffer));

    fprintf(fp, "Hello, world!"); // 数据先写入缓冲区
    fflush(fp); // 手动刷新缓冲区,将数据写入磁盘

    fclose(fp);

    return 0;
    }

    注意:

    • setbuffer 和 setbuf 函数可以用于标准 I/O 流和文件指针。

    • setbuffer 和 setbuf 函数会影响后续对该流的所有操作,直到再次使用 setbuf 或 setvbuf 函数修改缓冲模式。

    setbuffer 和 setbuf 的区别:setbuffer 需手动分配内存,setbuf 使用预先分配的缓冲区。
    setbuffer 和 setbuf 的应用场景:需要更大或更小的缓冲区、定制化缓冲管理等


    04

    setvbuf 函数详解

    函数原型:

    int setvbuf(FILE *stream, char *buf, int mode, size_t size);

    参数解释:

    参数类型解释
    streamFILE *要设置缓冲类型的流指针。
    bufchar *自定义缓冲区指针。如果设置为 NULL,则使用标准 I/O 库提供的默认缓冲区。
    modeint缓冲类型
    sizesize_t缓冲区大小,仅在 buf 不为 NULL 时有效。

    mode的缓存类型:

    • _IOFBF: 全缓冲模式,数据在缓冲区满或遇到换行符时才会写入磁盘。

    • _IOLBF: 行缓冲模式,数据在遇到换行符时才会写入磁盘。

    • _IONBF: 无缓冲模式,数据立即写入磁盘,不使用缓冲区。

    返回值: 成功返回 0,失败返回非 0 值。

    功能:setvbuf 函数为指定流 stream 设置缓冲模式,可以自定义缓冲区、缓冲类型和缓冲区大小。提供了更灵活的缓冲控制,可设置缓冲类型、大小和缓冲区地址。

    效果:

    • 灵活控制流的缓冲行为,可以根据程序需求选择不同的缓冲模式和缓冲区。

    • 可以提升程序性能,例如使用自定义缓冲区或全缓冲模式可以减少系统调用次数。

    • 可以提高程序交互性,例如使用行缓冲模式可以方便用户查看结果。

    示例:

    #include <stdio.h>

    int main() {
    char buffer[1024]; // 自定义缓冲区

    FILE *fp = fopen("test.txt", "w");
    if (fp == NULL) {
    perror("fopen");
    return 1;
    }

    // 设置流使用自定义缓冲区,全缓冲模式
    setvbuf(fp, buffer, _IOFBF, sizeof(buffer));

    fprintf(fp, "Hello, ");
    fprintf(fp, "world!"); // 数据先写入缓冲区
    fflush(fp); // 手动刷新缓冲区,将数据写入磁盘

    fclose(fp);

    return 0;
    }

    注意:

    • setvbuf 函数可以用于标准 I/O 流和文件指针。

    • setvbuf 函数会影响后续对该流的所有操作,直到再次使用 setbuf 或 setvbuf 函数修改缓冲模式。

    • setvbuf 函数只在程序开始时调用一次,之后就不能再修改缓冲模式了。

    • 使用 setvbuf 函数时,需要谨慎选择缓冲类型和缓冲区大小,以确保程序性能和效率。

    setvbuf 是最灵活的函数,可以替代 setlinebufsetbuffer 和 setbuf为什么 setvbuf 可以替代其他三个函数?

    1. 灵活的缓冲模式设置: setvbuf 可以设置三种缓冲模式:_IOFBF_IOLBF_IONBF,而其他三个函数只支持其中一种或两种。

    2. 自定义缓冲区: setvbuf 允许使用自定义缓冲区,而 setlinebuf 则只能使用默认缓冲区。

    3. 自定义缓冲区大小: setvbuf 允许设置自定义缓冲区大小,而 setbuffer 和 setbuf 则分别固定了缓冲区大小。


    05

    常见问题 

    它们的区别:

    函数缓冲模式自定义缓冲区缓冲区大小
    setlinebuf行缓冲 (_IOLBF)
    setbuffer全缓冲 (_IOFBF)自定义
    setbuf全缓冲 (_IOFBF)BUFSIZ
    setvbuf全缓冲 (_IOFBF)、行缓冲 (_IOLBF)、无缓冲 (_IONBF)自定义

    关系:

    • 功能: 它们都用于设置标准 I/O 流的缓冲模式,即数据何时写入磁盘。

    • 参数: 它们都接受流指针 stream 作为参数。

    • setlinebufsetbuffersetbuf 可以看作是 setvbuf 的特例:

      • setlinebuf 等价于 setvbuf(stream, NULL, _IOLBF, 0)

      • setbuffer 等价于 setvbuf(stream, buf, _IOFBF, size)

      • setbuf 等价于 setvbuf(stream, buf, _IOFBF, BUFSIZ)

    示例:

    #include <stdio.h>

    int main() {
    FILE *fp = fopen("test.txt", "w");

    // 设置行缓冲
    setlinebuf(fp);

    // 设置全缓冲,使用自定义缓冲区
    char buffer[1024];
    setbuffer(fp, buffer, sizeof(buffer));

    // 设置全缓冲,使用系统默认缓冲区
    setbuf(fp, buffer);

    // 设置无缓冲
    setvbuf(fp, NULL, _IONBF, 0);

    fclose(fp);

    return 0;
    }

    缓冲区溢出是程序中最常见且危险的安全漏洞之一,它可能导致数据损坏、程序崩溃,甚至被攻击者利用来执行恶意代码。

    什么是缓冲区溢出?

    缓冲区溢出发生在程序试图将超过分配内存大小的数据写入缓冲区时。例如,如果一个缓冲区只能容纳 10 个字符,而程序试图写入 11 个字符,就会导致溢出。多余的数据将被写入到相邻的内存区域,覆盖掉其他重要数据或代码,从而引发各种问题。

    缓冲区溢出是如何发生的?

    • 输入验证不足: 程序没有对用户输入进行充分的验证,允许用户输入超过缓冲区大小的数据。

    • 数组越界访问: 代码中存在访问数组元素超出数组边界的情况。

    • 字符串操作错误: 使用 strcpystrcat 等函数时,没有指定目标缓冲区的大小,导致数据溢出。

    • 格式字符串漏洞: 在格式化字符串函数(例如 printf)中,使用不受信任的输入作为格式化字符串,导致攻击者可以控制程序执行流程。

    缓冲区溢出的危害:

    • 数据损坏: 溢出的数据可能覆盖掉其他重要数据,导致程序无法正常工作。

    • 程序崩溃: 溢出的数据可能覆盖掉程序代码,导致程序崩溃。

    • 恶意代码执行: 攻击者可以利用缓冲区溢出将恶意代码注入到程序内存中,并获得系统控制权。

    如何解决缓冲区溢出问题:

    • 输入验证: 对所有用户输入进行严格的验证,确保输入数据长度不超过缓冲区大小。

    • 安全字符串函数: 使用安全字符串函数,例如 strncpystrncat,这些函数允许指定最大复制字符数。

    • 边界检查: 在访问数组元素时,添加边界检查代码,确保不会访问超出数组边界的元素。

    • 使用安全语言: 一些安全语言,例如 Java 和 Python,内置了边界检查机制,可以有效防止缓冲区溢出。

    • 使用编译器安全选项: 在编译代码时,使用编译器安全选项,例如 -Wformat 和 -Wformat-security,可以帮助发现代码中的潜在漏洞。

    • 使用安全库: 使用安全库,例如 OpenSSL,可以提供安全的字符串操作和数据加密功能。

    一个简单的缓冲区溢出示例:

    #include <stdio.h>
    #include <string.h>

    int main() {
    char buffer[10];
    char input[20];

    printf("请输入字符串:");
    fgets(input, sizeof(input), stdin);

    // 这里没有检查输入字符串的长度,可能导致缓冲区溢出
    strcpy(buffer, input);

    printf("输入的字符串是:%s\
    "
    , buffer);

    return 0;
    }

    如果用户输入超过 10 个字符,就会导致缓冲区溢出。

    安全修复:

    #include <stdio.h>
    #include <string.h>

    int main() {
    char buffer[10];
    char input[20];

    printf("请输入字符串:");
    fgets(input, sizeof(input), stdin);

    // 使用 strncpy 安全复制字符串
    strncpy(buffer, input, sizeof(buffer) - 1);

    // 添加 null terminator
    buffer[sizeof(buffer) - 1] = '\0';

    printf("输入的字符串是:%s\
    "
    , buffer);

    return 0;
    }


    06

    总结

    C 语言流缓冲机制,包括其概念、工作原理、各种缓冲模式、控制缓冲行为的函数以及相关安全问题。

    流缓冲机制在程序与底层 I/O 设备之间建立了桥梁,通过在内存中创建缓冲区来优化数据传输,减少系统调用次数,提升程序效率。C 语言提供了四种控制流缓冲行为的函数:setlinebufsetbuffersetbuf 和 setvbuf

    • setlinebuf 将流设置为行缓冲模式,数据遇到换行符时写入磁盘。

    • setbuffer 和 setbuf 使用自定义缓冲区,可以提升性能,但需要手动管理。

    • setvbuf 提供更灵活的缓冲控制,可以自定义缓冲类型、大小和缓冲区地址。

    理解流缓冲机制的工作原理,可以帮助我们更好地控制数据传输,提升程序效率和性能。同时,也需要注意缓冲区溢出问题,并采取相应的安全措施来保护程序的安全。

    推荐文档:【Linux C API 参考手册】 https://wizardforcel.gitbooks.io/linux-c-api-ref/content/173.html

    公众号: Lion 莱恩呀

    微信号: 关注获取

    扫码关注 了解更多内容

    点个 在看 你最好看

    Lion 莱恩呀
    专注分享高性能服务器后台开发技术知识,涵盖多个领域,包括C/C++、Linux、网络协议、设计模式、中间件、云原生、数据库、分布式架构等。目标是通过理论与代码实践的结合,让世界上看似难以掌握的技术变得易于理解与掌握。
     最新文章