900字范文 > C语言进阶之自定义类型：结构体枚举联合

C语言进阶之自定义类型：结构体枚举联合

时间：2023-02-03 00:10:49

相关推荐

C语言进阶之自定义类型：结构体枚举联合

前言

结构体

（1）结构体类型的声明

（2）结构的自引用

（3）结构体变量的定义和初始化

（4）结构体内存对齐

（5）结构体传参

（6）结构体实现位段（位段的填充&可移植性）

枚举

（1）枚举类型的定义

（2）枚举的优点

（3）枚举的使用

联合

（1）联合类型的定义

（2）联合的特点

（3）联合大小的计算。

一、结构体

1.结构体的声明

（1）结构的基础知识

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

（2）结构的声明

struct tag{member-list;}variable-list;

例如描述一个学生：

struct Stu{char name[20];//名字int age;//年龄char sex[5];//性别char id[20];//学号}; //分号不能丢

（3）特殊的声明（匿名结构体）

在声明结构体的时候，可以不完全的声明。

比如：

//匿名结构体类型struct{int a;char b;float c;}x; //必须在此紧挨着定义结构体变量，以后在后面不能定义了 //因为其特殊性，所以只能使用一次struct{int a;char b;float c;}a[20], *p;

上面的两个结构在声明的时候省略掉了结构体标签（tag）。

//在上面代码的基础上，下面的代码不合法//编译器认为等号两边时不同的结构体类型，所以这种写法时错误的p = &x;

因为是匿名结构体类型，所以上面的两个结构体是两种类型，并不存在结构体指针

警告：

编译器会把上面的两个声明当成完全不同的两个类型。

所以是非法的。

（4）结构的自引用

在结构中包含一个类型为该结构本身的成员

以链表为例：

1，2，3，4，5 是五块内存，但是并没有按顺序存储，而且要求他们互相之间能够找到，比如说，要1能够找到2，2能够找到3，3能够找到4，4能够找到5，5不再往下找。因此通过地址查找，1存2的地址，2存3的地址，3存4的地址，5就不存有效的地址，存一个NULL。当第一个是struct Node的类型的时候，因为是自己找自己的类型，所以其余四个也是这种类型的，因此指针也是 struct Node* 类型的。

错误的自引用方式：

//代码1struct Node{int data;struct Node next;};//不行！//sizeof(struct Node)是无限大了

正确的自引用方式：

//代码2struct Node{int data;struct Node* next;};//通过指针来完成

注意：

//代码3typedef struct{int data;Node* next;}Node;//不行！//Node* next的Node没人认识，Node* next是结构体里的成员变量//声明结构体时并没有Node，而Node是重定义以后才有的//解决方案：typedef struct Node{int data;struct Node* next;}Node;//将该结构体重命名为Node正确做法int main(){struct Node n2 = { 0 };Node n = { 0 };//两种初始化都可以return 0;}

当想定义把一个结构体重命名，那当前的这个结构体必须是清晰可见的，而结构体中的成员变量又用到了本来的这种结构体类型的指针，那当前的这个要重命名的结构体就不能是匿名的结构体，如上代码

（5）结构体变量的定义和初始化

有了结构体类型，那如何定义变量，其实很简单。

struct Point{int x;int y;}p1; //声明类型的同时定义全局变量p1struct Point p2; //定义结构体全局变量p2//初始化：定义变量的同时赋初值。struct Point p3 = {x, y};struct Stu//类型声明{char name[15];//名字int age;//年龄};struct Stu s = {"zhangsan", 20};//初始化struct Node{int data;struct Point p;struct Node* next; }n1 = {10, {4,5}, NULL}; //结构体嵌套初始化struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

（6）结构体内存对齐

我们已经掌握了结构体的基本使用了。

现在我们深入讨论一个问题：计算结构体的大小。

需要用到宏offsetof

size_t offsetof( structName, memberName );

返回的是偏移量，是一个成员在结构体里相较于起始位置的偏移量

struct S1{char c1;//1int i;//4char c2;//1};//12int main(){printf("%d\n", offsetof(struct S1, c1));//0printf("%d\n", offsetof(struct S1, i));//4printf("%d\n", offsetof(struct S1, c2));//8printf("%d\n", sizeof(s1));//12return 0;}

内存占用如下图：

c1 相对于起始位置的偏移量为0，占了一字节空间， i 相对于起始位置的偏移量为4，隔了三个字节才存了 i 的数据， c2 相对于起始位置的偏移量为8，直接在存完 i 数据后的空间存储，然后又占用了三个字节没存放数据的空间，一共占用了12个字节的空间大小

为何是这样呢？

这里就有关结构体内存对齐

这也是一个特别热门的考点：结构体内存对齐

考点

如何计算？

首先得掌握结构体的对齐规则：

1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
PS：VS中默认的值为8Linux中无默认对齐数，对齐数就是成员自身的大小
3. 结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
（最大对齐数指的是所有成员的对其书中最大的那个）
4. 如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

所以根据规则：

如上图：

当第一个数据按规则第一个成员在与结构体变量偏移量为 0 的地址处规则存放好以后

从第二个数据的存放开始，按规则变量要对齐到对齐数（这里默认使用的是VS）的整数倍的地址处，所以 i 的粗放应该是从偏移量为 4 处开始存放数据，而 c2 因为对齐数是 1 所以任意位置都可以，因此直接存放在偏移量为 8 处的空间

最后按规则结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍，所以结构体的总大小必须是 4 的整数倍(1，4，1)，而目前占用的空间是1+3+4+1=9 个字节的空间，所以需要浪费掉三个字节大小的空间，占 12 个字节大小的空间

当出现结构体嵌套时，如下代码：

struct S3{double d;//8char c;//1int i;//4};//已算占16个字节struct S4{char c1;//1struct S3 s3;//8double d;//8};

如上图：

先把 c1 置于 0 偏移位置处

然后根据规则如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，所以s3应该置于 8偏移位置处，然后 d 就应该置于 24 偏移位置处，目前占用的是 32 个字节大小的空间

最后根据规则结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍，也就是 8 的倍数（1，8，8），32正好满足

//练习1struct S1{char c1;int i;char c2;};printf("%d\n", sizeof(struct S1));//12//练习2struct S2{char c1;char c2;int i;};printf("%d\n", sizeof(struct S2));//8//练习3struct S3{double d;char c;int i;};printf("%d\n", sizeof(struct S3));//16//练习4-结构体嵌套问题struct S4{char c1;struct S3 s3;double d;};printf("%d\n", sizeof(struct S4));//32

为什么存在内存对齐?

大部分的参考资料都是如是说的：

平台原因(移植原因)：

不是所有的硬件平台都能访问任意地址上的任意数据的；

某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。

性能原因：

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。

原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；

而对齐的内存访问仅需要一次访问。

总体来说：

结构体的内存对齐是拿空间来换取时间的做法。

那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到：

让占用空间小的成员尽量集中在一起。

//例如：struct S1{char c1;int i;char c2;};struct S2{char c1;char c2;int i;};

S1和S2类型的成员一模一样，但是S1和S2所占空间的大小有了一些区别。

（7）修改默认对齐数

之前我们见过了#pragma这个预处理指令，这里我们再次使用，可以改变我们的默认对齐数。

#include <stdio.h>#pragma pack(8)//设置默认对齐数为8struct S1{char c1;int i;char c2;};#pragma pack()//取消设置的默认对齐数，还原为默认#pragma pack(1)//设置默认对齐数为1struct S2{char c1;int i;char c2;};#pragma pack()//取消设置的默认对齐数，还原为默认int main(){printf("%d\n", sizeof(struct S1));//12printf("%d\n", sizeof(struct S2));//6return 0;}

结论：

结构在对齐方式不合适的时候，我们可以自己更改默认对齐数。

百度笔试题：

写一个宏，计算结构体中某变量相对于首地址的偏移，并给出说明

考察： offsetof 宏的实现

注：这里还没学习宏，可以放在宏的博客中实现。

（8）结构体传参

直接上代码：

struct S{int data[1000];int num;};struct S s = {{1,2,3,4}, 1000};//结构体传参void print1(struct S s){printf("%d\n", s.num);}//结构体地址传参void print2(struct S* ps){printf("%d\n", ps->num);}int main(){print1(s); //传结构体print2(&s); //传地址return 0;}

上面的 print1 和 print2 函数哪个好些？

答案是：首选print2函数。

原因：

函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。
如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

结论：

结构体传参的时候，传结构体的地址。

2.位段

（1）什么是位段

位段的声明和结构是类似的，有两个不同：

1.位段的成员必须是 int、unsigned int 或signed int 。（但是位段的成员是char也行）
2.位段的成员名后边有一个冒号和一个数字。（非必须）

比如：

struct A{int _a:2;int _b:5;int _c:10;int _d:30;};

A就是一个位段类型。

位段A的大小是 8 个字节

printf("%d\n", sizeof(struct A));//8

（2）位段的内存分配

1. 位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型

2. 位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。

3.位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

//一个例子struct S{char a:3;char b:4;char c:5;char d:4;};struct S s = {0};s.a = 10;s.b = 12;s.c = 3;s.d = 4;//空间是如何开辟的？

一上来先开辟一个字节大小的空间，也就是 8 个比特位，当 a 存完 3 个比特位后又将 b 的四个比特位存进去，然后还剩下一个比特位的空间被舍弃（VS中是这样的），因为 c 的大小大于一个比特位，又开辟了一个字节大小的空间存放 c 的 5 个比特位，然后因为 d 的空间大小大于剩下的 3 个比特位，所以剩下的 3 个比特位大小的空间被舍弃（VS中是这样的），因此又开辟了一个字节大小也就是 8 个比特位大小的空间存放剩下的 4个比特位，最后剩下的四个比特位就被舍弃（VS中是这样的），所以一共占用了三个字节大小的空间

如上图：

因为C语言标准没有规定一个字节中比特位从哪一边开始使用，因此取决于编译器，所以假设从数的低位往高位开始使用

先把 s 初始化为 0 ，当 s.a = 10时，是把 10 存入 a 中，但是因为 a 只开辟了 3 个比特位大小的空间，而 10 的二进制数为 1010 所以只把 010 给存进去了。当 s.b = 12 ，然后把 12 存入 b ，因为 12 的二进制位为 1100 所以在 010 的左边紧接着存入。当 s.c = 3 时，因为 c 的大小大于一个比特位，又因为其占了 5 个比特位，所以应该存入第二个字节并且数据 3 的二进制数应该是 00011。当 s.d = 4时，因为 d 的大小大于三个比特位，所以又因为其占了四个比特位，所以应该存入第三个字节并且数据 4 的二进制数应该是 0100

然后转化成十六进制的数字分别是 0x62 0x03 0x04，并参考内存中的存储，发现一致，说明和我们推理的一样

在当前的编译器地下（VS），当存放的比特位不够时，开辟一块新空间存放，剩下的位就不要了，并且在开辟空间时，空间的使用是从低位向高位使用。

（3）位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。
3. 位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

总结：

跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

（4）位段的应用

使用位段式的结构来定义数据包的格式

二. 枚举

枚举和结构体一样，本质上是一种类型

枚举顾名思义就是一一列举。

把可能的取值一一列举。

比如我们现实生活中：

一周的星期一到星期日是有限的7天，可以一一列举。
性别有：男、女、保密，也可以一一列举。
月份有12个月，也可以一一列举

这里就可以使用枚举了。

1.枚举类型的定义

enum Day//星期{Mon,Tues,Wed,Thur,Fri,Sat,Sun};typedef enum Sex//重定义类型性别{MALE,FEMALE,SECRET}Sex；enum Color//颜色{RED,GREEN,BLUE};int main(){enum day d = Sum;//初始化enum Sex s = MALE;//初始化Sex s2 = MALE;//重定义以后的初始化方式printf("%d\n", sizeof(s2));//计算的是s2变量的大小//因为是s2变量的类型是int类型，所以大小是4个字节}

以上定义的 enum Day ， enum Sex ， enum Color 都是枚举类型。

{}中的内容是枚举类型的可能取值，也叫枚举常量。

这些可能取值都是有值的，默认从0开始，一次递增1，当然在定义的时候也可以赋初值。

例如：

enum Color//颜色{RED=1,GREEN=2,BLUE=4};

2.枚举的优点

为什么使用枚举？

我们可以使用 #define 定义常量，为什么非要使用枚举？

枚举的优点：

增加代码的可读性和可维护性和#define定义的标识符比较枚举有类型检查，更加严谨。防止了命名污染（封装）便于调试使用方便，一次可以定义多个常量

3.枚举的使用

enum Color//颜色{RED=1,GREEN=2,BLUE=4};enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。clr = 5;//不能这样，枚举是类型，也就是说enum Color是类型，缺少了类型只有变量是错误的

四. 联合体（共用体）

1. 联合类型的定义

联合也是一种特殊的自定义类型

这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。

比如：

//联合类型的声明union Un{char c;int i;};//联合变量的定义union Un un;//计算连个变量的大小printf("%d\n", sizeof(un));//4

2.联合的特点

联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联合至少得有能力保存最大的那个成员）。
同一时间只能使用一个成员变量

union Un{int i;char c;};union Un un;// 下面输出的结果是一样的printf("%d\n", &(un.i));printf("%d\n", &(un.c));//下面输出的结果是11223344un.i = 0x11223344;un.c = 0x55;printf("%x\n", un.i);

如下图：

使用场景：有时用其中的一个成员变量，有时用另外一个成员变量，两者不是同时使用时，当一个使用完后，上一个使用完以后存在里面的数据会被下一个成员变量的数据覆盖
如下，相似的值，但是只会用一个，开辟了一块空间，两个成员变量共用这块空间，当需要时，选择其中的一个成员使用这块空间

/*学校用户系统用户：老师（名字，年龄，职称）学生（名字，年龄，身份）*///结构体选择union type{identity;//身份technical_post;//职称};//用户UerInfo{char name[20];int age;union type t;};

面试题：

判断当前计算机的大小端存储

#include <stdio.h>/*//指针写法int Check_sys(){int i = 1return *((char*)i);}*///联合体写法int Check_sys(){union {char c;int i;}u;//匿名联合体，因为这里只用一次union u.i = 1;return u.c;}int main(){Check_sys();if(Check_sys == 1){ printf("小端\n");}else{priintf("大端\n");}return 0;}

3.联合大小的计算

联合的大小至少是最大成员的大小。当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。

比如：

union Un1{char c[5];//5个字节，对齐数是1（1和8比）int i;//4个字节，对齐数是4（4和8比）};//因为是 char 类型的数组，所以最大对4，所以占用的内存必须是4的整数倍//所以占用的内存不是5个字节，而是8个字节union Un2{short c[7];//14个字节，对齐数是2（2和8比）int i;//4个字节（4和8比）};printf("%d\n", sizeof(union Un1));//8printf("%d\n", sizeof(union Un2));//16

这里需要注意对齐数比较的是数组里类型的大小，不是整个数组的大小