零基础学C语言——结构体、共同体、枚举

这是一个C语言系列文章,如果是初学者的话,建议先行阅读之前的文章。笔者也会按照章节顺序发布。

结构体

在 一文中,我们提到过,数组是一种集合,这个集合中的元素都是同一种数据类型的。下面介绍一种用于整合不同数据类型的集合结构——结构体

结构体定义的一般形式

<code>struct 结构体名 {
数据类型 成员名1;
数据类型 成员名2;
...
};

struct 结构体名 {
数据类型 成员名1;
数据类型 成员名2;
...
} 结构体变量/数组[数组长度];/<code>

这里:

  • 结构体名和成员名都符合 的命名规范
  • 数据类型不仅涵盖了基础数据类型,还包含了自定义类型以及下面两小节介绍的共同体和枚举
  • 采用后一种形式定义结构体同时定义结构体变量或数组时,结构体名可以省略不写
  • 定义结构体同时定义变量/数组时也可以同时给变量/数组赋初值,参见下面结构体变量赋初值方式

来看一个例子:

<code>struct person {
char name[64];
unsigned long age;
};/<code>

我们定义了一个名为person的结构体类型,这个结构体中包含了两个成员,一个是字符数组name,一个是无符号长整型age。这是一个程序模拟人类的简单例子。

上面我将类型二字做了突出,是因为这个结构体定义是一个类型。举个例子,我们称自己为人类,而人类并不是一个具体的人,而是泛指一类生物。而码哥我是一个具体的人,我属于人类这个称谓所定义的范畴。等价到结构体上,这个结构体person只是一个类型(人类),而由这个类型定义的变量才是一个具体的人。


既然,我们定义的是一个人,那么人也应该有性别。不考虑特殊群体的话,性别仅分为男和女。我们可以如下定义:

<code>struct person {
char name[64];
unsigned long age;
unsigned long sex;
};/<code>

我们可以给sex的值做个约定:0代表男,1代表女。

但是0和1其实仅仅需要一个比特就可以表达了,我们却使用了一个8字节(64比特)的变量来表示。这是一种浪费,是否可以优化呢?

答案是肯定的。我们将使用位域来进行优化:

<code>struct person {
char name[64];
unsigned long age:63;
unsigned long sex:1;
};/<code>

对比一下,差别在于成员名后加了冒号和一个整数值。这是什么含义呢?

unsigned long占8字节内存,即64比特。冒号后的值表示,这个变量占这个数据类型中的比特数。即age占unsigned long这64个比特中的63个,还剩余了一个比特,而sex占了unsigned long中的1个比特。这二者组合在一起正好64个比特,也就是一个unsigned long变量的大小。此时,编译器会将这两个成员放入一个8字节内存中,一个占63比特,一个占1比特。

位域的一般形式

<code>数据类型 成员名1:所占比特数;/<code>

其中,如果所占比特数大于其数据类型自身所占比特数,则编译会报错。


既然类型已经定义好了,我们就可以用其定义变量了。

<code>struct person Tom;
//或赋上初值
struct person Tom = {"Tom", 18, 0};/<code>

这里,我们定义了一个类型为struct person的变量Tom。

可以看到,变量的定义形式与常规的变量定义形式一样,并且对结构体的初始化是用大括号(非块语句)包裹住的。

有了变量后,我希望对其name、age、sex成员进行访问,例如对他们进行赋值,方法如下:

<code>Tom.name[0] = 'T';
Tom.name[1] = 'o';
Tom.name[2] = 'm';
Tom.name[3] = '\\0';
Tom.age = 18;
Tom.sex = 0;//0-male 1-female/<code>

对结构体变量中的成员访问是通过 (.)来完成的

现在还有一个问题,这个Tom变量占多大内存呢?

结构体所占内存大小等于其所有成员大小之和加上编译器额外填充的字节。以Tom为例,其成员大小之和为64字节(name)+8字节(age+sex),一共72字节。编译器填充的字节涉及结构体对齐规则,本文不做延展,初学者暂时以快速入门为主,优化进阶类内容可以自行查阅网上资料。


既然定义了变量,而变量又是存在于内存中,那么结构体变量就有其内存地址,因此也就有结构体指针这一概念。

<code>struct person *ptr;
//或定义同时初始化
struct person *ptr = &Tom;/<code>

可以看到,结构体指针的定义与变量指针定义形式完全一样。

记得 一文中有两个成员选择运算符—— . 和 ->。

在结构体变量访问其成员时,使用的是.。而在结构体指针访问其成员时,使用的是->。例如:

<code>ptr->age = 8; //将Tom的age改为了8/<code> 

我们曾在 一文中说过,函数参数都是值传递,因此不可能传递结构体这样的集合结构给函数,所以当需要传递结构体给函数参数时,传递的是结构体指针。

<code>void output_person_information(struct person *p)
{
printf("name: %s, age: %lu, sex: %lu\\n", p->name, p->age, p->sex);
}/<code>

这里,printf的%s用于输出字符数组类型变量的内容,%lu用于输出无符号长整型变量的数值。


既然结构体是一种类型,那么可否定义这个类型的数组呢?

当然可以,例如:

<code>struct person couple[2];
//或同时赋初值
struct person couple[2] = {
{"Tom", 25, 0},
{"Susan", 23, 1}
};/<code>

共同体

首先给出共同体(union)定义的一般形式

<code>union 共同体名 {
数据类型 成员名1;

数据类型 成员名2;
...
};
或定义共同体同时定义共同体变量
union 共同体名 {
数据类型 成员名1;
数据类型 成员名2;
...
} 共同体变量/数组[数组长度];/<code>

其中:

  • 成员名符合 的命名规则
  • 采用后一种形式定义共同体同时定义共同体变量或数组时,共同体名可以省略不写

共同体定义的也是一种类型定义

在我们日常生活中,每一个人都会有多重身份。例如,在公司我是员工,在家长面前我是子女,在孩子面前我是长辈。共同体就像将一个人的多重身份汇总在一起。沿用结构体一节中的person结构体定义,可以给出如下共同体代码:

<code>union identity {
struct person employee;
struct person child;
struct person parent;
};/<code>

下面利用这个共同体类型来定义共同体变量:

<code>union identity my_identity;/<code>

共同体变量的大小是其定义包含的成员中占内存最大的成员的大小

即,这个my_identity占用的内存大小为72字节。

再例如:

<code>union example {
int i;
double r;
};
union example ex;/<code>

此时,ex的大小为8字节,即double类型的大小。


共同体的成员的使用与结构体有很大不同。结构体变量内的每个成员都有其各自的内存单元,因此可以赋予不同的值。但是共同体则不同,共同体所有成员共用同一块存储空间,对每个成员的修改,会直接影响到其他成员的内容。继续前面identity的例子:

<code>struct person couple[2] = {
{"Tom", 25, 0},
{"Susan", 23, 1}
};
my_identity.employee = couple[0];
output_person_information(&my_identity.employee);//输出的是Tom的信息

output_person_information(&my_identity.child);//输出的也是Tom的信息
my_identity.parent = couple[1]; //由于共用同一块内存,因此这次赋值将会影响employee和child的数据
output_person_information(&my_identity.employee);//输出的是Susan的信息
output_person_information(&my_identity.child);//输出的也是Susan的信息/<code>

枚举

枚举这个词的意思大致是:列出某些有穷序列集的所有成员。举个网上随处可见的例子:一周有7天,周一到周日。一周就是一个有穷序列集,而它的所有成员就是周一到周日。

在C语言中,枚举定义的一般形式为:

<code>enum 枚举类型名 {
成员名1,
成员名2,
成员名3 = 值3,
...
};
或定义枚举同时定义枚举变量
enum 枚举类型名 {
成员名1,
成员名2,
成员名3 = 值3,
...
} 枚举变量/数组[数组长度];/<code>

其中:

  • 成员名符合 的命名规范
  • 采用后一种形式定义枚举同时定义枚举变量或数组时,枚举名可以省略不写
  • 成员名后可以给出值,也可以不给值,值是一个整数,值也可以是简单的表达式,如:成员名1+10
  • 在不给值的情况下,第一个成员的值为0,第二个为1,逐个加1,以此类推;遇到给定值,则该成员的值为该值,并且其后成员的值默认情况下基于该值累加1

例如:

<code>enum week {
Monday,
Tuesday = 0,
Wednesday,
Thursday,
Friday = Wednesday+99,
Saturday,
Sunday
};/<code>

这个例子中,每个成员的值如下:

  • Monday——0
  • Tuesday——0
  • Wednesday——1
  • Thursday——2
  • Friday——100
  • Saturday——101
  • Sunday——102

枚举类型的用处主要是:用成员名取代具体数值,有些类似常量,让代码更加直观,便于维护。

综合示例

<code>#include <stdio.h>

enum data_type {
integer,
real
};
union data {
int i;
float r;
};
struct input_value {
enum data_type type;
union data data;
};

int main(void)
{
struct input_value arr[2];
arr[0].type = integer;
arr[0].data.i = 10;
arr[1].type = real, arr[1].data.r = 0.1;
int i;
for (i = 0; i < sizeof(arr)/sizeof(struct input_value); ++i) {
if (arr[i].type == integer) {
printf("integer %d\\n", arr[i].data.i);
} else {
printf("real %f\\n", arr[i].data.r);
}
}
return 0;
}/<stdio.h>/<code>

这个例子中,定义了一个input_value结构体,这个结构体有两个成员,一个类型为枚举data_type的变量,一个类型为共同体data的变量。main中定义了一个结构体数组,先对数组内成员进行初始化。然后利用for和if遍历并输出数组元素的data成员数据。


喜欢的小伙伴可以关注码哥,也可以给码哥留言评论,如有建议或者意见也欢迎私信码哥,我会第一时间回复。


分享到:


相關文章: