评论

收藏

[C++] 关于c语言结构体偏移的一点思考(一)

编程语言 编程语言 发布于:2021-06-30 10:45 | 阅读数:510 | 评论:0

  
1 问题定义
  相信大家在c语言程序开发的过程一定都使用过结构体,不知您是否有研究过结构体中成员变量偏移相关的知识,本文将和大家一起分享关于c语言中结构体偏移的一些思考。
  首先来看一个简单的案例,已知结构体类型定义如下:
struct node_t{
    char a;
    int b;
    int c;
};
  且结构体1Byte对齐
#pragma pack(1)
  请问结构体struct node_t中成员变量c的偏移是多少?(注:这里的偏移量指的是相对于结构体起始位置的偏移量。)
  2 解决方案
  看到这个问题的时候,相信不同的人脑中浮现的解决方法可能会有所差异,下面我们分析以下几种可能的解法:
  解法一
  如果你对c语言的库函数比较熟悉的话,那么你第一个想到的肯定是offsetof函数(其实只是个宏而已,先姑且这样叫着吧),在 Linux 类操作系统中,可以直接通过man 3 offsetof查看函数原型如下:
 #include <stddef.h>        size_t offsetof(type, member);
  有了上述的库函数,我们用一行代码就可以搞定:
offsetof(struct node_t, c);
  当然这并非本文探讨的重点,请继续阅读。
  解法二
  当我们对c语言的库函数不熟悉的时候,此时也不要着急,我们依然可以使用我们自己的方法来解决问题。
  最直接的思路是:
  【结构体成员变量c的地址】 减去 【结构体起始地址】
  我们先来定义一个结构体变量node:
struct node_t node;
  接着来计算成员变量c的偏移量:
(unsigned long)(&(node.c)) - (unsigned long)(&node)
  其中&(node.c)为结构体成员变量c的地址,并强制转化为unsigned long;
  &node为结构体的起始地址,也强制转化为unsigned long;
  最后我们将上述两值相减,得到成员变量c的偏移量;
  解法三
  上述思路在不借助库函数的情况下,通过计算可以得到成员变量c的偏移量。但作为程序员,我们应该善于思考,是不是可以针对上面的代码做一些改进,使我们的代码变得更简洁一些?在做具体的改进之前,我们应该分析其存在哪些方面的问题。
  相信不用我多说,细心的你一定已经察觉到,最主要的一个问题是为了计算结构体成员变量的偏移,我们自己定义了一个结构体变量node。虽然题目中并未限制我们可以自定义变量,但当我们遇到比较严且题目中不允许自定义变量的时候,此时就要思考新的解决方法。
  在探讨新的解决方法之前,我们先来探讨一个有关偏移的知识点:
  这是一道简单的几何问题,假设在座标轴上由A点移动到B点,如何计算B相对于A的偏移?这个问题对于我们来说是非常的简单,可能大部分人都会脱口而出并得到答案为B-A。
  那么这个答案是否完全正确呢?答案显然不是,原因在于当A为坐标原点即A=0的时候,上述答案B-A就直接简化为B了。
  这个小小的简单的问题,对于我们来说有什么启示呢?
  我们结合解法二的思路和上述的知识点,是不是很快就得到了下面的关联:
(unsigned long)(&(node.c)) - (unsigned long)(&node)
  和
B - A
  通过上面的知识点我们知道当A为坐标原点的时候,B - A就简化为B了。那么按照类似的做法,当node的内存地址为0即(&node==0)的时候,上面的代码就可以简化为:
(unsigned long)(&(node.c))
  由于node内存地址==0了,所以
node.c      //结构体node中成员变量c
  我们就可以用另外一种方式来表示了:
((struct node_t *)0)->c
  上述代码应该比较好理解,由于结构体的内存地址编号为0,所以我们可以直接通过内存地址的方式来访问该结构体的成员变量,相应的代码的含义就是获取内存地址编号为0的结构体struct node_t的成员变量c。
  注:此处只是利用了编译器的特性来计算结构体偏移,并未对内存地址0有任何操作,有些同学对此可能还有些疑问,详细的了解该问题可参考关于c语言结构体成员变量访问方式的一点思考。
  此时,我们的偏移求法就消除了struct node_t node这个自定义变量,直接一行代码解决,:
(unsigned long)(&(((struct node_t *)0)->c))
  3 总结
  本文由 c 语言的结构体成员变量的偏移引出问题,从最初调用库函数到手动计算依次递进的提出问题的解决思路,最后利用编译器计算内存地址0的特性直接一行代码解决问题,技巧性非常强。
  
  
  
DSC0000.jpg

  
  

  
关注下面的标签,发现更多相似文章