【C语言进阶】——数据的储存、大小端（超详细剖析+代码解析！）

上山打老虎 发表于 2021-8-9 20:32:36

@toc

一、数据类型详细介绍（从大方向分为两种类型）

1.内置类型（C语言本身库有函数）

2.构造类型（自定义函数）
自定义函数是系统不自带的，通过自己的编写后可以使用的函数。一般的编程语言、工作表等都可以编写自定义函数使用。
编写自定义函数可以简化主程序，让程序的检查调试更方便

3.类型的意义
类型的意义，可以从以下两个角度考虑：
1.使用这个类型开辟内存空间的大小（大小决定了使用范围）
比如说使用char类型创建的变量，开辟的内存空间是1个字节，使用int类型创建的变量，开辟的内存空间是4个字节。
2.如何看待内存空间的视角
比如：
int a = 0;
float b = 0.0;
虽然 a, b都是占用4个字节的空间，但是我们在看待a的时候，因为其类型是int，所以我们会把a当做整型来看待，在看待b的时候，因为其类型是float，所以我们会把b当做小数（而非整型）来看待。
二、数据类型细分类

1.整形家族

2.浮点型家族

3.构造类型

4.指针类型

5.空类型

例：

三、整型在内存中的存储
之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。
那接下来我们谈谈数据在所开辟内存中到底是如何存储的？

1. 如何储存
看下面这个例子：
#include<stdio.h>
int main()
{
int a = 3;
int b = -1;
return 0;
}为了查看a, b在内存中的存储形式，我们在编译器里面按F10进入调试，变量a，b创建后，打开内存监视器，输入& a，& b查看a，b对应的地址及其内容。
& a：

&b:

数据在内存中存储时是按二进制的补码存储的
展示内存的时候，为了方便展示，显示的是16进制数据。
什么意思呢？我们定义一个变量c，以16进制形式对其赋值，然后& c，可以看到：

c输入的16进制形式是 11223344 ，存储的时候是 44332211 接下来下面讲：

2. 原码、反码、补码
下面先来了解几个概念︰原码、反码、补码
计算机中的有符号数有三种表示方法，即原码、反码和补码。
三种表示方法均有符号位和数值位两部分，符号位都是用0表示′正”，用1表示"负”，而数值位三种表示方法各不相同。
原码：直接将二进制按照正负数的形式翻译成二进制就可以。
反码：将原码的符号位不变，其他位依次按位取反就可以得到了。
补码：反码 + 1就得到补码。
正数原码反码补码三码合一，负数的原反补按照上面的规则进行转换
整数有两种，有符号数和无符号数
有符号数-- - 符号位 + 数值位
正数 0 + 数值位
负数 1 + 数值位
b = -1;
//10000000 00000000 00000000 00000001 - 原码
//11111111 11111111 11111111 11111110 - 反码
//11111111 11111111 11111111 11111111 - 补码
//ff ff ff ff - 十六进制显示形式

int a = 3;
//00000000 00000000 00000000 00000011 - 原码、反码、补码
//0000 0000 0000 0000 0000 0000 0000 0000 0000 0011
//00 00 00 03 - 十六进制显示形式无符号数 unsigned --- 正整数是一样的！（只能表示正整数！）<br/>无符号数 --- 原反补按规则计算

数据存放内存中其实存放的是补码。

3. 为什么内存中要存储补码？
我们首先来看一下1 - 1 这个例子：
①先按照原码的方式去计算。

②接下来用补码来进行计算：

在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统一处理; 同时，加法和减法也可以统一处理(CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。
怎么理解补码与原码相互转换，其运算过程是相同的？（以下运算，符号位均不变）
原码-&gt;取反 + 1-&gt;补码
补码-&gt;取反 + 1-&gt;原码
当然补码到原码也可以是：补码 -&gt; - 1 取反-&gt;原码
例如 - 1：
11111111 11111111 11111111 11111111 - 补码
补码->取反 + 1->原码
10000000 00000000 00000000 00000000 - 取反
10000000 00000000 00000000 00000001 - +1
补码 -> - 1 取反->原码
11111111 11111111 11111111 11111110 - -1
10000000 00000000 00000000 00000001 - 取反
最终得到的结果均是：10000000 00000000 00000000 00000001
四、大小端介绍

1.什么大端小端
大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中。
小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位,，保存在内存的高地址中。
#include <stdio.h>
#include <windows.h>
int main()
{
unsigned int a = -10;
printf("%d\n", a);//%d有符号数打印
printf("%u\n", a);//%u无符号数打印
system("pause");
return 0;
}
对上述代码能运行的解释
存：
1000 0000 0000 0000 0000 0000 0000 1010->原码
1111 1111 1111 1111 1111 1111 1111 0101->反码
1111 1111 1111 1111 1111 1111 1111 0110->补码
//因为是int类型，所以在内存存储32位
即 0xfffffff6那么如何存呢？

可以看出是小端存储。
解析：

无符号数 unsigned --- 正整数是一样的！（只能表示正整数！)
无符号数 --- 原反补按规则计算
数据存取过程图解：

2.为什么有大端和小端
为什么会有大小端模式之分呢 ?
这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8bit。
但是在C语言中除了8bit的char之外，还有16bit的short型，32bit的long型（要看具体的编译器）。
另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如果将多个字节安排的问题。
因此就导致了大端存储模式和小端存储模式。
例如一个16bit的short型x，在内存中的地址为ox0010)，x的值为0×1122，那么0x11为高字节，0x22为低字节。对于大端模式，就将0x11放在低地址中，即0x0010中，0x22放在高地址中，即0x0011中。小端模式，刚好相反
我们常用的x86结构是小端模式，而KEIL c51则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。
笔试题：用小程序判断当前机器的字节序（大小端）
百度2015年系统工程师笔试题：
请简述大端字节序和小端字节序的概念，设计一个小程序来判断当前机器的字节序
如何判断大端、小端（字节序）呢？
思路：
int a = 1;
将a的第一个字节内容拿出来，判断其是1还是0，1为小端，0为大端。
char* 储存一个字节
#include <stdio.h>
int check_sys()
{
int i = 1;
//对指针i解引用，可以找存储的第一个字节
//如果得到01，说明存储的顺序是01 00 00 00，则为小端，
//如果得到00，说明存储的顺序是00 00 00 01，则为大端，
return (*(char *)&i);
}
int main()
{
int ret = check_sys();
if(ret == 1)//0x00 00 00 01
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}
当然，这里我们也可以将其封装成一个函数，根据其返回值确定是大端还是小端字节序。
check_sys()
{
int a = 1;
char* p = (char*)&a;
if (*p == 1)
return 1;//小端
else
return 0;//大端
}当然这个函数我们也可以进行简化：
check_sys()
{
int a=1;
char*p=(char*)&a;
//返回1，小端
//返回0，大端
return *p;
}也可以再简化：
check_sys()
{
int a = 1;
return*(char*)&a;
}
文档来源：51CTO技术博客https://blog.51cto.com/panyujie/3327093

页: [1]

CodeAE代码之家-专为程序员打造的技术家园！-网站地图

【C语言进阶】——数据的储存、大小端 （超详细剖析+代码解析！）

【C语言进阶】——数据的储存、大小端（超详细剖析+代码解析！）