小端和大端(有彩蛋)
大端和小端科普
大端和小端,老外叫 Big-Endian 和 Little-Endian,其实指的都是同一个东东!
学习底层编程或逆向的童鞋,肯定对这两个名词并不陌生吧?!
因为它们决定了数据的存放形式,你要不懂它们,逆向出来的那堆 1010 就足以使你蒙圈 {:10_272:}
不同的 CPU、操作系统对待数据的存储方式各有不同,但一般常见的操作系统都是小端,而通讯协议则是大端。
但并不是说系统是小端形式存储,文件就一定要采用小端的形式,不同的应用程序对于自身数据的存储方式也各有千秋(自家数据爱咋放咋放,有些还打乱了加密呢),比如:
[*]Adobe PS -- 大端
[*]BMP -- 小端
[*]GIF -- 小端
[*]JPEG -- 大端
[*]MacPaint -- 大端
[*]RTF -- 小端
那小端和大端有什么区别呢?
举个例子你就明白了(请读 liao)
比如 0x1234567 这个数:
[*]大端法在内存中按字节依次存放为:01 23 45 67
[*]小端法在内存中按字节依次存放为:67 45 23 01
解释
所谓的大端即高位字节排放在内存的低地址端,而低位字节排放在内存的高地址端。
比如整型变量 0x12345678 占 4 个字节,那么根据内存地址从小到大它们的存放方式如下:
数据0x120x340x560x78
地址0x100000000x100000010x100000020x10000003
小端则相反:低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
所以整型变量 0x12345678 根据内存地址从小到大它们的存放方式如下:
数据0x780x560x340x12
地址0x100000000x100000010x100000020x10000003
转换
我们发现一个字节是可以存放两个十六进制的数字的(一个字节最大可以存放的数是 0xFF),那如果给你一个十进制数(比如 112358),如何快速地知道它在内存中是如何存放的呢?
大端法很容易,直接将它转换成十六进制,然后依次存放即可:0x0001B6E6
小端法则比较麻烦,步骤依次如下:
[*]转换成十六进制数(0x0001B6E6)
[*]将八位数字的低四位和高四位互换(0xB6E60001)
[*]在低四位和高四位中,分别进行两两互换(0xE6B60100)
如何检测你的机器是大端还是小端?
虽然小甲鱼先抛出了结论:目前市面上绝大多数的个人电脑都是使用小端字节序。
但既然我们是学编程,那就不妨多动动脑筋,考虑下如何用代码来分辨?
其实不难,通过将 int 强制类型转换成 char 单字节,通过判断起始存储位置:
#include <stdio.h>
int main()
{
int a = 0x1234;
char *b = (char *)&a;
if (*b == 0x12)
{
printf("大端!\n");
}
else
{
printf("小端!\n");
}
return 0;
}
程序实现如下:
优势 VS 劣势
既然不同的 CPU、系统乃至应用程序,会根据自身特性和需求选择大端或小端的存储方式。
正如世上没有无缘无故的爱,也没有无缘无故的不爱……
小甲鱼这里试图给大家做下简单的分析,希望起一个抛砖引玉的作用(促进大家多思考)
小端 :强制转换类型不需要重新调整数据
比如有 int a = 0x1234,其按小端的存储方式为 0x34120000
如果执行 (long)a,只需在其右边补齐相应位数的 0 即可,即 0x3412000000000000
小端的优势及大端的劣势!
大端的存储方式是 0x00001234
如果执行 (long)a,则需要将原先的数据先向右移动,再在左边补齐相应位数的 0(因为转换类型后,变量的地址不能发生改变),即 0x0000000000001234
大端 :符号位的判定固定为第一个字节,容易判断正负
之前我们在讨论 使用补码的好处 时,根据的案例可是都不考虑存放的形式的,如果按照小端的方式来存放,你还能够快速地判断一个数的正负吗?!{:10_337:}
彩蛋
想知道大端和小端这两个名词的来源吗?
回复“朕想知道”,小甲鱼来告诉你:
**** Hidden Message *****
朕想知道 想知道 I want to know ok,i know haha 朕想知道 朕今天翻你牌子 朕想知道 看 1 还有吗,,鱼油们等不及了 朕想知道 ... 想知道 Come on buddy 朕想知道! 还好学了汇编{:10_244:} 真想知道 1