本质区别就是arm架构属于精简指令集(RISC),x86属于复杂指令集(CISC)。ARM处理器的主要特点是指令较少,功能精简,需要用较多的指令完成运算工作,设计比较简单,体积小,成本低,功耗低,采用ARM架构设计CPU的主要代表公司包括高通、联发科、展锐、全志、瑞芯微、三星、晶晨、海思、飞思卡尔、爱立信等。x86处理器的主要特点是指令多,功能较强,可以用较少的指令完成复杂的工作运算,电路设计复杂,成本比较高,主要代表公司包括:英特尔、超威、威盛、兆芯等。
X86架构是X86指令集,它属于CISC指令集。ARM架构是ARM指令集,属于RISC指令集。x0dx0aX86是冯若依曼结构,ARM是哈弗结构,这个不一定,比如ARM7TDMI用的就是冯若依曼结构。x0dx0a x0dx0a其实都是差不多,X86指令多,应用范围广,但效率就显得低一点,ARM指令少,应用范围小,效率显得高。
x86-64 ( 又称 x64 ,即英文词 64 -bit e x tended,64位拓展 的简写)是x86架构的64位拓展,向后兼容于16位及32位的x86架构。x64于1999年由AMD设计,AMD首次公开64位集以扩展给x86,称为“ AMD64 ”。其后也为英特尔所采用,现时英特尔称之为“ Intel 64 ”,在之前曾使用过“Clackamas Technology” (CT)、“IA-32e”及“EM64T”。
苹果公司和RPM包管理员以“x86-64”或“x86_64”称呼此64位架构。甲骨文公司及Microsoft称之为“x64”。BSD家族及其他Linux发行版则使用“x64-64”,32位版本则称为“i386”(或 i486/586/686),Arch Linux用x86_64称呼此64位架构。
用的x86指令集,当前这是主要的指令集,在它的基础上还有很多附加的指令集,比如说虚拟化相关的指令、向量相关的指令等等很多。
书接上文【当下主流处理器(CPU)介绍】在文章中我们提到手机端处理器与PC端处理器在制程工艺,功耗,性能上的差距本质上都来自于他们采用的指令集架构不同,本文我们就来简单探讨一下当下最最主流的两种架构 X86 , Arm 架构的底层差距,解释一下为啥会造成上文所提到的种种差异,同时也简单聊聊几大开源的新兴指令集架构。
【 同样,为了提高易读性,我们也不拽那么多专有名词,对于有需要扩展的地方也点到为止。 】
无论是 X86 还是 Arm 背后支撑他们的都是一套完善且专属的指令集,那么什么是指令集呢,这里我们可以简单理解成我们日常语言中的单词,一句完整的话就是将特定的单词按照特定的顺序组合在一起,同样对于计算机(手机也属于计算机)来讲每一次执行一个一个命令就是将特定的指令按照特定的顺序执行一次。
复杂指令集(cisc) :它的设计目的是用最少的机器语言来搞定所需要的的设计任务,简而言之就是人狠话不多,所以他有个前提是本人一定要狠。
精简指令集(risc) :它的设计目的是软件来指定每个操作的步骤,用特地的操作步骤用执行几条指令来替代复杂指令集里面的某条指令,简而言之,人怂破事多,所以自身要求不那么高,(当然这是相对于复杂指令集来讲)。
CISC月RISC的内功心法:
除了 X86 与Arm这两个老大哥其实还有其他的指令集架构他们分别在不同的领域发光发热,比如 RISC-V 与 MIPS 这两个小老弟也渐渐崭露头角了。
这次简单聊了一下CPU背后的秘密,指令集架构,搞清楚了我们平时网上看到或者听别人说的 x86 与 Arm 等是什么东东,其实聊的很浅很浅,如果有兴趣可以去深入了解这方面,从他们的诞生到发展一路过来也是很奇幻的,这些东西构建了我们现在的互联网文明,我们国家在这方面的积累还是太少了,好不容易看到了龙芯的 Loongarch 的架构虽然网络上对它的褒贬不一,我还是很激动,它给了看到了希望和惊喜。
预告: 下一篇,我们聊聊苹果的M系列芯片
x86汇编指令集数据传输指令 它们在存贮器和寄存器、寄存器和输入输出端口之间传送数据. 1. 通用数据传送指令. MOV 传送字或字节. MOVSX 先符号扩展,再传送. MOVZX 先零扩展,再传送. MOVSX reg16,r/m8 ; o16 0F BE /r MOVSX reg32,r/m8 ; o32 0F BE /r MOVSX reg32,r/m16 ; o32 0F BF /r MOVZX reg16,r/m8 ; o16 0F B6 /r MOVZX reg32,r/m8 ; o32 0F B6 /r MOVZX reg32,r/m16 ; o32 0F B7 /r PUSH 把字压入堆栈. POP 把字弹出堆栈. PUSHA 把AX,CX,DX,BX,SP,BP,SI,DI依次压入堆栈. POPA 把DI,SI,BP,SP,BX,DX,CX,AX依次弹出堆栈. PUSHAD 把EAX,ECX,EDX,EBX,ESP,EBP,ESI,EDI依次压入堆栈. POPAD 把EDI,ESI,EBP,ESP,EBX,EDX,ECX,EAX依次弹出堆栈. BSWAP 交换32位寄存器里字节的顺序 XCHG 交换字或字节.( 至少有一个操作数为寄存器,段寄存器不可作为操作数) CMPXCHG 比较并交换操作数.( 第二个操作数必须为累加器AL/AX/EAX ) XADD 先交换再累加.( 结果在第一个操作数里 ) XLAT 字节查表转换. —— BX 指向一张 256 字节的表的起点, AL 为表的索引值 (0-255,即 0-FFH); 返回 AL 为查表结果. ( -》AL ) 2. 输入输出端口传送指令. IN I/O端口输入. ( 语法: IN 累加器, {端口号│DX} ) OUT I/O端口输出. ( 语法: OUT {端口号│DX},累加器 ) 输入输出端口由立即方式指定时, 其范围是 0-255; 由寄存器 DX 指定时, 其范围是 0-65535. 3. 目的地址传送指令. LEA 装入有效地址. 例: LEA DX,string ;把偏移地址存到DX. LDS 传送目标指针,把指针内容装入DS. 例: LDS SI,string ;把段地址:偏移地址存到DS:SI. LES 传送目标指针,把指针内容装入ES. 例: LES DI,string ;把段地址:偏移地址存到ES:DI. LFS 传送目标指针,把指针内容装入FS. 例: LFS DI,string ;把段地址:偏移地址存到FS:DI. LGS 传送目标指针,把指针内容装入GS. 例: LGS DI,string ;把段地址:偏移地址存到GS:DI. LSS 传送目标指针,把指针内容装入SS. 例: LSS DI,string ;把段地址:偏移地址存到SS:DI. 4. 标志传送指令. LAHF 标志寄存器传送,把标志装入AH. SAHF 标志寄存器传送,把AH内容装入标志寄存器. PUSHF 标志入栈. POPF 标志出栈. PUSHD 32位标志入栈. POPD 32位标志出栈. 二、算术运算指令 ——————————————————————————————————————— ADD 加法. ADC 带进位加法. INC 加 1. AAA 加法的ASCII码调整. DAA 加法的十进制调整. SUB 减法. SBB 带借位减法. DEC 减 1. NEC 求反(以 0 减之). CMP 比较.(两操作数作减法,仅修改标志位,不回送结果). AAS 减法的ASCII码调整. DAS 减法的十进制调整. MUL 无符号乘法. IMUL 整数乘法. 以上两条,结果回送AH和AL(字节运算),或DX和AX(字运算), AAM 乘法的ASCII码调整. DIV 无符号除法. IDIV 整数除法. 以上两条,结果回送: 商回送AL,余数回送AH, (字节运算); 或 商回送AX,余数回送DX, (字运算). AAD 除法的ASCII码调整. CBW 字节转换为字. (把AL中字节的符号扩展到AH中去) CWD 字转换为双字. (把AX中的字的符号扩展到DX中去) CWDE 字转换为双字. (把AX中的字符号扩展到EAX中去) CDQ 双字扩展. (把EAX中的字的符号扩展到EDX中去) 三、逻辑运算指令 ——————————————————————————————————————— AND 与运算. OR 或运算. XOR 异或运算. NOT 取反. TEST 测试.(两操作数作与运算,仅修改标志位,不回送结果). SHL 逻辑左移. SAL 算术左移.(=SHL) SHR 逻辑右移. SAR 算术右移.(=SHR) ROL 循环左移. ROR 循环右移. RCL 通过进位的循环左移. RCR 通过进位的循环右移. 以上八种移位指令,其移位次数可达255次. 移位一次时, 可直接用操作码. 如 SHL AX,1. 移位》1次时, 则由寄存器CL给出移位次数. 如 MOV CL,04 SHL AX,CL 四、串指令 ——————————————————————————————————————— DS:SI 源串段寄存器 :源串变址. ES:DI 目标串段寄存器:目标串变址. CX 重复次数计数器. AL/AX 扫描值. D标志 0表示重复操作中SI和DI应自动增量; 1表示应自动减量. Z标志 用来控制扫描或比较操作的结束. MOVS 串传送. ( MOVSB 传送字符. MOVSW 传送字. MOVSD 传送双字. ) CMPS 串比较. ( CMPSB 比较字符. CMPSW 比较字. ) SCAS 串扫描. 把AL或AX的内容与目标串作比较,比较结果反映在标志位. LODS 装入串. 把源串中的元素(字或字节)逐一装入AL或AX中. ( LODSB 传送字符. LODSW 传送字. LODSD 传送双字. ) STOS 保存串. 是LODS的逆过程. REP 当CX/ECX《》0时重复. REPE/REPZ 当ZF=1或比较结果相等,且CX/ECX《》0时重复. REPNE/REPNZ 当ZF=0或比较结果不相等,且CX/ECX《》0时重复. REPC 当CF=1且CX/ECX《》0时重复. REPNC 当CF=0且CX/ECX《》0时重复. 五、程序转移指令 ——————————————————————————————————————— 1》无条件转移指令 (长转移) JMP 无条件转移指令 CALL 过程调用 RET/RETF过程返回. 2》条件转移指令 (短转移,-128到+127的距离内) ( 当且仅当(SF XOR OF)=1时,OP1 JA/JNBE 不小于或不等于时转移. JAE/JNB 大于或等于转移. JB/JNAE 小于转移. JBE/JNA 小于或等于转移. 以上四条,测试无符号整数运算的结果(标志C和Z). JG/JNLE 大于转移. JGE/JNL 大于或等于转移. JL/JNGE 小于转移. JLE/JNG 小于或等于转移. 以上四条,测试带符号整数运算的结果(标志S,O和Z). JE/JZ 等于转移. JNE/JNZ 不等于时转移. JC 有进位时转移. JNC 无进位时转移. JNO 不溢出时转移. JNP/JPO 奇偶性为奇数时转移. JNS 符号位为 "0" 时转移. JO 溢出转移. JP/JPE 奇偶性为偶数时转移. JS 符号位为 "1" 时转移. 3》循环控制指令(短转移) LOOP CX不为零时循环. LOOPE/LOOPZ CX不为零且标志Z=1时循环. LOOPNE/LOOPNZ CX不为零且标志Z=0时循环. JCXZ CX为零时转移. JECXZ ECX为零时转移. 4》中断指令 INT 中断指令 INTO 溢出中断 IRET 中断返回 5》处理器控制指令 HLT 处理器暂停, 直到出现中断或复位信号才继续. WAIT 当芯片引线TEST为高电平时使CPU进入等待状态. ESC 转换到外处理器. LOCK 封锁总线. NOP 空操作. STC 置进位标志位. CLC 清进位标志位. CMC 进位标志取反. STD 置方向标志位. CLD 清方向标志位. STI 置中断允许位. CLI 清中断允许位. 六、伪指令 ——————————————————————————————————————— DW 定义字(2字节). PROC 定义过程. ENDP 过程结束. SEGMENT 定义段. ASSUME 建立段寄存器寻址. ENDS 段结束. END 程序结束. 七、寄存器1. Register usage in 32 bit WindowsFunction parameters are passed on the stack according to the calling conventions listed onpage 13. Parameters of 32 bits size or less use one DWORD of stack space. Parametersbigger than 32 bits are stored in little-endian form, i.e. with the least significant DWORD at thelowest address, and DWORD aligned.Function return values are passed in registers in most cases. 8-bit integers are returned inAL, 16-bit integers in AX, 32-bit integers, pointers, and Booleans in EAX, 64-bit integers inEDX:EAX, and floating-point values in ST(0). Structures and class objects not exceeding64 bits size are returned in the same way as integers, even if the structure contains floatingpoint values. Structures and class objects bigger than 64 bits are returned through a pointerpassed to the function as the first parameter and returned in EAX. Compilers that don’tsupport 64-bit integers may return structures bigger than 32 bits through a pointer. TheBorland compiler also returns structures through a pointer if the size is not a power of 2.Registers EAX, ECX and EDX may be changed by a procedure. All other general-purposeregisters (EBX, ESI, EDI, EBP) must be saved and restored if they are used. The value ofESP must be divisible by 4 at all times, so don’t push 16-bit data on the stack. Segmentregisters cannot be changed, not even temporarily. CS, DS, ES, and SS all point to the flatsegment group. FS is used for a thread environment block. GS is unused, but reserved.Flags may be changed by a procedure with the following restrictions: The direction flag is 0by default. The direction flag may be set temporarily, but must be cleared before any call orreturn. The interrupt flag cannot be cleared. The floating-point register stack is empty at theentry of a procedure and must be empty at return, except for ST(0) if it is used for returnvalue. MMX registers may be changed by the procedure and if so cleared by EMMS beforereturning and before calling any other procedure that may use floating-point registers. AllXMM registers can be modified by procedures. Rules for passing parameters and returnvalues in XMM registers are described in Intel’s application note AP 589 "SoftwareConventions for Streaming SIMD Extensions". A procedure can rely on EBX, ESI, EDI, EBPand all segment registers being unchanged across a call to another procedure.2. Register usage in LinuxThe rules for register usage in Linux appear to be almost the same as for 32-bit windows.Registers EAX, ECX, and EDX may be changed by a procedure. All other general-purposeregisters must be saved. There appears to be no rule for the direction flag. Function returnvalues are transferred in the same way as under Windows. Calling conventions are thesame, except for the fact that no underscore is prefixed to public names. I have noinformation about the use of FS and GS in Linux. It is not difficult to make an assemblyfunction that works under both Windows and Linux, if only you take these minor differencesinto account.八、位操作指令,处理器控制指令1.位操作指令,8086新增的一组指令,包括位测试,位扫描。BT,BTC,BTR,BTS,BSF,BSR1.1 BT(Bit Test),位测试指令,指令格式: BT OPRD1,OPRD2,规则:操作作OPRD1可以是16位或32位的通用寄存器或者存储单元。操作数OPRD2必须是8位立即数或者是与OPRD1操作数长度相等的通用寄存器。如果用OPRD2除以OPRD1,假设商存放在Divd中,余数存放在Mod中,那么对OPRD1操作数要进行测试的位号就是Mod,它的主要功能就是把要测试位的值送往CF,看几个简单的例子:1.2 BTC(Bit Test And Complement),测试并取反用法和规则与BT是一样,但在功能有些不同,它不但将要测试位的值送往CF,并且还将该位取反。1.3 BTR(Bit Test And Reset),测试并复位,用法和规则与BT是一样,但在功能有些不同,它不但将要测试位的值送往CF,并且还将该位复位(即清0)。1.4 BTS(Bit Test And Set),测试并置位,用法和规则与BT是一样,但在功能有些不同,它不但将要测试位的值送往CF,并且还将该位置位(即置1)。1.5 BSF(Bit Scan Forward),顺向位扫描,指令格式:BSF OPRD1,OPRD2,功能:将从右向左(从最低位到最高位)对OPRD2操作数进行扫描,并将第一个为1的位号送给操作数OPRD1。操作数OPRD1,OPRD2可以是16位或32位通用寄存器或者存储单元,但OPRD1和OPRD2操作数的长度必须相等。1.6 BSR(Bit Scan Reverse),逆向位扫描,指令格式:BSR OPRD1,OPRD2,功能:将从左向右(从最高位到最低位)对OPRD2操作数进行扫描,并将第一个为1的位号送给操作数OPRD1。操作数OPRD1,OPRD2可以是16位或32位通用寄存器或存储单元,但OPRD1和OPRD2操作数的长度必须相等。1.7 举个简单的例子来说明这6条指令:AA DW 1234H,5678HBB DW 9999H,7777HMOV EAX,12345678HMOV BX,9999HBT EAX,8;CF=0,EAX保持不变BTC EAX,8;CF=0,EAX=12345778HBTR EAX,8;CF=0,EAX=12345678HBTS EAX,8;CF=0,EAX=12345778H BSF AX,BX;AX=0BSR AX,BX;AX=15BT WORD PTR 的内容不变BTC WORD PTR =1223HBTR WORD PTR =1223HBTS WORD PTR =1234HBSF WORD PTR =0;BSR WORD PTR =15(十进制) BT DWORD PTR 的内容保持不变BTC DWORD PTR =76779999HBTR DWORD PTR =76779999HBTS DWORD PTR =77779999HBSF DWORD PTR =0BSR DWORD PTR =31(十进制) 2.处理器控制指令处理器控制指令主要是用来设置/清除标志,空操作以及与外部事件同步等。2.1 CLC,将CF标志位清0。2.2 STC,将CF标志位置1。2.3 CLI,关中断。2.4 STI,开中断。2.5 CLD,清DF=0。2.6 STD,置DF=1。2.7 NOP,空操作,填补程序中的空白区,空操作本身不执行任何操作,主要是为了保持程序的连续性。2.8 WAIT,等待BUSY引脚为高。2.9 LOCK,封锁前缀可以锁定其后指令的操作数的存储单元,该指令在指令执行期间一直有效。在多任务环境中,可以用它来保证独占其享内存,只有以下指令才可以用LOCK前缀: XCHG,ADD,ADC,INC,SUB,SBB,DEC,NEG,OR,AND,XOR,NOT,BT,BTS,BTR,BTC3.0 说明处理器类型的伪指令 .8086,只支持对8086指令的汇编 .186,只支持对80186指令的汇编 .286,支持对非特权的80286指令的汇编 .286C,支持对非特权的80286指令的汇编 .286P,支持对80286所有指令的汇编 .386,支持对80386非特权指令的汇编 .386C,支持对80386非特权指令的汇编 .386P,支持对80386所有指令的汇编 只有用伪指令说明了处理器类型,汇编程序才知道如何更好去编译,连接程序,更好地去检错。九,FPU instructions(摘自fasm的帮助文档中,有时间我会反它翻译成中文的) The FPU (Floating-Point Unit) instructions operate on the floating–point values in three formats: single precision (32–bit), double precision (64–bit) and double extended precision (80–bit). The FPU registers form the stack and each of them holds the double extended precision floating–point value. When some values are pushed onto the stack or are removed from the top, the FPU registers are shifted, so st0 is always the value on the top of FPU stack, st1 is the first value below the top, etc. The st0 name has also the synonym st. fld pushes the floating–point value onto the FPU register stack. The operand can be 32–bit, 64–bit or 80–bit memory location or the FPU register, it’s value is then loaded onto the top of FPU register stack (the st0 register) and is automatically converted into the double extended precision format. fld dword ; load single prevision value from memory fld st2 ; push value of st2 onto register stack fld1, fldz, fldl2t, fldl2e, fldpi, fldlg2 and fldln2 load the commonly used contants onto the FPU register stack. The loaded constants are +1.0, +0.0, log2 10, log2 e, pi, log10 2 and ln 2 respectively. These instructions have no operands. fild convert the singed integer source operand into double extended precision floating-point format and pushes the result onto the FPU register stack. The source operand can be a 16–bit, 32–bit or 64–bit memory location. fild qword ; load 64-bit integer from memory fst copies the value of st0 register to the destination operand, which can be 32–bit or 64–bit memory location or another FPU register. fstp performs the same operation as fst and then pops the register stack, getting rid of st0. fstp accepts the same operands as the fst instruction and can also store value in the 80–bit memory. fst st3 ; copy value of st0 into st3 register fstp tword ; store value in memory and pop stack fist converts the value in st0 to a signed integer and stores the result in the destination operand. The operand can be 16–bit or 32–bit memory location. fistp performs the same operation and then pops the register stack, it accepts the same operands as the fist instruction and can also store integer value in the 64–bit memory, so it has the same rules for operands as fild instruction. fbld converts the packed BCD integer into double extended precision floating–point format and pushes this value onto the FPU stack. fbstp converts the value in st0 to an 18–digit packed BCD integer, stores the result in the destination operand, and pops the register stack. The operand should be an 80–bit memory location. fadd adds the destination and source operand and stores the sum in the destination location. The destination operand is always an FPU register, if the source is a memory location, the destination is st0 register and only source operand should be specified. If both operands are FPU registers, at least one of them should be st0 register. An operand in memory can be a 32–bit or 64–bit value. fadd qword ; add double precision value to st0 fadd st2,st0 ; add st0 to st2 faddp adds the destination and source operand, stores the sum in the destination location and then pops the register stack. The destination operand must be an FPU register and the source operand must be the st0. When no operands are specified, st1 is used as a destination operand. 38 CHAPTER 2. INSTRUCTION SET faddp ; add st0 to st1 and pop the stack faddp st2,st0 ; add st0 to st2 and pop the stack fiadd instruction converts an integer source operand into double extended precision floating–point value and adds it to the destination operand. The operand should be a 16–bit or 32–bit memory location. fiadd word ; add word integer to st0 fsub, fsubr, fmul, fdiv, fdivr instruction are similar to fadd, have the same rules for operands and differ only in the perfomed computation. fsub substracts the source operand from the destination operand, fsubr substract the destination operand from the source operand, fmul multiplies the destination and source operands, fdiv divides the destination operand by the source operand and fdivr divides the source operand by the destination operand. fsubp, fsubrp, fmulp, fdivp, fdivrp perform the same operations and pop the register stack, the rules for operand are the same as for the faddp instruction. fisub, fisubr, fimul, fidiv, fidivr perform these operations after converting the integer source operand into floating–point value, they have the same rules for operands as fiadd instruction. fsqrt computes the square root of the value in st0 register, fsin computes the sine of that value, fcos computes the cosine of that value, fchs complements its sign bit, fabs clears its sign to create the absolute value, frndint rounds it to the nearest integral value, depending on the current rounding mode. f2xm1 computes the exponential value of 2 to the power of st0 and substracts the 1.0 from it, the value of st0 must lie in the range ?1.0 to +1.0. All these instruction store the result in st0 and have no operands. fsincos computes both the sine and the cosine of the value in st0 register, stores the sine in st0 and pushes the cosine on the top of FPU register stack. fptan computes the tangent of the value in st0, stores the result in st0 and pushes a 1.0 onto the FPU register stack. fpatan computes the arctangent of the value in st1 divided by the value in st0, stores the result in st1 and pops the FPU register stack. fyl2x computes the binary logarithm of st0, multiplies it by st1, stores the result in st1 and pop the FPU register stack; fyl2xp1 performs the same operation but it adds 1.0 to st0 before computing the logarithm. fprem computes the remainder obtained from dividing the
x86一般有两种含义,一种指的是32位系统的意思;另一种指的是32bit,其中的bit代表32位版本的系统。x86的意思指的是32位系统,它是由Intel推出的一种复杂指令集,用于控制芯片的运行的程序,现在X86已经广泛运用到了家用PC领域。X86可以称作为32bit,其中的bit代表32位版本的系统,同时X86系统最大只能识别到内存是3、75G。而X64就是通常所说的64bit,是指64位的操作系统,64位系统最大支持内存总数高达128G,对于内存非常大的服务器基本都是装的64位系统,64位可以很好的利用大内存,如果大内存装32位那是对内存的一种浪费。
在集成电路的发展历程中,有一家公司必须被提及,那就是英特尔。不论是其创始人诺伊斯发明了可工业化生产硅芯片的平面工艺技术,还是后来在微处理器领域引领全球数十年,英特尔在集成电路领域的成就都是令人敬重的。
1971年英特尔发明了微处理4004,由此开启了微处理器快速发展的浪潮。 1978年,英特尔推出了首款基于x86架构的16位处理器 8086 CPU 。当时英特尔与IBM合作,推出基于8086处理器的PC,在市场上获得巨大成功,这也使x86迅速发展成为PC标准平台。
早年采用x86架构的企业其实也有数家,但最后就剩AMD能够与英特尔竞争,这其中关键竞争要素不仅在芯片设计技术上,还在于领先的工艺技术。
x86架构采用可变指令长度的复杂指令集(Complex Instruciton Set Computer,CISC)架构。与精简指令集(Reduced Instruciton Set Computer,RISC)相比,CISC执行效率更低。
另外x86架构有一个重要特点就是向前兼容 。每次架构的升级一定程度上帮助英特尔建立了更高的生态壁垒,但同时这也是困扰x86架构速度提升的一个 历史 包袱。 为了顾全兼容性和高性能,Intel推出的x86的新架构,把x86指令转换成类似RISC的微指令,然后再执行,以此获得和RISC相当的性能,同时仍然能够前向兼容。
英特尔于1985年推出了基于32位的80386 CPU,扩展了x86架构的位数,提升了CPU的性能。而后在32位处理器向64位处理器转移的过程中,英特尔也想尝试放弃前向兼容,采用新架构,和RISC的ARM硬拼。但是失败了,因为已有的软件生态不支持这样的新架构。
与此同时,老对手AMD在继承32位x86架构基础上,率先推出了64位的x86架构处理器。并于微软操作系统形成良好互动,英特尔只能放弃原来自己的新架构,采用AMD的64位架构进行扩展。
关于32位处理器为何要升级到64位处理器,主要原因是32位处理器能处理的最大内存容量是4GB(2的32次方),无法满足日益增长的内存容量需求,因此需要进行升级。
目前x86架构的应用领域非常广泛,涵盖了PC、服务器、工作站等领域。目前苹果的MacBook用的也是x86架构处理器。不过谷歌推出的Chromebook部分采用ARM处理器。另外苹果宣布2020年MacBook将放弃Intel的x86处理器,采用自家ARM处理器。
不可否认目前x86架构正在遭遇来自移动霸主ARM的强力挑战。但是英特尔也在不断提升工艺,以及优化架构。未来x86架构将如何继续捍卫自己的地盘,让我们拭目以待!
不对。X86一般使用的不是精简指令集,而是复杂指令集。X86服务器也称为CISC(复杂指令集)体系结构服务器,通常称为PC服务器。
推发布温馨提示: