跳转至

指令系统

一、指令格式

1、指令格式概述

1)操作码、地址码

操作码(OP):指明了"做什么"

地址码(A):指明了"对谁动手"

有的指令不需要地址码(停机)

2)指令的定义

指令(机器指令):是指示计算机执行某种操作的命令,是计算机运行的最小功能单位。

一台计算机的所有指令的集合构成该机的指令系统,也称为指令集。

2、指令格式的分类

1)地址码数目

1. 零地址指令

零地址指令:OP

不需要操作数,如空操作、停机、关中断等指令

堆栈计算机,两个操作数隐含存放在栈顶和次栈顶,计算结果压回栈顶

2. 一地址指令

一地址指令:OP + \(A_1\)

1、只需要单操作数,如加1、减1、取反、求补等

指令含义:OP(\(A_1\)) -> \(A_1\)

完成一条指令需要3次访存:取指 => 读\(A_1\) => 写\(A_1\)

2、需要两个操作数,但其中一个操作数隐含在某个寄存器(如隐含在ACC)

指令含义:(ACC)OP(\(A_1\)) -> ACC

完成一条指令需要2次访存:取指 => 读\(A_1\)

3. 二地址指令

二地址指令:OP + \(A_1\)(目的操作数) + \(A_2\)(源操作数)

常用于需要两个操作数的算术运算、逻辑运算相关指令

指令含义:(\(A_1\))OP(\(A_2\)) -> \(A_1\)

完成一条指令需要访存4次,取指 => 读\(A_1\) => 读\(A_2\) => 写\(A_1\)

4. 三地址指令

三地址指令:OP + \(A_1\)(目的操作数) + \(A_2\)(源操作数) + \(A_3\)(结果)

常用于需要两个操作数的算术运算、逻辑运算相关指令

指令含义:(\(A_1\))OP(\(A_2\)) -> \(A_3\)

完成一条指令需要访存4次,取指 => 读\(A_1\) => 读\(A_2\) => 写\(A_3\)

5. 四地址指令

四地址指令:OP + \(A_1\)(目的操作数) + \(A_2\)(源操作数) + \(A_3\)(结果) + \(A_4\)(下一个指令的地址)

指令含义:(\(A_1\))OP(\(A_2\)) -> \(A_3\)

\(A_4\):下一条将要执行指令的地址

完成一条指令需要访存4次,取指 => 读\(A_1\) => 读\(A_2\) => 写\(A_3\)

正常情况下:取指令之后 PC+1,指向下一条指令

四地址指令:执行指令后,将PC的值修改为\(A_4\)所指地址

2)指令长度

指令字长:一条指令的总长度(可能会变)=> 半字长指令、单字长指令、双字长指令 => 指令字长会影响取指令所需时间

机器字长:CPU进行一次整数运算所能处理的二进制数据的位数(通常和ALU直接相关)

存储字长:一个存储单元中的二讲制代码位数(通常和MDR位数相同)

定长指令字结构:指令系统内所有指令的长度都相等

变长指令字结构:指令系统内所有指令的长度都不等

3)操作码的长度

定长操作码:指令系统中所有指令的操作码长度都相同

可变长操作码:指令系统中各指令的操作码长度可变

4)操作类型

1. 数据传送类

LOAD:把存储器中的数据放到寄存器中

STORE:把寄存器中的数据放到存储器中

2. 运算类
  1. 算术逻辑操作
  2. 移位操作
  3. 转移操作
    1. 无条件转移 JMP
    2. 条件转移jZ:结果为0
    3. J0:结果溢出
    4. JC:结果有进位
    5. 调用和返回 CALL和RETURN
    6. 陷阱Trap与陷阱指令
3. 输入输出类

CPU寄存器与IO端口之间的数据传送(端口即IO接口中的寄存器)

二、扩展操作码指令格式

扩展操作码 = 定长指令字结构 + 可变长操作码

  1. 不允许短码是长码的前缀,即短操作码不能与长操作码的前面部分的代码相同。
  2. 各指令的操作码一定不能重复

设地址长度为n,上一层留出m种状态,下一层可扩展出 \(m*2^n\) 种状态

三、指令寻址

程序计数器PC:指明下一条条指令的存放地址

指令寻址:下一条欲执行指令的地址(始终由程序计数器PC给出)

1、顺序寻址

(PC) + "1" -> PC

2、跳跃寻址

指令修改PC的值

JMP 7:无条件转移,把PC中的内容改成7

四、数据寻址

数据寻址:确定本条指令的地址码指明的真实地址

求出操作数的真实地址,称为有效地址(EA)。

1、直接寻址

直接寻址:指令字中的形式地址A就是操作数的真实地址EA,即EA=A

一条指令的执行:取指令访存1次,执行指令访存1次,暂不考虑存结果,共访存2次

优点:简单,指令执行阶段仅访问一次主存,不需专门计算操作数的地址。

缺点:A的位数决定了该指令操作数的寻址范围,操作数的地址不易修改。

2、间接寻址

间接寻址:指令的地址字段给出的形式地址不是操作数的真正地址,而是操作数有效地址所在的存储单元的地址,也就是操作数地址的地 址,即EA = (A)

一条指令的执行:取指令访存1次,执行指令访存2次,暂不考虑存结果,共访存3次

优点:可扩大寻址范围(有效地址EA的位数大于形式地址A的位数),便于编制程序(用间接寻址可以方便地完成子程序返回)

缺点:指令在执行阶段要多次访存(一次间址需两次访存,多次导址需根据存储字的最高位确定几次访存)

3、寄存器寻址

寄存器寻址:在指令字中直接给出操作数所在的寄存器编号,即 \(EA=R_i\),其操作数在由指所指的寄存器内

一条指令的执行:取指令访存1次,执行指令访存0次,暂不考虑存结果,共访存1次

优点:指令在执行阶段不访问主存,只访问寄存器,指令字短且执行速度快,支持向量/矩阵运算

缺点:寄存器价格昂贵,计算机中寄存器个数有限

4、寄存器间接寻址

寄存器间接寻址:寄存器R中给出的不是一个操作数,而是操作数所在主存单元的地址,即\(EA=(R_i)\)

一条指令的执行:取指令访存1次,执行指令访存1次,暂不考虑存结果,共访存2次

特点:与一般间接寻址相比速度更快,但指令的执行阶段需要访问主存(因为操作数在主存中)

5、隐含寻址

隐含寻址:不是明显地给出操作数的地址,而是在指令中隐含着操作数的地址

优点:有利于缩短指令字长

缺点:需增加存储操作数或隐含地址的硬件

6、立即寻址

立即寻址:形式地址A就是操作数本身,又称为立即数,一般采用补码形式。#表示立即寻址特征。

一条指令的执行:取指令访存1次,执行指令访存0次,暂不考虑存结果,共访存1次

优点:指令执行阶段不访问主存,指令执行时间最短

缺点:A的位数限制了立即数的范围。如A的位数为n,且立即数采用补码时,可表示的数据范围为\(-2^{n-1}\) ~ \(2^{n-1}-1\)

7、基址寻址

基址寻址:将CPU中基址寄在器(BR)的内容加上指令格式中的形式地址A,形成操作数的有效地址,即\(EA=(BR)+A\)

操作系统中的"重定位奇存器"就是"基址寄存器"

  1. 专门的基址寄存器BR
  2. 在指令中指明,要将哪个通用寄存器作为基址寄存器

优点:便于程序"浮动",方便实现多道程序并发运行。可扩大寻址范围。有利于多道程序设计,可用于编制浮动程序

基址寄存器是面向操作系统的,其内容由操作系统或管理程序确定。在程序执行过程中,基址寄存器的内容不变(基地址),形式地址可变(偏移量)

当采用通用寄存器作为基址寄存器时,可由用户决定哪个寄存器作为基址寄存器,但其内容仍由操作系统确定。

8、变址寻址

变址寻址:有效地址EA等于指令字中的形式地址A与变址寄存器IX的内容相加之和,即\(EA=(IX)+A\)。其中EX为变址寄存器(专用),也可用通用寄存器作为变址寄存器。

变址寄存器是面向用户的:在程序执行过程中,变址寄存器IX的内容可由用户改变(偏移量),形式地址A不变(基地址)

优点:在数组处理过程中,可设定A为数组的首地址,不断改变变址寄存器IX的内容,便可很容易形成数组中任一数据的地址,特别适合编制循环程序

先基址后变址寻址:\(EA=(IX)+((BR)+A)\)

9、相对寻址

相对寻址:把程序计数器PC的内容加上指令格式中的形式地址A而形成操作数的有效地址,\(EA=(PC)+A\),其中A是相对于PC所指地址的位移量,可正可负,补码表示。

优点:操作数的地址不是固定的,它随着PC值的变化而变化,并且与指令地址之间总是相差一个固定值,因此便于程序浮动(一段代码在程序内部的浮动)。相对寻址广泛应用于转移指令。

ACC加法指令的地址码,可采用"分段"方式解决,即程序段、数据段分开

10、堆栈寻址

堆栈寻址:操作数存放在堆栈中,隐含使用堆栈指针(SP)作为操作数地址

堆栈是存储器(或专用寄存器组)中一块特定的按栈管理的存储区,该存储区中被读/写单元的地址是用一个特定的寄存器给出的,该寄存器称为堆栈指针(SP)

五、CISC和RISC

CISC:一条指令完成一个复杂的基本功能

RISC:一条指令完成一个基本"动作",多条指令组合完成一个复杂的基本功能

80-20规律:典型程序中80%的语句仅仅使用处理机中20%的指令