计算机系统结构张晨曦版课后答案解析

时间:2021-02-06 19:02:09 课后答案 我要投稿

计算机系统结构张晨曦版课后答案解析

  篇一:计算机系统结构张晨曦版课后答案

  1.1 解释下列术语

  层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

  虚拟机:用软件实现的机器。

  翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

  解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

  计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

  在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

  计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

  计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

  系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

  Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

  程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。

  CPI:每条指令执行的平均时钟周期数。

  测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

  存储程序计算机:冯诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

  系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

  软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。

  向上(下)兼容:按某档计算机编制的程序,不加修改就能运行于比它高(低)档的计算机。

  向后(前)兼容:按某个时期投入市场的某种型号计算机编制的程序,不加修改地就能运行于在它之后(前)投入市场的计算机。

  兼容机:由不同公司厂家生产的具有相同系统结构的计算机。

  模拟:用软件的方法在一台现有的计算机(称为宿主机)上实现另一台计算机(称为虚拟机)的指令系统。

  仿真:用一台现有计算机(称为宿主机)上的微程序去解释实现另一台计算机(称为目标机)的指令系统。

  并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠,就存在并行性。它包括同时性与并发性两种含义。

  时间重叠:在并行性概念中引入时间因素,让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。

  资源重复:在并行性概念中引入空间因素,以数量取胜。通过重复设置硬件资源,大幅度地提高计算机系统的性能。

  资源共享:这是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。

  耦合度:反映多机系统中各计算机之间物理连接的紧密程度和交互作用能力的强弱。

  紧密耦合系统:又称直接耦合系统。在这种系统中,计算机之间的物理连接的频带较高,一般是通过总线或高速开关互连,可以共享主存。

  松散耦合系统:又称间接耦合系统,一般是通过通道或通信线路实现计算机之间的互连,可以共享外存设备(磁盘、磁带等)。计算机之间的相互作用是在文件或数据集一级上进行。

  异构型多处理机系统:由多个不同类型、至少担负不同功能的处理机组成,它们按照作业要求的顺序,利用时间重叠原理,依次对它们的多个任务进行加工,各自完成规定的功能动作。

  同构型多处理机系统:由多个同类型或至少担负同等功能的处理机组成,它们同时处理同一作业中能并行执行的多个任务。

  1.2 试用实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系。

  答:如在设计主存系统时,确定主存容量、编址方式、寻址范围等属于计算机系统结构。确定主存周期、逻辑上是否采用并行主存、逻辑设计等属于计算机组成。选择存储芯片类型、微组装技术、线路设计等属于计算机实现。

  计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成的物理实现。一种体系结构可以有多种组成。一种组成可以有多种实现。

  1.3 计算机系统结构的Flynn分类法是按什么来分类的?共分为哪几类?

  答:Flynn分类法是按照指令流和数据流的多倍性进行分类。把计算机系统的结构分为:

  (1)

  (2)

  (3)

  (4) 单指令流单数据流SISD 单指令流多数据流SIMD 多指令流单数据流MISD 多指令流多数据流MIMD

  1.4 计算机系统设计中经常使用的4个定量原理是什么?并说出它们的含义。

  答:(1)以经常性事件为重点。在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。(2)Amdahl定律。加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。(3)CPU性能公式。执行一个程序所需的CPU时间 = IC ×CPI ×时钟周期时间。(4)程序的局部性原理。程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

  1.5 分别从执行程序的角度和处理数据的角度来看,计算机系统中并行性等级从低到高可分为哪几级?

  答:从处理数据的角度来看,并行性等级从低到高可分为:

  (1)字串位串:每次只对一个字的一位进行处理。这是最基本的串行处理方式,不存在并行性;

  (2)字串位并:同时对一个字的全部位进行处理,不同字之间是串行的。已开始出现并行性;

  (3)字并位串:同时对许多字的同一位(称为位片)进行处理。这种方式具有较高的并行性;

  (4)全并行:同时对许多字的全部位或部分位进行处理。这是最高一级的并行。 从执行程序的角度来看,并行性等级从低到高可分为:

  (1)指令内部并行:单条指令中各微操作之间的并行;

  (2)指令级并行:并行执行两条或两条以上的指令;

  (3)线程级并行:并行执行两个或两个以上的线程,通常是以一个进程内派生的多个线程为调度单位;

  (4)任务级或过程级并行:并行执行两个或两个以上的过程或任务(程序段),以子程序或进程为调度单元;

  (5)作业或程序级并行:并行执行两个或两个以上的作业或程序。

  1.6 某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:

  指令类型 指令执行数量 平均时钟周期数

  整数 45000 1

  数据传送 75000 2

  浮点 8000 4

  分支 1500 2

  求该计算机的有效CPI、MIPS和程序执行时间。

  解:(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776

  (2)MIPS速率=f/ CPI =400/1.776 =225.225MIPS

  (3)程序执行时间= (45000×1+75000×2+8000×4+1500×2)/400=575s

  1.7 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?

  解由题可知:可改进比例 = 40% = 0.4部件加速比 = 10

  根据Amdahl定律可知:

  采用此增强功能方法后,能使整个系统的性能提高到原来的1.5625倍。

  1.8 计算机系统中有三个部件可以改进,这三个部件的部件加速比为:

  部件加速比1=30;部件加速比2=20;部件加速比3=10

  (1) 如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?

  (2) 如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?

  解:(1)在多个部件可改进情况下,Amdahl定理的扩展:

  已知S1=30,S2=20,S3=10,Sn=10,F1=0.3,F2=0.3,得:

  得F3=0.36,即部件3的可改进比例为36%。

  (2)设系统改进前的执行时间为T,则3个部件改进前的执行时间为:(0.3+0.3+0.2)T = 0.8T,不可改进部分的执行时间为0.2T。

  已知3个部件改进后的加速比分别为S1=30,S2=20,S3=10,因此3个部件改进后的执行时间为:

  改进后整个系统的执行时间为:Tn = 0.045T+0.2T = 0.245T

  那么系统中不可改进部分的执行时间在总执行时间中占的比例是:

  1.9 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。具体数据如下表所示:

  操作类型 程序中的数量

  (百万条指令) 改进前的执行时间

  (周期) 改进后的执行时间

  (周期)

  操作1 10 2 1

  操作2 30 20 15

  操作3 35 10 3

  操作4 15 4 1

  (1)改进后,各类操作的加速比分别是多少?

  (2)各类操作单独改进后,程序获得的加速比分别是多少?

  (3)4类操作均改进后,整个程序的加速比是多少?

  解:根据Amdahl定律可得

  操作类型 各类操作的指令条数在程序中所占的比例Fi 各类操作的加速比Si 各类操作单独改进后,程序获得的加速比

  操作1 11.1%

  操作2 33.3%

  操作3 38.9% 2 1.06 1.33 1.09 3.33 1.37

  操作4 16.7% 4 1.14

  4类操作均改进后,整个程序的加速比:

  第2章指令集结构的分类

  2.1 解释下列术语

  堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。

  累加器型机器:CPU 中存储操作数的单元是累加器的机器。

  通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。

  CISC:复杂指令集计算机

  RISC:精简指令集计算机

  寻址方式:指令系统中如何形成所要访问的数据的地址。一般来说,寻址方式可以指明指令中的操作数是一个常数、一个寄存器操作数或者是一个存储器操作数。

  数据表示:硬件结构能够识别、指令系统可以直接调用的那些数据结构。

  2.2 区别不同指令集结构的.主要因素是什么?根据这个主要因素可将指令集结构分为哪3类?

  答:区别不同指令集结构的主要因素是CPU中用来存储操作数的存储单元。据此可将指令系统结构分为堆栈结构、累加器结构和通用寄存器结构。

  2.3 常见的3种通用寄存器型指令集结构的优缺点有哪些?

  答:

  指令系统结构类型 优点 缺点

  篇二:计算机系统结构作业答案第三章(张晨曦)

  3.1 -3.3为术语解释等解答题。

  3.4 设一条指令的执行过程分为取指令,分析指令和执行指令3个阶段,每个阶段所需时间分别为ΔT, ΔT, 2ΔT,分别求出下列各种情况下,连续执行N条指令所需的时间。 (1) 顺序执行方式

  (2) 只有“取指令”与“执行指令”重叠 (3) “取指令”,“分析指令”与“执行指令”重叠 解:

  (1)  4NΔT

  (2)  (3N+1) ΔT (3)  2(N+1) ΔT

  3.6 解决流水线瓶颈问题有哪两种常用方法? 解:

  (1) 细分瓶颈段  将瓶颈段细分为若干个子瓶颈段 (2) 重复设置瓶颈段  重复设置瓶颈段,使之并行工作,以此错开处理任务

  3.9 列举下面循环中的所有相关,包括输出相关,反相关,真数据相关。 for(i = 2; i < 100; i=i+1) {  a[i] = b[i] + a[i];-----(1)  c[i+1] = a[i] + d[i];-----(2)  a[i-1] = 2*b[i]; -----(3)  b[i+1] = 2*b[i]; -----(4) } 解:

  输出相关:第k次循环时(1)与第k+1轮时(3) 反相关:第k次循环时(1)和(2)与第k-1轮时(3)

  真数据相关:每次循环(1)与(2),第k次循环(4)与k+1次循环(1),(3),(4)

  3.12 有一指令流水线如下所示

  50ns 50ns100ns 200ns (1) 求连续如入10条指令的情况下,该流水线的实际吞吐率和效率

  (2) 该流水线的“瓶颈”在哪一段?请采用两种不同的措施消除此“瓶颈”。对于你所给出

  的两种新的流水线连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)(m表示流水线级数,n 表示任务数)

  (2)瓶颈在 3、4段。

  方法一:变成八级流水线(细分)

  11.7e8

  方法二:变成两级流水线(合并)

  方法三:将段 1、2 合并为一段,段 4 细化流水为两段

  方法四:重复设置部件,设置 2个部件 3,4个部件 4,和第一种方法结果相同

  3.14 有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段时间为2Δt,其余各段时间均为Δt,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中,现要在该流水线上计算

  (AB),画出其时空图,并计算其吞吐率、

  i

  i

  i1

  4

  急速比和效率。 解:(1).任务划分如下:

  F = ( A1  +  B1 )·( A

  2

  +  B2 )·( A3+  B3 )·( A4+  B4 )

  (7)

  时空图如下:

  S5S4S3S2S1 (2) Tk = 18Δt,TP = 7/18Δt,S = 29/18=1.611,E = 29/(18*5)=29/90≈32.2% 3.15

  一动态多功能流水线由6个功能段组成,如下图(图4):

  图4

  其中:S1、S4、S5、S6组成乘法流水线,S1、S2、S3、S6组成加法流水线,每个功能段时间均为50ns。假定该流水线的输出结果可以直接返回流水线输入端,而且设置有足够

  的缓冲寄存器。若按照最快的方式用该流水线计算 ① 请画出其处理过程的时空图。  ② 计算其实际吞吐率,加速比和效率。 解:(1).任务划分如下:

  。

  F = X1·Y1·Z1 + X2·Y2·Z2 + X3·Y3·Z3 + X4·Y4·Z4 + X5·Y5·Z5

  时空图如下:  S6S5S4S3S2

  S1 (2).Tk = 22Δt,TP = 7/11Δt=7/(11*50ns)=12.727e6,S = 28/11=2.555,E = 14/33=42.42%

  3.18、在Cray 1机上,按链接方式执行下面4条向量指令(括号中给出相应功能部件时间),如果向量寄存器和功能部件之间的数据传输需要1拍,试求此链接流水线的流过时间为多少拍?如果向量长度为64,则需要多少拍能得到全部结果。

  V0←存储器 (存储器取数:7拍)

  V2←V0+V1 (向量加:3拍)V3←V2<A3 (按照A3左移:4拍)V5←V3∧V4 (向量逻辑乘:2拍)

  解答:

  四条指令每前后两条依次存在先写后读相关,故流水线经过时间为(1+7+1) + (1+3+1) + (1+4+1) + (1+2+1) = 24。

  如果向量长度为64,则需24 + (64-1) = 87拍能得到全部结果。

  篇三:计算机体系结构课后习题原版答案_张晨曦著

  

  1.1 解释下列术语

  计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

  计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

  计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

  系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

  Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

  并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠,就存在并行性。它包括同时性与并发性两种含义。

  1.2 试用实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系。

  答:如在设计主存系统时,确定主存容量、编址方式、寻址范围等属于计算机系统结构。确定主存周期、逻辑上是否采用并行主存、逻辑设计等属于计算机组成。选择存储芯片类型、微组装技术、线路设计等属于计算机实现。

  计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成的物理实现。一种体系结构可以有多种组成。一种组成可以有多种实现。

  1.4 计算机系统设计中经常使用的4个定量原理是什么?并说出它们的含义。 答:(1)以经常性事件为重点。在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。(2)Amdahl定律。加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。(3)CPU性能公式。执行一个程序所需的CPU时间 = IC ×CPI ×时钟周期时间。(4)程序的局部性原理。程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

  1.6 某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:

  求该计算机的有效CPI、MIPS和程序执行时间。 解:(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (2)MIPS速率=f/ CPI =400/1.776 =225.225MIPS

  (3)程序执行时间= (45000×1+75000×2+8000×4+1500×2)/400=575s

  1.7 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?

  解 由题可知:可改进比例 = 40% = 0.4部件加速比 = 10 根据Amdahl定律可知:

  1

  系统加速比1.5625

  0.4

  10.4

  10

  采用此增强功能方法后,能使整个系统的性能提高到原来的1.5625倍。

  1.8 计算机系统中有三个部件可以改进,这三个部件的部件加速比为:

  部件加速比1=30;部件加速比2=20;  部件加速比3=10

  (1) 如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?

  (2) 如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?

  解:(1)在多个部件可改进情况下,Amdahl定理的扩展:

  Sn

  (1

  1

  Fi)

  Fi

  Si

  已知S1=30,S2=20,S3=10,Sn=10,F1=0.3,F2=0.3,得:

  10

  1

  1(-0.30.3F3)(0.3/300.3/20F3/10)

  得F3=0.36,即部件3的可改进比例为36%。

  (2)设系统改进前的执行时间为T,则3个部件改进前的执行时间为:(0.3+0.3+0.2)T = 0.8T,不可改进部分的执行时间为0.2T。

  已知3个部件改进后的加速比分别为S1=30,S2=20,S3=10,因此3个部件改进后的执行时间为:

  'Tn

  0.3T0.3T0.2T

  0.045T 302010

  改进后整个系统的执行时间为:Tn = 0.045T+0.2T = 0.245T

  那么系统中不可改进部分的执行时间在总执行时间中占的比例是:

  0.2T

  0.82

  0.245T

  1.9 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。具体数据如下表所示:

  (2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少?

  解:根据Amdahl定律Sn1Fe

  (1Fe)

  Se

  可得

  4类操作均改进后,整个程序的加速比:

  1

  Sn2.16

  Fi

  (1Fi)Si

  第2章 指令集结构的分类

  2.1 解释下列术语

  堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。

  累加器型机器:CPU 中存储操作数的单元是累加器的机器。

  通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。

  2.2 区别不同指令集结构的主要因素是什么?根据这个主要因素可将指令集结构分为哪3类?

  答:区别不同指令集结构的主要因素是CPU中用来存储操作数的存储单元。据此可将指令系统结构分为堆栈结构、累加器结构和通用寄存器结构。

  2.4指令集应满足哪几个基本要求?

  答:对指令集的基本要求是:完整性、规整性、高效率和兼容性。

  完整性是指在一个有限可用的存储空间内,对于任何可解的问题,编制计算程序时,指令集所提供的指令足够使用。

  规整性主要包括对称性和均匀性。对称性是指所有与指令集有关的存储单元的使用、操作码的设置等都是对称的。均匀性是指对于各种不同的操作数类型、字长、操作种类和数据存储单元,指令的设置都要同等对待。

  高效率是指指令的执行速度快、使用频度高。

  2.7简述RISC指令集结构的设计原则。

  答(1) 选取使用频率最高的指令,并补充一些最有用的指令;(2)每条指令的功能应

  尽可能简单,并在一个机器周期内完成;(3)所有指令长度均相同;(4)只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器之间进行; (5) 以简单有效的方式支持高级语言。

  2.10通常有哪几种指令格式,请简述其适用范围。

  答: (1) 变长编码格式。如果系统结构设计者感兴趣的是程序的目标代码大小,而不是性能,就可以采用变长编码格式。(2)固定长度编码格式。如果感兴趣的是性能,而不是程序的目标代码大小,则可以选择固定长度编码格式。 (3) 混合型编码格式。需要兼顾降低目标代码长度和降低译码复杂度时,可以采用混合型编码格式。

  第3章 流水线技术

  3.1解释下列术语

  流水线:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。

  吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。

  流水线的加速比:使用顺序处理方式处理一批任务所用的时间与按流水处理方式处理同一批任务所用的时间之比。

  数据相关:考虑两条指令i和j,i在j的前面,如果下述条件之一成立,则称指令j与指令i数据相关:

  (1)指令j使用指令i产生的结果;

  (2)指令j与指令k数据相关,而指令k又与指令i数据相关。

  数据冲突:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲突。

  定向:用来解决写后读冲突的。在发生写后读相关的情况下,在计算结果尚未出来之前,后面等待使用该结果的指令并不见得是马上就要用该结果。如果能够将该计算结果从其产生的地方直接送到其它指令需要它的地方,那么就可以避免停顿。

  链接技术:具有先写后读相关的两条指令,在不出现功能部件冲突和Vi冲突的情况下,可以把功能部件链接起来进行流水处理,以达到加快执行的目的。

  分段开采:当向量的长度大于向量寄存器的长度时,必须把长向量分成长度固定的段,然后循环分段处理,每一次循环只处理一个向量段。

  3.3 简述先行控制的基本思想。 答:先行控制技术是把缓冲技术和预处理技术相结合。缓冲技术是在工作速度不固定的两个功能部件之间设置缓冲器,用以平滑它们的工作。预处理技术是指预取指令、对指令进行加工以及预取操作数等。

  采用先行控制方式的处理机内部设置多个缓冲站,用于平滑主存、指令分析部件、运算器三者之间的工作。这样不仅使它们都能独立地工作,充分忙碌而不用相互等待,而且使指令分析部件和运算器分别能快速地取得指令和操作数,大幅度地提高指令的执行速度和部件

  的效率。这些缓冲站都按先进先出的方式工作,而且都是由一组若干个能快速访问的存储单元和相关的控制逻辑组成。

  采用先行控制技术可以实现多条指令的重叠解释执行。

  3.4 设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段,每个阶段所需的时间分别为△t、△t和2△t 。分别求出下列各种情况下,连续执行N条指令所需的时间。

  (1)顺序执行方式;

  (2)只有“取指令”与“执行指令”重叠; (3)“取指令”、“分析指令”与“执行指令”重叠。 解:(1)每条指令的执行时间为:△t+△t+2△t=4△t

  连续执行N条指令所需的时间为:4N△t

  (2)连续执行N条指令所需的时间为:4△t+3(N-1)△t=(3N+1)△t (3)连续执行N条指令所需的时间为:4△t+2(N-1)△t=(2N+2)△t

  3.5 简述流水线技术的特点。 答:流水技术有以下特点: (1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。

  (2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。 (3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。

  (4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。

  (5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。

  3.6 解决流水线瓶颈问题有哪两种常用方法? 答:细分瓶颈段与重复设置瓶颈段

  3.10 简述三种向量处理方式,它们对向量处理机的结构要求有何不同?

  答 (1)横向处理方式:若向量长度为N,则水平处理方式相当于执行N次循环。若使用流水线,在每次循环中可能出现数据相关和功能转换,不适合对向量进行流水处理。 (2)纵向处理方式:将整个向量按相同的运算处理完毕之后,再去执行其他运算。适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入、输出端直接与存储器相联,构成M-M型的运算流水线。 (3)纵横处理方式:把长度为N的向量分为若干组,每组长度为n,组内按纵向方式处理,依次处理各组,组数为「N/n」,适合流水处理。可设长度为n的向量寄存器,使每组向量运算的源/目向量都在向量寄存器中,流水线的运算部件输入、输出端与向量寄存器相联,构成R-R型运算流水线。

  3.11 可采用哪些方法来提高向量处理机的性能? 答:可采用多种方法:

  (1) 设置多个功能部件,使它们并行工作; (2) 采用链接技术,加快一串向量指令的执行;

【计算机系统结构张晨曦版课后答案解析】相关文章:

《匆匆》课后习题答案解析02-18

社戏课后题及答案解析02-18

建筑力学及课后答案解析02-17

大学数据结构课后习题答案02-18

狼的课后答案及题目解析02-16

斑羚飞渡课后题及答案解析02-11

《函数的概念》课后练习及答案解析02-15

《落叶》课后巩固练习题及答案解析02-13

中国石拱桥课后题及答案解析02-11