在一台单流水线多操作部件的处理机上执行下面的程序，取指令、指令译码各需一个时钟周期，MOVE、ADD

和MUL操作各需要2个、3个和4个时钟周期。每个操作都在第一个时钟周期从通用寄存器中读操作数，在最后一个时钟周期把运算结果写到通用寄存器中。 K： MOVE R1，R0 ；R1←(R0) K+1： MUL R0，R2，R1 ；R0←(R2)*(R1) K+2： ADD R0，R3，R2 ；R0←(R3)+(R2) 画出指令执行的流水线时空图，并计算执行完3条指令共需要多少个时钟周期。

答案

查看答案

发布时间：2020-09-27

更多“在一台单流水线多操作部件的处理机上执行下面的程序，取指令、指令译码各需一个时钟周期，MOVE、ADD”相关的问题

第1题

在一台向量处理机上实现A=B×S计算，其中A和B是长度为N=200的向量，S是一个标量。向量寄存器长度MVL=

64，各功能部件的启动时间为：取数和存数部件为12个时钟周期，乘法部件为7个时钟周期，执行标量代码的开销Tloop为15个时钟周期，对一个向量元素执行一次操作的时间Tg为1个时钟周期。求计算A的总执行时间。

点击查看答案

第2题

下面的一段MIPS汇编程序是计算高斯消去法中的关键一步，用于完成下面公式的计算。 Y=a×X+Y

指令的延迟如表4．1所示。整数指令均为1个时钟周期完成，浮点和整数部件均采用流水。整数操作之间以及与其他所有浮点操作之间的延迟为0，转移指令的延迟为0。X中的最后一个元素存放在存储器中的地址为DONE。 FOO： L．D F2，0(R1) MUT．D F4，F2，F0 L．D F6，0(R2) ADD．D F6，F4，F6 S．D F6，0[R2] DADDIU R1，R1，8 DADDIU R2，R2，8 DSUBIU R3，R1，DONE BNEZ R3．FOO ①对于标准的MIPS单流水线，上述循环计算一个Y值需要多少时间？其中有多少空转周期？ ②对于标准的MIPS单流水线，将上述循环顺序展开4次，不进行任何指令调度，计算一个Y值平均需要多少时间？加速比是多少？其加速是如何获得的？ ③对于标准的MIPS单流水线，将上述循环顺序展开4次，优化和调度指令，使循环处理时间达到最优，计算一个Y值平均需要多少时间？加速比是多少？ ④对于采用前瞻执行机制的MIPs处理器(只有一个整数部件)。当循环第二次执行到BNEZ R3，FOO时，写出前面所有指令的状态，包括指令使用的保留站、指令起始节拍、执行节拍和写结果节拍，并写出处理器当前的状态。 ⑤对于两路超标量的MIPS流水线，设有两个指令流出部件，可以流出任意组合的指令，系统中的功能部件数量不受限制。将上述循环展开4次，优化和调度指令，使循环处理时间达到最优。计算一个Y值平均需要多少时间？加速比是多少？ ⑥对于超长指令字MIPS处理器，将上述循环展开4次，优化和调度指令，使循环处理时间达到最优。计算一个Y值平均需要多少时间？加速比是多少？

点击查看答案

第3题

用一台每个时钟周期发射两条指令的超标量处理机运行下面一段程序。所有指令都要进行取指（IF)、译码

用一台每个时钟周期发射两条指令的超标量处理机运行下面一段程序。所有指令都要进行取指(IF)、译码(ID)、执行、写结果(WB)4个阶段。其中IF、ID、WB这3个阶段各为一个流水段，其延迟时间都为10 ns。在执行阶段，LOAD操作、AND操作各延迟10 ns，ADD操作延迟20 ns，MUL操作延迟30 ns。这4种功能部件各设置一个，它们可以并行工作。ADD部件和MUL部件都采用流水结构，每一级流水线的延迟时间都是10 ns。 I1 LOAD R0，M(A) ；R0←M(A) I2 ADD R1，R0 ；R1←(R1)+(R0) I3 LOAD R2，M(B) ；R2←M(B) I4 MUL R3，R4 ；R3←(R3)×(R4) I5 AND R4，R5 ；R4←(R4)∧(R5) I6 ADD R2，R5 ；R2←(R2)+(R5) ①请列出程序代码中所有的数据相关及其相关类型。 ②假设所有运算型指令都在译码(ID)流水段读寄存器，在写结果(WB)流水段写寄存器，采用顺序发射、顺序完成的调度方法。画出流水线的时空图，计算执行这个程序所用的时间。

点击查看答案

第4题

对于采用了Tomasulo算法和多流出技术的MIPS流水线，考虑以下简单循环的执行。该程序把F2中的标量加

到一个向量的每个元素上。 Loop： L．D F0，0(R1) ／／取一个数组元素放入F0 ADD．D F4，F0，F2 ／／加上在F2中的标量 S．D F4，0(R1) ／／存结果 DADDIU R1，R1，-8 ／／指针减8(每个数据占8个字节) BNE R1，R2，Loop ／／若R1不等于R2，表示尚未结束，转移／／到Loop继续现做以下假设。 ①每个时钟周期能流出一条整数型指令和一条浮点操作指令，即使它们相关也是如此。 ②整数ALU运算和地址计算共用一个整数部件，并且对于每一种浮点操作类型都有一个独立的流水化了的浮点功能部件。 ③指令流出和写结果各占用一个时钟周期。 ④具有动态分支预测部件和一个独立的计算分支条件的功能部件。 ⑤跟大多数动态调度处理器一样，写回段的存在意味着实际的指令延迟会比按序流动的简单流水线多一个时钟周期。所以，从产生结果数据的源指令到使用该结果数据的指令之间的延迟为：整数运算1个周期，load指令2个周期，浮点加法运算3个周期。要求： ①列出该程序前面3遍循环中各条指令的流出、开始执行和将结果写到CDB上的时间。 ②如果分支指令单流出，没有采用延迟分支，但分支预测是完美的。请列出整数部件、浮点部件、数据Cache以及CDB的资源使用情况。

点击查看答案

第5题

（）就是流水线技术，即采用指令预取技术，将每个指令分成多步，各步间叠加操作，当前指令完成前，后一指令准备就绪，缩小指令执行的时钟周期。

A.时间上的并行计算

B.空间上的并行计算

C.单指令多数据流（SIMD）

D.多指令多数据流（MIMD）

点击查看答案

第6题

在某向量处理机上执行DAXPY的向量指令序列，即完成y=a×X+Y。其中X和Y是向量，最初保存在主存中，a是

一个标量，已存放在寄存器F0中。它们的向量指令如下： LV V1，Rx ／／取向量X MULTFV V2，F0，V1 ／／向量X和标量(F0)相乘 LV V3，Ry ／／取向量y ADDV V4，V2，V3 ／／完成Y=a×X+Y SV V4，Ry ／／存结果假设向量寄存器的长度MVL=64，Tloop=15，各功能部件的启动时间为： ①取数和存数部件为12个时钟周期。 ②乘法部件为7个时钟周期。 ③加法部件为6个时钟周期。分别对于不采用向量链接技术和采用链接技术的两种情况，求完成上述向量操作的总执行时间。

点击查看答案

第7题

设有4个作业同时到达，每个作业的执行时间均为2小时，它们在一台处理机上按单道方式运行，则平均周

转时间为()。

A．1小时

B．5小时

C．2．5小时

D．8小时

点击查看答案

第8题

假设有4级流水线分别完成取指令、指令译码、执行运算、结果写回四步操作，完成各步操作的时间依次为1

00 ns、100 ns、80 ns、50 ns。试问：(1)流水线的操作周期应设计为多少？ (2)若相邻两条指令发生数据相关，而且在硬件上不采取措施，那么第二条指令要推迟多少时问进行？ (3)如果在硬件设计上加以改进，至少需推迟多少时间？