资源预览内容
第1页 / 共45页
第2页 / 共45页
第3页 / 共45页
第4页 / 共45页
第5页 / 共45页
第6页 / 共45页
第7页 / 共45页
第8页 / 共45页
第9页 / 共45页
第10页 / 共45页
亲,该文档总共45页,到这儿已超出免费预览范围,如果喜欢就下载吧!
点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,计算机系统结构(jigu)向量处理机,第一页,共45页。,计算机系统结构(jigu),第一章 基本概念,第二章 指令系统(xtng),第三章 存储系统(xtng),第四章 输入输出系统(xtng),第五章 标量处理机,第六章 向量(xingling)处理机,第七章 互连网络,第八章 并行处理机和 多处理机,第二页,共45页。,第六章 向量(xingling)处理机,6.1 向量(xingling)数据表示方式,6.2 向量(xingling)处理机的结构,6.3 向量(xingling)处理方式,6.4 向量(xingling)处理机的关键技术,6.5 向量(xingling)处理机实例,向量(xingling)处理机的性能评价,6.7 向量(xingling)处理机的发展,第三页,共45页。,6.1 向量数据表示方式,向量处理机是解决数值计算问题的一种高性能计算机结构,向量处理机一般都采用流水线结构,有多条流水线并行工作,向量处理机通常属大型或巨型机,也可以用微机加一台向量协处理器组成,一般向量计算机中包括有一台高性能标量处理机,必须把要解决的问题转化为向量运算,向量处理机才能(cinng)充分发挥作用,第四页,共45页。,6.1 向量数据(shj),6.1.1 从标量到向量,第五页,共45页。,例如:采用(ciyng)寄存器-寄存器结构的CRAY-1与采用(ciyng)存储器-存储器结构的STAR-100比较,运算速度高3倍多,而主存流量低倍。,BLELOOP;循环未结束转LOOP,;否则继续,主要采用两种方法:1.,ADDR3,R2;改变向量偏移量,INCR0;循环次数增1,必须把要解决的问题转化为向量运算,向量处理机才能(cinng)充分发挥作用,第四十四页,共45页。,7 向量处理(chl)机的发展,第三十二页,共45页。,向量处理机的性能评价(pngji),分组方法:,其中:为余数,共分组。,ADDR3,R2;改变向量偏移量,以一个简单的C语言编写的程序为例,说明向量的三种处理方式的工作原理。,ADDR3,R2;改变向量偏移量,向量计算是按列的方式自上而下纵向地进行。,采用多个存储体交叉和并行访问来提高存储器速度,例如:CRAY-1有64个存储体,每个处理机访问4个存储体STAR-100采用32个存储体交叉,每个存储体并行读出8个64位数据我国研制的YH-1向量计算机有37个存储体,6.1.1 从标量到向量,例如:一个简单的C语言程序如下:for(i=10;i=1010;i+)ci=ai+bi+5;,在向量处理机上,可以只用一条指令(zhlng):C(10:1010)=A(10:1010)+B(15:1015)一条向量指令(zhlng)可处理个或对操作数,在标量处理机上用10多条指令(zhlng),其中有8条指令(zhlng)要循环1000次。采用多寄存器结构的两地址指令(zhlng)编写程序。,第六页,共45页。,存储器采用字节编址方式,字长为32位在一般标量处理机中需要如下指令序列来实现(A、B、C分别是向量a、b、c在内存(ni cn)中的起始地址):,START:LOADR0,ST;读循环初值,10,LOADR1,ED;读循环终值,1010,LOADR2,L;读内存地址增量(zn lin),;常数4,MOVER3,R2,MULR3,R0;向量偏移量,;初始值为40,LOOP:LOADR4,A(R3);读A向量的;一个元素,第七页,共45页。,LOADR5,B(R3);读B向量的一个元素(yun s),ADDR4,R5,STORER4,C(R3);写C向量的一个元素(yun s),ADDR3,R2;改变向量偏移量,INCR0;循环次数增1,CMPR0,R1;循环是否结束,BLELOOP;循环未结束转LOOP,;否则继续,HALT,ST:10;循环初值,ED:1010;循环终值,L:4;内存地址增量,第八页,共45页。,第六章 向量(xingling)处理机,6.1 向量数据表示方式,6.2 向量处理机的结构,6.3 向量处理方式,6.4 向量处理机的关键技术,6.5 向量处理机实例,向量处理机的性能评价(pngji),6.7 向量处理机的发展,第九页,共45页。,6.2 向量处理机结构,向量处理机的最关键问题是存储器系统能够满足运算部件带宽的要求。,主要采用两种方法:1.存储器存储器结构多个独立的存储器模块并行工作处理机结构简单,对存储系统的访问速度要求很高2.寄存器寄存器结构运算通过向量寄存器进行(jnxng)需要大量高速寄存器,对存储系统访问速度的要求降低,第十页,共45页。,6.2.1 存储器存储器结构(jigu),向量处理机中有多个高速流水线运算部件,存储器的访问速度是关键,采用多个存储体交叉和并行访问来提高存储器速度,例如:CRAY-1有64个存储体,每个处理机访问4个存储体STAR-100采用32个存储体交叉,每个存储体并行读出8个64位数据我国研制的YH-1向量计算机有37个存储体,第十一页,共45页。,操作数缓冲栈和写结果缓冲栈主要用于解决访问存储器冲突虽然采用质数个存储体能消除访问存储器的冲突,但是,数据经过多次运算之后,在存储体中分布必然发生改变,主要优缺点:硬件结构简单,造价(zoji)低;速度相对较低,操作数缓冲(hunchng)栈,写结果(ji gu)缓冲栈,主存储器,流水线,运算,部件,第十二页,共45页。,6.2.2 寄存器-寄存器结构,把存储器-存储器结构中的缓冲栈改为向量寄存器,运算部件需要(xyo)的操作数从向量寄存器中读取,运算的中间结果也写到向量寄存器中。,向量寄存器与标量寄存器的主要差别是:一个向量寄存器能够保存一个向量,例如:64个64位寄存器。连续访问一个向量的各个分量。,需要(xyo)有标量寄存器和地址寄存器等。,第十三页,共45页。,采用寄存器-寄存器结构的主要优点:降低主存储器的流量。例如:采用寄存器-寄存器结构的CRAY-1与采用存储器-存储器结构的STAR-100比较(bjio),运算速度高3倍多,而主存流量低倍。STAR-100的主存储器流量:328W/1.28us=200MW/SCRAY-1的主存储器流量:4W/50ns=80MW/S,第十四页,共45页。,计算机系统结构(jigu),(第21讲),第十五页,共45页。,第六章 向量(xingling)处理机,6.1 向量数据表示方式,6.2 向量处理机的结构,6.3 向量处理方式,6.4 向量处理机的关键技术,6.5 向量处理机实例(shl),向量处理机的性能评价,6.7 向量处理机的发展,第十六页,共45页。,6.2 向量(xingling)处理机结构,向量(xingling)处理机的最关键问题是存储器系统能够满足运算部件带宽的要求。,主要采用两种方法:1.存储器存储器结构多个独立的存储器模块并行工作处理机结构简单,对存储系统的访问速度要求很高2.寄存器寄存器结构运算通过向量(xingling)寄存器进行需要大量高速寄存器,对存储系统访问速度的要求降低,第十七页,共45页。,6.2.1 存储器存储器结构,向量处理机中有多个高速流水线运算部件,存储器的访问速度是关键,采用多个存储体交叉和并行(bngxng)访问来提高存储器速度,例如:CRAY-1有64个存储体,每个处理机访问4个存储体STAR-100采用32个存储体交叉,每个存储体并行(bngxng)读出8个64位数据我国研制的YH-1向量计算机有37个存储体,第十八页,共45页。,采用(ciyng)寄存器-寄存器结构的主要优点:降低主存储器的流量。例如:采用(ciyng)寄存器-寄存器结构的CRAY-1与采用(ciyng)存储器-存储器结构的STAR-100比较,运算速度高3倍多,而主存流量低倍。STAR-100的主存储器流量:328W/1.28us=200MW/SCRAY-1的主存储器流量:4W/50ns=80MW/S,第十九页,共45页。,8个向量(xingling)寄存器,86464,主存储器,8MB,64个个体(gt),12个,流水,线结,构的,运算(yn sun),部件,缓冲寄存器,6464,标量寄存器,864,缓冲寄存器,6424,地址寄存器,824,指令缓冲寄存器,25616,CRAY-1,向量处理机结构,第二十页,共45页。,第六章 向量(xingling)处理机,6.1 向量数据表示方式(fngsh),6.2 向量处理机的结构,6.3 向量处理方式(fngsh),6.4 向量处理机的关键技术,6.5 向量处理机实例,向量处理机的性能评价,6.7 向量处理机的发展,第二十一页,共45页。,6.3 向量处理方式,要根据向量运算(yn sun)的特点和向量处理机的类型选择向量的处理方式。,有三种处理方式:1横向处理方式,又称为水平处理方式,横向加工方式等。向量计算是按行的方式从左至右横向地进行。2纵向处理方式,又称为垂直处理方式,纵向加工方式等。向量计算是按列的方式自上而下纵向地进行。3纵横处理方式,又称为分组处理方,第二十二页,共45页。,式,纵横向(hn xin)加工方式等。横向(hn xin)处理和纵向处理相结合的方式。,以一个简单的C语言编写的程序为例,说明向量的三种处理方式的工作原理。for(i=1;i=n;i+)yi=ai(bi+ci);,第二十三页,共45页。,6.3.1 横向处理方式,也称为水平处理方式,横向加工方式等逐个分量进行处理:假设中间结果(ji gu)为T(I)计算第1个分量:T(1)B(1)C(1)Y(1)A(1)T(1)计算第2个分量:T(2)B(2)C(2)Y(2)A(2)T(2)计算最后一个分量:T(N)B(N)C(N)Y(N)A(N)T(N),第二十四页,共45页。,存在两个问题:在计算向量的每个分量时,都发生写读数据相关。流水线效率低如果采用多功能流水线,必须(bx)频繁进行流水线切换,横向处理方式对向量处理机不适合即使在标量处理机中,也经常通过编译器进行指令流调度。,第二十五页,共45页。,6.3.2 纵向处理方式,也称为(chn wi)垂直处理方式,纵向加工方式等T(1)=B(1)+C(1)T(2)=B(2)+C(2)T(n)=B(n)+C(n)Y(1)=A(1)T(1)Y(2)=A(2)T(2)Y(N)=A(N)T(N),第二十六页,共45页。,采用向量(xingling)指令只需要2条:VADDB,C,TVMULA,T,Y,这种处理方式适用于向量(xingling)处理机数据相关不影响流水线连续工作。不同的运算操作只需要切换1次。,第二十七页,共45页。,6.3.3 纵横处理方式,用于寄存器-寄存器结构的向量处理机中向量寄存器的长度(chngd)是有限的,例如,每个向量寄存器有64个寄存器。当向量长度(chngd)N大于向量寄存器长度(chngd)n时,需要分组处理。,分组方法:,其中:为余数,共分组。组内采用纵向处理方式,组间采用横向处理方式。因此,也称为分组处理方式,纵横向加工方式等。,第二十八页,共45页。,计算机系统结构(jigu),(第22讲),第二十九页,共45页。,6.3.3 纵横处理方式,用于寄存器-寄存器结构的向量处理机中向量寄存器的长度是有限的,例如(lr),每个向量寄存器有64个寄存器。当向量长度N大于向量寄存器长度n时,需要分组处理。,分组方法:,其中:为余数,共分组。组内采用纵向处理方式
点击显示更多内容>>

最新DOC

最新PPT

最新RAR

收藏 下载该资源
网站客服QQ:3392350380
装配图网版权所有
苏ICP备12009002号-6