


单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2019/9/22,,‹#›,1,并行计算机,体系结构,,2024/9/11,,2,一、课程目标,1.,并行性理论的研究,并行计算机系统模型与体系结构;,并行程序设计模型与通信模型;,并行计算机性能评测方法;,可扩展性原理及实现方法2.,并行技术和结构的研究,微处理器并行技术;,互连网络技术;,共享存储技术及体系结构;,分布存储技术与可扩展体系结构;,通信时延包容技术2024/9/11,,3,二、参考教材,1,、并行计算机体系结构,陈国良等著,高等教育出版社,,,ISBN 7-04,—,11558-1,,,2002.9,2,、并行计算机体系结构,,David E.Culler,等著,李晓明等译,机械工业出版社,,ISBN 7-111-07888-8,,,2002.10,3,、可扩展并行计算,—,技术、结构与编程,,黄铠、徐志伟著,陆鑫达,等译,,,机械工业出版社,,2000.5,4,、计算机系统结构,—,一种定量的方法,(,第,5,版,),,,John L. Hennessy,等著,郑纬民等译,,清华大学出版社,,2002.8,5,、计算机系统结构,(,第二版,),,,郑纬民、汤志忠著,,清华大学出版社,,,1998.9,2024/9/11,,4,第一章 系统结构设计基础,2024/9/11,,5,第一节 计算机系统结构概念,一、,计算机系统结构概念,,1,、计算机系统层次结构,软硬件,交界面,,L6,:应用语言级,L5,:高级语言级,L4,:汇编语言级,L3,:操作系统级,L2,:机器语言级,L1,:微程序机器级,L0,:电子,线路,,,硬件,固件,,软件,,,虚拟机器,实际机器,,,,,,翻译(应用程序包),翻译(编译程序),翻译(汇编程序),解释,硬件直接执行,部分解释,,,,,,,计算机语言实现技术,回下页,2024/9/11,,6,2,、计算机系统设计方法,(1),由上向下方法,从软件到硬件,适合专用机的设计,结果:,形成软、硬脱节,(2),由下向上方法,从硬件到软件,适合通用机的设计,结果:,形成软、硬脱节,(3),从中间开始方法,从,软、硬件交界面,开始设计,要求:,不断进行交互、优化设计,→需要较好的评价工具和方法,转上页,2024/9/11,,7,3,、系统结构定义,*,精确定义:,机器语言程序员、编译程序编写者,所看到的计算机的,属性,,即概念性结构和功能特性,,概念性结构,—,系统的软、硬件功能界面;,功能特性,—,界面的功能分配,即界面的接口或组织,*,实质:,研究,软硬件,之间的界面定义,及,其上下的功能分配,*,基本定义:,程序员,所看到的计算机的,属性,*,研究内容:,数据表示、寻址方式、指令系统,寄存器组织,;,,存储系统;,中断机构、,I/O,结构;,机器工作状态定义和切换、信息保护,回下页,2024/9/11,,8,,,CPU,,,…,…,,键盘接口,,键盘,显卡,,显示器,,MEM,,,,,,,磁盘接口,磁盘,,,,,机器语言级机器,,,,,,,输入设备触发程序执行,,,指令系统,程序员看到的属性,,,信息保护,,机器状态,,存储系统,,I/O,系统,,中断系统,计算机系统结构包含内容示意图,,,进程管理程序,,作业管理程序,,文件管理程序,,存储管理程序,,,,,,,,,,,设备管理程序,,,,,信息保护,操作系统级机器,,注:,作业管理包含用户界面,功能,,,,,转上页,2024/9/11,,9,,计算机组成包含内容,—,数据通路宽度、专用部件设计、各种,OS,共享程度、功能部件并行度、控制机构组成方式、排队与缓冲技术、预估与预判技术、可靠性技术等,*,系统结构、计算机组成、物理实现三者关系:,,1,: n,,1,:,m,,系统结构,───,计算机组成 ─── 物理实现,*,计算机组成:,定义,—,计算机系统设计人员,看到的基本属性,,实质,—,是系统结构的,逻辑实现,2024/9/11,,10,4,、计算机系统结构设计步骤,(1),需求分析,在应用环境、所用语言种类及特性、对,OS,的特殊要求、所用外设特性、技术经济指标、市场分析等方面进行分析,(2),需求说明,,形成,设计,准则,、功能说明、器件性能说明,等需求,(3),概念性设计,,进行软、硬件功能分析,确定机器级界面,(4),具体设计,机器级界面各方面的确切定义,可考虑几种方案,(5),反复进行评价及优化设计,2024/9/11,,11,5,、,并行,体系结构,*并行计算机,:,是,一组相互通信、相互,协作的处理单元,,,用以快速求解大型问题,总线或互连网络,···,···,SM,SM,SM,,,,LM,MB,NIC,,,,,P/C,,,LM,MB,NIC,,,,,P/C,,,互连网络,···,,LM,MB,NIC,Bridge,,,,,P/C,,IOB,NIC,,,,LM,MB,NIC,Bridge,,,,,P/C,,IOB,NIC,,,2024/9/11,,12,*,并行,体系结构:,,由宏体系结构、微体系结构两部分组成,微体系结构,—,节点内部结构,,,主要为处理器,及其壳的,结构,宏体系结构,—,并行计算机的,整体结构,,包括节点间互连、通信、存储器访问等方面,*,并行,体系结构研究内容:,,互 连,—,结构模型、互连网络,,存储器,—,访存模型、,一致性模型,(Cache/,存储,),,交 互,—,编程模型、,通信机构、同步机构,2024/9/11,,13,二、,计算机系统结构分类,1,、,Flynn,分类法,*分类原理:,按,指令流和数据流的多倍性,进行分类,*,结构种类:,SISD,,,SIMD,,,MISD,,,MIMD,SISD,CU,MM,IS,,IS,PU,DS,,,,,,SIMD,CU,…,MMm,…,,DS1,,IS,,IS,MM1,PUn,DSn,,,,,,,,,PU1,MISD,…,DS,,IS1,,IS1,ISn,…,DS,,ISn,,,,,,,,,,,,,,,MMm,…,MM1,PU1,PU1,CU1,CU1,MIMD,…,DS1,,IS1,,IS1,ISn,…,DSn,,ISn,,,,,,,,,,,,,MMm,…,MM1,PU1,PU1,CU1,CU1,*,缺点:,对流水线处理机的分类不明确,2024/9/11,,14,2,、,Handler,分类法,*分类原理:,在三个,层次,,按并行程度及,流水处理,程度分类,层次,—,,PCU,(程序控制部件或,宏流水,),K,级,,ALU,(算术逻辑部件,或指令流水,),D,级,,ELC,(基本逻辑线路或,操作流水,),W,级,,描述,—,T(C),=,
B,机中,转移指令包含,比较,指令功能,,但,T,C,比,A,机慢,15%,执行,该程序时,,,A,机、,B,机哪个,工作速度快?,2024/9/11,,28,(2),模拟技术,*思路:,建立模拟器,模拟系统性能模型和工作负载模型,对运行后的数据进行统计、分析和评价,*,方法:,按被评价系统的运行特性建立,系统模型,;,按系统可能有的工作负载特性建立,工作负载模型,;,用语言编写模拟程序,,模仿,被评价系统的,运行,;,设计模拟实验,依照评价目标,选择与目标有关因素,得出实验值,再,进行统计、分析,*,应用:,可应用于,设计中或实际应用中系统,的分析与评价;,,可与分析技术相结合,构成一个混合系统,转上页,2024/9/11,,29,(3),测量技术,*思路:,通常采用基准测试程序对系统进行实际性能评价,*,基准测试程序:,,有实际应用程序、核心程序、合成测试程序三个层次,第一个层次,—,用于测试系统总体性能;,后两个层次,--,用于测试部件,(,如,CPU,、,I/O,系统等,),性能,,基准测试程序,—,具有三个层次的,测试程序组,,典型的有,SPEC,程序组,,包含测试,多,个领域,、三个层次的测试程序,*,应用:,只能应用于,实际使用中系统,的分析与评价;,通常根据系统的设计需求,(,应用领域,),选择基准测试程序组中的,部分测试程序,进行测量,2024/9/11,,30,2,、,比较技术,*,目的:,根据,多种测试,结果,,比较,不同系统的优劣,*,方法:,算术平均、几何平均、调和平均方法,(1),算术平均方法,基准测试程序,处理机,,,,X,Y,Z,B,1,20(,1.00,),10(0.50),40(2.00),B,2,40(,1.00,),80(2.00),20(0.50),A,m,,(,1.00,),(1.25),(1.25),基准测试程序,处理机,,,,X,Y,Z,B,1,20(2.00),10(,1.00,),40(4.00),B,2,40(0.50),80(,1.00,),20(0.25),A,m,,(1.25),(,1.00,),(2.13),*,特性:,选择不同的参考机,,A,m,结论不同,回下页,2024/9/11,,31,(2),几何平均方法,基准测试程序,处理机,,,,X,Y,Z,B,1,20(,1.00,),10(0.50),40(2.00),B,2,40(,1.00,),80(2.00),20(0.50),G,m,,(,1.00,),(1.00),(1.00),,特性:,G,m,性能与参考计算机性能无关,,依据,—,G,m,(X,i,)/G,m,(Y,i,)=G,m,(X,i,/Y,i,),基准测试程序,处理机,,,,X,Y,Z,B,1,20(2.00),10(,1.00,),40(4.00),B,2,40(0.50),80(,1.00,),20(0.25),G,m,,(1.00),(,1.00,),(1.00),(3),调和平均方法,,特性:,H,m,最接近,CPU,的实际性能,,依据,—,H,m,与所有测试程序时间总和成反比关系,转上页,2024/9/11,,32,一、,影响,计算机系统结构发展因素,1,、软件对系统结构发展的影响,,*影响因素:,软件可移植性,(1),系列机,*思想:,具有相同系统结构或扩充原系统结构,组成或实现技术不同,来实现软件可移植性,*影响一,:,新,的组成与实现技术很快得到应用,大量兼容产品的出现,,推动,了系统结构的发展,,系列机要求,—,保证向后兼容,,力争向上兼容,,,时间,机器档次,,,,,,,,当前机器,向上兼容,向下兼容,高,低,向后兼容,向前兼容,*,影响二,:,要求,系统结构基本不变,,限制,了系统结构的发展,回下页,第四节 系统,结构的,发展,2024/9/11,,33,(2),模拟与仿真,*,模拟:,用,机器语言,解释来实现软件移植,需模拟目标机指令系统、存储系统、,I/O,系统、,OS,等的操作,*,仿真:,用,微程序,直接解释另一种指令系统,需解释目标机,I/O,系统、,OS,等的操作,*,比较:,解释程序存放位置、是否有硬件参与方面不同;,在解释指令系统、存储系统、,I/O,系统、,OS,方面相同,(3),统一高级语言方法,存在一定的困难,可争取汇编语言或接口,/,技术的统一,*,方案,1,:,采用,统一的中间语言,(,如,Java),,通过解释执行以适应不同的系统结构,*,方案,2,:,采用标准的,开放系统,(,具有可移植性、交互操作性,),,用,硬件抽象层技术,适应不同的系统结构,转上页,2024/9/11,,34,2,、应用对系统结构发展的影响,*,应用背景:,应用领域、功能及性能要求有所不同,,*应用需求:,高速度、大容量、大吞吐率,*,系统结构设计思路:,分成不同级别的系统,以提高性能,/,价格,巨、大型机,—,研究专用系统结构、组成,技术,其它型机,—,研究通用系统结构,(,吸纳先进结构与技术,),*,系统结构发展趋势:,,·,保持价格基本不变,提高,性能,,·,保持性能基本不变,降低价格,,,价格,时间,等性能线,巨型机,大型机,中、小型机,微型机,,,,,,,,,,,,,,*,对系统结构影响:,,专用,系统结构,—,无限制,(,应用是原动力,),,通用,系统结构,—,如何有效实现专用结构→通用结构,2024/9/11,,35,3,、器件对系统结构发展的影响,*,器件使用方法:,,通用片→现场,片→半用户片→用户片,*,对系统结构影响:,,·,器件的发展推动了系统结构与组成技术的发展,,如,—,器件性能、使用方法影响系统结构及组成方法,,器件性,/,价提高,使结构、组成下移速度更快,,器件的发展,推动算法、语言的发展,·,系统结构的发展要求器件不断发展,,如,—,新结构的使用,取决于器件发展能否提供可能,提高器件性能,/,价格,要求改变器件逻辑设计,方法,2024/9/11,,36,二、并行性的发展,,并行性,—,包括,同时性,(,时刻,),、并发,性,(,时段,),*,开发方法:,,时间重叠、资源重复、资源共享,*,并行性等级划分:,,执行程序角度 处理数据角度 信息加工步骤,,操作级,位串字串 存储器操作并行,,指令级,位并字串 处理器操作步骤并行,任务或过程级 位串字并 处理器操作并行,作业或程序级 全并行 任务或作业并行,,,,1,、并行性开发,2024/9/11,,37,2,、并行性发展,用,三种并行性实现方法进行开发,得到如下系统结构树:,标量,顺序的,先行控制,I/E,重叠,功能并行,多个功能部件,流水线,隐式向量,显式向量,存储器,-,存储器,寄存器,-,寄存器,SIMD,MIMD,联想处理机,处理机阵列,多计算机,多处理机,,,,,,,,,,,,,,,,,,计算机系统结构树,空间并行,时间并行,,,2024/9/11,,38,本章思考,1,、系统结构精确定义、包含内容是什么?,与计算机组成和实现的关系是什么?,进行系统结构设计的方法和步骤是什么?,2,、系统结构的分类方法有哪些?,影响系统结构发展的因素又哪些?如何影响的?,3,、系统结构设计的定量原理有哪些?举例说明其应用。
4,、计算机系统的性能指标有哪些?其特点和影响因素是什么?,5,、评价系统性能的方法有哪些?如何比较测量的结果?,6,、并行计算机与单处理器计算机在系统结构上有哪些区别?,影响其性能的因素有哪些?如何评价?,7,、并行性包含的内容是什么?开发并行性的方法有哪些?,系统结构树中结点采用哪些技术可实现变迁?,2024/9/11,,39,Thank you!,2024/9/11,,2024/9/11,,40,。