當(dāng)前位置首頁 > 計算機(jī) > 并行計算/云計算
搜柄,搜必應(yīng)! 快速導(dǎo)航 | 使用教程

并行計算機(jī)體系結(jié)構(gòu)簡介

文檔格式:PPT| 38 頁|大小 504KB|積分 9.9|2024-10-26 發(fā)布|文檔ID:248944970
第1頁
第2頁
第3頁
下載文檔到電腦,查找使用更方便 還剩頁未讀,繼續(xù)閱讀>>
1 / 38
此文檔下載收益歸作者所有 下載文檔
  • 版權(quán)提示
  • 文本預(yù)覽
  • 常見問題
  • 單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,*,第11章 并行計算機(jī)體系結(jié)構(gòu)簡介,并行技術(shù)是針對大型機(jī)和巨型機(jī)的:,第一種:多處理器(一個處理器指一個單片,CPU,芯片),第二種:多機(jī)組成,目前通常把后者并行技術(shù)稱為并行計算機(jī)體系結(jié)構(gòu)11.1 并行計算機(jī)結(jié)構(gòu)分類,并行計算機(jī)系統(tǒng)可以分成兩大類:,SIMD,系統(tǒng)和,MIMD,系統(tǒng)SIMD,(,Single Instruction Multiple Data,),計算機(jī)可以同時在多個數(shù)據(jù)集上并行執(zhí)行同一條指令這種類型計算機(jī)包括陣列處理系統(tǒng)和向量處理機(jī)MIMD,(,Multiple Instruction Multiple Data,),計算機(jī)可以同時執(zhí)行多條指令并同時處理多數(shù)據(jù)集,它是目前并行技術(shù)的主流MIMD,計算機(jī)又分成多處理器系統(tǒng)和多計算機(jī)系統(tǒng)兩大類如圖,11,1,所示圖,11,1,并行計算機(jī)分類,11.2,SIMD,并行計算機(jī),SIMD,計算機(jī):用于解決使用向量和陣列這樣比較規(guī)整的數(shù)據(jù)結(jié)構(gòu)的復(fù)雜的科學(xué)計算和工程計算問題這種計算機(jī)特點:只有一個控制單元,每次只能執(zhí)行一條指令,但是每一條指令可同時對多個數(shù)據(jù)進(jìn)行操作。

    SIMD,分為:陣列處理機(jī)和向量處理機(jī)1.陣列處理機(jī)(,array processor),特點:一個單一的控制單元提供信號驅(qū)動多個處理單元同時運(yùn)行,如圖,11,2,所示組成:,PU,由,1,個處理單元,PE,同它的局部存儲器組成控制部件方式:向全體,PE,“,播送”控制信號,所有,PE,在同一個總的時鐘信號下同步工作PE,組成:,可以簡單到每個,PE,由,1,位,ALU,組成,也可大到,32,位,ALU,,,或者帶浮點計算能力的,ALU,圖,11,2,陣列處理機(jī)組成圖,2.向量處理機(jī),SIMD,計算機(jī)中另一類是向量處理機(jī)(,vector processor)70,年代前后,為了處理向量計算研發(fā)兩種類型的巨型計算機(jī)系統(tǒng):流水線處理機(jī)和并行處理機(jī)兩者比較優(yōu)缺點:并行處理機(jī)的結(jié)構(gòu)復(fù)雜,成本高,因而流水線處理機(jī)發(fā)展很快它是處理向量計算的主要手段,因此已把它稱為向量處理機(jī)向量運(yùn)算舉例,假定有一個向量運(yùn)算:,D=A(B+C),式中,A,B,C,D,都是長度為,N,的向量若按常規(guī)處理,則流水線不能連續(xù)流動D1=A1(B1+C1),D2=A2(B2+C2),DN=AN(BN+CN),計算這個向量流水線要反復(fù)進(jìn)行加法和乘法的切換,即流水線功能切換。

    如改變處理順序,先對所有元素執(zhí)行加法運(yùn)算(,N,個加法),然后對所有元素執(zhí)行乘法運(yùn)算(,N,個乘法),其順序如下:,B,i,+C,i,D,i,(i,從1到,N),D,i,A,i,D,i,(i,從1到,N),這樣就能保證流水線暢通Cray,1,的體系結(jié)構(gòu)與后來的,RISC,體系結(jié)構(gòu)類似,它成為了很好的研究范例,許多現(xiàn)代的向量超級計算機(jī)都受到它的影響圖,11,3,Cray,1,體系結(jié)構(gòu),Cray,1,機(jī)采用多功能部件結(jié)構(gòu),一共有,12,個功能部件,分為,4,組:,3,個向量整數(shù)單元部件(加、邏輯、移位),,3,個浮點標(biāo)量,/,向量浮點單元部件(加、乘、求倒數(shù)),,4,個標(biāo)量整數(shù)單元部件(加、邏輯、移位、“,1,”個數(shù)計數(shù)),,2,個地址功能部件(加、乘)這些功能部件本身都采取流水線結(jié)構(gòu),只要不發(fā)生寄存器沖突,這些功能部件都能并行工作11.3,MIMD,并行計算機(jī),MIMD,系統(tǒng)可以分為多處理器系統(tǒng)和多計算機(jī)系統(tǒng)兩大類多處理器系統(tǒng)特點:所有,CPU,共享同一個物理內(nèi)存,每個,CPU,不帶自己的內(nèi)存或少量帶有,由統(tǒng)一操作系統(tǒng)管理,整個物理內(nèi)存空間由許多內(nèi)存模塊組成多計算機(jī)系統(tǒng)特點:每個,CPU,都有自己的內(nèi)存,即自己獨立的物理地址空間;執(zhí)行自己的操作系統(tǒng),再加上對外通信的通信處理器。

    圖,11,4,a,和圖,11,4,b,分別說明了多處理器系統(tǒng)與多計算機(jī)系統(tǒng)的區(qū)別多處理器系統(tǒng)特點:軟件設(shè)計簡單,易實現(xiàn),硬件設(shè)計比較復(fù)雜多計算機(jī)系統(tǒng)特點:正好相反圖,11,4,a,多處理器系統(tǒng),圖,11,4,b,多計算機(jī)系統(tǒng),MIMD并行計算機(jī)設(shè)計中的互連網(wǎng)絡(luò)問題,MIMD并行計算機(jī)設(shè)計中面臨的問題之一:互連網(wǎng)絡(luò)多計算機(jī)系統(tǒng)中用互連網(wǎng)絡(luò)把多個計算機(jī)連接是顯而易見的,多處理器系統(tǒng)同樣存在這個問題11.3.1,多處理器系統(tǒng),根據(jù)共享內(nèi)存的實現(xiàn)方式可以把多處理器系統(tǒng)分成三類:,分別是一致性內(nèi)存訪問(,Uniform Memory Access,UMA,),非一致性內(nèi)存訪問(,Non Uniform Memory Access,NUMA,),基于,cache,的內(nèi)存訪問(,Cache Only Memory Access,COMA,),1.,UMA,多處理器系統(tǒng),UMA,計算機(jī)的特點是,CPU,訪問所有的內(nèi)存模塊的時間都相同,即讀取每個內(nèi)存字的時間是相等的訪問速度按最慢內(nèi)存模塊為準(zhǔn)程序員不會感覺有速度問題存在,這就是一致的含義這種一致性可以保證系統(tǒng)的性能可以預(yù)測,也有利于程序員編寫高效率代碼如圖,11,5,所示,圖,11,5,基于總線的多處理器系統(tǒng),每個,CPU,都帶有,Cache,,,當(dāng)同時操作內(nèi)存中某一塊數(shù)據(jù)時,會出現(xiàn),Cache,一致性問題。

    例如,,CPU1,與,CPU2,同時讀取內(nèi)存中一塊數(shù)據(jù)到自己的,Cache,中,,CPU1,先對,Cache,內(nèi)容進(jìn)行了修改,此后,CPU2,讀自己,Cache,中數(shù)據(jù)就已成為舊內(nèi)容,因為,CPU1,修改自己的,Cache,后還沒有寫回內(nèi)存,而,CPU2,讀的數(shù)據(jù)相對,CPU1,來講是舊數(shù)據(jù)解決,Cache,一致性問題有兩種方法,一種是監(jiān)聽型的,Cache,(,本書不再詳述,請查閱有關(guān)書籍),另一種是“,MESI,”,Cache,一致性協(xié)議MESI,協(xié)議是一種比較常用的寫回,Cache,一致性協(xié)議,它是用協(xié)議中用到的四種狀態(tài)的首字母(,M、E、S、I),來命名的目前,,Pentium 4,和許多其他的,CPU,都使用了,MESI,協(xié)議來監(jiān)聽總線每個,Cache,項都處于下面四種狀態(tài)之一:,(1)無效(,Invalid),該,Cache,項包含的數(shù)據(jù)無效2)共享(,Shared),多個,Cache,中都有這塊數(shù)據(jù),內(nèi)存中的數(shù)據(jù)是最新的3)獨占(,Exclusive),沒有其他,Cache,包括這塊數(shù)據(jù),內(nèi)存中的數(shù)據(jù)是最新的4,)修改(,Modified,),該項的數(shù)據(jù)是有效的,內(nèi)存中的數(shù)據(jù)是無效的,而且在其他,Cache,中沒有該數(shù)據(jù)項的拷貝。

    2.,NUMA,多處理器系統(tǒng),NUMA,系統(tǒng)也為所有,CPU,提供單一的地址空間,與,UMA,不同處是靠近,CPU,的內(nèi)存模塊的訪問速度比其他的內(nèi)存模塊快得多NUMA,計算機(jī)的主要特點:,(1)所有的,CPU,都看到一個單一的地址空間2)使用,LOAD,和,STORE,指令訪問遠(yuǎn)程內(nèi)存3,)訪問遠(yuǎn)程內(nèi)存比訪問本地內(nèi)存慢NUMA,計算機(jī)也存在,Cache,一致性問題,除前面介紹過的,MESI,協(xié)議外,還有一個,SCI,(,Scalable Coherent Interface,,,可伸縮的一致性接口)的,Cache,一致性協(xié)議3.,COMA,多處理器系統(tǒng),在,COMA,系統(tǒng)中,把每個,CPU,的主存看成,Cache,來處理,物理地址空間被劃分成,Cache,塊,這些塊根據(jù)需要在系統(tǒng)中來回移動,,Cache,塊不再有宿主計算機(jī)了它要解決的新問題:如何對,Cache,塊進(jìn)行尋址和,Cache,塊丟棄了最后一個拷貝怎么辦COMA,系統(tǒng)號稱比,NUMA,有更好的性能,但實際建造的,COMA,系統(tǒng)很少11.3.2 多計算機(jī)系統(tǒng),多處理器系統(tǒng)的缺點:規(guī)模擴(kuò)展受到限制,通常百個左右,CPU,規(guī)模,同時要用大量硬件實現(xiàn),它的最大規(guī)模是幾百個,CPU,以內(nèi)。

    多計算機(jī)系統(tǒng)的特點:每個,CPU,都有自己的私有內(nèi)存,,CPU,不能訪問其他,CPU,內(nèi)存,不能再用,LOAD,和,STORE,指令訪問任意內(nèi)存模塊,而要用,send,和,receive,這樣的原語相互傳遞消息每個結(jié)點通過高性能互連網(wǎng)絡(luò)連接起來,圖,11,6,多計算機(jī)系統(tǒng)結(jié)構(gòu),多計算機(jī)系統(tǒng)一般分成兩大類:,MPP,和,COW1.MPP,大規(guī)模并行處理機(jī)(,Massively Parallel Processor),這是一種價值數(shù)百萬到上億美元的超級計算機(jī)系統(tǒng)MPP,系統(tǒng)已取代了原有,SIMD,計算機(jī)、向量超級計算機(jī)和陣列處理機(jī),成為當(dāng)今大型機(jī)、巨型機(jī)的主流大多數(shù)的,MPP,系統(tǒng)都使用標(biāo)準(zhǔn)的,CPU,作為它們的處理器大的系統(tǒng)都使用幾百片以上的,CPU,集合而成,巨型機(jī)使用幾千片,CPUMPP,有三大特點,第一為它使用了高性能的私用的互連網(wǎng)絡(luò),可以在低時延和高帶寬的條件下傳遞消息另一特點是它們具有強(qiáng)大的輸入輸出能力第三個特點是如何進(jìn)行容錯在使用數(shù)千個,CPU,的情況下,每星期有若干,CPU,失效是常見的事情如果,因一個,CPU,失效,而導(dǎo)致運(yùn)行一天的任務(wù)被中止是不能容忍的MPP,系統(tǒng)還需要使用大量定制的軟件和庫。

    2.,COW,工作站集群(,Cluster of Workstation),它是另一種多計算機(jī)系統(tǒng),也被稱為工作站網(wǎng)絡(luò)COW,系統(tǒng)是由數(shù)百臺,PC,機(jī)或者工作站通過商用網(wǎng)絡(luò)連接在一起構(gòu)成的COW,系統(tǒng)主要有兩種:集中式和分散式,集中式的,COW,是裝在一個大機(jī)架上的工作站或者,PC,機(jī)的集群,這些計算機(jī)都是同構(gòu)的,而且除了網(wǎng)卡和磁盤之外沒有其他的外設(shè)這是當(dāng)今第五代計算機(jī)的模型11.3.3,集群機(jī)系統(tǒng),Cluster,1.Cluster簡介,計算機(jī)體系結(jié)構(gòu)的研究就是當(dāng)時的超級計算機(jī)的研究,超級計算機(jī)共經(jīng)歷了五代第一代為早期的單芯片系統(tǒng),第二代為向量處理系統(tǒng),第三代為大規(guī)模并行處理系統(tǒng),第四代為共享內(nèi)存處理系統(tǒng),第五代為集群系統(tǒng),目前全球五百強(qiáng)超級計算機(jī)排名已經(jīng)有半數(shù)以上是集群式系統(tǒng)第三代計算機(jī)(,MPP,)與第五代計算機(jī):,相同:(,Cluster,)在體系結(jié)構(gòu)上是同構(gòu)的,同屬于分布式內(nèi)存處理方式(,DMP,Distributed Memory Processing,),差別:是否采用物美價廉的普通商品組件MPP,與,Cluster,從互連角度看,區(qū)別在于,MPP,使用專用高性能互連網(wǎng)絡(luò),而,Cluster,使用商用網(wǎng)絡(luò)。

    從,CPU,角度看,MPP,要用單獨設(shè)計的高性能處理器,而,Cluster,采用高性能成品處理器,從價格方面看,,MPP,比,Cluster,要貴的多集群機(jī)系統(tǒng)的主要生命力來自其經(jīng)濟(jì)有效性,它采用高性能的普通日用品,IA,芯片、公開系統(tǒng)的主板、免費(fèi)的公開源碼操作系統(tǒng)與并行編程接口,使超級計算機(jī)系統(tǒng)的造價告別了天文數(shù)字,讓具有一般規(guī)模的公司都用的起基于集群機(jī)特點,它的規(guī)??纱罂尚?.Linux集群的特點,集群機(jī)根據(jù)采用的,操作系統(tǒng)不同而稱為某某集群,例如采用,Linux,就稱為,Linux,集群,采用,UNIX,就稱為,UNIX,集群下面介紹,Linux,集群的特點Linux,集群可分為三類:,第一類是高可用性集群,運(yùn)行于兩個或多個節(jié)點上,目的是在系統(tǒng)出現(xiàn)某些故障的情況下,仍能繼續(xù)對外提供服務(wù)第二類是負(fù)載均衡集群,目的是提供和節(jié)點個數(shù)成正比的負(fù)載能力,這種集群很適合提供大訪問量的,Web,服務(wù)第三類是超級計算集群,按照計算關(guān)聯(lián)程度的不同,又可以分為兩種一種是任務(wù)片方式,要把計算任務(wù)分成任務(wù)片,再把任務(wù)片分配給各節(jié)點,在各節(jié)點上分別計算后再把結(jié)果匯總,生成最終計算結(jié)果另一種是并行計算方式,節(jié)點之間在計算過程中大量地交換數(shù)據(jù),可以進(jìn)行具有強(qiáng)耦合關(guān)系的計算。

    CSM,包含多種組件,使,Linux,群集的管理更加容易:,分布式管理服務(wù)器,事件應(yīng)答資源管理器遠(yuǎn)程硬件控制,配置文件管理,分布式,Shel。

    點擊閱讀更多內(nèi)容
    最新文檔
    傳統(tǒng)文化道德不是高懸的明月而是腳下的星光.pptx
    世界無煙日關(guān)注青少年成長健康無煙為成長護(hù)航.pptx
    五四青年節(jié)詩詞贊歌五四青年自強(qiáng)不息.pptx
    XX學(xué)校班主任培訓(xùn)用心管理慧做班主任.pptx
    拒絕熬夜健康養(yǎng)生規(guī)律作息遠(yuǎn)離亞健康.pptx
    兒童成長手冊時光里的童真印記.pptx
    幼兒園夏季傳染病預(yù)防指南預(yù)見夏天健康童行夏季傳染病預(yù)防科普.pptx
    高中生心理健康教育主題班會快樂學(xué)習(xí)高效學(xué)習(xí)正視壓力學(xué)會減壓.pptx
    員工職業(yè)道德與職業(yè)素養(yǎng)培訓(xùn)遵守職業(yè)道德提高職業(yè)修養(yǎng).pptx
    2025職業(yè)病防治法宣傳周健康守護(hù)職防同行.pptx
    XX幼兒園防災(zāi)減災(zāi)安全教育臨災(zāi)不亂安全童行學(xué)會保護(hù)自己.pptx
    在2025年縣教育工作大會暨高考備考工作推進(jìn)會上的講話發(fā)言材料.docx
    在2025年縣全面從嚴(yán)治黨和黨風(fēng)廉政會議上的講話發(fā)言材料.docx
    在2025年全市慶祝“五一”暨勞動模范表彰大會上的講話發(fā)言材料多篇.docx
    2025年稅務(wù)局青年代表在五四青年座談會上的發(fā)言材料3篇.docx
    在2025年市委全體會議上的主持講話發(fā)言材料.docx
    2025年黨風(fēng)廉政建設(shè)工作要點材料.docx
    在2025年全市青年干部慶祝五四青年節(jié)大會上的講話發(fā)言材料多篇.docx
    在入黨積極分子培訓(xùn)班上的講話發(fā)言材料.docx
    縣文旅局黨組書記在五一假期及夏季旅游安全生產(chǎn)工作部署會議上的講話發(fā)言材料.docx
    賣家[上傳人]:chenhao
    資質(zhì):實名認(rèn)證