Cache中TLB的設計及優(yōu)化
- 期刊名字:蘇州大學學報(自然科學版)
- 文件大小:267kb
- 論文作者:孫宏,薛駿,凌青
- 作者單位:東南大學
- 更新時間:2020-09-30
- 下載次數:次
第21卷第1期蘇州大學學報(自然科學版)Vol.21 No.12005年1月JOURNAL OF SUZHOU UNIVERSITY( NATURAL SCIENCE EDITION)Jan. 2005文章編號:000-2073( 2005 )01-0037-06 .Cache中TLB的設計及優(yōu)化孫宏薜駿凌青(東南大學國家專用集成電路系統(tǒng)工程技術研究中心江蘇南京210096)摘要當今微處理器的設計中為了加快虛擬地址向物理地址轉換的速度通常使用地址轉換后備緩沖器TLH translation lokaside buffer來加快地址轉化的速度.本論文基于逆向設計提出了一種可行的TLB結構,可完成地址轉換的功能并從硬件上支持了不同大小的頁表格式.此外通過引入DVS技術將TLB存儲單元中的漏電功耗減少90%以上.關鍵詞Cache TLB地址轉化功耗DVS中圖分類號:TP368.1文獻標識碼:A .0引言TLB是一個用于頁表匹配的高速緩存1].TLB里保存了虛擬頁號及其對應的物理頁號虛擬地址的高位用于在TLB內進行查找輸出相對應的物理頁號,與虛擬地址的低位(偏移量)--起組成物理地址輸出.TLB的使用能極大地加速虛擬地址向物理地址轉換的時間2].本文將給出實現TLB功能的存儲單元電路,判決及位長變換電路,以及數據的輸出流向.完成TLB電路結構的設計后本文使用DVS技術對TLB的靜態(tài)功耗進行優(yōu)化.隨著工藝線寬的縮小,CMOS工藝中的靜態(tài)功耗將大幅提高使用DVS技術能大幅降低靜態(tài)功耗.而且由于供電壓降低動態(tài)功耗也將得到大幅抑制本文僅研究靜態(tài)功耗).1 TLB 的電路設計本文所設計的TLB結構34如圖1所示CAM陣列保存用于比對的虛擬頁號,SRAM1保存頁長為20位的大頁物理地址SRAM2保存頁長為16位的小頁地址,當CAM陣列中的某個表項與進行比對的虛擬頁號相同時,該表項所對應的SRAM陣列輸出相應的物理頁號并發(fā)出命中信號.總體而言本次設計所完成的TLB將包含64個表項從硬件上支持16位或20位的頁面.中國煤化工MYHCNMHG收稿日期2004-09- 02基金項目國家自然科學基金資助項目( 60176018)作者簡孫云( 1981 - )男江蘇太倉人東南大學無線電工程系畢業(yè)現在英國York大學從事容錯系統(tǒng)方面的研究.38蘇州大學學報(自然科學版)第21卷位線8-供電壓式tCAMSRAMISRAM2M6口17|陣列1上T7T⊥5?!?輸入驅動輸入驅動 ][輸入驅動匹配值夢。ME45↑地址標簽命中讀/寫數據亍圖1 TLB 的結構圖2 CAM 單元的結構1.1 存儲單元電路設計需要設計的存儲單元有CAMs和SRAM兩部分CAM陣列保存虛擬頁號與虛擬地址進行比對其單元結構如圖2所示.當結點1的信號與結點4的內部信號進行比對時先把匹配信號線.上拉至高電平若信號相同則匹配信號線保持高電平若信號不同則下拉為低電平. CAM單元的優(yōu)點在于當把幾個不同單元的匹配信號相連就能進行多位比較把不同單元的位線輸入信號相連能夠并行地進行比對.本文中每--列CAM單元前4位的匹配信號線連在-起將其輸出為匹配信號1 ;后16位的匹配信號線連在一起將其輸出為匹配信號2其中匹配信號2將始終參與比對結果的輸出.而通過選擇匹配信號1的有效與否可以選擇用于比對的虛擬頁號是20位還是16位.SRAM陣列用來儲存物理頁號,當TLB命中時輸出其存儲的物理地址;當TLB未命中時,0,SRAM中的某個表項需要與對應的CAM一起更新其中的內容.在本次設計中,對SRAM單元采用雙港口設計[6]對SRAM的讀/寫由兩根字線分別控制.1.2 判決及位長變換電路的實現位長變換電路的實現是通過控制CAM單元中8葉士且6hond2 Lima匹配信號1的有效與否實現的,而判決電路就是能輸出信號表示CAM中匹配與否.$設計時需要注意的一個問題是匹配信號線在電\比對前必須全部上拉為高電平,而此時不能將其用于判決,否則將會使SRAM中多根字線同時導通,bWa導致邏輯出錯.因此必須在CAM比對完后才能對↓SRAM中的字線進行操作.根據以上要求所設計的判決及位長變換電路中國煤化工換電路如圖3所示.圖3中的m、m2信號是CAM陣列給出的匹配信號其.JYHCNMH G表示不匹配;b 是位長控制信號當b=1時m1信號無效,當b=0時,m1信號有效a及a1、a2 信號是來自MMU(存儲器管理單元)的控制信號用于控制判決過程的正確進行. Wa信號為SRAM中控制讀操作的字線命中信號( hit )是比對結果的輸半儔晨.第1期孫宏薛駿凌青Cache中TLB的設計及優(yōu)化39在TLB的64個表項中,每個表項的m\、m2及Wa信號均不相同而控制信號aa小\2、b信號則均連在-起,由MMU進行控制;每個表項的f結點均連在一起整個TLB只有一個hit信號.在導出Cadence中如圖3所示電路的網表文件后,在 Hspice中對其進行仿真獲得如圖4所示時序圖:VVQhit)ξV(m)10300~50t/ms圖4 TLB 時序仿真由圖4可見仿真結果完全符合設計電路時所作分析.hit 與m、m2、b滿足以下關系:hit=m;(b+m1 )1.3 TLB數據的輸出流向當處于小頁模式時虛擬地址中有20位參與比對傳輸門TG1、TG2關閉,TG3導通SRAM2的20位輸出輸入到寫緩沖的高20位作為物理頁號而虛擬地址的低12位輸入到寫緩沖的低12位,作為偏移量,兩者-起組成物理地址.當處于大頁模式時,虛擬地址中僅有16 位參與比對傳輸門TG1、TG2導通,TG3關閉SRAM的16位輸出輸入到寫緩沖的高16位作為物理頁號虛擬地址的[15:12通過TG1后與虛擬地址的低12位-起輸入到寫緩沖的低16位,作為16位的偏移量.具體的數據流向如圖5所示.C虛擬地址16 151211430CAM TAG物理地址3寫緩沖;?命中SRAMI16位t +F2]PAI5:01DATA[1S:0]SRAM2→3→“20位DATA[19:16]20位圖5 TLB 的數據中國煤化工MHCNMHG2性能優(yōu)化一 低功耗設計本文使禺DYS技術減少TLB的靜態(tài)功耗.DVS技術的核心思想是為每根Cache線設置兩個不同的供l0蘇州大學學報(自然科學版)第21卷電壓,一個為正常的供電壓,而另-個則作為睡眠電壓.在大部分時間內,Cache中大部分的表項處于睡眠狀態(tài)而當對Cache進行讀寫操作時再將供電壓.上拉為正常電壓(否則會破壞內部存儲的信號).本文將對CAM陣列和SRAM陣列分別進行優(yōu)化.2.1 關于CAM陣列的優(yōu)化設計由于CAM單元在比對時并不與外部信號直接連接,因此在低電壓下進行比對不會破壞單元存儲的內部信號所以可以直接降低CAM單元中導向器對的供電壓.由導向器結構可知當供電壓縮小到1.5Vr時仍可以保存所存儲的信息但是需要注意的是使匹配信號線降為低電平所需要的時間不能過長,否則將嚴重影響系統(tǒng)速度甚至造成功能錯誤.而匹配信號線在內容匹配的時候,他需要能保持高電平.根據一般嵌 入式Cache的特征假設其匹配信號線的正常供電壓為3.3V頻率為60MHz則我們所設置的睡眠電壓必須滿足:當所存儲的信息與外部信息不匹配時使匹配信號線上的電壓在15ns內下降至1. 5V以下方可視為合格.匹配信號線下拉的速度與實際電路中匹配信號線的寄生電容有關寄生電容越大下拉速度越慢而寄生電容越小則保持高電平的能力會降低.--般而言,匹配信號線上通常只有0.001pF數量級的寄生電容.為了增強電路的魯棒性確保電路在最壞情況下正常工作在仿真比對結果為不匹配考查匹配信號線下拉速度時使用的寄生電容定義為0.1pF而在仿真比對結果為匹配考查匹配信號線保持高電平能力時使用的寄生電容為0.001pF.仿真結果表明在睡眠電壓為0.6V的情況下電路性能依然良好.圖6為睡眠電壓為0.6V時的仿真結果.用于仿真的模型為圖2所示的CAM單元所使用的工藝庫是新加坡CharteredSemi-conductor Manufacturing的0.25um的工藝庫.由圖6可見當存儲的信息與外部比對的信息相同時,匹配信號在20ns的時間內仍然保持了3.24V以上的高電壓不會造成邏輯錯誤.網0-113.3V3s.-0.2V4)-0.4V間331V7)3:2121620~t/as圖6在睡眠電壓為0. 6V中國煤化工由圖7可見當存儲的信息與外部比對信息不相同時內降到了1. 1V在6nsYHCNMHG的時間內降到了接近于0.對導向器對管進行了優(yōu)化前后的靜態(tài)功耗測定在優(yōu)化前使用3.3V的供電壓時漏電功耗為2.19x10- "w.在使用優(yōu)化后將供電壓降低到1.1V后漏電功耗為7.25x 10 - 13w.可見優(yōu)化后的漏電功耗僅為優(yōu)化前的乃方數據第1期孫宏薛駿凌青Cache中TLB的設計及優(yōu)化t113.373.3--6.7V(2)V間ξ -0.2V4)-0.41V(5)V6)V7)2410~1214t/ns圖7 在睡眠電壓為0. 6V下的性能(未命中)2.2關于SRAM陣列的優(yōu)化設計由于僅當表項匹配或者需要寫入新內容時SRAM陣列才打開NMOS管,與外部發(fā)生電源線聯(lián)系其余時間NMOS管均關斷.因此,可以考J正常電壓-門慮在平時將SRAM單元的內部供電壓置為睡眠7休眠電壓工 5SRAM廠七丁狀態(tài)而僅當表項匹配,需要將存儲的信息讀出或者需要更新表項內容將信息寫入SRAM休眠倌號Wb單元時才將內部供電壓上拉至正常模式并且W保持在此高電平模式.每隔若干個時鐘周期一般為2000周期)將所有的SRAM的供電壓均圖8雙港口SRAM使用的DVS電路置為睡眠狀態(tài).這樣,根據程序的局部性原理,在大部分時間內只有少數表項工作在正常狀態(tài),而大多數表項則在大部分時間內工作在睡眠狀態(tài).在本次設計中考慮使用字線Wa和字線Wb對SRAM的供電壓進行選擇.當比對匹配,需要讀出信息或者是字線Wb為高電平需要寫入信息時才將SRAM的供電壓置為正常模式,否則就將其置為睡眠狀態(tài).為實現.上述功能所作電路圖如圖8及圖9所示.設置休眠T]休眠信號0]休眠信號1 .....i 休眠信號63中國煤化工MH.CNMHGWb0-4[ Wa0H [Wb1-+”Wa1- PWb63-- [Wa63Hh古↓圖9控制電路42蘇州大學學報(自然科學版)第21卷在如圖8所示DVS電路中當休眠信號為高電平時通過組合電路將把休眠電壓傳送給SRAM的電源線,處于低功耗狀態(tài)當休眠信號為低電平時,該電路把正常電壓傳給SRAM的電源線,SRAM將處于正常工作模式.該休眠信號為邊沿觸發(fā).當處于低功耗狀態(tài)時字線將無法選通,以防止低功耗時字線選通后對內部邏輯的破壞.由于喚醒電路是Wa與Wb的或邏輯,因此將喚醒電路的控制電路設計成如圖9所示當輸入Wa或Wb為高電平時將把輸出休眠信號下拉至0.在如圖9所示的控制電路中當設置休眠信號為低電平時其控制的N管關斷,從而使Wa、Wb信號無效防止短路淇控制的P管導通將每個表項的休眠信號均置為高電平,從而使每個表項均進入低功耗的睡眠狀態(tài).當設置休眠信號為高電平時其控制的P管關斷,N管導通每個表項的休眠信號均由該表項的Wa、Wb信號控制根據Wa和Wb的值決定是繼續(xù)保持睡眠狀態(tài)還是將其轉到正常工作模式.在睡眠電壓的設置方面,--般把睡眠電壓設置成1.5VT即可.由于程序的局部性原理在大部分時間內大部分表項將處于睡眠狀態(tài),因此可以預測DVS技術在SRAM中的運用也將取得良好的優(yōu)化效果.3總結及展望TLB在地址轉換過程中發(fā)揮著極其重要的作用本次設計給出了實現TLB的電路結構驗證了其結果的正確性.在下一步的設計當中,可以考慮進一步考查TLB與MMU的關系通過TLB內部的硬件結構實現邏輯功能進-步加快地址轉換速度.本次設計中對漏電功耗的優(yōu)化將漏電功耗降低到一個很低的比例事實上源電壓的降低對動態(tài)功耗也有很大的抑制在今后的工作中也可以對這方面進行深入考查.參考文獻:[1] William Sallings.,計算機組織與結構一性 能設訊[ M]北京電子工業(yè)出版社2001.[2]孟靜. 操作系統(tǒng)教程-原理和實例分析M]北京高等教育出版社, 2001.[3] RABAEY J M.數字集成電路設計透視M]北京清華大學出版社, 1998.[4] FURBER S. ARM SoC體系結構[ M ]北京北京航空航天大學出版社,2002.[5]黃正瑾.計算機結構與邏輯設訊[ M]北京高等教育出版社,2001.[6] 李偉華. VLSI設計基礎M]北京電子工業(yè)出版社, 2002.Design and optimize of the TLB in CacheSUN Hong XUE Jun ,LING Qing( National ASIC System Engineering Research Center , Southeast Univ. , Nanjing 210096 , China )中國煤化工Abstract :In nowadays' microprocessor design , the TLB is wi.MYHCNMH Gtranslation speed fromvirtual address to physical address. Based on the adverse design , an applicable TLB structure supporting the dif-ferent page sizes besides the address translation is proposed. In addition ,a DVS technology is used reducing theleakage power in the TLB' s memory cells by 90% .Key word5方數據;TLB address translation ipower :DVS(責任編輯周建蘭)
-
C4烯烴制丙烯催化劑 2020-09-30
-
煤基聚乙醇酸技術進展 2020-09-30
-
生物質能的應用工程 2020-09-30
-
我國甲醇工業(yè)現狀 2020-09-30
-
JB/T 11699-2013 高處作業(yè)吊籃安裝、拆卸、使用技術規(guī)程 2020-09-30
-
石油化工設備腐蝕與防護參考書十本免費下載,絕版珍藏 2020-09-30
-
四噴嘴水煤漿氣化爐工業(yè)應用情況簡介 2020-09-30
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-09-30
-
甲醇制芳烴研究進展 2020-09-30
-
精甲醇及MTO級甲醇精餾工藝技術進展 2020-09-30






