英特爾® 至強(qiáng)® 6:專為 AI 和分析工作負(fù)載而構(gòu)建
搭載 P-core(性能核)的英特英特爾®至強(qiáng)® 6900 系列處理器現(xiàn)已推出。從計(jì)算密集型人工智能和高性能計(jì)算用例到關(guān)鍵任務(wù)關(guān)系數(shù)據(jù)庫和分析應(yīng)用程序,爾至而構(gòu)對數(shù)據(jù)中心性能的強(qiáng)專需求從未如此之強(qiáng)烈。英特爾®至強(qiáng)® 6 處理器旨在為 IT 團(tuán)隊(duì)提供面向各種工作負(fù)載的分析負(fù)載有針對性的增強(qiáng)功能,它主要借助于兩種產(chǎn)品線:P-core(性能核)和 E-core(能效核)。工作
P-core(性能核)采用超線程內(nèi)核,英特內(nèi)置矩陣引擎可加速計(jì)算密集型人工智能、爾至而構(gòu)高性能計(jì)算和數(shù)據(jù)服務(wù)工作負(fù)載,強(qiáng)專而 E-core(能效核)則省去了矩陣引擎,分析負(fù)載以支持更高的工作單線程內(nèi)核密度。
所有英特爾®至強(qiáng)®6處理器,英特?zé)o論是爾至而構(gòu)P-core(性能核)還是E-core(能效核),都采用相同的強(qiáng)專指令集、BIOS和內(nèi)置I/O加速器,分析負(fù)載包括英特爾®數(shù)據(jù)保護(hù)與壓縮加速技術(shù)(英特爾®QAT),工作英特爾®Data Streaming Accelerator(英特爾®DSA),英特爾®In-Memory Analytics Accelerator(英特爾®IAA)和英特爾®Dynamic Load Balancer(英特爾®DLB)。
它們還支持相同的驅(qū)動(dòng)程序、操作系統(tǒng)和應(yīng)用程序,以及數(shù)據(jù)中心所依賴的相同可靠性、可用性和可維護(hù)性 (RAS) 功能。
探索具有P-core(性能核)優(yōu)勢的英特爾®至強(qiáng)® 6 處理器
企業(yè)希望在部署用于語言、視覺和圖像識別以及推薦系統(tǒng)的最先進(jìn)人工智能模型時(shí)節(jié)省資金和時(shí)間,并從高性能計(jì)算驅(qū)動(dòng)的模擬和高級分析中獲得更深入的見解。采用 P-core(性能核)的英特爾®至強(qiáng)® 6 處理器通過提供大量具有創(chuàng)新矩陣和向量引擎以及超高內(nèi)存和 I/O 帶寬的高性能內(nèi)核,使企業(yè)能夠抓住這些機(jī)遇。
為廣泛的工作負(fù)載實(shí)現(xiàn)高性能
采用 P-core(性能核)的英特爾®至強(qiáng)® 6 處理器,每個(gè)插槽可靈活擴(kuò)展至 128 個(gè)內(nèi)核、12 個(gè)內(nèi)存通道和 96 個(gè) PCIe 通道,幫助企業(yè)滿足不同的應(yīng)用需求。對于希望緩解內(nèi)存帶寬瓶頸的 IT 團(tuán)隊(duì)來說,創(chuàng)新的多路合并陣列 (MRDIMM) 可提供高達(dá)每秒 8,800 兆 (MT/s) 的傳輸速度,同時(shí)通過快速完成工作來降低總體擁有成本。內(nèi)置加速器為目標(biāo)工作負(fù)載提供額外的提升,實(shí)現(xiàn)更高的性能和效率。
利用CPU 的強(qiáng)大 AI 性能
采用 P-core(性能核)的英特爾®至強(qiáng)® 6 處理器旨在支持許多要求嚴(yán)苛的 AI 用例。P-core(性能核)通過英特爾® Advanced Matrix Extensions(英特爾® AMX)等加速功能,擴(kuò)大了英特爾在內(nèi)置 AI 領(lǐng)域四代產(chǎn)品的領(lǐng)先優(yōu)勢,目前支持 int8、BF16 和 FP16(新)數(shù)據(jù)類型。因此,P-core(性能核)可幫助滿足從目標(biāo)檢測到中型 GenAI 等多種人工智能模型的服務(wù)級別協(xié)議 (SLA),同時(shí)提供開放標(biāo)準(zhǔn)、高性能、RAS 功能,并根據(jù)需要支持其他加速器。
優(yōu)化通用工作負(fù)載的性能
采用 P-core(性能核)的英特爾®至強(qiáng)® 6 處理器在全范圍工作負(fù)載上表現(xiàn)出色,其主流系列產(chǎn)品擁有 8-86 個(gè)內(nèi)核,在基于雙 CPU 的系統(tǒng)中,網(wǎng)絡(luò)和存儲(chǔ)外接卡擁有多達(dá) 176 個(gè) PCIe 5.0 通道,而基于單 CPU 的系統(tǒng)中,單插槽產(chǎn)品則擁有 136 個(gè) PCIe 通道。所有英特爾®至強(qiáng)® 6 處理器都能隨著服務(wù)器利用率的增加而提供可擴(kuò)展的每瓦性能,在整個(gè)負(fù)載線路上提供近乎線性的功耗-性能消耗,這凸顯了所有英特爾®至強(qiáng)® 6 處理器的高效性。對于性能要求苛刻的工作負(fù)載,這意味著平臺(tái)在高負(fù)載下有效地利用能耗,以幫助快速完成工作。
Performance-core(性能核)工作負(fù)載性能優(yōu)勢:
與第五代英特爾® 至強(qiáng)® 處理器相比:
● 借助英特爾® AMX,Llama2 性能提升高達(dá) 3 倍
● HammerDB MySQL 性能提升高達(dá) 2 倍
● 利用 MRDIMM,HPCG 基準(zhǔn)測試的性能提升高達(dá) 2.5 倍
與第二代英特爾®至強(qiáng)® 處理器相比:
● 采用 INT8 的 ResNet – 50 BSX 的性能提升高達(dá) 17 倍
與競爭對手相比:
● 與 AMD EPYC 相比,借助 MRDIMM 的 AI 推理性能提升高達(dá) 5.5 倍
利用增強(qiáng)的安全功能跟上業(yè)務(wù)增長的步伐
在本地、邊緣和云服務(wù)器上追求新的業(yè)務(wù)模式和數(shù)據(jù)共享,即使在處理敏感數(shù)據(jù)或受監(jiān)管數(shù)據(jù)時(shí)也是如此?;诳尚艌?zhí)行環(huán)境 (TEE) 的機(jī)密計(jì)算能夠幫助在使用過程中保護(hù)數(shù)據(jù)和 AI 模型。采用 P-core(性能核)的英特爾®至強(qiáng)® 6 處理器允許客戶選擇最符合其業(yè)務(wù)和監(jiān)管要求的機(jī)密計(jì)算技術(shù)。
應(yīng)用程序隔離:英特爾® Software Guard Extensions(英特爾® SGX)提供旨在保護(hù)使用中數(shù)據(jù)的應(yīng)用程序隔離。英特爾® SGX 是目前市場上研究和更新最多的數(shù)據(jù)中心機(jī)密計(jì)算技術(shù)。
虛擬機(jī)(VM) 級隔離:英特爾® Trust Domain Extensions(英特爾® TDX) 在虛擬機(jī)級別提供隔離和機(jī)密性。在基于英特爾® TDX 的機(jī)密虛擬機(jī)中,客戶機(jī)操作系統(tǒng)和虛擬機(jī)應(yīng)用程序被隔離開來,無法被云端主機(jī)、虛擬機(jī)管理程序和平臺(tái)的其他虛擬機(jī)訪問。
增強(qiáng)針對P-core(性能核)優(yōu)化的目標(biāo)工作負(fù)載
為 AI 、高性能計(jì)算和關(guān)系數(shù)據(jù)庫等用例管理計(jì)算密集型工作負(fù)載的 IT 決策者,將從部署采用 P-core(性能核)的英特爾®至強(qiáng)® 6 處理器中獲得最大收益。增加對 MRDIMM 內(nèi)存的支持,還有助于緩解超大內(nèi)存占用的內(nèi)存數(shù)據(jù)庫或大型語言模型 (LLM) 等用例的內(nèi)存訪問限制。
加速AI 工作流程,以保持競爭力
采用 P-core(性能核)的英特爾®至強(qiáng)® 6 處理器由于配備了增強(qiáng)的內(nèi)核、更大的內(nèi)存帶寬和強(qiáng)大的矩陣引擎,可提供充足的算力,以支持中小規(guī)模生成式人工智能模型的推理、微調(diào)和檢索增強(qiáng)生成 (RAG) 用例。此外,針對英特爾®至強(qiáng)® 處理器的優(yōu)化已集成到 TensorFlow 和 PyTorch 等在內(nèi)的流行深度學(xué)習(xí)框架的主流發(fā)行版。
管理日益復(fù)雜的高性能計(jì)算和模擬
除內(nèi)置矩陣引擎外,采用 P-core(性能核)的英特爾® 至強(qiáng)® 6 處理器還具有英特爾® Advanced Vector Extensions 512(英特爾® AVX-512),可加速科學(xué)模擬中常見的基于矢量的數(shù)學(xué)運(yùn)算。由該平臺(tái)提供支持的集群可幫助釋放 3D 渲染、科學(xué)研究、金融模擬和計(jì)算機(jī)輔助工程的威力,以加快取得成果。
將基礎(chǔ)架構(gòu)和存儲(chǔ)優(yōu)化提升到新的水平
由于 P-core(性能核)和 E-core(能效核)共享相同的硬件平臺(tái),企業(yè)可以混合使用具有每種類型內(nèi)核的系統(tǒng)來管理其基礎(chǔ)設(shè)施中的各種工作負(fù)載,同時(shí)不超出功率預(yù)算,并遵守?cái)?shù)據(jù)隱私和主權(quán)法規(guī)。計(jì)算密集型 P-core(性能核)可以支持 SAS 等高強(qiáng)度業(yè)務(wù)分析軟件,而 E-core(能效核)可用于運(yùn)行系統(tǒng)備份和軟件更新等低強(qiáng)度、高空閑時(shí)間的工作負(fù)載。
提高工作效率,幫助消除邊緣的延遲
通過將高性能計(jì)算資源置于更靠近終端用戶和設(shè)備的位置,從而提高邊緣生產(chǎn)力和延遲。采用 P-core(性能核)的英特爾® 至強(qiáng)® 6 處理器能夠在邊緣服務(wù)器中部署先進(jìn)的人工智能模型,并提供所需的算力,以便從數(shù)千個(gè)物聯(lián)網(wǎng)設(shè)備中快速獲得洞察力。具有 136 個(gè) PCIe 通道的單插槽選件還允許每個(gè)處理器使用更多的擴(kuò)展卡,從而有助于在空間有限的部署中整合基礎(chǔ)設(shè)施。
在保持快速、響應(yīng)式分析的同時(shí)發(fā)展關(guān)系型數(shù)據(jù)庫
P-core(性能核)處理器中的高級矢量引擎允許有效運(yùn)行高級數(shù)據(jù)庫和分析用例中常見的基于單指令、多數(shù)據(jù) (SIMD) 的工作負(fù)載。英特爾® 至強(qiáng)® 6 處理器還能利用高水平的超低延遲緩存,幫助避免與資源爭奪有關(guān)的延遲。利用該平臺(tái)和英特爾® QAT 等加速器的多功能配置,可以在分析和存儲(chǔ)復(fù)雜數(shù)據(jù)類型時(shí)快速得出結(jié)果。