高性能計算的下一步是什麼?
這是今年 5 月 22 日至 24 日舉行的 ISC 高性能活動期間提出的大問題,更快、更大的存儲與更多數據和人工智能一起推動創新。
為了了解更多最新消息,CUBE 分析師與行業專業人士聯繫,討論了高性能計算領域如何被重塑以及哪些市場發展正在推動創新需求。
CUBE 行業分析師表示:“多年來,我們一直在報導 AI 和 HPC 正在以一種巨大的方式結合在一起。” 戴夫維蘭特. “我們已經看到這種情況在 2023 年加速。組織正在努力弄清楚如何利用 ChatGPT 等基礎模型的潛力來提高他們的工作效率。 問題是,他們是怎麼做到的?”
除了 AI,Vellante 和合作分析師 約翰·弗瑞爾 在 SiliconANGLE Media 的直播工作室 theCUBE 對活動的報導中,談到了可持續性、機器學習、量子等。 (* 下面披露。)
以下是您可能錯過的三個關鍵見解:
1. 可組合計算可能是滿足 HPC 需求的一種解決方案。
過去,當一個人想要構建一個集群並在集群中包含圖形處理單元時,需要購買一台特定的服務器,其中包含 GPU。 可組合計算並非如此,它帶來了一個非常高速的網絡,允許用戶決定該服務器是 GPU 服務器還是內存服務器,據稱 傑夫柯克,戴爾技術公司工程師
“正是這種外部、超高速、低延遲結構的概念,讓您從根本上決定了服務器的架構,”他說。
當然,網絡是整個等式中的關鍵部分。 根據 Furrier 的說法,這通常是每個人都急於讓事情進展得更快的最後一個地方。
“這涉及物理,但它連接到服務器、存儲並使硬件充當一個 HPC 系統而不是幾個獨立的系統,”他說。
在這種情況下,HPC 網絡空間將如何發展? 根據 Kirk 的說法,真正的問題是延遲。
“如果你想將內存操作添加到列表中——換句話說,你有一些連接在車庫裡的內存——那麼你必須有低延遲,因為中央處理器將停止,直到內存訪問完成,”柯克說。 “這絕對是一個延遲很重要的領域。”
在 HPC 和網絡方面,網絡空間的一大變化是 通過融合以太網進行遠程直接內存訪問,它可以為 HPC 應用程序實現高帶寬和低延遲網絡。 RoCE 已經存在了很長時間,但該技術已經成熟到 HPC 用戶現在可以為其網絡訪問廣泛的硬件和軟件解決方案生態系統的地步,據稱 洛朗·亨德里希斯,高速以太網適配器和SmartNIC高級產品線經理 博通公司
“除了 RoCE,以太網已經大大縮小了與 InfiniBand 的性能差距。 過去,InfiniBand 可能是您構建高性能網絡的首選技術,而現在您可以使用以太網部署具有類似性能和延遲的網絡,”Hendrichs 說。 “並在標準、軟件和硬件生態系統方面充分利用以太網帶來的所有好處。”
在 HPC 的世界裡,有很多值得好奇的地方,包括量子。 儘管量子計算顯示出希望,但還有很多工作要做。
“特定工作負載在 GPU 上運行得更好,而其他工作負載則不然。 以同樣的方式,量子技術將加速和改進我們當前方法的特定類別的工作負載,然後還有其他他們不會的工作負載,“說 伯恩斯希利,戴爾研究辦公室的新興技術研究員。
這是對 Jeff Kirk、Laurent Hendrichs 和 赫馬爾沙阿,Broadcom 的傑出工程師和系統、軟件和標準架構師,SiliconANGLE 和 theCUBE 對 ISC 高性能事件:
2. 強大的力量帶來巨大的可持續性。
處理所有這些高功率設備意味著公司還必須尋求高功率可持續性解決方案來管理它們。 Furrier 考慮的重要話題是電源和冷卻 — 但如何為所有這些 CPU、GPU 和處理器提供更多電源,同時使一切可持續發展?
“最大的挑戰之一是為這些系統提供足夠的功率來支持這些高性能處理器,包括 CPU 和 GPU,”說 大衛·哈代,數據中心解決方案——戴爾的戰略和業務發展,他是 PowerEdge 的產品經理。 “幸運的是,這非常值得。 與增加的功率相關的性能提升使得使用下一代系統變得輕而易舉。”
當然,等式的另一部分是如何冷卻它。
“總的來說,我們一直在改進我們的空氣冷卻能力,我們有液體冷卻選項,可以讓一切都非常高效地運行,”Hardy 說。
多年來,英特爾公司和戴爾之間的關係已得到充分證明。 考慮到可持續性方面的冷卻挑戰,英特爾還一直與戴爾等原始設備製造商合作,為超高性能處理器創建解決方案。
“我們有針對這些市場的產品,”說 莫漢庫馬爾,英特爾數據中心和人工智能研究員。 “我們針對基於液體冷卻的解決方案優化了散熱器。 最重要的是,我們有這種‘不讓任何人掉隊’的方法來解決性能問題。”
Kumar 表示,除了處理器之外,該公司還擁有 GPU 和 AI 解決方案。 英特爾還與戴爾密切合作,以確保制定適當的標準。
“我們有一種方法可以從根本上為他們提供解決方案,”他說。
這是 theCUBE 對 David Hardy、Mohan Kumar 和 蒂姆謝德,工程技術專家,戴爾首席技術信息官辦公室:
3. HPC 正在對金融界產生影響。
傳統上,HPC 僅被認為涉及用於特定研究的巨型超級計算機,但如今 HPC 已經發展。 AI 產生了巨大的影響,更多人相信 AI 和 HPC 有機會交叉。
“人工智能過去需要大量研究; 它將是一個或兩個節點,一個或兩個 GPU 和大量測試。 但是現在,隨著 OpenAI 的所有事情都在進行,並且這些事情即將完成,你可以開始向它投入一些力量,”說 彼得·阮,戴爾高級產品經理。
HPC 的使用也在各個行業呈爆炸式增長。 它現在被用於醫療保健、政府、製造業和金融科技。 在金融領域,HPC 正被用於定量層面,並被證明引領著實時風險分析的新前沿。
“客戶在做大規模模擬, 蒙特卡洛模擬,以及實時進行風險評估,這樣他們就可以在競爭中領先,”說 帕布·拉瑪穆迪客戶/合作夥伴開發者關係經理 英偉達公司
Ramamoorthy 補充說,人們希望結合人工智能和其他技術在這一領域做得更多。 “例如,他們想使用大型語言模型,然後將其用於交易信號,並在定性金融領域使用自己的算法,”他說。
在所有動作的中間是 STAC 基準委員會,涵蓋 50 多家領先的技術供應商和 400 多家金融公司。 據稱,STAC 的主要目標是改善金融業的技術發現和評估 彼得納比希特,證券技術分析中心有限責任公司總裁。
STAC 剛成立時,Nabicht 是一家貿易公司的首席技術官,他手下的所有工程師除了評估技術和進行測試外什麼都不做。 出現的想法涉及這樣一個事實,即每個人都有相似的工作量。
“STAC 出現並幫助將基準委員會召集在一起定義這些工作負載,這樣我們就可以對不同的技術堆棧進行同類比較,看看他們如何解決問題,他們解決問題的速度有多快,他們可以獲得多少吞吐量完成以及他們這樣做的效率如何,”他說。 “現在,15 年後,這就是我們在各個領域所做的事情,包括 HPC 和 AI。”
這是 CUBE 對 Prabhu Ramamoorthy、Peter Nabicht 和 安德魯·盧戴爾產品經理:
觀看更多 theCUBE 的報導 ISC 高性能事件,這是我們完整的活動視頻播放列表:
(* 披露:TheCUBE 是 ISC 高性能活動的付費媒體合作夥伴。CUBE 活動報導的讚助商 Dell Technologies Inc. 和其他贊助商都沒有對 CUBE 或 SiliconANGLE 上的內容進行編輯控制。)
圖片來自 PhonlamaiPhoto / Canva
您的支持票對我們很重要,它有助於我們保持內容免費。
單擊下面的按鈕支持我們提供免費、深入和相關內容的使命。
在 YouTube 上加入我們的社區
加入由 15,000 多名#CubeAlumni 專家組成的社區,其中包括 Amazon.com 首席執行官 Andy Jassy、Dell Technologies 創始人兼首席執行官 Michael Dell、英特爾首席執行官 Pat Gelsinger 以及更多名人和專家。
謝謝