“人工智能技術的大爆發,給各行各業帶來的巨大的賦能作用,同時也對計算產業提出了巨大的挑戰,從‘計算’向‘智算’演進,目前面臨多元化、巨量化、生態化三大挑戰?!敝袊こ淘涸菏客醵鳀|在日前舉行的IPF2021浪潮數據中心合作伙伴大會的主題演講中表示。在當天的演講中,王恩東對于當前之所以出現的“芯片五花八門”、“AI計算群雄逐鹿”等產業現象給出了分析,并認為腦機接口最近取得系列重大進展是目前類腦計算發展的一大亮點。
腦接接口取得突破進展
王恩東首先談及了人類大腦和人工智能大腦以及硅基大腦和碳基大腦發展的情況。最近,腦機接口領域有很多突破性進展,比如埃隆·馬斯克公布了“腦機接口”的最近實驗,科學家在獼猴的大腦皮層中植入了兩顆芯片,捕捉大腦活動的信號,實現將大腦信號翻譯成游戲的動作,實現猴子動動腦子打乒乓球的游戲。
清華大學施路平教授去年曾經說:“碳基上能夠實現的,硅基上一定能夠實現”,而實際情況也顯示,碳基生物大腦同硅基系統的結合已經不再是科幻小說或者科幻電影,而是逐步在形成科學和技術上的突破。
目前,類腦計算是全球的研究熱點,而腦機接口技術延展了生物大腦,在中國2020年人工智能學會推選出的自然科學類五個應用獎中,兩個是關于類腦計算和腦機接口。
王恩東表示,人工智能技術大的爆發,才剛剛開始。目前我們已經創造了無數的智慧大腦,包括城市大腦、交通大腦、企業大腦等等?;谌斯ぶ悄芗夹g,正在給我們的世界帶來巨大的改變,基于人工智能技術,可以實現毫秒級的精準識別,準確率達到99%,即使在光線不足的夜晚也可以根據一個尾巴和背影能夠識別出亞洲象,通過對野生大象長期的追蹤和觀測,為洞察大象物種的習性,種群的遷移軌跡提供了幫助。從而也能夠為進行合理亞洲象國家公園的規劃,棲息地改造,食源地的優化等這些保護措施提供了科學的依據。2020年中國農業無人機的銷量超過了1.5萬架,一架無人機一天農業噴散面積達到300畝是人工的20倍。無人機裝上了病蟲害的識別系統,能夠及時發現受病蟲害侵蝕的葉子,實現農藥的精準噴散,減少了農業的使用量。通過噴散催熟劑可以實現農作物成熟周期的同步,實現規?;呐渴崭?,成本大大降低,利潤率大幅提升。根據普華永道的預測,到2030年人工智能技術將為全球GDP帶來14%的提升,大約16萬億美元。
王恩東認為,人工智能技術的大發展,對產業與經濟社會的巨大賦能作用,與計算能力的巨大支撐不無關系。同樣也對從“計算”向“智算”推進提出了更多的挑戰和更高的訴求。智慧計算對于計算力的需求指數級增長,在2020年以GPU為代表的AI加速芯片所交付的計算力已經超過了同類CPU,預計到2025年加速芯片所提供的計算力可能在整個計算力交付當中超過80%。
智慧計算面臨三大挑戰
王恩東認為,面對指數級增長的計算需求,計算的技術、產品、產業面臨著巨大的挑戰,具體來說體現在以下三個方面:一是多元化的挑戰。計算場景的復雜、計算架構的多元。二是巨量化的挑戰。由巨量模型、巨量數據、巨量算力、巨量應用所引發對現有計算及體系結構的挑戰。三是生態化的挑戰?,F在的智算正處于群雄并起的階段,自成體系,生態離散,產業鏈上下游脫節。
一是多元化挑戰。計算的關鍵任務是支撐業務的發展,不同的業務類型勢必要求不同的計算系統完成,比如針對傳統的地震波模擬的科學計算,對于數值精度要求很高,而AI訓練則可以適用數值范圍大、精度相對低的16位附件類型。對于AI推理,由于推理要求的速度快、能耗少,則可以更低的數值精度下處理,像4位、2位甚至1位的整數類型。
王恩東表示,AI應用引入了新的計算類型,從推理到訓練跨度大,同時數據量也從GB到TB、PB不斷提升,數據類型從結構化到半結構化、非結構化更加復雜多樣。而不同數值精度的計算類型對計算芯片的指令集、架構等要求也不一樣,這樣就導致之前一直使用的通用CPU沒有辦法滿足多元計算場景的要求,這也是計算芯片種類越來越多的重要原因。
芯片種類多的另一個原因就是芯片代工模式的普及?,F在芯片設計、制造等關鍵環節都有開源開放的軟件、工具包括代工企業都可以使用。但是芯片從造出來到大規模用起來往往還隔著一個巨大的生態鴻溝,芯片應用一般都面臨著開發者學習成本高、用戶應用千疑難、芯片制造公司難以上規模的困難和挑戰。
人工智能芯片出來之后,大部分都面臨著面向開發者的幫助文檔、調試工具、交流回答問題的社區建設不足,開發者學習的時間長、難度大,如果學習多個芯片,那這種難更大時間就更不夠,所以開發者的學習積極性就會下降。
對于芯片的最終使用者來說,由于芯片的指令集或者芯片架構的差異,導致編程庫、編程模型、算法框架無法有效地橫向拉通,讓大量應用遷移變得困難,可能只是百分之一億的對原來的編程環境小小的依賴就會導致對新芯片的適配工作前功盡棄。
“芯片供應商如果想解決開發者的問題或者是使用者的問題,往往需要投入比芯片的研發成本高數十倍的投入。以往我們認為英特爾就是一個芯片公司、硬件公司,但其實在英特爾內部有超過一萬人在為芯片的配套支撐、應用適配、軟件優化做工作?!巴醵鳀|說,英偉達公司的CUDA軟件環境更是通過長期的大規模的投入才打造了支撐了GPU在HPC和AI方面的霸主地位。
第二,巨量化。巨量化首先表現是模型參數多,訓練數據量大。以自然語言處理為例,基于此訓練模型興起之后,模型精度隨著模型尺寸及訓練數據的增加顯著提升,在2020年GPT-3模型的參數量首次突破了千億大關,達到了1750億。按照當前的發展趨勢預測,到2023年模型的參數量會突破百萬億,也就是基本打造人腦的神經突出數量大概是125萬億。
巨量模型就需要巨量內存,當前1塊GPU板載高速內存容量大概是40GB,對于包含百萬億參數的巨量模型,將這些參數分配到每個GPU生存當中就需要1萬塊GPU,考慮到訓練當中還需要額外的存儲,實際上就需要2萬塊GPU才能夠啟動百萬億參數模型的訓練?,F有AI芯片的架構已經不足以支撐巨量模型的參數存儲需求。
同時,巨量模型依賴海量數據的位壓。目前AI算法本質上還是依賴量變的質變,很難從一個質變跳躍到另外一個質變。例如最新的巨量模型需要萬億級的詞量數據,海量數據需要海量存儲,在超大規模集群中同時滿足幾萬個AI芯片的高精度讀取,存儲系統也是一個極大挑戰。
巨量化的第二個表現是計算力需求的指數級增長。深度學習從2011年興起到今天,對于算力的需求一直是指數級增長,每隔3.4個月算力需求翻一倍。
就像我們用千瓦時來度量用電量,在天文學里面,以光年為代表來度量距離,我們以Petaflops-day(簡稱為PD)來度量算力, 2020年GPT-3需要的算力是3640個PD。
GPT-3是以處理英文理解任務為主的,為了滿足不同的語言、不同的場景的精度要求也需要訓練不同的巨量模型。如此龐大的計算力需求給計算技術和產業帶來了機遇和巨大的挑戰。解決這樣的挑戰需要從體系結構、系統軟件各個方面開展創新。
到2023年,巨量也就是百萬億參數的這種巨量模型的算力需要百萬PD,現在世界上最快的超算是日本的富岳,在這上面完成百萬PD的計算所需要的時間需要兩年,在不同的領域需要不同類型的巨量的模型。
巨量化的第三個表現是模型應用規模大,AI的應用已經滲透到各個行業,以互聯網頭部企業為例,他們基于自身的已有的AI技術搭建了開放平臺,在這上面承載著各類AI的基礎能力(語言識別、圖像識別、自然語言處理)等等。這些開放平臺已經吸引了超百萬的AI開發者,開發了各種AI應用和服務,這些AI開放平臺每天承載著數萬億次的交用量、數百萬小時的語音識別、超過百億張圖像社別、超過萬億句自然語言的理解。如此巨量的調用對計算中心的算力、應用是能力產生了極大的挑戰。
第三,生態化。AI技術鏈條和產業鏈條面臨脫節的問題。很多人可能會問一個問題,大家都說人工智能好,但是這個東西與現在的業務、與客戶的應用場景怎么結合,用戶沒有人懂算法和模型,也缺少好的AI開發平臺,同時那么多的算法、模型如何與應用進行最優組合等等。懂AI算法與模型的人往往是集中在科研機構或者頭部企業,但缺少對傳統行業的需求場景、業務規律的深入理解,也拿不到最關鍵的業務數據對模型進行訓練,這就導致技術無用武之地。
埃森哲等咨詢機構的調查報告也表明了這個問題,70%以上有技術的研究機構和科技公司缺少需求場景、領域知識和數據,70%以上的行業用戶則缺少技術人才、AI平臺和實踐能力。
“計算技術與產業生態是離散化,這與我們講的多元化的挑戰是相呼應的,芯片架構五花八門,指令集不同無法兼容,而面向芯片的編程庫等等又更芯片緊密綁定,靈活性差。小公司只做了一個環節,這就造成生態的縱向不通;大公司則希望構建封閉系統,就造成了生態橫向不通。這些都嚴重制約了AI技術的應用和發展?!蓖醵鳀|說。
王恩東進一步表示,通過這些分析我們可以看到,一方面智算需求蓬勃發展是重大的機遇,另一方面是多元化、巨量化、生態化的挑戰和困難亟需解決,面向新的需求機遇,迎接新的挑戰,應該說計算技術和產業需要構建一個新的發展格局。
產業攜手加速破解三大難題
那么如何來轉型構建新的智能產業的發展新格局,關于如何應對多元化的挑戰,王恩東表示,首先要創新智算體系結構,要從硬件重構、軟件定義兩個方面引領智算技術的體系創新。
王恩東以浪潮的融合架構3.0為例,是通過片內大容量的緩存,片外高帶寬內存等存算一體方式實現計算數據結合,突破存儲墻。通過高速互聯交換網絡支持更廣泛的多元異構計算,支持新型存儲資源置換,提高性能降低功耗,實現更大規模的資源可擴展。進一步通過在互聯處理單元中卸載控制平面,實現控制和計算的分離,進而打造更為靈活資源的可重構。在系統軟件創新方面,可以重構的硬件資源集組織,通過軟件定義的方式實現控制層和基礎設施的分離,統一資源組織模型,標準化可編程結構,形成軟件定義計算、軟件定義存儲、軟件定義網絡。通過微服務化實現集中管理平臺的高可用和高擴展。此外,也可以往底層延伸,基于不同的場景來開發定制化的AI加速、網絡加速、存儲加速產品,最終形成覆蓋芯片板卡、系統平臺和算法的領先的產品體系,在加速芯片和板卡方面,芯片多元化應該既是挑戰也是應對當前算力需求復雜多樣的手段。
而面對算法巨量化的挑戰,王恩東認為可以通過構建智算中心以服務化的方式來為產業提供服務,面對各行各業以及各類不同的AI算法公司,社會需要AI算力的基礎設施,通過構建“智算中心”能夠加速解決巨量化的挑戰。一個例子是江蘇省建設的智算中心,今年年初江蘇按照《智能計算中心規劃建設指南》,在南京投資建設了智算中心,由寒武紀和浪潮聯合承建目前已經投入運營使用。這個智算中心對外可以提供的算力達到了每秒百億億/次,采用了最先進的AI處理芯片和AI計算平臺,該中心可以為區域的公共算力服務、創新應用孵化、產業聚集發展、科研創新和人才培養提供助力和支撐。
最后王恩東表示,AI產業化是一個千億級的市場,產業AI化是一個萬億級的市場,無論AI產業化還是產業AI化,產業鏈的拉通和生態的建設都是必須的,在AI產業化的過程當中,浪潮推動元腦計劃,希望構建一個開放的AI生態,也希望更多的廠商加入到推動AI生態化發展的進程當中。