飛象原創(chuàng)(孫迎新/文)回顧人類科技革命史,無(wú)論是牛頓的萬(wàn)有引力定律被提出還是薛定諤的量子力學(xué)方程面世,幾乎還從來沒有一次科技革命像人工智能大模型的問世這樣讓人感受到極度的興奮與焦慮。大模型以其強(qiáng)大的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力,成為推動(dòng)人類走進(jìn)未來智能時(shí)代的重要力量。同時(shí),大模型的開發(fā)和訓(xùn)練需要耗費(fèi)巨量的資源與金錢,簡(jiǎn)直堪稱超級(jí)吸金的“黑洞”,但更為重要的是,想要玩轉(zhuǎn)大模型就需要天量的AI算力,這就需要像大型智算中心這樣的算力底座作為支撐。
從大模型到AI算力再到智算中心,這一切都只有實(shí)力異常雄厚的企業(yè)才能擔(dān)負(fù)得起,甚至需要國(guó)家力量介入才能實(shí)現(xiàn)。也正因?yàn)槿绱,像大模型與AI芯片這樣的人工智能領(lǐng)域頂級(jí)科技成就便成為某些發(fā)達(dá)國(guó)家筑起的一道科技“防火墻”,同時(shí)也成為打壓后起國(guó)家科技發(fā)展的政治工具。
智慧的火花:OpenAI的誕生與GPT的革命
如果談及大模型的問世,便不得不提及OpenAI這家公司。OpenAI的成立,是科技界對(duì)人工智能安全性和可控性的一種自我反思和承諾。2015年,一群科技界的領(lǐng)軍人物,包括特斯拉的埃隆·馬斯克和Y Combinator的山姆·阿爾特曼,共同創(chuàng)立了OpenAI。他們的初衷是推動(dòng)人工智能的安全性發(fā)展,并確保這一強(qiáng)大技術(shù)能夠造福全人類。
OpenAI對(duì)GPT系列模型的貢獻(xiàn),是其對(duì)人工智能領(lǐng)域最重要的貢獻(xiàn)之一。GPT(生成式預(yù)訓(xùn)練變換器),是一系列基于深度學(xué)習(xí)的自然語(yǔ)言處理模型。從GPT-1到GPT-3,每一個(gè)版本的發(fā)布,都標(biāo)志著人工智能在理解和生成自然語(yǔ)言方面的巨大飛躍。現(xiàn)在很難形容當(dāng)GPT問世時(shí)人們從震撼到驚愕的轉(zhuǎn)變,甚至都以為是創(chuàng)造出了具有意識(shí)的硅基生命體,而這樣的工作,在以往幾千年里人們都認(rèn)定是由上帝或神才能完成。
讓人感到意外的是,山姆·阿爾特曼,OpenAI的聯(lián)合創(chuàng)始人,對(duì)人工智能的未來持有復(fù)雜的看法。他曾預(yù)言,到2030年,我們將見證通用人工智能(AGI)的到來,屆時(shí)GPT-10的智慧將超越全人類。這一預(yù)言,既令人興奮也引發(fā)了廣泛的憂慮。他指出,實(shí)現(xiàn)AGI的過程應(yīng)該是緩慢而謹(jǐn)慎的,需要時(shí)間來適應(yīng)和理解。這種擔(dān)憂并非無(wú)的放矢,因?yàn)殡S著AI技術(shù)的不斷進(jìn)步,我們正面臨著前所未有的挑戰(zhàn)。也或許正是這樣具有前瞻性的眼光,使得山姆·阿爾特曼后來不得不以辭職這樣的方式表達(dá)對(duì)人工智能快速發(fā)展的擔(dān)憂。
埃隆·馬斯克,作為SpaceX和Tesla的創(chuàng)始人,同樣對(duì)AI的快速發(fā)展持有深深的顧慮。他曾是OpenAI的聯(lián)合創(chuàng)始人之一,即便是在“獵鷹”火箭發(fā)射失敗,投資打了水漂之時(shí)也沒有放下對(duì)AI技術(shù)的執(zhí)念,但后來還是因?yàn)閷?duì)公司發(fā)展方向的分歧而退出。盡管如此,他依然對(duì)AI技術(shù)保持關(guān)注,并在其他項(xiàng)目中探索AI的應(yīng)用。
震撼世界的巨浪:大模型的奇跡與應(yīng)用
大模型完全可以說是AI技術(shù)發(fā)展史上的一座里程碑。大模型以其前所未有的計(jì)算能力和智能水平,在全球范圍內(nèi)引起了廣泛的關(guān)注和討論。大模型在多個(gè)領(lǐng)域展現(xiàn)了其震撼世界的能力,尤其是在自然語(yǔ)言處理、圖像識(shí)別和多模態(tài)交互等方面。
自然語(yǔ)言處理的突破簡(jiǎn)直可以算得上是一個(gè)科技奇跡,人們第一次驚奇地發(fā)現(xiàn)可以和機(jī)器用人類的語(yǔ)言進(jìn)行交流。大模型在理解和生成自然語(yǔ)言方面的能力,使得機(jī)器能夠以前所未有準(zhǔn)確度進(jìn)行語(yǔ)言翻譯、文本摘要和情感分析。例如,GPT-3在多項(xiàng)語(yǔ)言理解測(cè)試中的表現(xiàn)超越了人類,這一成就在學(xué)術(shù)界和工業(yè)界都引起了巨大反響。
同時(shí),多模態(tài)交互的實(shí)現(xiàn)更是強(qiáng)化了人們對(duì)這項(xiàng)科技奇跡的認(rèn)知。大模型的發(fā)展推動(dòng)了多模態(tài)AI的興起,這些AI系統(tǒng)能夠處理和理解圖像、文本和聲音等多種類型的數(shù)據(jù)。例如,DALL-E 2等模型能夠根據(jù)文本描述生成逼真的圖像,這種能力在藝術(shù)創(chuàng)作和設(shè)計(jì)領(lǐng)域產(chǎn)生了深遠(yuǎn)影響。
在更多的領(lǐng)域,大模型的問世有力推動(dòng)了科學(xué)研究的加速。大模型在生物制藥、材料科學(xué)和物理學(xué)等領(lǐng)域的應(yīng)用,加速了科學(xué)研究的進(jìn)程。例如,AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面的突破,為生物學(xué)和醫(yī)學(xué)研究開辟了新的道路。
跨越障礙:萬(wàn)億級(jí)大模型的挑戰(zhàn)與中美AI領(lǐng)域的較量
在人工智能的宏大敘事中,萬(wàn)億級(jí)大模型代表著技術(shù)的巔峰,它們?cè)谔幚韽?fù)雜任務(wù)時(shí)展現(xiàn)出的能力令人震撼。然而這些模型在訓(xùn)練過程中面臨著一系列難題,同時(shí),全球政治經(jīng)濟(jì)的動(dòng)態(tài)也對(duì)這一領(lǐng)域的發(fā)展產(chǎn)生了深遠(yuǎn)的影響。
如果僅這么說大家肯定不會(huì)有什么直觀的印象,但說到英偉達(dá)這家公司,它僅憑推出用于AI訓(xùn)練和推理任務(wù)的H100 TENSORCORE引擎便成為全球市值最高的科技公司,當(dāng)前的市值(3.34萬(wàn)億)相當(dāng)于約1.15個(gè)微軟(2.89萬(wàn)億)或1.86個(gè)谷歌(1.8萬(wàn)億)。更為重要的是,英偉達(dá)是一家美國(guó)公司,美國(guó)政府利用它想給誰(shuí)斷供就給誰(shuí)斷供,想掐誰(shuí)脖子就掐誰(shuí)脖子。
即便在財(cái)力上豪橫似英偉達(dá),在面對(duì)大模型持續(xù)開發(fā)和訓(xùn)練時(shí)的算力需求與成本也不得不掂量一下。訓(xùn)練萬(wàn)億級(jí)大模型需要巨大的計(jì)算資源,但這樣的資源在全球范圍內(nèi)仍屬稀缺,算力的高昂成本也成為大模型訓(xùn)練的一大障礙。英偉達(dá)CEO黃仁勛就多次強(qiáng)調(diào)數(shù)據(jù)中心在未來計(jì)算中的重要性。他認(rèn)為數(shù)據(jù)中心將成為整個(gè)計(jì)算單元的基礎(chǔ),未來計(jì)算量級(jí)的計(jì)算將成為常態(tài)。他還提到,全球每年對(duì)數(shù)據(jù)中心設(shè)備的投資費(fèi)用高達(dá)2500億美元,英偉達(dá)將占據(jù)其中大部分市場(chǎng)份額。
數(shù)據(jù)獲取與處理也是一大難題。大模型的訓(xùn)練需要依賴海量的高質(zhì)量數(shù)據(jù),數(shù)據(jù)的采集、清洗、標(biāo)注都需要大量的時(shí)間和人力資源。AI教母、斯坦福大學(xué)教授李飛飛最著名的貢獻(xiàn)之一就是創(chuàng)建了ImageNet數(shù)據(jù)庫(kù),這是一個(gè)龐大的圖像分類數(shù)據(jù)庫(kù),為深度學(xué)習(xí)的發(fā)展提供了重要的數(shù)據(jù)支持,而這項(xiàng)成果的獲得正是基于搞定了大模型訓(xùn)練需要的海量高質(zhì)量數(shù)據(jù)。
模型的泛化能力一直是令人工智能科學(xué)家們頭疼的問題。盡管大模型在特定任務(wù)上表現(xiàn)出色,但如何確保它們?cè)诓煌I(lǐng)域和場(chǎng)景下都能保持穩(wěn)定的性能,是研究者們需要解決的問題。很難想象大模型在面對(duì)某個(gè)領(lǐng)域時(shí)表現(xiàn)得像個(gè)百年不遇的天才,而在面對(duì)有的領(lǐng)域卻表現(xiàn)得像個(gè)不折不扣的白癡,這樣的情況讓科學(xué)家們無(wú)比抓狂卻又無(wú)可奈何。
此外,能耗與環(huán)境影響也是人工智能發(fā)展之路上的攔路虎,面對(duì)這個(gè)巨大的障礙除了爭(zhēng)取國(guó)家支持,幾乎沒有什么太好的應(yīng)對(duì)之策。大模型訓(xùn)練過程中的高能耗問題不容忽視,如哈爾濱智算中心的6.9EFLOPS算力,其背后是巨大的電力消耗,放眼全球也只有中國(guó)電力這樣的能源企業(yè)有實(shí)力提供支撐,畢竟在6,900,000 MW到103.5億千瓦時(shí)之間的電力消耗,有的小國(guó)家舉全國(guó)之力也未必能夠辦到。
事實(shí)上在全球的計(jì)算中心里,曾經(jīng)出現(xiàn)過許多次因電力供應(yīng)中斷帶來的事故。
2015年9月20日,亞馬遜AWS的一個(gè)數(shù)據(jù)中心遭遇停電事故,影響了Netflix、Tinder、Airbnb等應(yīng)用程序的在線服務(wù)。
2022年8月8日,谷歌位于美國(guó)愛荷華州康瑟爾布拉夫斯的數(shù)據(jù)中心發(fā)生電力事故,導(dǎo)致3名電工嚴(yán)重受傷。
同樣在2022年,微軟澳大利亞東部數(shù)據(jù)中心在一次長(zhǎng)達(dá)46小時(shí)的中斷事件中,起因是電力供應(yīng)問題導(dǎo)致冷卻系統(tǒng)故障。
Interxion位于倫敦的一個(gè)數(shù)據(jù)中心在2023年1月10日遭遇了4個(gè)小時(shí)的故障,許多客戶受到了影響。
最后不得不提到的就是美國(guó)對(duì)中國(guó)在AI領(lǐng)域的限制。通過技術(shù)封鎖、投資限制、人才流動(dòng)限制和國(guó)際合作限制等手段,美國(guó)在人工智能技術(shù)及大模型領(lǐng)域?qū)χ袊?guó)進(jìn)行了全面的限制。這些措施不僅影響了中國(guó)的AI產(chǎn)業(yè)發(fā)展,也加劇了中美之間的科技競(jìng)爭(zhēng)。但從某種意義上看,人工智能技術(shù)或許是美國(guó)在科技領(lǐng)域的最后一個(gè)制高點(diǎn),中國(guó)一旦在人工智能技術(shù)上占據(jù)領(lǐng)先地位將無(wú)可爭(zhēng)議地將美國(guó)拉下科技神壇。
智算自主:全球運(yùn)營(yíng)商最大單集群智算中心在哈爾濱建成投用
在全球智算領(lǐng)域的競(jìng)爭(zhēng)日趨激烈的今天,中國(guó)移動(dòng)在哈爾濱建成并投入使用的全球運(yùn)營(yíng)商最大單集群智算中心,不僅標(biāo)志著中國(guó)在智能計(jì)算領(lǐng)域的一次重大飛躍,更是中國(guó)在面對(duì)美國(guó)技術(shù)限制下自主創(chuàng)新能力的有力證明。
首先是哈爾濱智算中心實(shí)現(xiàn)了國(guó)產(chǎn)化率的飛躍。哈爾濱智算中心的AI芯片國(guó)產(chǎn)化率達(dá)到100%,這一成就的取得來之不易,尤其是在人工智能高端芯片嚴(yán)重受限的當(dāng)下,這也得益于昆侖技術(shù)、華鯤振宇、寶德計(jì)算機(jī)、長(zhǎng)江計(jì)算、神州鯤泰以及寒武紀(jì)這些公司付出的努力,使得哈爾濱智算中心在建設(shè)過程中減少了對(duì)外部供應(yīng)鏈的依賴,為中國(guó)智算領(lǐng)域的發(fā)展提供了堅(jiān)實(shí)的基礎(chǔ)。通過國(guó)產(chǎn)化AI芯片和自主研發(fā)技術(shù)的運(yùn)用,哈爾濱智算中心減少了對(duì)美國(guó)技術(shù)的依賴,這在一定程度上打破美國(guó)的技術(shù)限制,削弱了美國(guó)通過技術(shù)限制對(duì)中國(guó)智算領(lǐng)域發(fā)展的影響力。
哈爾濱智算中心在算力方面取得大幅的提升。該中心能夠提供6.9EFLOPS的智能算力,這一算力相當(dāng)于300多萬(wàn)臺(tái)高性能計(jì)算機(jī)的集合。這使得中國(guó)在處理大規(guī)模數(shù)據(jù)和復(fù)雜計(jì)算任務(wù)時(shí)更加自如,大大提升了國(guó)內(nèi)科研和商業(yè)應(yīng)用的能力。
在技術(shù)創(chuàng)新方面,哈爾濱智算中心采用了多項(xiàng)中國(guó)移動(dòng)自主研發(fā)的技術(shù),如GSE1.0、天池SDN等,這些技術(shù)的創(chuàng)新應(yīng)用不僅提升了智算中心的運(yùn)行效率,也為全球智算領(lǐng)域的發(fā)展貢獻(xiàn)了中國(guó)智慧。
哈爾濱智算中心的成功建設(shè)也推動(dòng)了國(guó)內(nèi)產(chǎn)業(yè)鏈的發(fā)展,智算中心的建設(shè)和運(yùn)營(yíng),帶動(dòng)了國(guó)內(nèi)相關(guān)產(chǎn)業(yè)鏈的發(fā)展,包括芯片制造、軟件開發(fā)、系統(tǒng)集成等,這有助于構(gòu)建更加完善和自主的國(guó)內(nèi)智算產(chǎn)業(yè)生態(tài)。同時(shí)在增強(qiáng)國(guó)際競(jìng)爭(zhēng)力方面,哈爾濱智算中心的建成,提升了中國(guó)在全球智算領(lǐng)域的競(jìng)爭(zhēng)力。它不僅能夠支持國(guó)內(nèi)的大型AI模型訓(xùn)練和應(yīng)用,還能夠吸引國(guó)際企業(yè)和研究機(jī)構(gòu)的合作,提升中國(guó)在全球智算領(lǐng)域的影響力。
在全球AI領(lǐng)域的較量中,中國(guó)正以堅(jiān)定的步伐,不斷探索和創(chuàng)新,力求在萬(wàn)億級(jí)大模型的研發(fā)和應(yīng)用上取得更多的突破。盡管道路充滿挑戰(zhàn),但未來仍然充滿希望。哈爾濱智算中心的建成和投入使用,是中國(guó)智算領(lǐng)域自主創(chuàng)新能力的一個(gè)縮影。它不僅展示了中國(guó)在面對(duì)外部技術(shù)限制時(shí)的堅(jiān)韌和智慧,也為全球智算領(lǐng)域的發(fā)展貢獻(xiàn)了新的動(dòng)能。
在人工智能技術(shù)領(lǐng)域,美國(guó)還能卡中國(guó)的脖子嗎?
最后,向GPT-4提出以上的問題作為總結(jié)。GPT-4是這樣回答的:
作為一個(gè)AI助手,我沒有情感,也不支持或反對(duì)任何國(guó)家。人工智能技術(shù)的發(fā)展一直在全球范圍內(nèi)進(jìn)行,并帶來了許多機(jī)遇和挑戰(zhàn)。對(duì)于中國(guó)或任何其他國(guó)家來說,人工智能的使用和發(fā)展都需要權(quán)衡利弊,并采取適當(dāng)?shù)拇胧﹣斫鉀Q可能出現(xiàn)的問題。