本周,谷歌CEO桑達爾·皮查伊(Sundar Pichai)度過了他幾年來最美好的一周。因為谷歌取得了一系列大大小小的勝利,從諾貝爾獎頒獎典禮,到突破性的新AI模型Gemini 2.0,再到量子計算的突破。
日前,美國新銳媒體Semafor科技編輯里德·阿爾伯戈蒂(Reed Albergotti)在山景城采訪了皮查伊。今年是皮查伊擔(dān)任谷歌CEO的第十個年頭,無論是在壓力之下,還是被勝利所圍繞,他總是能保持平穩(wěn)。
自2022年11月ChatGPT發(fā)布以來,谷歌的發(fā)展一直很坎坷,至少從外部來看是這樣。傳統(tǒng)觀點認為,谷歌不知何故錯過了ChatGPT時刻,感到恐慌。但皮查伊表示,他從未懷疑過公司的長期計劃,選擇堅持到底,打持久戰(zhàn)。
皮查伊還表示,當(dāng)唐納德·特朗普(Donald Trump)明年入主白宮時,他將積極參與美國新政府的AI“曼哈頓計劃”。
以下為采訪內(nèi)容摘要:
問:對谷歌而言,這是一個十分瘋狂的一周,所有的產(chǎn)品公告,量子計算突破,諾貝爾獎,還有新AI模型Gemini 2.0。這都是你們計劃好的嗎,還是因為AI的瘋狂所導(dǎo)致的?
皮查伊:2015年,我讓公司朝著AI優(yōu)先的方向發(fā)展。作為其中的一部分,我們表示,將從世界級的研究開始,對AI進行深入、全棧的研究,建立基礎(chǔ)設(shè)施。然后為我們開發(fā)人員構(gòu)建模型,并將其放入我們的產(chǎn)品中。這種深度投資貫穿了我們作為一家公司、谷歌和Alphabet所做的一切。這是基礎(chǔ),采取深度技術(shù)創(chuàng)新方法,全棧方法。然后在當(dāng)前的生成式AI時代,有時你會投資來提前做好事情。對我來說,這就是從頭開始建立谷歌DeepMind,啟動Gemini,并將其構(gòu)建為原生多模式和長上下文,現(xiàn)在進入2.0版本。
所以,要打好基礎(chǔ),調(diào)整團隊,建立公司。我想你已經(jīng)看到了所有這些裨益已經(jīng)開始提供給消費者了。我預(yù)計我們的速度會更快,因為總是有固定的成本。我們必須大規(guī)模地準(zhǔn)備我們的TPU,以構(gòu)建我們想要構(gòu)建的模型,建設(shè)我們的數(shù)據(jù)中心,組建合適的團隊。創(chuàng)新管道感覺非常非常強大。其中一些是長期賭注,需要時間來完成。在我看來,量子計算就像AI在2010年左右的樣子。很少有人知道這件事,但你正在有條不紊地處理它。這是一樣的。至于Waymo,我們已經(jīng)走過了15的歷史,這是一個激動人心的時刻,所以這可能是所有這些子的結(jié)合。諾貝爾獎不是計劃好的,但當(dāng)它發(fā)生時我說了這句話:我覺得看著Demis Hassabis和John Jumper(榮獲2024年諾貝爾化學(xué)獎),他們的團隊,以及在AlphaFold上的工作,我很榮幸從頭到尾都能看到諾貝爾獎的作品。所以這是錦上添花。
問:一兩年前,人們的說法是,谷歌被ChatGPT打得措手不及。而本周是一個很好的時機,看看你在公司方面取得了多大的進步,以及人們對谷歌的看法。你現(xiàn)在感覺不一樣了嗎?
皮查伊:這是一個激動人心的時刻。在內(nèi)部,我明顯感覺到我們正在取得的進步。當(dāng)你在研究AI模型時,你會看到所有這些損失曲線(loss curve),以及模型的能力。有各種基準(zhǔn)做證。我們擁有世界級的人才,可以獲得最先進的資源。谷歌DeepMind和谷歌研究(Google Research)的結(jié)合,是當(dāng)前生成式AI領(lǐng)域引用最多的。我們會對這場革命正在發(fā)生的許多突破負責(zé)。看到這種勢頭,我們肯定非常滿意。但我們計劃做得更多,這才剛剛開始。
問:你上周在《紐約時報》DealBook會議上說,AI進展越來越難,低垂的果實已經(jīng)摘下來了。這到底是什么意思?被摘下的低垂的水果是什么?那真正困難的是什么?
皮查伊:為了明確我的答案,我在那里說了。事實上,我對未來的進展感到非常興奮。我的意思是,我認為在這個領(lǐng)域,你可以投入計算,并取得初步進展。但是,這不僅僅是一個擴大規(guī)模的問題,而是實現(xiàn)突破。因此,讓我們的模型使用多達200萬個令牌作為輸入長度,這就是長上下文。這是一個突破的例子。使用Gemini 2.0,我們有一個多模式實時API,所以現(xiàn)在它可以進行本地圖像和音頻輸出。它支持流式傳輸,讓用戶實時看到模型的輸出,而不是等到整個響應(yīng)生成完畢。這些都是突破。當(dāng)我們進入下一個階段時,你需要更具洞察力的突破。我認為,這項工作的質(zhì)量將相當(dāng)高。我想說的是,我認為這將有助于區(qū)分真正的精英團隊。不僅僅是我們,還有其他幾個團隊,這會讓2025年更令人興奮。
問:我明白了,是人們理解錯了。外界的理解是,你們的發(fā)展已經(jīng)進入了平穩(wěn)期,甚至是停滯期。但你的意思是,在谷歌,當(dāng)事情變得艱難時,反而會大放異彩?
皮查伊:沒錯。Waymo也是一樣。許多人都在努力解決這個問題,但后來變得更難了。當(dāng)它變得更難時,能夠克服它,達到下一個水平,這很重要。
問:人們傾向于將過去兩年的發(fā)展視為曲線。如果這樣看,確實像我們正在達到一個平穩(wěn)期。如果你縮小視野,看看那條曲線,我想你看到的路上會有一些停滯。你認為它會從這里走向何方?這是同一條軌跡嗎?
皮查伊:我仍然清楚地記得2010年左右,我剛剛意識到這個模型幾乎無法識別圖像,并對此感到興奮。在過去的十年里,進步是無情的,F(xiàn)在,它無疑將更廣泛的公眾擴展到了這個領(lǐng)域,所以它是主流。但當(dāng)我展望2025年時,我肯定認為我們現(xiàn)在已經(jīng)有了足夠多的功能模型,我們可以在其上構(gòu)建許多用例。
這一進展將是非常真實的。有了Gemini 2.0,我們正在為它更具代理性奠定基礎(chǔ)。雖然它仍在研究范圍內(nèi),但我們將它交給值得信賴的測試人員,比如Project Mariner,從一開始就在Chrome上工作。看到一個模型能夠使用瀏覽器是非常不可思議的,但我們必須突破一些障礙,因為我們在這些領(lǐng)域必須安全、可靠地做到這一點。俗話說,“最后的20%需要80%的努力!痹谶@種情況下,最后10%可能需要90%的努力。但這就是為什么我們要有基準(zhǔn)。我們正在取得進展。我們正在把它交給值得信賴的測試人員。這樣我們就可以負責(zé)任地進行測試,獲得反饋,然后將其提供給更多的人,等等。但想想AI可以開始影響世界上的所有工作流程。我們實際上可能會看到比我們所看到的更大的進步。兩者同時為真。
問:說到長期策略,從一開始就與Gemini進行多模式合作似乎犧牲了一些其他能力(也許是在語言和編碼方面),是這樣嗎?
皮查伊:當(dāng)我們推出Gemini 1.2時,我們真的希望它從一開始就是多模式的。我認為我們的模型在多模態(tài)方面幾乎是最先進的,但我們還沒有展示出模型的能力。沒有本地圖像輸出或音頻輸出。在2.0版本中,我們正在解鎖這些功能,但與此同時,我們在所有編碼或推理等方面都變得最先進。在SWE基準(zhǔn)下,我們的模型現(xiàn)在是最先進的。我們還有其他尚未發(fā)布的實驗?zāi)P停@些模型顯示了更多的功能。我們肯定在推動前沿,但我們會負責(zé)任地做到這一點,這就是為什么你會看到其中一些處于可信任的測試模式,其中一些僅作為開發(fā)人員的實驗API,但我們將努力工作,獲得反饋,然后將其提升到一個新的水平。
問:DeepMind的人說了這一點,并提出理論,認為多模型方法是通往AGI的道路,因為你需要有這個世界模型,也許你需要有一個具體的AI,才能真正推理和理解。隨著你的進步,你發(fā)現(xiàn)這是真的嗎?你認為這是正確的方法嗎?
皮查伊:作為人類,我們與世界的體驗是令人難以置信的多模式的,所以它總是有意義的。這就是為什么我們使用Google Lens進行搜索。如果你能把手機指向你正在看的東西并問問題,你就不應(yīng)該總是打字。Lens每月為我們帶來數(shù)十億次查詢,這是我們增長最快的用例之一。我一直很清楚,這就是未來的發(fā)展方向。Demis和他的團隊,一直有著強烈的愿景。作為這一切的一部分,我們推出的一件事是,你可以用它來幫助游戲。如果你是一名新玩家,它會關(guān)注你在做什么,并與你交談以提供反饋。我認為這是它的基礎(chǔ)。從長遠來看,當(dāng)你看到機器人(21.780, -0.21, -0.95%)技術(shù)之類的東西時,這將是非常重要的,尤其是對于Waymo。Waymo就是看你周圍的世界并做出決定。我們正在使用這些原生多模式模型進行的工作將與Waymo相交,并隨著時間的推移使Waymo變得更好。
問:當(dāng)你把這些多模式產(chǎn)品交到數(shù)十億人手中,看看Astra,當(dāng)它廣泛可用時,它真的成為一個很好的訓(xùn)練數(shù)據(jù)來源嗎?這對谷歌來說是一個優(yōu)勢嗎?
皮查伊:在我們所做的一切中,沒有什么比真實世界的反饋更好的了。人們在搜索中使用Google Lens,人們在使用Astra。我認為良性循環(huán)對我們的產(chǎn)品來說變得非常重要。我認為這一切都讓我們的產(chǎn)品變得更好。例如,如果你看看Waymo,我們模擬了很多,然后我們在現(xiàn)實世界中開車。但現(xiàn)在我們在現(xiàn)實世界中,部署在城市中,每周提供17.5萬次出行服務(wù),約100萬英里。我認為這是你創(chuàng)造性地改進產(chǎn)品的最佳方式。
問:明年有10座城市,這很快。你認為這會成為真正的收入來源嗎?標(biāo)準(zhǔn)是什么?按每英里收費嗎?
皮查伊:我們現(xiàn)在的衡量標(biāo)準(zhǔn)是確保我們正在構(gòu)建一個通用的Waymo駕駛程序。我們可以采取的情況越多,規(guī)模就越大,使其在城市環(huán)境、高速公路和所有天氣條件下都能以很高的標(biāo)準(zhǔn)安全工作。然后在各種場景中交付它(在我們的汽車中,與合作伙伴合作,就像他們與Uber或其他參與者的合作一樣),讓它擴大規(guī)模,擁有良好的用戶體驗是我們在努力解決這個問題時所考慮的。
問:有一件事我沒想到會發(fā)生,那就是數(shù)據(jù)中心的名字,比如Colossus、Rainier。你在堪薩斯城有一個價值數(shù)十億美元的數(shù)據(jù)中心。你是打算建立一個這樣的大型集群,還是已經(jīng)建立了?會有名字嗎?
皮查伊:從現(xiàn)在開始,我們應(yīng)該讓Gemini接管我們的命名。我們一直在推動數(shù)據(jù)中心的最新技術(shù),我認為我們有一些世界上最強大的集群。我感到自豪的是,世界上大部分地區(qū)都在采用液體冷卻。我們在數(shù)據(jù)中心廣泛部署液體冷卻已經(jīng)有一段時間了。我們將成為首批客戶之一,不僅是TPU,還將與英偉達合作,在我們的數(shù)據(jù)中心獲得GB200。我們已經(jīng)有一個部分由地?zé)狎?qū)動的數(shù)據(jù)中心。我們的頂級數(shù)據(jù)中心,其中許多在能源使用方面都是90%無碳的。所以我們處于領(lǐng)先地位,我們正在擴大規(guī)模。我所看到的一切,我們所制定基準(zhǔn)的一切,我認為我們也處于前沿。
問:但你不會像其他人那樣談?wù)撍。亞馬遜宣布要部署數(shù)十萬個他們的Trainium2芯片。你在TPU上訓(xùn)練了Gemini 2.0,為什么不出去吹噓一下呢?
皮查伊:我記得在2017年或2018年的谷歌IO上,我談到了建立AI優(yōu)先的數(shù)據(jù)中心,并展示了我們的TPU部件。也許我們已經(jīng)做了一段時間了。我們?yōu)槲覀兯龅氖虑楦械阶院,但我會接受你的建議,并確保我們更多地討論它。
問:也許這是商業(yè)秘密;也許如果你處于領(lǐng)先地位,你就不必談?wù)撍。你能把這些被認為是世界上最大的集群中的一些進行比較嗎?
皮查伊:需要明確的是,有幾家公司在做這件事。重要的是,為了生成用于預(yù)培訓(xùn)的尖端模型,你需要這些大型集群,理想情況下是同時定位的。我們在這方面絕對處于領(lǐng)先地位。我認為我們有一些最大的計算集群可供谷歌DeepMind和我們的云客戶使用。我們將在那里做得更多。
問:即將上任的特朗普政府提出了AI的“曼哈頓計劃”。你對這將是什么樣子以及Alphabet將在其中扮演什么角色有什么見解嗎?
皮查伊:現(xiàn)在還為時過早。過渡團隊正在那里進行,但總統(tǒng)非常明確地表示,他希望投資于技術(shù)領(lǐng)導(dǎo)力和關(guān)鍵技術(shù)。在我看來,多年來我們一直這樣做,但我們想提供幫助。你看到了我們關(guān)于量子計算或AI的公告,我們宣布了與合作伙伴一起建造小型模塊化核反應(yīng)堆的團隊。其中一些是大型的實體基礎(chǔ)設(shè)施項目。我認為我們有機會作為一個國家共同努力,實施這些雄心勃勃的大型項目,并回到那個階段。世界上沒有人對看到SpaceX助推器以這種方式返回并著陸不感興趣。我認為設(shè)定一個高標(biāo)準(zhǔn),追求這些大型的實體基礎(chǔ)設(shè)施項目,并把它做得又好又快。稅率的進步是我們非常興奮的事情,我們很樂意盡我們所能發(fā)揮作用。
問:你和新的AI沙皇談過了嗎?
皮查伊:還沒有,但我期待著與David Sacks會面。很明顯,會有一些人走進來,他們是這些領(lǐng)域的技術(shù)專家。我認為這將非常非常有幫助。我們期待著參與其中。
問:所以還沒有具體細節(jié),你不知道那會是什么樣子?
皮查伊:是的。除了早期跡象表明他們肯定有興趣推動大規(guī)模創(chuàng)新。我們期待著這些對話。
問:你們的量子AI團隊在糾錯方面取得了重大突破。你預(yù)料到了嗎?你的反應(yīng)是什么?
皮查伊:令人興奮的事情之一是我們的量子團隊,與Hartmut Neven和團隊一起,他們一直有一個非常嚴(yán)格的框架,他們在這一明確的里程碑中定義了進展。每次我們有一個里程碑,我都覺得,這些都是雄心勃勃的項目。這無疑是最積極的驚喜之一。這絕對是一個更深層次的突破,在量子計算機中擴展時解決了糾錯問題。這無疑是該領(lǐng)域最嚴(yán)峻的挑戰(zhàn)之一。我對此非常滿意。但對我們來說,這些都是我們專注于開發(fā)實用量子計算機的里程碑,我們可以將其應(yīng)用于新的新穎應(yīng)用案例。這就是目標(biāo)。這與我們的Waymo或AI旅程相似,都需要時間。但我認為,如果你下定決心,進步是不可避免的。
問:你說量子就像2010年的AI。這意味著它很快就會開始產(chǎn)生真正的影響。實現(xiàn)大規(guī)模量子計算機對Alphabet意味著什么?
皮查伊:對于你之前的問題,經(jīng)典計算或超級計算機正變得越來越強大。但我認為,對于某些類型的用例,量子最終將發(fā)揮強大的作用。它將成為我們武器庫中的重要工具。未來,量子和AI的交叉對我們來說非常令人興奮。我們與GenCast一起發(fā)布了最先進的天氣預(yù)報模型。但在未來,當(dāng)我們可以使用量子計算時,你不應(yīng)該低估我們在更深入、更好的尺度上預(yù)測這些事情的能力。這些都具有深遠的實際意義。有些事情,比如AlphaFold所做的,你還能做些什么來理解自然,模擬自然,所有這些都有實際應(yīng)用。然后,無論是通過AI還是量子,我們都在更深入地了解我們所生活的宇宙的性質(zhì)和結(jié)構(gòu)。我認為這給了我們最好的機會,因為宇宙從根本上是量子的。因此,取得進展也有更深層次的影響。它不僅會改變世界,而且也有可能為很多其他項目提供支持。我的目標(biāo)是,在五年的時間框架內(nèi),我們正在商業(yè)化地應(yīng)用量子來解決一些用例,然后從那里開始,你可以進一步發(fā)展。
問:你提到明年AI搜索將是一件更大的事情。AI Overview(AI概述)對于我的許多搜索已經(jīng)變得非常有用。你能更詳細地說明一下嗎?
皮查伊:我們對AI Overviews搜索的發(fā)展感到非常興奮。我一直在使用Gemini 2.0 flash的AI概述,我已經(jīng)看到了它的改進。這是我們將向更多人推廣的東西。但我們也會用它做更多的事情。我們的AI模型將幫助我們進行搜索,為更復(fù)雜、更深入的查詢構(gòu)建體驗,在這些查詢中,你必須對其進行分解,幫助用戶迭代,并獲得更深入的答案。2025年,我們肯定會迅速創(chuàng)新,搜索將做2024年無法做到的事情。這就是我為團隊設(shè)定的目標(biāo):2025年搜索的一類問題比2024年明顯改善,我認為我們會實現(xiàn)這一目標(biāo)。這很令人興奮,因為這意味著你正在推動知識和信息的前沿。我期待著所有這些都能交到用戶手中。
問:AI安全是很多人提出的另一個問題。Demis說,也許一年前,隨著競爭的升溫,最大的風(fēng)險之一是你開始從安全工作中拿走資源(弱化安全),因為你需要盡可能多的資源來贏得這場比賽。是這樣嗎,或者你能具體談?wù)動卸嗌偃嗽趶氖掳踩ぷ,或者有多少計算資源嗎?有辦法衡量這一點嗎?
皮查伊:我們一直認為,這是一個推動創(chuàng)新的領(lǐng)域,但幫助你推動進步的是從一開始就納入安全。我認為,能夠長期思考和長期投資的優(yōu)勢之一是,我們正在對這些模型的基礎(chǔ)安全性進行盡可能多的投資。這就是為什么,例如,構(gòu)建它的合成、開源方面,這些都是我們推動安全邊界的方式。隨著我們使這些模型更具代理性,我們都在投資安全框架。但我認為安全和創(chuàng)新是齊頭并進的。正是這一點幫助我們在Waymo取得了更大的進步。因為從第一天起,我們就將安全深深地融入了我們的創(chuàng)新和發(fā)展實踐中,它們是相輔相成的。同樣,在AI領(lǐng)域,我們有比以前更多的人從事AI安全工作,包括訪問更多的計算。這是我們始終要堅持的事情。
問:關(guān)于反壟斷的一個問題很有趣。當(dāng)我在Chrome上演示Mariner時,這就是美國政府想要迫使谷歌分拆的地方。如果你看看政府的任命,看起來這種情況不會消失。我只想問,沒有Chrome,谷歌會是什么樣子?
皮查伊:這是一個重要的過程,我們將建設(shè)性地參與其中。我確實認為法官承認我們一直在創(chuàng)新,我們打造了最好的產(chǎn)品。我認為一些補救措施的范圍很廣。我們計劃提出強有力的理由。你剛剛看到了創(chuàng)新的出現(xiàn)。所有這些都有利于消費者,歸根結(jié)底,這必須是基礎(chǔ)。這就是我們的法律所依據(jù)的。只要我們繼續(xù)堅持這種方法,為我們的用戶帶來有益的東西,我認為我們最終會做得很好。
問:你之前談到了地?zé)。我只是想知道在這方面是否有什么讓你興奮的事情,什么類型的能量會推動這一點?這會帶來新的可再生能源創(chuàng)新嗎?
皮查伊:我們對太陽能(5.010, -0.13, -2.53%)的潛力知之甚少。有更多的機會擴大太陽能。從物理學(xué)和工程學(xué)的角度來看,我們有很多選擇。核能已經(jīng)得到證實,有些國家已經(jīng)證明了這一點,而且它今天仍然有效。我認為有更安全的選擇正在不斷研究中。地球內(nèi)部也有如此多的能量。我們只生活在地球表面,地球內(nèi)部也有大量的能量,我們幾乎沒有利用。我一直覺得,如果你下定決心,我們應(yīng)該處理能源過剩的問題。能源應(yīng)該是一種催化劑,而不是一種約束。阻礙我們前進的只有我們的想象力和結(jié)果。
問:我在看一張地?zé)釢撛诘攸c的地圖,它很大,覆蓋了整個美國西部。你們有一個(用地?zé)釣閿?shù)據(jù)中心供電),但它仍然很小,還不是千兆瓦,而是兆瓦。你們必須要深入挖掘嗎?
皮查伊:對能源的需求如此之大,我認為我們能夠滿足它。但我們需要更多的研發(fā)資金。我們需要更適當(dāng)?shù)脑S可才能真正開展這些工作。我認為這是新政府真正有機會的領(lǐng)域。他們已經(jīng)表示,他們致力于實現(xiàn)這一目標(biāo)。這是我們都可以取得很大進步的事情。