劃重點(diǎn)
01阿里云創(chuàng)始人王堅表示,AI對人類社會的影響將超越“0到1”的創(chuàng)新,更多在于“1到100”的創(chuàng)新,如數(shù)據(jù)、模型、算力的系統(tǒng)結(jié)合以及機(jī)制創(chuàng)新、技術(shù)創(chuàng)新和基礎(chǔ)設(shè)施的創(chuàng)新。
02王堅認(rèn)為,云計算本質(zhì)屬性是服務(wù),應(yīng)越來越全球化,同時要關(guān)注應(yīng)用本身,而非局限于技術(shù)本身。
03他強(qiáng)調(diào),AI競爭不僅僅是中美兩家,歐洲也在異軍突起,關(guān)鍵在于把國際資源用好,實現(xiàn)科技領(lǐng)先。
04此外,王堅指出,AI應(yīng)用不能簡單“+行業(yè)”或“+場景”,而應(yīng)關(guān)注創(chuàng)新過程,如權(quán)重變化和認(rèn)知重塑。
05最后,他呼吁在機(jī)制創(chuàng)新上下功夫,以實現(xiàn)科技領(lǐng)域的重大突破。
以上內(nèi)容由大模型生成,僅供參考
中國工程院院士、之江實驗室主任王堅與《財經(jīng)智庫》的對話。攝影/李君
AI在諾貝爾獎上大放異彩,事實上是在提示人類要重新思考基礎(chǔ)學(xué)科的含義和概念。這已經(jīng)不是科學(xué)研究工具的革命,而是能讓科學(xué)發(fā)生一次革命的工具。其之所以能最終得到社會的認(rèn)可,本質(zhì)上是縱橫交錯的結(jié)果:縱向,即在這個時刻所有創(chuàng)新要素都得到整合,形成有效的創(chuàng)新機(jī)制;橫向,則是數(shù)據(jù)、算力變得成熟,更像基礎(chǔ)設(shè)施
文|財經(jīng)智庫》研究員張燕冬
編輯|袁雪
王堅像“謎”一樣神奇而獨(dú)特的存在。他是中國工程院院士、之江實驗室主任、阿里云創(chuàng)始人,作為一名科班出身的工業(yè)心理學(xué)博士、教授、系主任,到微軟擔(dān)任亞洲研究院常務(wù)副院長,再到阿里巴巴首席架構(gòu)師,以及具有國家重要戰(zhàn)略意義機(jī)構(gòu)的科技領(lǐng)導(dǎo)人,其經(jīng)歷橫跨高校、企業(yè)、科研多個領(lǐng)域,這些角色看似差異較大,但它們之間卻有一種密不可分的連接。
可以說,上世紀(jì)80年代“開放而超前”的杭州大學(xué)心理系奠定了他作為心理學(xué)家和計算機(jī)學(xué)家(兼修并完成浙江大學(xué)計算機(jī)系相關(guān)的基礎(chǔ)課程)的科學(xué)家底色;而微軟近十年的歷練使其在緊跟世界科技前沿,尤其在大規(guī)模數(shù)據(jù)處理系統(tǒng)等方面打下扎實的基礎(chǔ);無論是采用計算作為公共服務(wù)的產(chǎn)業(yè)模式,主持研發(fā)大規(guī)模分布式計算系統(tǒng)的“飛天”以及云計算產(chǎn)業(yè)的突破,還是以志愿者的方式推動“城市大腦”作為未來城市新的數(shù)字基礎(chǔ)設(shè)施,則使其完成“0到1”“1到100”的創(chuàng)新全過程;而在之江實驗室則是其聚焦智能計算,推進(jìn)高效能新型算力系統(tǒng)成為浙江、杭州實施人工智能戰(zhàn)略的創(chuàng)新嘗試,尤其在機(jī)制創(chuàng)新、市場模式創(chuàng)新有了新突破。
在杭州云棲小鎮(zhèn)的“2050博悟館”,王堅與《財經(jīng)智庫》進(jìn)行了獨(dú)家對話。博悟館陳列著近百件與數(shù)據(jù)、計算和互聯(lián)網(wǎng)相關(guān)的藝術(shù)品,還有百余位對人類作出重大貢獻(xiàn)科學(xué)家的畫像,就如他傾其全身在苦苦追索“創(chuàng)新究竟如何發(fā)生,尤其在決定人類命運(yùn)的關(guān)鍵性創(chuàng)新,在何種條件下產(chǎn)生”,猶如他創(chuàng)辦“云棲大會”“云棲小鎮(zhèn)”“2050”的初衷,而醞釀已久的“夢溪論壇”亦初步成型,既追蹤沈括,也借鑒為期兩個月誕生了近代“人工智能”的達(dá)特茅斯會議。
“悟”是靈魂,“大道至簡”是他認(rèn)知世界的風(fēng)格。
王堅院士與《財經(jīng)智庫》的對話。攝影/李君
“1到100”實質(zhì)是社會對技術(shù)的認(rèn)可《財經(jīng)智庫》:近期,諾貝爾物理學(xué)獎和化學(xué)獎分別頒發(fā)給了從事人工智能的科學(xué)家,無論是人工神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)的基礎(chǔ)性發(fā)現(xiàn),還是在預(yù)測蛋白質(zhì)結(jié)構(gòu)和計算方面,均與人工智能相關(guān),這說明AI技術(shù)在多個領(lǐng)域的應(yīng)用并產(chǎn)生深遠(yuǎn)影響,但為什么諾貝爾獎的頒獎詞里并未提人工智能的字眼?
王堅:有意思吧。當(dāng)今年的諾貝爾物理學(xué)獎公布后,《科學(xué)》雜志的網(wǎng)站上發(fā)表了一篇文章,題為“In the surprise,AI pioneers win Nobel Prize”(出乎意料,AI開拓者贏得了諾貝爾獎)。更有意思的是,《財富》雜志在介紹獲獎人Geoffrey Hinton(杰弗里辛頓)時,說他是一個認(rèn)知心理學(xué)家,同時也是一個計算機(jī)科學(xué)家,所以物理學(xué)獎不僅頒給了計算機(jī)科學(xué)家,同時還是一位心理學(xué)家。有好事者跑到ChatGPT去問,Hinton的相關(guān)研究是不是屬于物理學(xué)?怎么問也問不出來Hinton從事的是物理學(xué)研究。
《大西洋月刊》的報道更是直接以《AI贏得了諾貝爾獎》為標(biāo)題,但同時也描述了諾貝爾獎“向善”的初衷,即諾獎的獲得者要對人類福祉有貢獻(xiàn)。在我看來,這次諾獎肯定了AI對人類的益處。曾經(jīng)有人說過ChatGPT是人工智能的iPhone時刻,《大西洋月刊》的這篇文章則認(rèn)為這次諾貝爾獎就像是AI的青霉素(青霉素對人類有貢獻(xiàn))和X光時刻。如此的表述是為AI正名。當(dāng)然在全球范圍內(nèi),仍然對AI有爭議,但我愿意將這次頒獎稱之為最好的“AI諾貝爾和平獎”。但整個頒獎詞里確實未提AI字眼,科學(xué)界與媒體界強(qiáng)調(diào)的面有所不同,我比較同意部分主流媒體的觀點(diǎn)。
事實上,這是在提示人類要重新思考基礎(chǔ)學(xué)科的含義和概念。這已經(jīng)不是科學(xué)研究工具的革命,而是一個能讓科學(xué)發(fā)生一次革命的工具,這個新工具讓科學(xué)得以進(jìn)行一次徹底革命,某種意義上講它“革”了科學(xué)的命。
《財經(jīng)智庫》:您在講工具的革命和革命的工具時,將此運(yùn)用于企業(yè),記得您曾提到大公司覺得AI是工具的革命,小公司覺得AI是革命的工具。如果大公司也有革命工具的意識,那么劃時代的影響就來了。您的意思是,盡管大小公司有區(qū)別,但都具備一個創(chuàng)新空間?
王堅:嚴(yán)格意義上講,大企業(yè)是可以把AI作為革命的工具,只不過它要守著原來的利益和慣性不放,就只能變成工具的革命了。理論上都可以成為革命的工具,但在大公司中,讓人們?nèi)鎿肀I會比小公司更難。
《財經(jīng)智庫》:船小好掉頭,大企業(yè)往往做不到。
王堅:對,做不到是因為機(jī)制原因,而非工具本身的原因。其實今年諾貝爾獎也部分反映出了這個問題,為什么不是這個學(xué)科領(lǐng)域的科學(xué)家來完成這些研究呢?他們還是抱著固有的思維不放。
《財經(jīng)智庫》:這跟你提出的“機(jī)制創(chuàng)新”又有怎樣的關(guān)聯(lián)?您說過,從AI到AI+,這個“加”不是別的,而是“機(jī)制的創(chuàng)新”,而機(jī)制創(chuàng)新不是人工智能與產(chǎn)業(yè)的簡單結(jié)合,它完全超出了“0到1”的創(chuàng)新,就像OpenAI,事實上繼承了源自Google的Transformer技術(shù),但Google內(nèi)部的機(jī)制難以創(chuàng)新,不像早期的OpenAI本身具備非營利機(jī)構(gòu)的特質(zhì)。您說這種超越“0到1”創(chuàng)新,遠(yuǎn)遠(yuǎn)超出學(xué)界、產(chǎn)業(yè)界已有的認(rèn)知,那它對現(xiàn)有認(rèn)知提出了怎樣的挑戰(zhàn)?
王堅:講“0到1”時,人們往往沒有把它的內(nèi)涵和外延說清楚,我們總是狹隘地將此視為技術(shù)本身的革新,而技術(shù)本身的革新是0還是1,可能有一種判斷的標(biāo)準(zhǔn)問題,既包含技術(shù)帶來的或者技術(shù)影響的變化,也含有一個“0到1”的過程。毫無疑問,“從0到1”的創(chuàng)新很重要,但“1到100”的創(chuàng)新同樣重要。1到100的創(chuàng)新不是簡單的應(yīng)用,是社會對這個技術(shù)的認(rèn)可程度,這是非常艱難的過程。也就是說一個新技術(shù)的起源到最終需要社會的認(rèn)可,實際上就是“從1到100”的過程。
今年諾貝爾獎可以視為科學(xué)界認(rèn)可了AI,它是AI在科學(xué)領(lǐng)域“1到100”的創(chuàng)新。AI開始影響科學(xué)研究本身。所以我的明確定義就是,“1到100”是社會對這個技術(shù)認(rèn)可的過程,而不是簡單的再重復(fù)過程。
關(guān)鍵要將“機(jī)制”說清楚!1到100”的內(nèi)涵到底是什么?1到100是1被放大了100倍,而不是1重復(fù)100次。從這個意義上講,社會接受一項新技術(shù)的過程極其艱難,人們理解AI也是這個過程。你可以說AI從1956年達(dá)特茅斯會議開始,已近70年的歷史;如果從ChatGPT的出現(xiàn)算起,也可以說近幾年才有了突破。
《財經(jīng)智庫》:在AI的歷史縱向上,您說過雖然人工智能有很長的過去,但只有七年的歷史,直到Google開始提出了Transformer,后來OpenAI推出了ChatGPT。但在橫向關(guān)聯(lián)性上,您也提出其中的創(chuàng)新就是數(shù)據(jù)、模型、算力的系統(tǒng)結(jié)合,以及機(jī)制創(chuàng)新、技術(shù)創(chuàng)新和基礎(chǔ)設(shè)施的創(chuàng)新,這個歷史縱向跟你所想的橫向關(guān)聯(lián),其結(jié)合點(diǎn)又在哪?
王堅:它本質(zhì)上就是一個縱橫交錯的關(guān)系?v向,就是這個時刻所有的創(chuàng)新要素要能夠整合,OpenAI把深度學(xué)習(xí)、Transformer架構(gòu)、大語言模型,以GPT的形式整合在一起;橫向,數(shù)據(jù)、算力慢慢變得成熟,更像個基礎(chǔ)設(shè)施。比喻來說,高速公路作為基礎(chǔ)設(shè)施,如果沒有汽車、汽油及相關(guān)技術(shù)的整合,沒有任何用處。因此,要在一個基礎(chǔ)設(shè)施上進(jìn)行深刻的縱向整合,世界才會被改變,誰先誰后則是另外一回事。歷史源頭也很重要,有的可能是先修路才有車,有的可能有了車才修路,兩者之間相互作用并影響。
如何加速基礎(chǔ)設(shè)施的創(chuàng)新也至關(guān)重要。設(shè)想一下,造一輛車容易,但要大規(guī)模使用,基礎(chǔ)設(shè)施不可缺。若把大規(guī)模使用當(dāng)作一個創(chuàng)新加速過程,就變得有意思了。
我經(jīng)常被問到一個問題,到底是“0到1”重要,還是“1到100”重要?很難回答,因為這個問題需有前提和條件,哪方面欠缺它就是重要的。
《財經(jīng)智庫》:條件和時間不同,重要性就不同。當(dāng)我們談?wù)損ure questions時,答案是一樣的,但放入不同的時間和地點(diǎn)或環(huán)境,答案則不同;即使同樣的問題,強(qiáng)調(diào)的面也不同。
王堅:就是這個道理。你說對人來講,維生素C重要還是鈣重要?就看你缺什么。我始終強(qiáng)調(diào)判斷很重要,判斷不對所有東西都不對。你到底是缺鈣還是缺維C,判斷變得很重要。創(chuàng)新也是如此。舉例來說,人才很重要,這句話永遠(yuǎn)都對,但今天此時此刻是哪種人才重要,不見得是一件容易判斷的事情。
《財經(jīng)智庫》:判斷與認(rèn)知就會影響決策和結(jié)果。您曾經(jīng)引用紅杉資本的觀點(diǎn),在云時代、移動時代、AI時代,云計算就是基礎(chǔ)設(shè)施。為什么基礎(chǔ)設(shè)施作為技術(shù)滲透的一種形式對人類產(chǎn)生的影響是最深刻的?
王堅:為什么基礎(chǔ)設(shè)施最重要?好的基礎(chǔ)設(shè)施能跟隨人類幾百年、幾千年,真正一直存留下來的基礎(chǔ)設(shè)施沒有多少,如道路,電網(wǎng)等,有些當(dāng)時所謂的新發(fā)明,例如很多智能硬件,認(rèn)為是創(chuàng)新,其實曇花一現(xiàn)。如今火熱的虛擬現(xiàn)實,最后不是還回到“眼鏡”上嗎!所以,越是能跟著人類發(fā)展,越是簡單離不開的東西,才是真正革命性的東西。道路、電力等可以發(fā)生諸多形式的變化,但不會消失。
那么,云計算為什么是基礎(chǔ)設(shè)施?計算是不會沒有的。一個技術(shù)真正要追求的就是它的生命周期,世界上生命周期足夠長的技術(shù)不多,云計算是少數(shù)幾個可以與電等媲美生命周期的技術(shù),因為對計算服務(wù)的需求不會消失,就像對電的需求。
我常常說自己做云計算是非常幸運(yùn)的。第一,云計算是技術(shù),技術(shù)創(chuàng)新是關(guān)鍵;第二,云計算是商業(yè),不是每一項技術(shù)本質(zhì)上都有商業(yè)屬性。為什么阿里云成功,不是我有什么了不起,是因為云計算本質(zhì)上就是商業(yè);第三,云計算還是一個能夠持續(xù)幾百年的商業(yè)。大家對商業(yè)的理解不太一樣,不能把簡單的買賣當(dāng)商業(yè);市場化與商業(yè)化也不是同一概念,我們需要的是真正回歸市場化?偠灾瑫r兼具這三個條件,技術(shù)、商業(yè),還能持續(xù)百年的創(chuàng)新,很少。
王堅院士與《財經(jīng)智庫》的對話。攝影/李君
《財經(jīng)智庫》:您把數(shù)據(jù)、計算和云計算都視為基礎(chǔ)設(shè)施。那未來AI還會主要依靠transformer技術(shù),還是會有更好的技術(shù)?如果有的話,這種新技術(shù)應(yīng)該有什么特點(diǎn)?或者比現(xiàn)在更優(yōu),或更好的底層?
王堅:依我之見,這次諾貝爾獎的物理學(xué)和化學(xué)獎的獲獎貢獻(xiàn)對AI的作用還是稍微差了一層意思,沒有直接把AI說出來。如果真正要說AI,一定要說Transformer技術(shù),神經(jīng)網(wǎng)絡(luò)是Transformer的基礎(chǔ),Transformer是非常革命性的,其革命性體現(xiàn)在幾個方面:其一,Transformer是能夠真正把大規(guī)模算力用上的一個技術(shù)框架,除了Transformer,沒有其他任何技術(shù)框架和方法能夠利用如此大規(guī)模的算力進(jìn)行訓(xùn)練;其二,在Transformer的框架下定義了數(shù)據(jù),它用Token變成了定義數(shù)據(jù)最基本的單元,事實上把計算和數(shù)據(jù)相融合,使其架構(gòu)趨于完整。
我認(rèn)為,短期內(nèi)發(fā)生革命性變化,還是比較難的。要不要想辦法革新?當(dāng)然要。但如果有人今天說有東西會馬上顛覆Transformer,我也表示懷疑。計算機(jī)會不會革命?一定會,毋庸置疑。但我基本認(rèn)為20年之內(nèi)是不可能的,我們到今天還是依賴馮諾依曼結(jié)構(gòu)。
《財經(jīng)智庫》:您有沒有覺得Transformer這個革命性技術(shù)有弱點(diǎn)?
王堅:我可能鼠目寸光,我更愿意看到它的長處。這就如同對待一個人,他的長處還沒有完全發(fā)揮出來,你卻去想他的弱點(diǎn)?有人會寫文章,你卻責(zé)怪他數(shù)學(xué)能力差,邏輯是不對的。你需要先找到他的能力邊界,而不是找缺陷。ChatGPT的巨大成功誤導(dǎo)大家的地方,就是把大家的目光集中在讓Transformer做ChatGPT類似的事情。事實上,這次諾獎得主預(yù)測蛋白質(zhì)結(jié)構(gòu)也是用的Transformer架構(gòu),但他們對這個架構(gòu)做了革命性的延伸。再比如,在生成圖片的Midjourney所用的技術(shù)也同樣用在了蛋白質(zhì)結(jié)構(gòu)預(yù)測;接下來也可以用這個技術(shù)來預(yù)測天氣等。在AI歷史上還沒有一個方法可以被這么廣泛運(yùn)用,目前一個很大的挑戰(zhàn)是我們還沒有把它用好。就像電從點(diǎn)亮燈泡到成為汽車的動力經(jīng)歷了100多年。而讓我“著迷”的就是它還能被用在哪里!對技術(shù)也要有敬畏之心。
一個技術(shù)創(chuàng)新會有巨大的社會成本,創(chuàng)新也要符合經(jīng)濟(jì)規(guī)律。如果創(chuàng)新的成本代價超過其社會價值,這個創(chuàng)新可能就會失去意義。從產(chǎn)業(yè)角度,一定要搞清楚科技創(chuàng)新給社會帶來的效益能否覆蓋其成本。
創(chuàng)新的本源:密度+強(qiáng)度+加速度《財經(jīng)智庫》:云計算的概念最早可以追溯到1961年,當(dāng)時科學(xué)家John McCarthy(約翰麥卡錫)提出了一個想法,即計算能力可以作為一種像公共事業(yè)服務(wù)來提供,用戶可以像使用水電一樣按需使用資源,但是這個概念在當(dāng)時的技術(shù)條件下并未得到廣泛發(fā)展。
王堅:約翰麥卡錫是很有意思的一個科學(xué)家,他是達(dá)特茅斯會議的十個人之一,且是主要發(fā)起人,他也是提出“人工智能”概念的人。計算要像公共服務(wù)那樣也是由他最早提出,隨著萬維網(wǎng)的出現(xiàn)和20世紀(jì)90年代末到21世紀(jì)初互聯(lián)網(wǎng)技術(shù)的發(fā)展和普及,計算作為服務(wù)這樣的思想逐漸成熟,多家公司如亞馬遜、谷歌、微軟開始探索提供基于互聯(lián)網(wǎng)的計算服務(wù),這些服務(wù)后來被稱之為“云計算”。
這就是為什么說云計算本質(zhì)屬性是服務(wù)。當(dāng)年電就是服務(wù),因為沒人買發(fā)電機(jī)了。電在英文里被歸為Utility,這個詞在中文里很難找到對應(yīng)的詞,但本質(zhì)上Utility就是服務(wù),而且是一個不可或缺的服務(wù)。約翰麥卡錫就提出了計算會變成Utility,這也是公共服務(wù)的意思。
王堅院士與《財經(jīng)智庫》的對話。攝影/李君
《財經(jīng)智庫》:所以,您提出云計算是“公共云”的概念,您說私有云沒有未來。
王堅:對。從這個角度上講,是一脈相承的。但我們在中文語境里很少人會理解Utility,我當(dāng)時痛苦了很長時間。如果以后云計算也是Utility,實際上就是一種公共服務(wù)。我的書《在線》翻成Utility cloud,這是cloud的方法論,即公共服務(wù)。
《財經(jīng)智庫》:美國云服務(wù)產(chǎn)業(yè)當(dāng)中,是公有的訂閱制為主?中國現(xiàn)在是以定制項目為主,這兩種不同的模式又會產(chǎn)生怎樣的影響?
王堅:你問了兩個不同問題,要分開講。美國有公有云和私有云,里面有兩個不同的概念,說公共云的,像亞馬遜、微軟、谷歌這些公司;私有云的倡導(dǎo)者是IBM、Oracle,傳統(tǒng)廠商較多。美國標(biāo)準(zhǔn)研究所妥協(xié)了一些產(chǎn)業(yè)之間的關(guān)系。我經(jīng)常講,一定要搞清楚什么是產(chǎn)業(yè)的變革,什么只是產(chǎn)業(yè)的妥協(xié)。在全球,大家的共識是公共云是產(chǎn)業(yè)的變革,私有云是產(chǎn)業(yè)的妥協(xié)。中國要作好這個抉擇,中國本來傳統(tǒng)的IT基礎(chǔ)就很弱。
一個產(chǎn)業(yè)的誕生有其特質(zhì),不能妥協(xié),妥協(xié)就失去了一次創(chuàng)新機(jī)會,但要活下來是可以妥協(xié)的,先活下來再談創(chuàng)新。若妥協(xié)不影響創(chuàng)新,那就可以妥協(xié);但有些妥協(xié)會影響創(chuàng)新,那就不能妥協(xié)。當(dāng)時做阿里云時,我們就有這方面的思考,做了一些艱難的選擇,否則沒法做事,無法生存。
《財經(jīng)智庫》:但這些妥協(xié)不能影響它根本性的變革。變革與妥協(xié),很深刻。您將云計算都視為基礎(chǔ)設(shè)施,那云計算的“云”如何看待?互聯(lián)網(wǎng)時代的云計算與AI時代的云計算有何區(qū)別?
王堅:應(yīng)該把云計算的“云”視為方法論,這是云計算對其他產(chǎn)業(yè)的貢獻(xiàn),即不同的問題都可以用云的方法論來解決。云計算把“云”的方法論用到了計算上。
這個方法論有兩個特點(diǎn):一是規(guī)模效應(yīng);二是服務(wù)特性。云計算事實上是個服務(wù)的概念,規(guī)模和服務(wù)是其重要特性。規(guī)模,意味著它肯定不是一臺計算機(jī),服務(wù)則是說它不需要計算機(jī),只需要用它的算力就行。過去用算力需要把計算機(jī)買回去,現(xiàn)在則是買算力即可,這是最基本的變革,就是服務(wù)特性。
互聯(lián)網(wǎng)時代的云計算,算力硬件是CPU提供的;AI時代,算力硬件是GPU提供的。理論上,GPU能干的事情CPU都能干,本質(zhì)區(qū)別在于GPU一天的算力,使用CPU可能需要1萬天,在事實上就變得不可行。換言之,產(chǎn)生算力的來源不同,算力的大小就有質(zhì)的不同。
《財經(jīng)智庫》:其結(jié)果也不同,也就是說云計算的規(guī)模發(fā)生了巨大的變化,量變引起質(zhì)變。您剛才提到云計算是方法論,并沒有用“工具”一詞。
王堅:為什么是“方法論”而不是“工具”?規(guī)模很重要,任何東西都要考慮規(guī)模,這是非常重要的一個方面。某種意義上講,今天GPU更加需要這個方法論。IT時代,很少聽說誰要用一萬臺機(jī)器;但在AI時代,大家都說需要萬卡,因為人工智能說的每張卡本質(zhì)上都是一臺計算機(jī),強(qiáng)調(diào)的就是規(guī)模效應(yīng)。
王堅院士與《財經(jīng)智庫》的對話。攝影/李君
《財經(jīng)智庫》:規(guī)模效應(yīng),Scaling Law是這個原理嗎?
王堅:規(guī)模和Scaling Law是兩個有關(guān)聯(lián)卻不同的概念,規(guī)模帶來的量變和質(zhì)變在很多方面存在,但內(nèi)涵不同。規(guī)模效應(yīng)是最基本的約束人類發(fā)展的自然規(guī)律,而Scaling Law是專門特指大語言模型的規(guī)模效應(yīng),如計算成本,規(guī)模越大成本越低,這也是規(guī)模效應(yīng),但不是Scaling Law。大語言模型的規(guī)模效應(yīng)本質(zhì)上是參數(shù)規(guī)模,并產(chǎn)生一些特殊的現(xiàn)象,指的是模型參數(shù)的規(guī)模效應(yīng)。
《財經(jīng)智庫》:那么IT時代的云和AI時代的云有何異同?AI時代中國云服務(wù)的模式和路徑應(yīng)該是怎樣的?
王堅:很難說,但我將此具象化一些。事實上,AI時代給中國的云計算又創(chuàng)造了一次發(fā)展機(jī)會。某種程度上說中國的IT發(fā)達(dá)程度與美國仍有一些差距,特別是中小企業(yè)IT普及率相對較低,一般企業(yè)并不迫切地一定要“上云”。規(guī)模不需要,就很難改變這種現(xiàn)狀。但到了AI時代,規(guī)模效應(yīng)成了必須,這是機(jī)會。
我每次講到阿里云的發(fā)展都會強(qiáng)調(diào)全球化的重要性。云計算技術(shù)的服務(wù)應(yīng)該越來越全球化,總講國內(nèi)的大語言模型在中國用,這是有問題的。越是在全球范圍內(nèi)使用的技術(shù),對云計算的要求就越高,這給我們提供了提升云計算服務(wù)能力的機(jī)會,實際是準(zhǔn)入門檻更高了。阿里云以前在世界排前三,現(xiàn)在又變成第四名了,前面是亞馬遜、微軟和谷歌。撇開其他因素,純粹從市場技術(shù)因素來說,說明我們的人工智能沒有趕上,因為人工智能算力在整個云計算算力的比重被大大提高了。對阿里云來講,既是挑戰(zhàn)也是機(jī)會:能否在人工智能上有一次大提升,趕上了就有可能變成老二,趕不上就會跑到后面去。
其中還有兩個原因,一方面是算力不夠,另一方面則是沒有用好已有算力。我在剛結(jié)束的“上海人工智能大會”上講了一個不等式:就應(yīng)用而言,相對已有的大模型,我們應(yīng)用做得不夠好;相對已有的算力,基礎(chǔ)模型做得不夠好;相對已有的電力供給,算力的規(guī)模還不夠大。所有面臨的問題都要在動態(tài)中解決。
王堅院士與《財經(jīng)智庫》的對話。攝影/李君
《財經(jīng)智庫》:大模型時代,許多端到端的數(shù)據(jù)成為可能,作為阿里巴巴最早的首席架構(gòu)師,阿里云是否會進(jìn)行組織架構(gòu)的調(diào)整,戰(zhàn)略是否也會相應(yīng)調(diào)整?
王堅:戰(zhàn)略就是要成為一個服務(wù)全球的云計算公司,不服務(wù)全球市場就沒有希望。比如在今年法國巴黎奧運(yùn)會上,阿里云本質(zhì)上就是展現(xiàn)服務(wù)全球的能力。技術(shù)能力是前提,同時一定是在服務(wù)中提升自己。人們總愿意將問題的原因簡單歸結(jié)為生態(tài),但實際上能力一定是與高手的過招中形成的,生態(tài)也是過招“打”出來的,在“打殺”過程中練就過硬武功。關(guān)起門來,練就不了“武功”,生態(tài)更無從談起。中國走出去的過程,既是高手過招過程,也是能力提升的過程。
《財經(jīng)智庫》:您認(rèn)為阿里云在全球的服務(wù)方面,還可以步子邁得更大?
王堅:在這方面,阿里云剛剛開始,甚至可以說“開始的開始”,但從云計算角度,阿里云是中國企業(yè)唯一一家真正邁出去的企業(yè)。李強(qiáng)總理在上海人工智能大會期間巡館時,到了阿里云展臺,我主要報告了兩點(diǎn),阿里云既是全球服務(wù),也是全棧服務(wù)。所謂全棧服務(wù),就是別人在我們上面用我們的云計算服務(wù),只要關(guān)注應(yīng)用本身就行。全棧服務(wù)聽起來很抽象,比喻說你買一雙鞋,也同時必須有鞋帶,換成云計算服務(wù)就是要提供最基本的系統(tǒng)服務(wù)能力。但也不能越界,若賣鞋的人把穿的襪子也綁死了,那就做了別人的事情。阿里云要做的就是保證全棧服務(wù),但又不越界去做別人的事情,這就是生態(tài),任何核心能力都是有邊界的。
《財經(jīng)智庫》:您作為阿里云的創(chuàng)始人,實現(xiàn)了從“飛天”技術(shù)平臺到云計算產(chǎn)業(yè)的突破,您覺得在AI時代杭州還會再出現(xiàn)一個阿里云嗎?
王堅:是否在杭州,是否可以用阿里云來對比不好說,但我相信中國還會出現(xiàn)一個現(xiàn)象級的技術(shù)企業(yè)。越是變革的時代越會出現(xiàn)這樣的現(xiàn)象級企業(yè)。如果沒有出現(xiàn)現(xiàn)象級企業(yè),那就是不夠革命的技術(shù)。所謂現(xiàn)象級不一定是公司的大小,OpenAI就是一個現(xiàn)象級公司,但它現(xiàn)在算不上有多大規(guī)模。
美國已經(jīng)出現(xiàn)了現(xiàn)象級公司,在中國有那么多創(chuàng)業(yè)公司,迄今在AI領(lǐng)域還沒有一個現(xiàn)象級企業(yè)。
《財經(jīng)智庫》:您談到了在現(xiàn)象級公司方面的一些差異,那中美現(xiàn)在人工智能在技術(shù)產(chǎn)業(yè)的發(fā)展方向有什么異同?社會上總愿意問到底中美AI技術(shù)距離是拉大了還是縮小了。
王堅:對于中美科技的差距,維度不同,答案就迥異。如果僅從論文研究角度看,有兩個答案。答案一,中美差距只有三個月基本上美國人做出來的東西,我們?nèi)齻月都能做出來;答案二,差距有30年就是美國不做,我們或許永遠(yuǎn)不會去做。不過這與其說是答案,不如說是反思。強(qiáng)調(diào)“0到1”的創(chuàng)新針對的就是這個問題。
從產(chǎn)業(yè)角度,我們更需要從技術(shù)迭代的視角來看。其實,中美距離拉大還是縮小,根本上是一個“動態(tài)”而不是“靜態(tài)”問題。以O(shè)penAI為例,從前谷歌比OpenAI要領(lǐng)先得多,而真正產(chǎn)生突破卻在OpenAI。對于科技創(chuàng)新而言,“加速度”才至關(guān)重要,有加速度即使落后也能趕上,沒有加速度即使先進(jìn)也會落后。
人才的多少也是同樣道理。OpenAI只有600人,谷歌對應(yīng)的有幾千人,而到最后人才的“密度”決定創(chuàng)新的成敗。OpenAI就是人才密度高,谷歌幾千人各自為政;還有就是科研的“強(qiáng)度”,沒有強(qiáng)度,什么都做,最后什么都做不出來。OpenAI的故事是一個很好的案例,人才密度加上科研的強(qiáng)度,創(chuàng)新加速度就出來了。
創(chuàng)新過程中,我們需要問的是,人才密度夠不夠?科研強(qiáng)度夠不夠?創(chuàng)新的加速度夠不夠?否則就會陷在舊有圈子里兜不出來。所以我們需要反思,與其問中美有什么差距,不如想想我們能不能走得更快一點(diǎn)。
2024年5月30日,OpenAI聯(lián)合創(chuàng)始人、首席執(zhí)行官Sam Altman(右)在瑞士日內(nèi)瓦出席國際電信聯(lián)盟(ITU)AI for Good全球峰會。圖/法新《財經(jīng)智庫》:你說AI競爭除了中美兩家,歐洲也在異軍突起,你覺得大家各自在戰(zhàn)略上有什么不同?中國如果想在短時間或中長期形成技術(shù)優(yōu)勢,需要怎么做?王堅:我確實不能談戰(zhàn)略上有什么不同,只能試著給你表述一下。我們總是盯著中美競爭,實際忽略了世界上正在發(fā)生的事情。人們經(jīng)常談?wù)摰娜斯ぶ悄苋揞^或四巨頭中,他們中有兩人今年得了諾獎。四人有六個國籍,其中有兩人有雙重國籍,但只有一個國籍是美國,主要是法國、英國、加拿大,從這個角度上講,美國都不在這個圈子里。但本質(zhì)上講,美國高明地用好了全球人才資源。歐洲之所以會出現(xiàn)Mistral模型,也是用好國際資源的案例。今天的世界就看誰能把國際資源用好,國際的資源配置至關(guān)重要,我們應(yīng)該理性認(rèn)識其關(guān)鍵性。
另外,我們簡單說只有中美競爭也是很靜態(tài)的看法,從科技競爭的角度講,科技的流動性變化更快。美國科技的快速發(fā)展也是二戰(zhàn)后起來的。我始終有個觀點(diǎn),美國根本不是靠“0到1”的創(chuàng)新立國的,它是靠“1到100”的創(chuàng)新立國的,然后靠“0到1”的創(chuàng)新保持領(lǐng)先地位。這是一個動態(tài)的過程,跟發(fā)展階段密切相關(guān)。
如果不是動態(tài)看問題,道理就變得僵化。即使有非常嚴(yán)格對于數(shù)據(jù)的監(jiān)管,Mistral仍然在歐洲橫空出世,也是歐洲少數(shù)幾個在世界上站得住腳的大模型,而中國是否有能與其抗衡的模型還難有定論。中國肯定有自己的優(yōu)勢,但盲目會讓我們付出代價,警覺比盲目要好。警覺不代表悲觀,然而不警覺肯定是錯的,盲目更不可。坏X也不能變成自卑。最糟的就是沒有警覺,盲目迷路。
談到國際,我還是要強(qiáng)調(diào)中國科技企業(yè)要在世界領(lǐng)先,不走向世界是沒有希望的,同時也是我們對全球的貢獻(xiàn)。就像當(dāng)初阿里云討論是否要有國際業(yè)務(wù),我的態(tài)度非常明確:“阿里云如果沒有國際業(yè)務(wù),阿里云現(xiàn)在關(guān)掉就好了”。國際業(yè)務(wù)不僅僅是要拓展一個市場,而是必須走的一條路,是道路選擇問題。中國企業(yè)國際化的一個難點(diǎn)在于,巨大的市場讓企業(yè)很多時候只依賴中國市場就可以活下來,少了一點(diǎn)動力。如果不走向國際市場,能力就會被削弱,而科技企業(yè)的能力往往也是國家綜合能力的體現(xiàn)。
AI應(yīng)用:認(rèn)知+創(chuàng)新過程《財經(jīng)智庫》:很好奇,您就像謎一樣神奇的存在,每個人都會碰到自己認(rèn)知的邊界,您是怎么打破知識局限完成其轉(zhuǎn)化的?創(chuàng)新,有些方面肯定不是自己固有的領(lǐng)域所熟知的,除了自身學(xué)習(xí),也有聘請更有能力的人來合作,怎么突破自己認(rèn)知上的邊界?
王堅:這個超出我可以回答的能力,對我來講是自然而然發(fā)生的。人的知識有兩種,一種是可以說清的,另一種是說不清的,或者說是生命中與生俱來的。但有一點(diǎn)可以肯定,我不是一個簡單從書本上找依據(jù)的人,當(dāng)然我也不是一個不讀書的人。
瑞士有位著名心理學(xué)家讓皮亞杰,研究發(fā)展心理學(xué),尤其是研究兒童心理發(fā)展,他的認(rèn)知發(fā)展理論成為這個學(xué)科的典范。他將人的知識結(jié)構(gòu)分成兩種:同化和順應(yīng)!巴笔前研碌臇|西納入舊有的知識結(jié)構(gòu)里;“順應(yīng)”是當(dāng)接納新知識時,重構(gòu)原來的知識框架來適應(yīng)新的環(huán)境和狀況。順應(yīng)是讓人去適應(yīng)新的知識,而不是知識來適應(yīng)你。我肯定“順應(yīng)”的體會多一點(diǎn),不會簡單地把新東西納到原來的知識框架里,更不會讓原有的知識約束我。
《財經(jīng)智庫》:事實上是重塑,新的知識在你舊有的框架下重新組織,形成新的認(rèn)知框架。人類的“認(rèn)知”概念來自心理學(xué)?
王堅:Cognition(認(rèn)知)是心理學(xué)的概念,人類較為高級的功能或心理活動都叫Cognition,這個認(rèn)知跟哲學(xué)的認(rèn)知不是同一含義,而是與記憶、注意、學(xué)習(xí)等都有關(guān)聯(lián),沒有一個跟“注意”沒有關(guān)系的“記憶”,也沒有一個跟“記憶”沒有關(guān)系的“學(xué)習(xí)”,整體就被稱之為認(rèn)知。
《財經(jīng)智庫》:最近諾貝爾物理獎得主說,記憶不是一個簡單的重復(fù),而是一種重塑,與您剛才講得有些接近。
王堅:為什么稱之為“重塑”?記憶就是重塑神經(jīng)元之間的連接。記憶的偏好,就是神經(jīng)元之間相互鏈接的關(guān)系改變了。而對于今天的大語言模型來講,就是權(quán)重發(fā)生了變化。
《財經(jīng)智庫》:您是一個能把復(fù)雜問題簡單化的人,這也是人類認(rèn)知的最高階段,有穿透力的洞見之人。
王堅:不能把問題復(fù)雜化,深入淺出,就是大道至簡。淺入淺出沒有價值,淺入深出很糟糕,而深入深處大家都搞不懂。深入淺出是最好的一種組合!
《財經(jīng)智庫》:前一段在杭州調(diào)研,走訪了60余家企業(yè),也去了阿里云。調(diào)研中發(fā)現(xiàn)AI的應(yīng)用依然是個難題,尤其在企業(yè)和產(chǎn)業(yè)應(yīng)用中,是普遍存在的問題,你覺得最大的難點(diǎn)是什么?諾貝爾物理學(xué)獎和化學(xué)獎讓人看到AI應(yīng)用的潛力和前景,但在“百模大戰(zhàn)”的環(huán)境下,“應(yīng)用”依然是問題,你認(rèn)為中國產(chǎn)業(yè)和科技的銜接上突破點(diǎn)在哪兒?
王堅:從ChatGPT看,此前很多人會簡單、籠統(tǒng)地認(rèn)為ChatGPT是大語言模型,但實際上ChatGPT是GPT+chat,GPT才是大語言模型,chat是應(yīng)用場景。大語言模型很多人都在做,但為何只有OpenAI能夠橫空出世?除了GPT做得出色,OpenAI對Chat的認(rèn)識足夠深,對技術(shù)的理解也足夠透。所以一件事情的發(fā)生一定是兩個前提同時具備:一是對要解決的問題有足夠深刻的認(rèn)識;二是對技術(shù)也要有足夠的認(rèn)知。
這就說到了應(yīng)用困難。很多人甚至連自己要解決的問題都說不清楚,如何做應(yīng)用?而要知道某項技術(shù)在今天水平有沒有能力來解決他們需要解決的問題,技術(shù)判斷變得極其重要。OpenAI當(dāng)時并不是只做了ChatGPT,而是做了很多不同領(lǐng)域的應(yīng)用,只不過ChatGPT是最有效的。
其實,大部分人對我們今天要解決的問題本身認(rèn)識不夠深刻,所以AI的應(yīng)用不能簡單“+行業(yè)”,或者“+場景”那么簡單。任何創(chuàng)新都是有判斷,更是有代價的。
王堅院士與《財經(jīng)智庫》的對話。攝影/李君
《財經(jīng)智庫》:關(guān)鍵是加什么,怎么加。
王堅:行業(yè)到底存在什么問題,而問題是否是現(xiàn)有技術(shù)可以解決的,如果這兩點(diǎn)都不清楚,“+行業(yè)”就是盲目湊熱鬧。
ChatGPT已經(jīng)把一個最基本的應(yīng)用Chat做好了,接下來是什么?比如我和新加坡科技部長交流,談到城市的問題遠(yuǎn)遠(yuǎn)比ChatGPT要復(fù)雜得多,如果能把Transformer用到城市運(yùn)營或治理的優(yōu)化上,其研究規(guī)?赡鼙痊F(xiàn)在要大得多。同樣,氣象預(yù)報也是如此。
現(xiàn)在說起大語言模型就想到ChatGPT這樣的場景,但更具顛覆性的場景是在制造業(yè)、城市、新能源、生物等其他領(lǐng)域,盡管技術(shù)與應(yīng)用的本質(zhì)原理或許一樣。不能簡單的想象“應(yīng)用”,事實上它是個創(chuàng)新過程。創(chuàng)新過程有了結(jié)果,才能把它叫作應(yīng)用,在創(chuàng)新沒有結(jié)果之前它就是過程。
《財經(jīng)智庫》:我們聊聊之江實驗室。自從您成為之江實驗室的“掌門人”后,目標(biāo)更為聚焦,聚焦在了智能計算,并開始新一輪綜合性改革和規(guī)則的變化。你覺得從人才、資金以及機(jī)制,之江實驗室能夠勝任這項工作?您始終強(qiáng)調(diào)機(jī)制創(chuàng)新的重要性,之江實驗室的機(jī)制如何評估?
王堅:機(jī)制是什么?以任務(wù)為導(dǎo)向的實驗室需要具備以大團(tuán)隊完成科研任務(wù)的能力,但我們以前的科研機(jī)構(gòu)不太適應(yīng)需要幾十個人或上百人共同緊密協(xié)同才能完成的事,適合做小項目。重大科研任務(wù)簡單地拆成了不能成為有機(jī)整體的小項目,一個科研任務(wù)就自然會失去其戰(zhàn)略價值。重大科研任務(wù)需要重投入、重人才的大兵團(tuán)作戰(zhàn),區(qū)別于學(xué)校里導(dǎo)師帶學(xué)生的小團(tuán)隊機(jī)制,各自為戰(zhàn)。之江實驗室更要做到有組織的科研與自由探索的緊密結(jié)合,融為一體。之江實驗室的任務(wù)要求我們既要有成建制的突破,同時又保留相對自由探索的創(chuàng)新,這對我們的工作提出了非常高的要求。
之江實驗室慢慢找到了對浙江創(chuàng)新發(fā)展來講一個很重要的機(jī)制,這是普通學(xué)校和科研機(jī)構(gòu)所不具備的,我們走了一條獨(dú)特的路。
《財經(jīng)智庫》:市場機(jī)制在之江實驗室如何起作用?我們知道,政府給了實驗室很多支持。
王堅:之江實驗室就是政府支持的,因為它承擔(dān)了國家的使命。但同時市場機(jī)制會對之江實驗室的成敗起很大的作用。我們必須在四個不同層面上思考機(jī)制問題:社會機(jī)制、市場機(jī)制、商業(yè)機(jī)制和信用機(jī)制。我們往往把市場化和商業(yè)化劃等號,對我來講,這是兩個不同的概念。商業(yè)化,就是一手交錢一手交貨,非常簡單;市場化,它要符合經(jīng)濟(jì)學(xué)規(guī)律,但不見得一定要一手交錢一手交貨;社會化,即指動用社會資源才能完成市場化的過程。社會化很重要,因為很多社會資源難以拿錢來衡量,但它對完成一件事至關(guān)重要。
之江實驗室就是在社會化跟市場化之間完成了交融,也就是說,不用一手交錢一手交貨,比商業(yè)化更加有時間的寬容度,但符合市場規(guī)律和經(jīng)濟(jì)學(xué)規(guī)律。機(jī)制理順了,實驗室就會有大突破。
《財經(jīng)智庫》:最后一個問題,聽說有關(guān)部門正在討論建設(shè)全國統(tǒng)一的算力網(wǎng),您怎么看?
王堅:取決于算力網(wǎng)如何定義用處,因為算力有完全不同的用法。如果講算力資源需要有個更好的共享和流通機(jī)制,這個概念是對的,這也是云計算最初要解決的基本問題。但如果是想通過算力網(wǎng)解決人工智能大語言模型訓(xùn)練的算力問題,那就需要認(rèn)真推敲了。做任何一件事一定要說清究竟解決什么問題,不然很難說是對還是錯。嚴(yán)格來講,大部分今天說的算力網(wǎng)要解決的問題就是云計算要解決的。事實上,目前云計算就是最大的算力網(wǎng)。