展會(huì )信息港展會(huì )大全

復旦大學(xué)NLP實(shí)驗室核心成員:我們低估了ChatGPT影響力
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-02-22 10:08:51   瀏覽:6686次  

導讀:時(shí)下科技領(lǐng)域最熱的概念莫過(guò)于ChatGPT。 2月20日,復旦大學(xué)邱錫鵬團隊推出中國版ChatGPTMOSS,這是國內第一個(gè)公布的對話(huà)式大型語(yǔ)言模型,熱情的用戶(hù)涌入一度導致其服務(wù)器被擠崩。 21日晚,第一財經(jīng)連麥學(xué)界、法律界大V,共同探討了ChatGPT的應用、誤讀以及其...

時(shí)下科技領(lǐng)域最熱的概念莫過(guò)于ChatGPT。

2月20日,復旦大學(xué)邱錫鵬團隊推出中國版ChatGPT“MOSS”,這是國內第一個(gè)公布的對話(huà)式大型語(yǔ)言模型,熱情的用戶(hù)涌入一度導致其服務(wù)器被擠崩。

21日晚,第一財經(jīng)連麥學(xué)界、法律界大V,共同探討了ChatGPT的應用、誤讀以及其牽涉的法律風(fēng)險和商業(yè)倫理問(wèn)題。

復旦大學(xué)計算機科學(xué)技術(shù)學(xué)院教授張奇參與了本次討論,他正是推出MOSS的復旦大學(xué)NLP實(shí)驗室的核心成員之一,就當下所面臨的一些爭議,他表示MOSS并不代表國內最好的模型,團隊只是想在學(xué)術(shù)上進(jìn)行數據收集,進(jìn)入更詳細的探討。

作為專(zhuān)業(yè)研究者,張奇復現了ChatGPT 推出背后所需要投入的資源,這是一個(gè)非常耗時(shí)、耗人且耗錢(qián)的一個(gè)過(guò)程。他表示,這不僅對于學(xué)術(shù)界來(lái)說(shuō)是不小的投入,甚至對于互聯(lián)網(wǎng)大廠(chǎng)來(lái)說(shuō),做這類(lèi)研究都是一個(gè)不小的投入。

MOSS邁出第一步

相對于ChatGPT,MOSS仍然有非常大的差別,在直播中,張奇直言,“ChatGPT是千億級的模型,我們只有百億級。此外在指定微調的階段ChatGPT并沒(méi)有公開(kāi),但是能夠看到的版本已經(jīng)有1800種任務(wù),團隊只有數百種任務(wù),規模上遠遠小于它。”

張奇所在的復旦團隊從整體上復現了ChatGPT的步驟,他解釋道,語(yǔ)言模型的最后一步需要人的參與,如果沒(méi)有用戶(hù)的真實(shí)數據,團隊很難對模型進(jìn)行提升,也很難再進(jìn)行下一步的研究。這也是MOSS推出的背景。

推出當時(shí)團隊并沒(méi)有考慮太多,隨后而來(lái)的熱度和爭議也是團隊沒(méi)有想到的,“我們低估了ChatGPT和MOSS的影響力。”

面臨爭議,2月21日,復旦團隊在MOSS官網(wǎng)發(fā)布公告致歉,稱(chēng)模型還不成熟,距離ChatGPT還有很長(cháng)的路需要走,“我們一個(gè)學(xué)術(shù)研究的實(shí)驗室無(wú)法做出和ChatGPT能力相近的模型,MOSS只是想在百億規模參數上探索和驗證 ChatGPT的技術(shù)路線(xiàn),并且實(shí)現各種對話(huà)能力。”

對于ChatGPT 背后模型所擁有的1750億的參數規模,張奇表示,學(xué)校這類(lèi)機構很難去完成,目前百億級的規模都已經(jīng)非常困難。

按照ChatGPT目前開(kāi)源的最簡(jiǎn)單的復現版本、最便宜的模式去計算,要做到1750億的參數規模,需要大概6000萬(wàn)的硬件成本,同時(shí)運算3年5個(gè)月。這還是所有事情都做對的情況,如中間有參數調整,或者想加速訓練過(guò)程,就需要更高規模的投資。

按ChatGPT的規模估算,張奇判斷OpenAI大概為此耗費了十幾億的硬件投資,不包括頂級的算法研究人員的投資,以及后續對大量用戶(hù)數據收集的投資。

“這其實(shí)是一個(gè)非常耗時(shí)、耗人且耗錢(qián)的一個(gè)過(guò)程。”不僅對于學(xué)術(shù)界來(lái)說(shuō)是不小的投入,甚至對于互聯(lián)網(wǎng)大廠(chǎng)來(lái)說(shuō)都是一個(gè)不小的投入。

因此,在資金、算力的投入門(mén)檻下,面臨應用場(chǎng)景和商業(yè)化的不確定性,團隊和企業(yè)敢不敢去做這類(lèi)研究,每一步都制約著(zhù)在這個(gè)領(lǐng)域的進(jìn)步。

盡管當下面臨很多問(wèn)題,張奇所在的實(shí)驗室對于ChatGPT所帶來(lái)的通用人工智能的可能性仍充滿(mǎn)期待。

“實(shí)驗室很多同學(xué)都已經(jīng)是997,我們大概8點(diǎn)就已經(jīng)到辦公室,晚上10點(diǎn)才回家。這種狀態(tài)就像我們看到了萊特兄弟的飛機飛10米的那個(gè)狀態(tài),然后我們想把它飛到100米,去實(shí)現那樣的可能性。”

ChatGPT被過(guò)譽(yù)了嗎

ChatGPT的能力到底如何?張奇團隊對此做了一個(gè)針對ChatGPT的高考測試,發(fā)現其展現了很好的理解和推理能力。

以2022年的高考全國卷為例,在把一些復雜的問(wèn)題排除掉后,ChatGPT可以達到76%的準確率和67%的得分率,在文科上能夠達到78%的得分率。綜合來(lái)看,ChatGPT在高考中可以獲得500分左右的成績(jì),相當于是二本線(xiàn)的一個(gè)結果。

但就目前ChatGPT所引起的追捧來(lái)看,它是否被過(guò)譽(yù)了?上海大邦律師事務(wù)所高級合伙人游云庭提到,自己是國內較早使用ChatGPT的用戶(hù),但用了兩天就失去興趣,因為現有的互聯(lián)網(wǎng)對他這類(lèi)成熟網(wǎng)民來(lái)說(shuō)仍然是更好的選擇。

游云庭并不認為ChatGPT可以顛覆搜索,ChatGPT更多偏向于咨詢(xún),和搜索引擎是兩類(lèi)產(chǎn)品,且主流用戶(hù)已經(jīng)適應了搜索引擎,以目前ChatGPT所展現的能力還無(wú)法替代。

此外,ChatGPT還需要很長(cháng)的時(shí)間去開(kāi)發(fā)進(jìn)行二次落地,“像VR、元宇宙這些概念提出來(lái)之時(shí)都很熱,但現在都相對平靜了,因為這些技術(shù)的開(kāi)發(fā)實(shí)際上都需要很長(cháng)的時(shí)間,這是誤導性的問(wèn)題。”游云庭表示。

復旦大學(xué)管理學(xué)院助理教授李文文還提到,目前大眾的一個(gè)誤區是對ChatGPT取代人類(lèi)的工作的擔憂(yōu),現在網(wǎng)上一些文章或者短視頻,用一些或許比較夸張的標題營(yíng)造了一些恐慌,對于不了解AI產(chǎn)品或是技術(shù)的人,甚至會(huì )對技術(shù)產(chǎn)生消極的情緒。

但實(shí)際上,就現階段的ChatGPT而言,它仍然是一個(gè)對話(huà)型的AI產(chǎn)品,距離商業(yè)落地有比較長(cháng)的路要走。在試用ChatGPT的時(shí)候也會(huì )發(fā)現它其實(shí)存在一些事實(shí)性的錯誤。

如果僅僅把ChatGPT當做娛樂(lè )向的產(chǎn)品,錯誤是可以接受的,但如果要將它應用在企業(yè)的業(yè)務(wù),如醫療健康、法律領(lǐng)域,它會(huì )產(chǎn)生一些嚴重的后果。

基于此,李文文認為ChatGPT并不會(huì )對人類(lèi)的工作造成太大威脅,未來(lái)可能更多是人工智能產(chǎn)品被引入到更多的行業(yè),去輔助而不是取代我們的工作。

作為一名律師,游云庭也提到,作為一個(gè)工具,ChatGPT確實(shí)能夠一定程度提高效率,但并不會(huì )對法律行業(yè)造成挑戰。

“我試著(zhù)用ChatGPT生成一份合同,給它設定一個(gè)任務(wù),給了一些條件,這份合同出來(lái)之后我松了一口氣,我的職業(yè)看起來(lái)是比較難取代的。”游云庭提到,在ChatGPT的合同中,有一些邏輯上的錯誤,前后仍然有一些矛盾,還需要很多的細調。但僅僅是這樣的細調,在人工智能領(lǐng)域或許就需要耗時(shí)不短的時(shí)間,才能達到對于商業(yè)化的要求。

在訴訟方面,美國一家企業(yè)已經(jīng)開(kāi)發(fā)了一個(gè)人工智能律師,一定程度上的確可以取代律師的工作,但法律服務(wù)在所有國家都是有壁壘的,包括律師的牌照。而是否允許人工智能參與到法律服務(wù)中,還涉及到人工智能的倫理問(wèn)題。

“在這些問(wèn)題沒(méi)有搞清楚之前,我相信任何一個(gè)國家的律師主管部門(mén),都不會(huì )輕易給人工智能發(fā)牌照。從訴訟的角度來(lái)說(shuō)類(lèi)似ChatGPT的一些應用,要挑戰律師飯碗也挺難。”游云庭說(shuō)。

贊助本站

人工智能實(shí)驗室
相關(guān)內容
AiLab云推薦
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗室 版權所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責聲明 | 隱私條款 | 工作機會(huì ) | 展會(huì )港