黄色网站va,欧美一区综合,91九色成人,亚洲午夜视频,综合激情久久,伊人成网站222综合网,三级在线观看视频

甲子光年對話RockAI劉凡平:以群體智能挑戰(zhàn)OpenAI的造神之路

相比于單體智能,甲光群體智能才是智能的本質(zhì)。

甲子光年對話RockAI劉凡平:以群體智能挑戰(zhàn)OpenAI的造神之路

 

作者|甲小姐 田思奇

ChatGPT呼嘯而來的年對近兩年,市場的大共識是AI即未來。但大概念之下,劉路諸多命題爭議并未收斂:開源還是閉源?商業(yè)如何閉環(huán)?Scaling law的天花板在哪里?通往世界模型與AGI的途徑是否唯一?AI最終是否會失控?

這些討論中蘊(yùn)含一個(gè)關(guān)鍵命題:Transformer機(jī)制是否是永遠(yuǎn)的主導(dǎo)范式?

從全球AI從業(yè)者的行動來看,Transformer架構(gòu)已經(jīng)吸附了巨量的資本和人才,讓挑戰(zhàn)這一“鐵王座”的任務(wù)變得格外艱巨。然而,凡平科技爆發(fā)如同自然進(jìn)化和物種演進(jìn),沒有變異就沒有進(jìn)化的原動力,缺乏多樣性往往意味著生態(tài)的脆弱,因此,「甲子光年」始終在尋找挑戰(zhàn)這一“鐵王座”的孤勇者。

這一次,群體我們迎來了RockAI巖芯數(shù)智。這家隸屬于巖山科技的挑戰(zhàn)新銳公司剛剛成立一年多,但早在2024年初便發(fā)布了非Transformer架構(gòu)的Yan架構(gòu)大模型,并在9月將其迭代至具有多模態(tài)能力的Yan1.3模型,實(shí)現(xiàn)了在手機(jī)、電腦,甲光甚至樹莓派等廣泛設(shè)備端上的無損部署。

當(dāng)前,年對大部分人工智能從業(yè)者所置身的是一場“由OpenAI提出概念,Meta負(fù)責(zé)開源,國內(nèi)市場專注應(yīng)用”的技術(shù)接力賽,但RockAI CEO劉凡平放棄了這條路。

在行業(yè)持續(xù)加碼數(shù)據(jù)和算力的劉路軍備競賽中,劉凡平致力于基礎(chǔ)理論層創(chuàng)新,他認(rèn)為,算法仍有機(jī)會在2024年實(shí)現(xiàn)革命性突破。在OpenAI等巨頭投入海量資源,凡平旨在開發(fā)如神明一般無所不能的人工智能時(shí),劉凡平堅(jiān)信,行業(yè)不需要“造神”,也足以抵達(dá)AI巨變的另一種可能——群體智能。

本文,群體甲小姐對話RockAI巖芯數(shù)智CEO劉凡平。

1.“如果投入的挑戰(zhàn)資源和結(jié)果不成正比,那一定是在某個(gè)環(huán)節(jié)出了問題,我們認(rèn)為這個(gè)環(huán)節(jié)就是算法”

甲小姐:在全球人工智能行業(yè)的聚光燈下,擺在AI從業(yè)者面前的是兩條路:一是不斷加大資金、能源和數(shù)據(jù)的甲光投入追趕OpenAI等領(lǐng)先者的“造神”之路,二是尋找新的路徑。為什么RockAI選擇了后者?年對

劉凡平:我們也曾走在第一條路上,但到了2021年初,我意識到Transformer架構(gòu)無法支撐我走得更遠(yuǎn)。它在算力消耗、劉路數(shù)據(jù)處理等方面存在諸多問題。因此,我們決定走一條全新的路,開發(fā)一種更優(yōu)秀的模型。

眾所周知,人工智能的發(fā)展離不開三大要素:數(shù)據(jù)、算法和算力。其中,數(shù)據(jù)和算力都是有限的資源。我們不能依賴有限的資源來創(chuàng)造更偉大的成就,這種投入的成本也高得難以估量。“造神”工程對于現(xiàn)階段的我們來說越來越難。

如果投入的資源和結(jié)果不成正比,那一定是在某個(gè)環(huán)節(jié)出了問題,我們認(rèn)為這個(gè)環(huán)節(jié)就是算法。當(dāng)然算法的突破并非一蹴而就,我們需要在漫長的過程中不斷挑戰(zhàn)底層邏輯來實(shí)現(xiàn)創(chuàng)新。

甲小姐:目前市場在算力和數(shù)據(jù)方面投入越來越多,是什么讓你堅(jiān)信當(dāng)前的主要癥結(jié)仍在于算法?

劉凡平:我舉個(gè)例子,你知道人類大腦的功率是多少瓦嗎?

甲小姐:30瓦。

劉凡平:沒錯(cuò),30瓦不到,而一臺GPT服務(wù)器的功率遠(yuǎn)超于此。人類僅憑20多瓦的功率就能產(chǎn)生更高級的智能——這表明,人類的聰明程度并不與算力直接相關(guān)。

在數(shù)據(jù)層面,我們訓(xùn)練Transformer大模型通常需要10TB的數(shù)據(jù)。然而從小學(xué)到博士,我們學(xué)習(xí)的數(shù)據(jù)總量遠(yuǎn)低于10TB。為什么人類能在如此低的數(shù)據(jù)量和算力下產(chǎn)生智能?我們認(rèn)為是因?yàn)闄C(jī)器缺乏合適的算法。因此,算法才是核心。

從人工智能的發(fā)展來看,Transformer架構(gòu)誕生于2017年,但在此之前我們已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,RNN、LSTM等模型在當(dāng)時(shí)也很優(yōu)秀,但總有更優(yōu)秀的模型來替代它們。所以,盡管Transformer架構(gòu)在當(dāng)下很優(yōu)秀,它也并不能代表未來。

甲小姐:不得不承認(rèn),Transformer在此時(shí)此刻是主導(dǎo)性范式。全世界和你持有相同觀點(diǎn)的人有多少?

劉凡平:挺多的。獲得圖靈獎(jiǎng)的深度學(xué)習(xí)三巨頭(楊立昆、本杰奧和辛頓)在不同場合都提過現(xiàn)有模型架構(gòu)的一些問題。今年上半年英偉達(dá)舉行GTC大會時(shí),《Attention is All You Need》論文的作者之一也提到我們需要比Transformer更好的架構(gòu)。

甲小姐:在今年5月的甲子引力大會上,我詢問了包括朱嘯虎、傅盛等嘉賓關(guān)于Transformer是否是“鐵王座”的問題。大家的觀點(diǎn)是,也許它并非最佳,但也看不到第二條出路。如果你要重新定義主流范式,那達(dá)到什么程度時(shí),會讓你覺得這條路跑通了?

劉凡平:我們已經(jīng)成功驗(yàn)證了我們的技術(shù)路線,Yan架構(gòu)大模型在某些方面已經(jīng)超越了Llama3的表現(xiàn);特別是在訓(xùn)練效率、成本控制及推理吞吐量等方面,都展現(xiàn)出了明顯的優(yōu)勢。

其次,我們的追求是讓每個(gè)人都能享受到AI帶來的便利,讓更多設(shè)備用上AI?,F(xiàn)階段我們也達(dá)到了這樣的狀態(tài),我們最低在樹莓派上就可以運(yùn)行——相當(dāng)于家里的機(jī)頂盒都可以用上大模型。這會讓每一個(gè)覺得大模型很遙遠(yuǎn)的人都感受到它近了。

我們9月發(fā)布的Yan 1.3是完全在設(shè)備端運(yùn)行的版本。最近舉行的開放日活動上,我們展示了搭載Yan1.3的多種設(shè)備,包括無人機(jī)、機(jī)器人、樹莓派、手機(jī)、AIPC等。Yan1.3還具備了多模態(tài)交互的能力,它能夠處理文本、視覺和音頻輸入,同時(shí)提供文本和音頻輸出,從而實(shí)現(xiàn)人機(jī)交互的過程。

甲小姐:在這么多終端上的多模態(tài)部署是如何實(shí)現(xiàn)的?

劉凡平:以樹莓派這類開發(fā)板為例,它不僅能被應(yīng)用于家庭中的機(jī)頂盒,還能被集成到冰箱、洗衣機(jī)等多種家電產(chǎn)品中。這表明我們的技術(shù)可以廣泛應(yīng)用于家庭和工作場所等多種環(huán)境。

但是把傳統(tǒng)的Transformer架構(gòu)集成到這些設(shè)備上存在很多困難。目前主流的做法,如模型的量化、裁剪和蒸餾等,雖然可以將大模型壓縮來適應(yīng)小型設(shè)備,但這些方法可能導(dǎo)致模型失真。失真是指在模型壓縮過程中,原始模型中的參數(shù)值被簡化為近似值,例如π被簡化為3.14。大量的參數(shù)縮減可能導(dǎo)致模型性能的顯著下降,從而影響實(shí)際應(yīng)用的效果。我們希望實(shí)現(xiàn)無損部署,把自主學(xué)習(xí)能力衍生下來。

甲小姐:怎么做到從有損到無損的部署?

劉凡平:我們改變了Transformer的Attention機(jī)制。 在GTC大會上,有演講者提到,即使是執(zhí)行簡單的計(jì)算任務(wù),如2+2,傳統(tǒng)AI模型中的所有參數(shù)都會參與運(yùn)算。然而人類的大腦并非這樣工作。你開車的時(shí)候會集中注意力在路面信息上,這時(shí)大腦中的視覺皮層會被大量激活,而當(dāng)你在晚上睡覺時(shí)閉上眼睛思考問題,視覺皮層的活動就會減少,因?yàn)檫@時(shí)不需要處理視覺信息。

這個(gè)例子說明,人腦在處理不同任務(wù)時(shí),只有相關(guān)的神經(jīng)元會參與運(yùn)算?;谶@一原理,我們也在我們的AI模型中實(shí)現(xiàn)了類似的類腦機(jī)制。我們希望模型在執(zhí)行特定任務(wù)時(shí),只有與該任務(wù)相關(guān)的參數(shù)參與運(yùn)算。

這不意味著其他參數(shù)沒有意義,而是它們在不同的條件下才會被激活。這樣的設(shè)計(jì)模擬了人腦的工作方式,使得模型在處理信息時(shí)更加高效和有針對性。

甲小姐:你用類腦機(jī)制規(guī)避了Transformer那種暴力性的投入。但大腦是很難被理解的。我也不知道睡前半夢半醒的狀態(tài)下,我的哪些腦細(xì)胞被激活了,哪些參數(shù)被壓抑了。我們都還沒有完全理解我們的大腦,你如何做到類腦?

劉凡平:我們的途徑是類腦智能,而不是復(fù)制一個(gè)真正的大腦。人類大腦已經(jīng)演化出一套高效的機(jī)制和反應(yīng)方式,我們可以將這些特性整合到我們的AI模型中。這些模型應(yīng)該借鑒大腦的最佳特性來提高性能和效率。說得更直白一些,Attention機(jī)制的早期理念也包含類腦的元素,但它沒有按照完整的類腦方式去實(shí)現(xiàn)。既然生物界已經(jīng)有很好的方案,我們?yōu)槭裁床灰?

甲小姐:Transformer有意地讓渡了很多人為設(shè)計(jì),是為了更好地泛化到不同的場景中。在面對高度復(fù)雜的端側(cè)環(huán)境或應(yīng)用場景時(shí),如何確保你們的機(jī)制具備類似transformer的泛化能力和適應(yīng)性?

劉凡平:類腦分區(qū)激活的過程完全是模型自我形成的,沒有外部的人為干預(yù)。神經(jīng)元的激活模式完全由模型根據(jù)其所處環(huán)境自主決定,從而在底層技術(shù)上確保了這一機(jī)制的自然性和適應(yīng)性。

我們的理念是讓機(jī)器直接與現(xiàn)實(shí)世界交互并從中學(xué)習(xí),這比單純依賴于人工準(zhǔn)備的數(shù)據(jù)集進(jìn)行訓(xùn)練更為有效。正如兒童通過與社會的實(shí)際互動來獲取知識和技能一樣,機(jī)器也需要置身于真實(shí)的環(huán)境中實(shí)現(xiàn)更加豐富和深刻的學(xué)習(xí)體驗(yàn)。因此,我們要使更多的設(shè)備能夠承載這些先進(jìn)的模型,并將其廣泛部署到千家萬戶之中,從而允許它們在多樣化的應(yīng)用場景中不斷學(xué)習(xí)和完善自身。從技術(shù)和數(shù)據(jù)的角度來看,更真實(shí)的數(shù)據(jù)有助于推動模型變得更聰明。

甲小姐:具體到端側(cè),Yan模型是如何在機(jī)器人、無人機(jī)這種設(shè)備下體現(xiàn)你所說的這些特征的?

劉凡平:比如在無人機(jī)應(yīng)用場景中,我拿著甲小姐的照片給無人機(jī)看,指示它識別并尋找甲小姐是否位于室外的某個(gè)地方,比如操場或運(yùn)動場。無人機(jī)就能夠理解我的指令,自動起飛,前往指定區(qū)域內(nèi)搜索甲小姐并拍照。再比如集體拍照環(huán)節(jié),我可以跟無人機(jī)說,等到我招手或者集體起跳的時(shí)候再拍照。這種感知能力是傳統(tǒng)模型達(dá)不到的。

甲小姐:可是,你把這樣的智能做到無人機(jī)和路由器里,我也并不會認(rèn)為無人機(jī)活了,或者路由器活了,他們和我們直覺里的“智能”不太一樣。

劉凡平:但是你會感覺到它的智能,因?yàn)樗_實(shí)解決了你的實(shí)際問題。原來空調(diào)是沒有智能的,現(xiàn)在我們隱約感覺到它有了智能,包括冰箱也是。大家正在適應(yīng)這個(gè)過程,而我們在做的是加速這個(gè)過程,幫助我們通往人機(jī)共融共生的智能時(shí)代。

未來智能體的數(shù)量會遠(yuǎn)超人口總數(shù)的很多倍。這一比例變高不是壞事,它意味著人能獲得的服務(wù)越來越好,生產(chǎn)效率也越高。

2.“相比于單體智能,群體智能才是智能的本質(zhì)”

甲小姐:你選擇了一條hard模式的創(chuàng)業(yè)路。通常創(chuàng)業(yè)公司會乘著時(shí)代紅利加強(qiáng)創(chuàng)新成功的概率,但你要挑戰(zhàn)最主流的范式,在基礎(chǔ)理論層做創(chuàng)新。你認(rèn)為RockAI可以脫穎而出的“法門”是什么?

劉凡平:RockAI致力于底層邏輯的創(chuàng)新,核心目標(biāo)是實(shí)現(xiàn)群體智能。群體智能由多個(gè)能夠自主學(xué)習(xí)的智能單元組成,它們通過環(huán)境感知、自我組織、相互交流和協(xié)同合作來完成復(fù)雜任務(wù),并在復(fù)雜環(huán)境中實(shí)現(xiàn)整體智能的提升。

從螞蟻到狼群,再到人類社會,都存在邁向群體智能的過程。通過這種方式,我們可以更有效地利用資源,實(shí)現(xiàn)智能的全面提升,而不僅僅依賴單一的技術(shù)創(chuàng)新或概念。

甲小姐:你剛才說過“造神式”的人工智能投入產(chǎn)出比不合理,你所做的群體智能是否僅僅是因?yàn)橘Y源有限才退而求其次的戰(zhàn)術(shù)選擇?

劉凡平:并非如此。相比于單體智能,群體智能才是智能的本質(zhì)。比如我們體內(nèi)的一個(gè)白細(xì)胞對于免疫系統(tǒng)來說沒有意義,但一群白細(xì)胞就能產(chǎn)生免疫作用。狼群也通過相互協(xié)作來捕食獵物。人類社會也早已證明,在追求最高智能的過程中,還是要依靠群體的智慧。我們所有的成果,包括前沿科技,航空航天等等,都是群體智能的成果。

甲小姐:群體智能和傳統(tǒng)的云端協(xié)作有什么區(qū)別?

劉凡平:云端協(xié)作中有一些任務(wù)在設(shè)備端完成,有一些在云端完成。人類社會中也有群體智能。假設(shè)在辦公室里,每一個(gè)人是獨(dú)立的個(gè)體,云相當(dāng)于公司,每個(gè)人會遵守公司的一些制度。我們所理解的群體智能中的端和云,是價(jià)值的傳遞和能力的對齊與理解。

甲小姐:OpenAI的核心是造出強(qiáng)大的“單一神明”,可以解決我所有的問題和疑惑,成為我的助理。而你要做的是智能的集體,每一個(gè)單體在協(xié)作機(jī)制下涌現(xiàn)出更符合自然法則的智能體系?

劉凡平:是的。OpenAI造出的“神”需要人的信仰與崇拜,它會加速信息不公平。我們更希望每個(gè)人都能公平地獲得信息。

為什么要追求OpenAI的模式,創(chuàng)造一個(gè)所謂的“神”?從更高的維度來說,為什么我們要尋找單一最聰明的智能體?一個(gè)小孩長到10歲左右,他的知識面可能還不夠廣泛,但我們能判斷出這個(gè)孩子有潛力。這說明我們更看重孩子的學(xué)習(xí)能力,而不是他出生時(shí)的聰明程度。智能體最重要的是與社會進(jìn)化同步的能力,而不是它絕對的聰明程度。

甲小姐:OpenAI的做法可能代表工程師特有的一種野心。工程師都喜歡造物,都想扮演造物主。

劉凡平:但是人類無法創(chuàng)造這類生物,因?yàn)楦袃r(jià)值的東西不是創(chuàng)造生物,而是以人類為中心去創(chuàng)造價(jià)值。我們應(yīng)該以人為中心,而不是以神為中心。

甲小姐:人造神具有一種神秘感,讓這個(gè)賽道更性感,可以讓估值沖上百億甚至千億美金。如果OpenAI宣傳的是要做輔助人類拍照的工具,就不可能支撐它今天的市值。而你是在祛魅,直接說我們可以降低30%成本甚至更多,實(shí)現(xiàn)多模態(tài)的終端智能等等。這可能意味著你的創(chuàng)業(yè)之路沒有神秘光環(huán)護(hù)法。

劉凡平:我們需要的不是神秘光環(huán),而是實(shí)現(xiàn)我們的群體智能。這才是最核心的——其他的光環(huán)如果不能轉(zhuǎn)換成為社會服務(wù)的價(jià)值,我們認(rèn)為沒有意義。

甲小姐:行業(yè)很多人選擇蹲守、后發(fā)、追趕,而你本來也可以不用辛苦地扛大旗,等群體智能的行業(yè)領(lǐng)導(dǎo)者出現(xiàn)了,你再跟進(jìn)就可以。你為什么要選擇自己突破一個(gè)全新的范式?

劉凡平:我們已經(jīng)在跟隨了,行業(yè)老大就是大自然。生物界已經(jīng)給了我們明確答案。

甲小姐:這讓我想到幾年前我和達(dá)特茅斯會議的參與者特倫斯·謝諾夫斯基的對話。他當(dāng)時(shí)也告訴我,當(dāng)我們無路可走的時(shí)候,就回歸自然。我們可以遵循自然的機(jī)制,而不是在腦海中杜撰一個(gè)烏托邦。

他的觀點(diǎn)有點(diǎn)類似“道法自然”的東方哲學(xué),而西方哲學(xué)更強(qiáng)調(diào)個(gè)人英雄主義和英雄敘事,比如漫威中的超級英雄,往往以改變世界、重塑秩序的個(gè)人力量為核心。

劉凡平:群體智能中也有個(gè)人英雄,但這些角色是動態(tài)變化的。比如在產(chǎn)業(yè)領(lǐng)域,甲小姐可能更擅長;當(dāng)話題轉(zhuǎn)向計(jì)算機(jī)科學(xué),另一位成員更了解技術(shù)細(xì)節(jié),他就成為新的中心節(jié)點(diǎn)——這種角色的轉(zhuǎn)換體現(xiàn)了群體智能的重要特征:中心點(diǎn)的去中心化。它不僅僅依賴于個(gè)體的專業(yè)能力,更重要的是如何靈活調(diào)整角色以適應(yīng)不同情境下的需求,從而實(shí)現(xiàn)整體效能的最大化。

甲小姐:在具體實(shí)現(xiàn)群體智能的過程中,RockAI把群體智能的實(shí)現(xiàn)分為創(chuàng)新型基礎(chǔ)架構(gòu)、多元化硬件生態(tài)、自適應(yīng)智能進(jìn)化、協(xié)同化群體智能四個(gè)階段,確定這四個(gè)階段的條件和標(biāo)準(zhǔn)是什么?

劉凡平:我們已經(jīng)實(shí)現(xiàn)了第一個(gè)自主架構(gòu)模型,多元化的硬件生態(tài)系統(tǒng)也已構(gòu)建完畢。在自主學(xué)習(xí)與自適應(yīng)進(jìn)化方面,一個(gè)關(guān)鍵特性是“訓(xùn)推同步”,即訓(xùn)練與推理過程能夠同時(shí)進(jìn)行,這類似于人際交流:當(dāng)我表達(dá)觀點(diǎn)時(shí)(推理階段),同時(shí)也通過傾聽你的介紹來進(jìn)行自我學(xué)習(xí)(訓(xùn)練階段)。因此,系統(tǒng)能夠在執(zhí)行任務(wù)的同時(shí)不斷優(yōu)化自身性能,實(shí)現(xiàn)持續(xù)的學(xué)習(xí)與改進(jìn)。“訓(xùn)推同步”不僅是模型自我完善的核心機(jī)制,也是驗(yàn)證其自主學(xué)習(xí)能力的有效方式。將邊學(xué)習(xí)、邊輸出、邊討論的理念融入整個(gè)過程中,就可以顯著加速系統(tǒng)的成長速度和知識積累效率。

甲小姐:從執(zhí)行角度來看,哪些是你確定已經(jīng)完成的事情,哪些未來還有留白和風(fēng)險(xiǎn)?

劉凡平:對于架構(gòu)我們完全確定,另外自主學(xué)習(xí)與自適應(yīng)智能進(jìn)化代表的第三階段也在我們實(shí)驗(yàn)室里運(yùn)行到比較好的狀態(tài),明年會正式對外發(fā)布。目前正在挑戰(zhàn)的是第四階段,也就是機(jī)器與機(jī)器之間如何協(xié)作的過程。人類的信息交流是通過語言,但語言溝通需要時(shí)間成本,機(jī)器溝通的效率會更高,我們還在探索如何通過最高的效率實(shí)現(xiàn)相互合作,預(yù)計(jì)2026年會進(jìn)入群體智能階段。

甲小姐:我可否理解為,你相信智能的本質(zhì)不是在運(yùn)動場上比誰跳得高,而是人類作為一個(gè)集體,在這項(xiàng)運(yùn)動上可以達(dá)到什么程度?在這條路上你的勝算有多大?

劉凡平:我們非常有信心,100%。

甲小姐:為什么?

劉凡平:2020年底,我在一個(gè)AI和機(jī)器人的大會上講完自己大模型的內(nèi)容,一位行業(yè)大佬拍著我肩膀說,你走錯(cuò)路了,但我當(dāng)時(shí)很堅(jiān)定。等到ChatGPT火起來的時(shí)候,我們的模型早已交付。所以我相信自己的判斷力。隨著我們的模型在社會上投入應(yīng)用,越來越多廠商接觸到我們,從自我認(rèn)可到外部認(rèn)可的過程已經(jīng)開始顯現(xiàn)。

3.“2024年到2025年,基礎(chǔ)算法的變化一定會發(fā)生”

甲小姐:ChatGPT之所以讓人驚艷,是因?yàn)樗龀龅漠a(chǎn)品讓人覺得“像人”。從智能的本質(zhì)來說,很多人認(rèn)為智能有沒有意識、怎么想不重要,只要它看著像智能,聽著像智能,用著像智能,它就是智能。而你選擇的道路,讓智能看起來并不“像人”。

劉凡平:我不太認(rèn)同“像人”是唯一標(biāo)準(zhǔn)。我覺得智能還是源自物理世界,它是從物理世界逐步衍生出來的。大家心中感受到的智能只是表象。第一,每個(gè)人的感覺不完全一樣。第二,現(xiàn)在大家用ChatGPT的頻率也不一定有剛發(fā)布時(shí)那么高了。

甲小姐:Transformer的作者之一表示,要想讓人工智能真正邁進(jìn),你得做到顯著優(yōu)秀,讓人一看就知道。他也因此認(rèn)為,當(dāng)前業(yè)界發(fā)展還過于靜態(tài),一直留在原點(diǎn)。你怎么評價(jià)他的觀點(diǎn)?

劉凡平:他提到要顯著被看到,這個(gè)觀點(diǎn)我認(rèn)同。但另一方面,智能化存在演進(jìn)的過程,他說的靜態(tài)也許是相對的。就好比我們?nèi)嗽诖?我相對于船,我是靜態(tài)的,但相對于岸邊的人,其實(shí)我在運(yùn)動。也許他作為業(yè)內(nèi)人士看到的內(nèi)容相對靜止,但宏觀世界已經(jīng)在向前。

甲小姐:業(yè)內(nèi)有一些和你們類似的架構(gòu)或者團(tuán)隊(duì),比如去年發(fā)布的RWKV和Mamba模型被稱為Transformer的強(qiáng)勁對手,包括最近MIT推出的LFM架構(gòu),據(jù)稱在性能上已經(jīng)超越了Llama3.2。你有沒有關(guān)注他們?

劉凡平:他們也是我們關(guān)注的一部分,但是從實(shí)踐效果來說,我們現(xiàn)階段比較樂觀,因?yàn)槲覀兊讓蛹軜?gòu)的原理比他們先進(jìn)很多。

甲小姐:從某種意義上來說,你現(xiàn)在可能要呼喚競爭對手,因?yàn)樾枰喾荰ransformer路線的孤勇者把這個(gè)大方向點(diǎn)亮。

劉凡平:有可能他們也在呼喚我們。

甲小姐:很多人跟我說市場已經(jīng)非常卷了。你認(rèn)為國內(nèi)大模型研發(fā)是否也陷入模式化的困境?如何避免國內(nèi)人工智能行業(yè)走向加拉帕格斯時(shí)刻(指孤立的生態(tài)系統(tǒng)遵循獨(dú)立范式,一旦有外來范式或者物種加入,原有的體系變得異常脆弱)?

劉凡平:困境是存在的,Transformer現(xiàn)在的確陷入這樣的怪圈里面。目前國內(nèi)和國外的狀態(tài),我覺得可以比喻成一場技術(shù)的接力賽:OpenAI提出概念,Meta負(fù)責(zé)開源,而國內(nèi)則專注于應(yīng)用。這并非我們追求的方向。

甲小姐:沒錯(cuò),很多人都在蓄勢待發(fā)地等著當(dāng)“第二名”。我在2024年5月的甲子引力大會上也提到,AI已經(jīng)變成了一場明牌游戲——一旦先行者跑通了,驗(yàn)證了,后來者的速度就加快了。從結(jié)果看,AI很像是一場“me too”競爭:你一旦有,我馬上有。

劉凡平:但這是一場多樣化的比賽,我們不應(yīng)該僅僅看到Transformer,并且Transformer現(xiàn)在的困境也和太多人投入在上面有關(guān)。

甲小姐:幾年前,關(guān)于人工智能的討論還充滿了自信與熱情,人們積極探討真智能的定義及對未來的憧憬?,F(xiàn)在我感到許多人似乎放棄了獨(dú)立思考,轉(zhuǎn)而依賴OpenAI來設(shè)定智能標(biāo)準(zhǔn)和技術(shù)突破的方向。每當(dāng)OpenAI預(yù)告GPT-5的重大進(jìn)展,公眾便翹首以盼;若GPT-5遭遇挑戰(zhàn),OpenAI推出GPT-4o和o1之類的新模型,大眾的關(guān)注點(diǎn)又迅速轉(zhuǎn)移。

劉凡平:問題在于,為什么我們要等OpenAI呢?事實(shí)上在OpenAI創(chuàng)業(yè)之初,它并不是主流。當(dāng)時(shí)Transformer架構(gòu)的Bert是主流。而現(xiàn)在的OpenAI是不是當(dāng)年的Google Bert?為什么現(xiàn)在不能再產(chǎn)生新的路線?我認(rèn)為 follow OpenAI不是一條合理的路,而且也不適合我們國內(nèi)的產(chǎn)品。

甲小姐:每個(gè)時(shí)代的技術(shù)自有屬于它的代際使命。我想知道你對人工智能行業(yè)發(fā)展的判斷,第一是關(guān)于人工智能在2024年的預(yù)測,第二是對5年后人工智能的預(yù)判,最后是關(guān)于人工智能的終極預(yù)判。

劉凡平:我內(nèi)心一直有明確的答案。2024年,人工智能還會發(fā)生很大變化,核心體現(xiàn)在算法層面,我相信很重要的算法很快就會誕生。就像剛剛獲得諾貝爾物理學(xué)獎(jiǎng)的辛頓,他很早就用FF算法挑戰(zhàn)過自己提出的反向傳播算法,而反向傳播是現(xiàn)在人工智能最關(guān)鍵的底層算法。像他一樣的很多人都看到了改變底層算法的必要性。2024年到2025年,基礎(chǔ)算法的變化一定會發(fā)生,可能還會更快,因?yàn)榍把氐难芯空叨家庾R到了這一點(diǎn)。

5年以后,不管硅谷或者國內(nèi)會有什么預(yù)判,通用人工智能的水平一定遠(yuǎn)遠(yuǎn)超過現(xiàn)在的水平。

至于終極的形態(tài),我還是認(rèn)為會走向群體智能。只有走向群體智能,才可能真正邁向更廣泛的大眾化人工智能。

甲小姐:你的三個(gè)判斷很具體,尤其算法在2024年內(nèi)就可能迎來重要的革新,這件事被大量媒體忽略了。還有什么是你想分享的?

劉凡平:我想強(qiáng)調(diào)的是,從我個(gè)人和團(tuán)隊(duì)的創(chuàng)業(yè)歷程來看,創(chuàng)新才是科技公司的本質(zhì),而不是一味地follow。follow這條路有它的價(jià)值,但不能改變太多。我們相信基礎(chǔ)層的創(chuàng)新能對應(yīng)用層和未來的市場價(jià)值帶來巨大的改變,所以我們愿意去做一家創(chuàng)新的科技企業(yè)。