《中國經濟周刊》 記者 ?孫冰 | 北京報道
誰是當下中國乃至全球的“科技頂流”?AI大模型幾乎毫無爭議。
【資料圖】
5月28日,科技部新一代人工智能發展研究中心發布的《中國人工智能大模型地圖研究報告》顯示,中國研發的大模型數量排名全球第二,僅次于美國,目前中國10億參數規模以上的大模型已發布79個。而從大模型區域分布來看,中國已有14個地區在開展大模型研發,其中,北京、廣東、浙江、上海處于第一梯隊,數量最多的北京有38個大模型,第二位的廣東有20個。
在全球大模型競賽中,中國科學院院士、中國計算機學會開源發展委員會主任王懷民表示,過去5年世界上參數量超過百億的大模型大約有45個,其中有32個出現在美國,9個出現在中國,4個出現在歐洲。
但是,發展迅猛、一路“狂飆”的中國AI大模型們,仍然需要一些冷靜的思考。
大模型“智能涌現”令人興奮,AI能力開始不可預測
人工智能技術已經發展了很多年,為什么大模型出現后,學界、產業界乃至社會大眾會如此興奮甚至害怕呢?北京智源人工智能研究院院長黃鐵軍教授告訴《中國經濟周刊》記者,AI之前更像是人類的助手,根據人類的指令做著人類能夠確定結果的工作,比如你設計AI打開電燈,AI就只會打開電燈。
“但是,大模型之所以現在如此受關注,是因為當人工智能的參數量達到了百億級別之后,出現了拐點或者說突變,人工智能的能力開始不可預測了,就是所謂的‘智能涌現’現象,人工智能一些沒有被預期到的能力開始出現,這種不可預知讓大家都很興奮。”黃鐵軍說。
黃鐵軍介紹,這一波人工智能浪潮的核心任務就是訓練模型,所謂模型,在人工智能領域的意思很明確,就是一個神經網絡,而神經網絡并沒有什么特別的地方,我們人腦就是個神經網絡。
“但人腦是一個很龐大的神經網絡,大約有800多億個神經元通過100萬億個神經突觸進行連接,所以人腦的能力非常強。對比一下,最接近人類的猩猩,其腦部神經元的數量和連接的數量差不多是人腦的1/3,猴子是人類的1/10,而一條蟲子大概有300多個神經元,但其實也可以有很多生命活動了。”黃鐵軍解釋說。
當然,目前人工智能模型的神經網絡比人腦要簡單很多。但是,隨著數據規模的增長和算力的增加,模型的參數量也在不斷增加,能力也就不斷隨之提高,于是就有了“大模型”,即參數量巨大的神經網絡,當然其智能程度就更高。
大模型是有史以來最大平臺革命,將10倍于移動互聯網
“AI大模型是絕對不能錯過的歷史機遇。因為這將是有史以來最大的平臺革命,它將比Windows、安卓要大10倍甚至更多,它會讓每個應用改寫,會重構人類的工作,會讓有創意的那些人的聰明才智被放大10倍或者更多。”創新工場董事長兼CEO李開復說。
李開復還表示,他非常認同美國著名VC機構投資人安德里森·霍羅維茲(Andreessen Horowitz)的觀點:大模型的市場未來到底多大很難把握,它最小將是所有軟件,最大可能將代表著人類所有的努力。
“人類歷史上可能也就只有三四次這樣的機會。大模型賽道是未來的兵家必爭之地,因此,自主創新將是中國企業的必經之路和重大責任。”李開復告訴《中國經濟周刊》記者。
李開復已經投身人工智能超過40年,他戲稱自己是“投資人中最懂AI的,AI科學家中最懂投資的”。他從投資和產業發展的角度認為,隨著大模型的崛起,人工智能的發展已經從AI 1.0時代進入AI 2.0時代。
李開復認為,在AI 1.0時代,單領域的數據集、數據集和模型各成孤島,且數據標記工作量和成本非常可觀;但AI 2.0時代大模型的出現可以解決這些瓶頸障礙,人們用超級巨量數據訓練具有跨領域知識的單一大模型,微調后就可以執行五花八門的任務。這是一個全新且巨大的平臺機會,所有的應用和界面都要重寫,AI 2.0應用會進入爆發期。
“雖然目前大模型還是非完美的,但它已經擁有相當大的商業價值,甚至幾十萬億規模的商業價值。”李開復預測。他表示,大模型目前還有“一本正經地胡說八道”的問題,因為AI的推理能力也來自同一個技術引擎,如果你把它的胡說八道降到接近零,它的推理能力也幾乎沒有了。也就是說,那些讓它聰明的理由,也是讓它胡說八道的理由。
“我們相信未來這是可以解決的問題。比如可以讓AI與人類協作,我們不是把AI拿來作為一個終極的應用,而是把它當作一個人類‘助理’。比如可以先讓AI起草法律文件或者新聞稿件的初稿,最后由人類的律師和記者進行把關和調整,這樣就能夠在享受AI強大能力的同時,又避免了AI會犯的錯誤。”李開復表示。
《中國經濟周刊》記者 馬銘悅I攝
大模型競爭沒有絕對壁壘,但平臺席位不會太多,成敗關鍵在生態
黃鐵軍表示,大模型最終會成為未來社會的一種新型基礎設施,其提供“智力”能力,輸送給千行百業和千家萬戶。因此,人工智能進入大模型時代之后,會形成一個體系化的產業生態。
簡單來說,就像電力時代的電網一樣,千行百業、千家萬戶都在用電,但并不是自己發電,而是有專門的發電廠,發電方式也是多種多樣,如煤電、火電、風電、核電……也有企業去生產各種各樣的電器。
“有了大模型就像人類學會發電了,目前可能是一種技術路徑走通了,但后續一定還會有各種各樣‘發電手段’不斷演進迭代、降本增效。這意味著,就像不會有國家或企業壟斷發電一樣,大模型也沒有絕對壁壘和門檻,大家比拼的是成本和效率,競爭的是應用和生態。”黃鐵軍說。
李開復也表示,未來的AI 2.0時代會有三大生態層:基礎模型層、中間層和應用層。“以大模型為代表的AI 2.0市場規模巨大,足以容納巨頭、中小企業和初創公司在里面‘賽馬’。”他說。
至于創業者和投資人如何選擇自己在這個龐大生態中的地位和角色,李開復認為,需要基于不同的判斷。
比如,基礎模型層的大模型平臺公司當然機會巨大,天花板會非常高,就像PC互聯網時代的微軟和移動互聯網時代的谷歌,但風險也是最大的,因為平臺公司一定是少數;如果是做應用層,風險就沒有那么大,而且每一個生產力領域都可能成長出垂直領域的領先公司,但規模可能無法與平臺公司相比。對于投資人來說,則永遠是在風險和回報之間尋求平衡。
人工智能、智能制造業崗位頗受歡迎
中國大模型在“狂飆”,但“平臺席位”不會太多,安全威脅也要警惕
聚焦到中國,李開復認為,大模型和AI 2.0也是中國不容錯過的歷史機遇,而且中國也有自身的優勢。
“中國擁有豐富的中文語料和龐大的市場,通過發展AI大模型,中國可以推動創新產業的發展,實現科技與經濟的雙重紅利。而且中國擁有龐大基數的年輕工程師和最堅韌的企業家,為發展AI大模型提供了強大的人才支持,技術領先、策略靈活、市場反應快、能打硬仗、落地執行力強,將是中國大模型公司的成功關鍵。”李開復表示。
黃鐵軍也對中國在大模型領域的發展充滿信心。但也有一些現象需要格外關注。比如,大模型火了之后,還是出現了一哄而上、同質化競爭加劇的現象。
“數據就是這些數據,算力也就這么多,如果大家都去訓練模型,一定很多工作是重復的,這其實也消耗了大量社會資源,不利于大模型生態的發展。”黃鐵軍說。
“如果類比PC互聯網時代和移動互聯網時代,全球范圍內的大模型底層平臺很有可能不會超過三個。就像移動互聯網初期也曾有很多操作系統,但最后只剩下iOS和安卓。很多企業想要成為第三個,投入巨大但最終都鎩羽而歸。”黃鐵軍說。
黃鐵軍認為,中國甚至全世界大模型的運營體系都會是屈指可數的,雖然還不能預判是幾個,但肯定不可能是十幾個或幾十個,根本沒有市場可能性。“更多企業參與進來,不是運營平臺,而是做應用。類似于蘋果生態和安卓生態,會生發出很多應用。”他說。
因此,黃鐵軍建議,一方面要依靠“市場的手”,讓市場的“大浪淘沙”發揮主要作用;但同時也需要“政策的手”予以引導和調節,推動、鼓勵和統籌產學研進行合作,共建大模型的產業生態。
縱觀全球,打造人工智能生態,有開源和閉源兩種路線。王懷民表示,大模型因其不確定性形成開源模式和預研模式同時推進的基本格局。在美國32個大模型中,有15個開源。中國的9個大模型中,有5個開源。
但一位人工智能領域的資深投資人告訴《中國經濟周刊》,現在國內確實有一些大模型就是把國外的開源代碼進行“套殼”和微調,“GPT3.5人家可能還會開源給你,但GPT4.0短期內人家是不可能會給你用的”。所以,中國要發展大模型,還是要自主創新。而且因為大模型的發展涉及數據問題,從監管的角度,這幾乎意味著中美一定是“平行宇宙”。
大模型越來越強大,擔心安全風險和被AI替代不如學習與AI合作
隨著人工智能技術,尤其是大模型的快速發展,安全問題也被提高到新的維度。“AI一定會給數字世界帶來新的安全威脅。”奇安信集團董事長齊向東告訴《中國經濟周刊》記者。
“這個安全威脅主要來自兩個方面:一是AI可以模仿,甚至以假亂真地實施詐騙;二是AI能夠幫助黑客提高攻擊水平,幫助一些黑客寫程序、寫代碼、制定攻擊方案和提供攻擊策略。這些都給數字世界帶來新的威脅。”齊向東說。
齊向東表示,網絡安全技術是一個伴生型技術,一定是先有數字化技術的創新,再有安全技術的創新,這是矛和盾的關系,就像沒有一種特殊材料的矛出現,就不會出現特殊材料的盾。現在大模型等AI新技術還處在萌芽狀態,應用還只是試探性的,發展還是第一要務。
但齊向東表示,他相信網絡安全的技術和產品的創新,一定能夠解決新時代AI帶來的這些網絡安全問題和風險。“奇安信正在抓緊跟進AI的各種場景,探索解決AI給我們帶來的新的網絡風險所需要的新技術和新的安全解決方案,我相信,未來安全不會拖AI發展的后腿。”他說。
至于大模型何時會影響到普通人的生活,黃鐵軍表示,其實已經在發生了。比如現在人工智能已經在替代人類的某些工作,尤其是不具備原創性的部分。
以繪畫為例,黃鐵軍認為,像畢加索、齊白石這種開創性的創作,人工智能還無法替代,但如果只是模仿和組合之前的創作,那人工智能肯定是效率更高的。再比如像愛因斯坦、牛頓這種原創性的理論創新,人工智能也無法做到,但如果是常規編程和做數學題,那人工智能確實可以做得更好。
但黃鐵軍強調,AI和人類之間并不是簡單替代,而是需要合作。“比如,一個企業原來需要1000名程序員,但接入了AI大模型能力之后,可能只需要幾十個就夠了,通過人和AI的合作來獲得更高的效率和產生更好的效果。”
而且黃鐵軍認為,這種影響力會很快傳遞到教育領域。
“現在很多學生有疑問,不是先問老師,而是先問AI,因為AI掌握的知識和信息可能更全面、更豐富,然后自己根據AI給出的資料就可以學習了。這個會是非常大的沖擊,未來教師在學生的成長過程中到底發揮什么作用?扮演什么角色?AI在不停學習,人自然也是要不停學習,教育肯定是會長期存在下去的,只不過我們教育的目的是什么?教育的方式是什么?都需要重新思考。”黃鐵軍說。
更為“可怕”的是,我們常說:讀書破萬卷,下筆如有神。“一個人一生能讀完一萬本書已經非常厲害了,但AI一天就能讀100萬本書,而全人類共有書籍約1億部,AI再讀3年左右就全讀完了,那AI的能力提升速度可想而知,和人類完全不在一個尺度上。”黃鐵軍說。
科大訊飛副總裁章繼東告訴《中國經濟周刊》記者,AI技術尤其是大模型的發展,會對中國的教育帶來巨大挑戰。
“中國教育的核心在于知識的傳遞和知識的獲取,尤其是考試的考核目標主要是以知識為主,那些記憶好、訓練多的孩子就能得高分,而這些是最容易被AI替代的能力。未來,我們將更需要具有創造力、有批判思維和創新思維的人才。但我相信,隨著大模型成為各行各業的好助手,其也會成為教育的好助手。”章繼東說。
(本文刊發于《中國經濟周刊》2023年第11期)
2023年第11期《中國經濟周刊》封面