7月4日,2024世界人工智能大會在上海啟幕,聚焦大模型、算力、機(jī)器人、自動駕駛等重點(diǎn)領(lǐng)域,與“人工智能+”相關(guān)的創(chuàng)新應(yīng)用成果和產(chǎn)品備受矚目。
大會上,商湯科技、科大訊飛、星環(huán)科技等企業(yè)帶來的新一代大模型集體亮相;摩爾線程也帶來了其AI旗艦產(chǎn)品夸娥(KUAE)智算集群解決方案的重大升級,旨在打造專為萬億參數(shù)級別的復(fù)雜大模型訓(xùn)練設(shè)計(jì)的國產(chǎn)通用加速計(jì)算平臺;“AI大模型產(chǎn)業(yè)發(fā)展的關(guān)鍵要素與創(chuàng)新生態(tài)”閉門研討會舉辦……吸引著全行業(yè)的目光。
近年來,全世界數(shù)十萬億級的數(shù)據(jù)被投入大模型訓(xùn)練當(dāng)中,一次次挑戰(zhàn)著開發(fā)者和硬件算力的極限,大國、巨頭加速ALL IN。在這場未來產(chǎn)業(yè)的激烈競爭中,成都已經(jīng)成為其中的有力參與者。
今年,四川省把人工智能作為1號創(chuàng)新工程精準(zhǔn)支持。成都也接連出臺了《成都市進(jìn)一步促進(jìn)人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展的若干政策措施》等相關(guān)文件。5月,成都市3個(gè)人工智能大模型通過國家備案,實(shí)現(xiàn)了成都行業(yè)大模型備案的零突破。
大模型發(fā)展面臨哪些挑戰(zhàn)?成都能否從中找到新賽道競爭的破局點(diǎn)?是人工智能產(chǎn)業(yè)當(dāng)下聚焦的重點(diǎn)。
01“馭風(fēng)”而行場景孕育大模型落地
目前,大模型技術(shù)在國內(nèi)日趨升溫,許多廠商正在積極推進(jìn)大模型在垂直領(lǐng)域的應(yīng)用探索。復(fù)旦大學(xué)自然語言處理實(shí)驗(yàn)室教授張奇認(rèn)為,“推理能力”是通用人工智能核心,目前GPT4.0在企業(yè)端直接端到端使用仍有巨大困難,大部分場景下直接使用只能達(dá)到20%至85%的準(zhǔn)確率,因此需要對AGI的邊界有清晰認(rèn)知,如何選擇場景,才是大模型技術(shù)落地的關(guān)鍵。
今年4月北京發(fā)布的《北京市人工智能大模型行業(yè)應(yīng)用分析報(bào)告》中提到,通過舉辦人工智能大模型創(chuàng)新應(yīng)用大賽的形式助推大模型的技術(shù)落地。大賽設(shè)置了政務(wù)、金融、產(chǎn)業(yè)升級、醫(yī)療、文化教育、智慧城市6個(gè)大模型領(lǐng)域熱門賽道,挖掘出了一批典型的行業(yè)應(yīng)用案例,梳理凝練出了大量核心業(yè)務(wù)場景和高質(zhì)量行業(yè)核心數(shù)據(jù),為大模型后續(xù)發(fā)展進(jìn)行“預(yù)訓(xùn)練”。
今年7月,在2024世界人工智能大會的浦東新區(qū)人工智能產(chǎn)業(yè)生態(tài)推介會上,上海浦東張江“模力社區(qū)”正式啟用。作為浦東新區(qū)人工智能產(chǎn)業(yè)生態(tài)的重要組成部分,“模力社區(qū)”將為人工智能領(lǐng)域的創(chuàng)新團(tuán)隊(duì)和企業(yè)提供更加便捷的交流合作平臺,推動產(chǎn)學(xué)研用深度融合,加速形成大模型創(chuàng)新生態(tài)。
在場景應(yīng)用方面,成都市深挖AI大模型在生產(chǎn)、生活、城市治理等領(lǐng)域應(yīng)用實(shí)踐并發(fā)布機(jī)會清單引導(dǎo)科技研發(fā)。根據(jù)《成都市人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展三年行動計(jì)劃(2024—2026年)》,成都將大力實(shí)施場景融合應(yīng)用培育行動,在2026年打造150個(gè)創(chuàng)新應(yīng)用場景,培育示范應(yīng)用產(chǎn)品超過500個(gè)。
02搶占賽道直面發(fā)展挑戰(zhàn)與機(jī)遇
如同形式各樣的城市排名,在火熱的“百模大戰(zhàn)”之下,大模型備案數(shù)量似乎成為人工智能產(chǎn)業(yè)實(shí)力的重要指標(biāo),各地對大模型的重視程度也不斷提高。成都市場上已經(jīng)誕生了一批具有競爭力的大模型:成都海藝互娛科技有限公司的“海藝?yán)L畫大模型”,聚焦AI繪圖和視頻生成領(lǐng)域,滿足企業(yè)和個(gè)人個(gè)性化的設(shè)計(jì)需求;成都曉多科技有限公司的“曉模型XPT”大語言模型已經(jīng)賦能電商、金融等多個(gè)行業(yè);成都考拉悠然科技有限公司的多模態(tài)產(chǎn)業(yè)通用大模型已經(jīng)面向半導(dǎo)體、煙草、城市治理等500多個(gè)高能項(xiàng)目……
數(shù)據(jù)顯示,國內(nèi)已經(jīng)推出超300個(gè)大模型,截至今年4月已經(jīng)有117個(gè)大模型完成了生成式AI備案服務(wù),其中屬地位于北京的有51個(gè)、上海24個(gè)、廣東19個(gè)……百花齊放、百家爭鳴的同時(shí),“百模大戰(zhàn)”也逐漸進(jìn)入白熱化階段。
目前成都在“百模大戰(zhàn)”中處于什么位置?四川省人工智能研究院副院長、四川省人工智能行業(yè)協(xié)會秘書長陳章表示,根據(jù)他的觀察和推斷,成都已通過備案的大模型數(shù)量大概處于全國第六、七名左右的位置,在他看來,這個(gè)排名不算太高,還可以爭取再往前靠。
03強(qiáng)力支撐大模型產(chǎn)業(yè)提速跑
總體來看,加速大模型應(yīng)用落地依然是圍繞“算力、算法、數(shù)據(jù)”開展工作。成都正利用自身發(fā)展優(yōu)勢,尋找行業(yè)破局點(diǎn),迎頭趕上。
增強(qiáng)算力基礎(chǔ)設(shè)施。正如沒有超高速風(fēng)洞,造不出頂級的導(dǎo)彈和戰(zhàn)斗機(jī),沒有足夠的算力支撐,大模型訓(xùn)練也難以邁進(jìn)。今年的政府工作報(bào)告上提到,適度超前建設(shè)數(shù)字基礎(chǔ)設(shè)施,加快形成全國一體化算力體系,培育算力產(chǎn)業(yè)生態(tài)。要以廣泛深刻的數(shù)字變革,賦能經(jīng)濟(jì)發(fā)展、豐富人民生活、提升社會治理現(xiàn)代化水平。
成渝地區(qū)是國家“東數(shù)西算”工程的樞紐節(jié)點(diǎn)之一,成都已經(jīng)形成國家超級計(jì)算成都中心、成都智算中心“雙中心”格局。
可喜的是,近年來成都不斷發(fā)布《成都市圍繞超算智算加快算力產(chǎn)業(yè)發(fā)展的政策措施實(shí)施細(xì)則》等算力發(fā)展相關(guān)政策,推進(jìn)產(chǎn)業(yè)建圈強(qiáng)鏈,構(gòu)建“超算+智算+通算+邊緣計(jì)算”多元異構(gòu)算力設(shè)施,目前智能算力規(guī)模已超過4700 Pflops,并計(jì)劃到2026年實(shí)現(xiàn)算力規(guī)模2萬PFLOPS,未來成都的獲得算力成本將進(jìn)一步下降。
穩(wěn)抓高質(zhì)量行業(yè)數(shù)據(jù)。算力規(guī)模的基礎(chǔ)設(shè)施建設(shè)是一個(gè)漫長的過程,同時(shí)還受到摩爾定律、芯片研發(fā)實(shí)力、算力成本等多方面因素影響,打下高質(zhì)量數(shù)據(jù)基礎(chǔ)是成都破局的重要發(fā)力點(diǎn)。
人民網(wǎng)財(cái)經(jīng)研究院發(fā)布的《2024年中國AI大模型產(chǎn)業(yè)發(fā)展報(bào)告》指出,國內(nèi)大模型的數(shù)據(jù)缺乏多數(shù)據(jù)源的調(diào)用,可供大模型訓(xùn)練的有效數(shù)據(jù)源呈現(xiàn)碎片化分散狀態(tài),政府部門的權(quán)威數(shù)據(jù)、大型企業(yè)掌握的行業(yè)或內(nèi)部數(shù)據(jù)通常不對外公開,仍需構(gòu)建高質(zhì)量的AI大模型訓(xùn)練數(shù)據(jù)集,擴(kuò)充數(shù)據(jù)源提高數(shù)據(jù)質(zhì)量。
四川擁有全部41個(gè)工業(yè)門類,成都作為四川省會城市,利用好完整工業(yè)體系中的高質(zhì)量數(shù)據(jù),使得利用行業(yè)大模型打通“人工智能+”最后一公里成為可能。
今年5月,第七屆數(shù)字中國建設(shè)峰會舉辦,成都獲批成為全國首批7個(gè)數(shù)據(jù)標(biāo)注試點(diǎn)基地之一。成都已建成覆蓋全市2140余萬常住人口和390余萬法人等系列基礎(chǔ)數(shù)據(jù)庫,向社會公眾開放數(shù)據(jù)3億條;授權(quán)運(yùn)營公共數(shù)據(jù)575類5.7億條,數(shù)字城市競爭力排名全國第5。
通過數(shù)據(jù)標(biāo)注,可以將原始數(shù)據(jù)轉(zhuǎn)化為機(jī)器學(xué)習(xí)算法可理解的形式,是新一代人工智能發(fā)展的關(guān)鍵抓手。參考北京人工智能數(shù)據(jù)訓(xùn)練基地,若能有效組織數(shù)據(jù)供給方、加工服務(wù)方、模型訓(xùn)練方“進(jìn)場”合作,推動高質(zhì)量數(shù)據(jù)價(jià)值釋放,將對通用模型和行業(yè)垂類模型訓(xùn)練精調(diào)提供極大助力。
相信只要找準(zhǔn)突破口,隨著大模型技術(shù)奇點(diǎn)的到來以及行業(yè)標(biāo)準(zhǔn)化體系的建設(shè)與完善,成都規(guī)劃中的人工智能萬億級市場定能實(shí)現(xiàn)。(張夏桐 陳夢雪)