2023年,隨著ChatGPT等應用的爆火,以生成式AI為代表的人工智能再度成為各界的焦點。
【資料圖】
“從更長遠的角度來講,我們可以把2023年看作是AI領(lǐng)域令人振奮的一年,”5月10日,在2023年中國ICT市場趨勢論壇(北京站)上,IDC中國區(qū)研究副總裁鐘振山表示,“在這一年中,我們能夠看到大量語言及圖像模型的逐步成熟與推廣,并看到新的AIGC產(chǎn)品及企業(yè)級應用共存,未來有望全面改寫企業(yè)數(shù)字化進程的趨勢。”
鐘振山指出,生成式AI都是基于大模型的應用之一。根據(jù)IDC的定義,大模型是對原有算法模型的技術(shù)升級,基于海量數(shù)據(jù)開發(fā)預訓練模型,到最終用戶環(huán)境中使用少量數(shù)據(jù)即可獲得比之前的算法模型更好的結(jié)果。
如今大熱的ChatGPT便是建立在OpenAI的GPT-3.5系列大型語言模型之上的,并通過監(jiān)督和強化學習技術(shù)進行了微調(diào)。
鐘振山認為,基于大模型的AI應用和傳統(tǒng)AI的區(qū)別,本質(zhì)上在于前者改變了用戶使用數(shù)據(jù)的方式。
根據(jù)IDC預測的數(shù)據(jù),到2026年中國地區(qū)所產(chǎn)生的數(shù)據(jù)量約為50ZB,年復合增長率約為26%,遠超世界上其他任何一個國家。但是,其中真正能被企業(yè)和個人所使用的數(shù)據(jù)卻不到1%。對企業(yè)來說,這意味著大部分的數(shù)據(jù)都無法產(chǎn)生價值。
不過,隨著ChatGPT等基于大模型的生成式AI的出現(xiàn)與成熟,這一現(xiàn)狀有望得到改變。以ChatGPT為例,該應用抓取了2021年之前所有的互聯(lián)網(wǎng)數(shù)據(jù)進行了預訓練。“未來隨著AIGC應用不斷成熟之后,無論企業(yè)還是個人所產(chǎn)生的任何數(shù)據(jù),都可以被用來訓練大模型的產(chǎn)品,從而為企業(yè)帶來相關(guān)的價值?!?/p>
鐘振山認為,對于用戶來說,大模型在降低開發(fā)門檻和計算資源、提升預測效果等方面具有重要價值。
其中,鐘振山特別強調(diào),對于一個只有應用需求的企業(yè)來說,自行搭建大模型體系的成本極高。因此大模型生成式AI的應用往往是由相關(guān)的技術(shù)廠商進行前期的預訓練工作,再由企業(yè)使用少量內(nèi)部數(shù)據(jù)進行二次訓練,即可滿足預期的需求,從而實現(xiàn)計算資源的節(jié)省。
目前在大模型的基礎上,生成式AI的典型應用場景主要集中在數(shù)字人、藝術(shù)設計領(lǐng)域。此外,生成式AI在知識管理類應用、銷售和營銷、代碼生成、醫(yī)療領(lǐng)域、金融業(yè)、制造業(yè)中也均有應用案例。以醫(yī)療領(lǐng)域為例,生成式AI已被應用于抗體和蛋白質(zhì)的設計。
而它們均基于大模型底座。鐘振山介紹稱,目前全球范圍內(nèi),除OpenAI的GPT-3(大型語言模型)、DALL-E 2(圖像模型)以及Whisper(語言識別模型)外,包括Stable Diffusion(圖像模型)、Midjourney(圖像模型)、Make-a-Video(視頻模型)等都是典型的AIGC基礎模型。
不過,雖然從顛覆性的功能價值與豐富的應用場景來看,生成式AI的表現(xiàn)令人振奮,但是其面臨的挑戰(zhàn)也不容忽視。
鐘振山表示,生成式AI還存在不少挑戰(zhàn),包括prompt工程師等相關(guān)人才的缺乏;AI生成內(nèi)容的準確度不足,版權(quán)不清,甚至可能產(chǎn)生誤導、有害或誤用的內(nèi)容;威脅用戶隱私安全;甚至可能造成在線社區(qū)內(nèi)的性別、種族、能力歧視等。
盡管如此面臨挑戰(zhàn),展望未來,鐘振山仍對大模型所在的AI市場充滿信心。他預測,到2026年,中國人工智能市場規(guī)模將達到264.36億美元左右。而市場增量則主要來源于基于大模型的應用替換過去幾年建設的AI應用,生成式AI帶來增量市場,以及全新的AI賦能的企業(yè)級應用。
鑒于此,鐘振山提醒道,過去通用AI市場將會日漸飽和甚至消失,而不具備大模型能力的廠商將難以維持競爭優(yōu)勢。
(文章來源:21世紀經(jīng)濟報道)
標簽: