如何用AIGC支點(diǎn),撬動(dòng)元宇宙生態(tài)?
來源 | 野馬財(cái)經(jīng)
“被AI的繪畫技術(shù)整破防了”“AI會(huì)取代人類繪畫嗎”……這些近期掛在微博熱搜榜上的話題,揭示了AI繪畫的火爆程度。無論是自拍、合影,還是搞怪圖片,只需應(yīng)用AI繪畫特效,就能一鍵轉(zhuǎn)換為自己指定風(fēng)格的精美繪圖。這種開盲盒似的體驗(yàn),讓許多用戶欲罷不能。
【資料圖】
昆侖天工旗下模型包括天工巧繪SkyPaint、天工樂府SkyMusic、天工妙筆SkyText、天工智碼SkyCode,覆蓋圖像、音樂、文本、編程等多模態(tài)內(nèi)容生成能力。這標(biāo)志著昆侖萬維成為目前國內(nèi)AIGC領(lǐng)域布局最為全面的公司之一,也是國內(nèi)第一個(gè)全身心投入到AIGC開源社區(qū)的公司。
此時(shí)宣布開源,昆侖萬維CEO方漢表示,“因?yàn)槲覀儓?jiān)信開源是推動(dòng)AIGC生態(tài)發(fā)展的土壤和重要力量。昆侖萬維致力于在AIGC模型算法方面的技術(shù)創(chuàng)新和開拓,致力于推進(jìn)開源AIGC算法和模型社區(qū)的發(fā)展壯大,致力于降低AIGC技術(shù)在各行各業(yè)的使用和學(xué)習(xí)門檻?!?/p>
昆侖萬維的AIGC技術(shù)到底已經(jīng)發(fā)展到了什么程度?能夠?qū)IGC生態(tài)的發(fā)展助推到一個(gè)新高度嗎?
模型突破,AIGC爆發(fā)
“成精”的AI,不僅能繪畫,還能聊天。12月以來在科技圈刷屏的聊天機(jī)器人ChatGPT,面對網(wǎng)友們“調(diào)戲式”的提問,不僅對答如流,還能中英文絲滑切換,就連參加有“美國高考”之稱的SAT考試也能考出排在全美前52%的成績。
相關(guān)產(chǎn)品的出圈,讓AIGC概念站到了聚光燈下。國盛證券研報(bào)稱,AIGC代表新一輪范式轉(zhuǎn)移的開始,其中在AIGC生成算法模型及數(shù)據(jù)集層面,可關(guān)注英偉達(dá)、Meta、百度、藍(lán)色光標(biāo)(300058.SZ)、昆侖萬維(300418.SZ)等公司。
事實(shí)上,AIGC頻繁見諸報(bào)端是今年才發(fā)生的事,這也是為何2022年被稱為AIGC元年。其是繼PGC(專業(yè)生產(chǎn)內(nèi)容)和UGC(用戶生產(chǎn)內(nèi)容)后的又一種新型內(nèi)容創(chuàng)作方式,此前雖然業(yè)界對AIGC研究已久,但一直難以實(shí)現(xiàn)質(zhì)的突破。
招商證券研報(bào)中,將AIGC的發(fā)展分為三個(gè)階段,分別是1950-1990年的早期萌芽階段、1990-2010年的沉淀積累階段和2010年至今的快速發(fā)展階段。其迭代與人工智能深度學(xué)習(xí)的演進(jìn)沿革密切相關(guān)。
要了解深度學(xué)習(xí),就離不開機(jī)器學(xué)習(xí)的概念。這項(xiàng)技術(shù)的主要任務(wù)是指導(dǎo)計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí),然后利用經(jīng)驗(yàn)來改善自身的性能。
在此基礎(chǔ)上,深度學(xué)習(xí)開辟了機(jī)器學(xué)習(xí)研究中的新方法。其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),模仿人腦的機(jī)制來解釋數(shù)據(jù),是2011-2020年最熱門的AI研究主題。
最早出現(xiàn)的深度學(xué)習(xí)模型是2014年的GAN,其對輸出結(jié)果的控制力較弱;2021年,CLIP模型橫空出世,其已經(jīng)能實(shí)現(xiàn)圖像和文本的匹配;而2022年的最新深度學(xué)習(xí)模型Diffusion,不僅能高效合成視覺數(shù)據(jù),還在視頻生成、音頻合成等其他領(lǐng)域展示出了不俗的潛力,直接推動(dòng)了AIGC技術(shù)的突破性發(fā)展。
可以說,近兩年AI深度學(xué)習(xí)的發(fā)展,是以天為單位計(jì)算的。以AI繪畫為例,其實(shí)今年年初被大眾熟知的AI繪畫產(chǎn)品Disco Diffusion的缺點(diǎn)還較為明顯,不僅無法刻畫具體細(xì)節(jié),還要耗費(fèi)數(shù)以小時(shí)計(jì)的時(shí)間對圖像進(jìn)行渲染。
圖注:天工巧繪生成作品
但這些缺點(diǎn)僅過了幾個(gè)月就被新模型Stable Diffusion近乎完美的解決,后者可將模型的計(jì)算空間,在盡可能保留細(xì)節(jié)信息的情況下降維到一個(gè)稱之為“潛空間”的低維空間里, 再進(jìn)行繁重的模型訓(xùn)練和圖像生成計(jì)算,大大降低了內(nèi)存和計(jì)算要求。而且這款當(dāng)今堪稱最強(qiáng)大的AI繪畫模型,已經(jīng)于8月完全開源。
這種從前只會(huì)發(fā)生在《三體》等科幻小說中的“降維打擊”情節(jié),竟成為了現(xiàn)實(shí),也難怪AIGC領(lǐng)域當(dāng)下深受資本青睞。目前,大數(shù)據(jù)+AI公司Databricks估值已達(dá)380億美元,開發(fā)出ChatGPT的OpenAI估值在今年10月超過200億美元。同時(shí),國內(nèi)百度、騰訊、阿里巴巴、字節(jié)跳動(dòng)、網(wǎng)易等大廠也正競相入場。
AIGC的應(yīng)用場景大致可以分為To B和To C兩個(gè)賽道,其中B端主要通過“AI+”為產(chǎn)業(yè)進(jìn)行賦能;C端主要通過與人交互進(jìn)行內(nèi)容生產(chǎn)。而招商證券又按照生成的內(nèi)容形式,將AIGC分為了文字、圖像、音頻、視頻和虛擬人五類。
另據(jù)Gartner預(yù)測,至2025年人工智能生成數(shù)據(jù)占比將達(dá)10%。紅杉美國的兩位合伙人在一篇題為《Generative AI:A Creative New World》的報(bào)告中表示,AIGC有潛力產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價(jià)值。
AIGC走紅后,兩年前就開始對該領(lǐng)域進(jìn)行全系列布局的昆侖萬維受到了廣泛關(guān)注。
登陸A股的2015年,昆侖萬維的游戲收入占比達(dá)97%,境外收入占比達(dá)74%,公司IPO募集的13億元也基本用于游戲的研發(fā)和代理,是一家不折不扣的海外游戲公司。
但在上市后次年,昆侖萬維就聯(lián)合三六零(601360.SH)收購了全球知名瀏覽器公司Opera,自此走上了互聯(lián)網(wǎng)平臺(tái)型企業(yè)的轉(zhuǎn)型之路。7年時(shí)間里,昆侖萬維一邊收購資產(chǎn),一邊開發(fā)自研,目前業(yè)務(wù)已覆蓋包括社交、娛樂、元宇宙、信息分發(fā)、搜索及游戲等在內(nèi)的多個(gè)領(lǐng)域。
同期,昆侖萬維一直堅(jiān)持出海戰(zhàn)略。截至今年上半年,公司的兩個(gè)主要產(chǎn)品,Opera全球平均月活用戶達(dá)3.3億;海外社交娛樂領(lǐng)域頭部平臺(tái)StarX主打產(chǎn)品StarMaker累計(jì)在102個(gè)國家音樂/音頻類暢銷榜排名前五,其中84個(gè)國家位列第一。
事實(shí)上,早在兩年前,昆侖萬維已經(jīng)開始全系列布局AIGC,投入數(shù)千萬元,組建了二百余人的研發(fā)團(tuán)隊(duì)。2020年底至2021年4月,其研發(fā)出百億參數(shù)的中文GPT-3模型,并于2021年8月開始研發(fā)基于自有大文本模型的對話機(jī)器人,迅速刷新國內(nèi)技術(shù)指標(biāo)。2022年1月啟動(dòng)SkyMusic音樂實(shí)驗(yàn)室,2022年4月達(dá)到人工智能領(lǐng)域最優(yōu)效果;2022年9月啟動(dòng)編程、圖像、文本方向的AIGC產(chǎn)品。
目前,昆侖萬維推出的AIGC模型與算法昆侖天工,AI生成能力已覆蓋圖像、音樂、編程、文本等全模態(tài)領(lǐng)域,且其在四大模態(tài)領(lǐng)域均采用世界頂尖開源模型。
如AI圖像方面,天工巧繪采用全球第一款多語言Stable Diffusion分支模型,兼容Stable Diffusion;使用1.5億中英雙語語料,支持中英雙語輸入實(shí)現(xiàn)文字生成圖像,是國內(nèi)為數(shù)不多的支持中英雙語的文圖生成模型。
圖注:天工巧繪生成作品
AI音樂方面,天工樂府則采用了國內(nèi)第一款商用級開源作曲AI模型,和弦準(zhǔn)確率達(dá)92.5%,遠(yuǎn)超目前行業(yè)最佳64.7%;還支持31種語種、全球多個(gè)曲風(fēng),并能從旋律、文案素材生成歌詞。
今年上半年,StarX成立的MusicX Lab音樂實(shí)驗(yàn)室發(fā)布了五首完全由AI作曲的歌曲,已在Spotify、SoundCloud、QQ音樂和網(wǎng)易云音樂等海內(nèi)外180余個(gè)音樂平臺(tái)上線;三季度,MusicX Lab再推10首新作AI歌曲,算法模型及AIGC能力不斷優(yōu)化提升。得益于此,目前StarMaker旗下K歌類產(chǎn)品Sing Star已是業(yè)內(nèi)第一個(gè)可實(shí)現(xiàn)AIGC豐富內(nèi)容供給的產(chǎn)品。
而AI編程方面,天工智碼則采用全球第一款多語言開源編程大模型,能生成python、Java、C、php、swift等共計(jì)十余種編程語言,使不同語言的使用者都能來體驗(yàn)。
圖注:天工妙筆生成五言詩
不難發(fā)現(xiàn),無論是哪一領(lǐng)域,昆侖天工都很重視多語言模型的開發(fā)、為全球的從業(yè)者和用戶造福,這也與公司出海的戰(zhàn)略遙相呼應(yīng)。優(yōu)質(zhì)模型疊加豐富的數(shù)據(jù)集,讓昆侖天工擁有強(qiáng)大的團(tuán)隊(duì)模型訓(xùn)練能力,并在同賽道上市公司中處于領(lǐng)先地位。
值得一提的是,目前AI圖像、AI編程、AI文本的模型已經(jīng)在GitHub上開源。“我們堅(jiān)信開源是推動(dòng)AIGC生態(tài)發(fā)展的土壤和重要力量?!狈綕h在發(fā)布會(huì)上稱。
能讓昆侖萬維如此不遺余力地押注,AIGC到底有何魔力?或許將目光放到其背后的元宇宙可以找到答案。
雖然終極形態(tài)尚未確定,但業(yè)界的共識(shí)是,元宇宙將極大擴(kuò)展人類的存在空間。而這樣的空間需要大量的數(shù)字內(nèi)容支撐,顯然單靠人工設(shè)計(jì)和開發(fā)無法完全滿足需求,AIGC剛好可以解決這樣一個(gè)問題。
在此背景下,AIGC被視作“推動(dòng)元宇宙發(fā)展的加速器”,亦或是“開啟元宇宙的鑰匙”。結(jié)合昆侖萬維原本的元宇宙業(yè)務(wù),AIGC或?qū)①x予昆侖萬維更大的想象空間。
一方面,AIGC可以實(shí)現(xiàn)降本增效,并增強(qiáng)應(yīng)用的可玩性和功能性。還是以AI作曲為例:昆侖萬維的游戲、StarMaker等產(chǎn)品中都需要植入海量音樂,而音樂本身創(chuàng)作成本較高,AI作曲則能在提高音樂品質(zhì)的同時(shí)降低使用成本和音樂愛好者、獨(dú)立音樂人的使用門檻。
方漢曾打過這樣一個(gè)比方:“假設(shè)每款游戲的音樂成本在50萬元至100萬元之間,那么通過AIGC,我們的音樂成本就能夠降至0。”
同時(shí),這種模式也具備商業(yè)化潛力。近期昆侖萬維方面表示,已經(jīng)接到了采購AI創(chuàng)作歌曲的意向。目前看來,為企業(yè)用戶提供音樂相關(guān)解決方案,包括批量供給背景音樂、伴奏配樂等泛化內(nèi)容,或?yàn)樗嚾思疤摂M偶像定制化創(chuàng)作符合其人設(shè)調(diào)性的音樂作品等服務(wù),是AI作曲B端落地的重要方向。
“其實(shí)全世界做AIGC的公司非常多,但是昆侖萬維的長處在于我們有音頻方面的深厚積累。我們擁有全世界最大的伴奏帶數(shù)據(jù)庫,里面有相當(dāng)多是已經(jīng)被數(shù)字化的伴奏母帶。人工智能非常依賴數(shù)據(jù)集,我們有這樣高質(zhì)量的數(shù)據(jù)集,對于AIGC非常有幫助。這是競爭對手短期內(nèi)無法復(fù)制的?!狈綕h曾表示。
不只是AI作曲,昆侖天工在AI繪畫、AI編程、AI文本方面的輸出能力,同樣能與昆侖萬維的元宇宙業(yè)務(wù)形成協(xié)同效應(yīng)。再結(jié)合昆侖萬維此前在文娛、社交、游戲等不同行業(yè)的深度商業(yè)沉淀和領(lǐng)先的互聯(lián)網(wǎng)運(yùn)營能力,在行業(yè)人士看來,昆侖萬維也有望成為元宇宙風(fēng)口到來后最大的受益者之一。




