摘要: 原標(biāo)題:Sora問(wèn)世,一石激起千層浪 穿著時(shí)尚的女性漫步在霓虹燈閃爍的東京街頭兩艘海盜船在一杯咖啡內(nèi)作戰(zhàn)春節(jié)假期,這幾段畫(huà)面精美的視頻在朋友圈
原標(biāo)題:Sora問(wèn)世,一石激起千層浪
“穿著時(shí)尚的女性漫步在霓虹燈閃爍的東京街頭”“兩艘海盜船在一杯咖啡內(nèi)作戰(zhàn)”……春節(jié)假期,這幾段畫(huà)面精美的視頻在朋友圈“霸屏”,這些視頻是美國(guó)人工智能團(tuán)隊(duì)OpenAI新發(fā)布的視頻大模型Sora創(chuàng)作的。
Sora,這個(gè)詞來(lái)源于日語(yǔ)中的“天空”,意指無(wú)限的創(chuàng)造潛力。2022年底因發(fā)布ChatGPT一炮走紅的OpenAI,又因Sora在全球內(nèi)容創(chuàng)作領(lǐng)域掀起新的風(fēng)暴。
博采眾長(zhǎng),
Sora“一騎絕塵”
只需要一段20至30個(gè)詞匯的文本指令或一張靜態(tài)圖像,就可以生成一段視頻,不論是寫(xiě)實(shí)還是動(dòng)畫(huà)風(fēng)格、寬屏還是豎屏,皆可任意選擇。雖然Sora并非首個(gè)可以通過(guò)文本生成視頻的大模型,但在時(shí)長(zhǎng)、分辨率等視頻生成模型的關(guān)鍵指標(biāo)上,相比先前的Runway、Pika等文生視頻產(chǎn)品,Sora可謂“一騎絕塵”。“Sora的誕生,意味著AGI(人工通用智能)的實(shí)現(xiàn)可能從10年縮短至一兩年。”360創(chuàng)始人周鴻祎在微博上宣布。
記者親身體驗(yàn)了此前某款視頻大模型的生成產(chǎn)品,在生成的10秒視頻中,人物表情僵硬、動(dòng)作不協(xié)調(diào),視頻也無(wú)法準(zhǔn)確呈現(xiàn)文字描述,與Sora的演示視頻相比,確實(shí)差距巨大。
“Sora的技術(shù)亮點(diǎn)是,讓AI內(nèi)容編輯和生成實(shí)現(xiàn)了從文本、圖像到視頻的本質(zhì)跨越。”中國(guó)計(jì)算機(jī)學(xué)會(huì)理事、南京理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院副院長(zhǎng)肖亮認(rèn)為,Sora的底層技術(shù)并不算新,但優(yōu)勢(shì)在于“博采眾長(zhǎng)”,是多項(xiàng)技術(shù)積累、共同作用的結(jié)果。Sora在技術(shù)上的“顛覆性”主要體現(xiàn)在三方面:一是突破當(dāng)前視覺(jué)大模型“60s超長(zhǎng)視頻”生成瓶頸,以往的視頻模型大多只能生成時(shí)長(zhǎng)不超過(guò)10秒的視頻,而Sora在保證視頻時(shí)長(zhǎng)的同時(shí),還能保持人物和場(chǎng)景的連貫;二是呈現(xiàn)多角度一鏡到底,逼真表現(xiàn)光影幾何、物理關(guān)系;三是較為真實(shí)地遵循物理世界規(guī)律,比如畫(huà)筆會(huì)在畫(huà)布上留下水墨、人吃漢堡會(huì)留下咬痕等。
OpenAI對(duì)Sora的定位頗具野心,號(hào)稱其并非僅僅是“文生視頻”的工具,而是一個(gè)通用的“物理世界模擬器”——復(fù)現(xiàn)真實(shí)世界的重力、摩擦力等物理現(xiàn)象。這一定位使得Sora未來(lái)有望成為跨越各行各業(yè)的“超級(jí)工具”,可用于模擬天氣變化、自動(dòng)駕駛、生物行為甚至軍事場(chǎng)景等。
對(duì)此,南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授過(guò)潔表示,實(shí)際上,早有多條技術(shù)路徑瞄準(zhǔn)“模擬物理世界”這一目標(biāo),只不過(guò)實(shí)現(xiàn)方式不同。Sora的技術(shù)路徑可以理解為“數(shù)據(jù)驅(qū)動(dòng)”——通過(guò)學(xué)習(xí)視頻來(lái)理解現(xiàn)實(shí)世界的動(dòng)態(tài)變化,并用計(jì)算機(jī)視覺(jué)技術(shù)模擬這些變化。“但從Sora的一些‘翻車(chē)’視頻可以看出,它在理解物理世界時(shí)會(huì)遇到困難。”過(guò)潔以游戲舉例,在一款射擊游戲中,玩家想要走出屋子射擊“敵人”,Sora很可能會(huì)讓玩家“穿墻而去”。“Sora是否知道墻是一道物理障礙?在它塑造的世界規(guī)則中,是否有這么一條規(guī)矩,規(guī)定墻是不能穿過(guò)的?這些都是未知。”
“目前Sora接受的所有訓(xùn)練都是人類(lèi)‘喂’給它的,其實(shí)還是沒(méi)有跳脫現(xiàn)階段人類(lèi)的認(rèn)知范圍。目前還有許多物理規(guī)律連人類(lèi)都還沒(méi)有掌握,人類(lèi)尚未踏足的知識(shí)領(lǐng)域,Sora也無(wú)法理解。”過(guò)潔說(shuō)。
創(chuàng)意工作
AI仍難以替代人類(lèi)
“過(guò)往的人工智能產(chǎn)品,多半可以分為‘以文生文’‘以文生圖’等類(lèi)型。它們大多是根據(jù)網(wǎng)上已有的語(yǔ)料來(lái)進(jìn)行內(nèi)容產(chǎn)出,對(duì)于我們的工作生活并沒(méi)有帶來(lái)特別大的改變。”南京大學(xué)人工智能學(xué)院院長(zhǎng)周志華分析,大家之所以對(duì)“文生視頻”的反應(yīng)“有點(diǎn)大”,是因?yàn)橥ㄟ^(guò)文字輸入來(lái)生成視頻這種方式,更容易讓大家感同身受。
影視娛樂(lè)行業(yè)的內(nèi)容創(chuàng)作者,成為最早擁抱AI創(chuàng)作工具的探路人之一。國(guó)內(nèi)一家頭部影視公司的AI項(xiàng)目負(fù)責(zé)人王鈺媛告訴記者,自2022年5月“文生圖”工具M(jìn)idjourney推出測(cè)試版本,她便開(kāi)始探索AI為內(nèi)容創(chuàng)作帶來(lái)的可能性。“AI目前在影視全流程都有所應(yīng)用,涵蓋前期開(kāi)發(fā)、中期制作、后期宣發(fā)整個(gè)鏈條。在影視項(xiàng)目的前期開(kāi)發(fā)中,AI可以協(xié)助頭腦風(fēng)暴,激發(fā)‘腦洞’,還可以輔助背景調(diào)研、制作策劃書(shū)、潤(rùn)色大綱、評(píng)估IP等。比如,在動(dòng)畫(huà)電影的角色設(shè)計(jì)過(guò)程中,需要完成角色的配色、服裝、整體的線稿等,傳統(tǒng)情況下,美術(shù)設(shè)計(jì)師要用三四天時(shí)間才能完成,如果導(dǎo)演不滿意,還需要好幾輪溝通和修改,而利用AI,能迅速生成很多案例給導(dǎo)演和制片方選擇,減少了大量溝通成本。”
3月6日,一部自稱“完全由AI制作的開(kāi)創(chuàng)性長(zhǎng)篇電影”在洛杉磯首映。這部《終結(jié)者2》的翻拍作品,由50位藝術(shù)家組成的團(tuán)隊(duì)完成。該團(tuán)隊(duì)使用Midjourney、Runway、Pika等多個(gè)AI工具進(jìn)行創(chuàng)作。結(jié)合過(guò)往的使用經(jīng)驗(yàn),王鈺媛認(rèn)為,就整體質(zhì)量而言,目前AI生成的內(nèi)容離商業(yè)質(zhì)量要求還很遠(yuǎn)。比如,控制影片特定畫(huà)面的風(fēng)格、色調(diào),保持角色的一致性,制作連貫的長(zhǎng)鏡頭,都是AI目前難以完成的。AI工具更偏向于輔助、提供靈感和參考,沒(méi)有辦法完全取代某一個(gè)環(huán)節(jié)。
“不過(guò),大模型確實(shí)有可能顛覆傳統(tǒng)電影的商業(yè)模式。傳統(tǒng)的影視制作,需要編劇、導(dǎo)演、制作團(tuán)隊(duì)、演員等共同協(xié)作,工種細(xì)分程度很高。”王鈺媛說(shuō),近幾年興起的短視頻中,遵循“黃金三秒定律”的短視頻,無(wú)需在制作上多么精良,但對(duì)視頻創(chuàng)意的要求很高,需要立刻抓住觀眾眼球。對(duì)于這些短視頻創(chuàng)作者,AI就可以成為很好的輔助。
在未來(lái)的“眼球爭(zhēng)奪戰(zhàn)”中,拼創(chuàng)意將成為趨勢(shì)。“曾經(jīng)一個(gè)專(zhuān)業(yè)團(tuán)隊(duì)才能制作出的影片,現(xiàn)在有可能一個(gè)人就能完成。不需要商業(yè)融資、不需要花大價(jià)錢(qián)請(qǐng)演員、攝影師,人人都可以成為創(chuàng)作者。”王鈺媛推測(cè),AI將給觀眾帶來(lái)更多可選擇的娛樂(lè)產(chǎn)品,除了電影、電視劇,短視頻、游戲等更多節(jié)奏緊湊、領(lǐng)域細(xì)分的內(nèi)容和產(chǎn)品將呈現(xiàn)爆發(fā)式增長(zhǎng)。“我認(rèn)為AI工具沖擊的不是某個(gè)具體的工種,而是傳統(tǒng)行業(yè)或者帶有固定思維的人群。”
新浪潮來(lái)襲,
教育何為?
“盡管?chē)?guó)內(nèi)大模型產(chǎn)品如雨后春筍大量涌現(xiàn),但實(shí)際發(fā)展還是與美國(guó)存在差距。”業(yè)內(nèi)人士表示,究其原因,在于算力、數(shù)據(jù)和人才三個(gè)方面。
當(dāng)下,人工智能已成為產(chǎn)業(yè)創(chuàng)新的關(guān)鍵抓手之一。省政府工作報(bào)告也指出,要更大力度發(fā)展數(shù)字經(jīng)濟(jì),以人工智能全方位賦能新型工業(yè)化,積極構(gòu)建特色化行業(yè)大模型,打造人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)。
“江蘇發(fā)展人工智能大模型的一大優(yōu)勢(shì)是高校資源非常充分,但江蘇各個(gè)高校培養(yǎng)的頂尖人才外溢現(xiàn)象比較明顯。”過(guò)潔說(shuō)。
2月27日,南京大學(xué)宣布,將于今年9月面向全體本科新生開(kāi)設(shè)“人工智能通識(shí)核心課程體系”。課程體系將涵蓋1門(mén)必修的人工智能通識(shí)核心課,搭配人工智能素養(yǎng)課,以及各學(xué)科與人工智能深度融合的前沿拓展課,從知識(shí)、能力、價(jià)值觀與倫理三個(gè)維度開(kāi)展教育教學(xué)。
“近幾年國(guó)內(nèi)許多高校都建立了人工智能學(xué)院,從本科開(kāi)始專(zhuān)門(mén)培養(yǎng)人工智能專(zhuān)業(yè)人才,這是一個(gè)好開(kāi)端。”周志華表示。南京大學(xué)2018年成立我國(guó)C9高校中第一個(gè)人工智能學(xué)院培養(yǎng)本科生,并率先發(fā)布我國(guó)第一個(gè)人工智能本科專(zhuān)業(yè)教育培養(yǎng)體系。
“從人工智能領(lǐng)域的發(fā)展來(lái)看,重要的是打通‘基礎(chǔ)研究—人才培養(yǎng)—創(chuàng)新技術(shù)—產(chǎn)業(yè)發(fā)展’的通道。”周志華說(shuō),“基礎(chǔ)研究水平提高了,國(guó)內(nèi)大批研究生能夠接觸和從事與國(guó)際接軌的研究課題。其中一些學(xué)生自然會(huì)走到前沿促進(jìn)基礎(chǔ)研究和技術(shù)創(chuàng)新,他們將成為我國(guó)人工智能產(chǎn)業(yè)蓬勃發(fā)展的生力軍。”
原標(biāo)題:網(wǎng)龍2024年?duì)I收60億元,教育業(yè)務(wù)占總營(yíng)收34.8% 多知4月9日消息,近日,
公司2025-04-09 19:36:46
原標(biāo)題:DeepSeek搶張雪峰飯碗?網(wǎng)友模擬高分農(nóng)村考生填志愿,規(guī)劃月薪8000 不管誰(shuí)
公司2025-02-11 18:56:08
原標(biāo)題:任正非再次力挺英語(yǔ):稱英語(yǔ)是華為工作語(yǔ)言 據(jù)ICPC(國(guó)際大學(xué)生程序
公司2024-11-01 22:50:58
原標(biāo)題:離開(kāi)OpenAI和特斯拉后,他創(chuàng)辦了一家AI教育公司 7月17日,OpenAI創(chuàng)始成員
公司2024-07-18 12:10:13
原標(biāo)題:粉筆2023年經(jīng)調(diào)整利潤(rùn)4.5億,CEO張小龍:做高品質(zhì)高效率的事,穿越周
公司2024-05-01 16:43:56
原標(biāo)題:學(xué)而思悶聲擴(kuò)張研學(xué)版圖 學(xué)而思在研學(xué)領(lǐng)域有了新動(dòng)態(tài)。4月16日,北
公司2024-04-17 19:55:00
原標(biāo)題:知乎職業(yè)教育之路,再進(jìn)一步 1月11日,知乎舉辦主題為「啟程!未來(lái)
公司2024-01-13 16:43:49
原標(biāo)題:良師新文道:重塑考研培訓(xùn)格局鑄就教育領(lǐng)域的新標(biāo)桿 在 2023 年,隨著考
公司2024-01-02 20:24:52