Sora爆火,OpenAI狂飙,誰又被甩在身後?

太平洋科技 2024-02-22 16:25:42

作者:趙甜怡

編輯:曾憲天

一覺醒來,又要“失業”了?

龍年的“第一把火”來自OpenAI推出的新産品Sora。這個AI視頻模型還未開放使用,僅憑一頁技術報告就迅速火遍全網。發布三天後,從Sora的功能介紹到技術原理,甚至是背後的團隊都被“扒”得清清楚楚,逐個成爲大家熱議的話題。發布五天後,熱度絲毫不減,影視、教育、IT……各個行業都開始分析Sora會帶來什麽樣的改變。春節休假都沒有擋住它刷屏的速度。

數據來自微信指數

文生視頻模型在市場上並不少見,Runway、Pika等已經成爲多數用戶的趁手工具。但區區Sora爲何能“突出重圍”? 讓大家如此興奮的原因是Sora這個文生視頻模型如一年前的ChatGPT一般,可謂是AI史上裏程碑的存在。

在場景過渡中能保持視角的一致性(素材來自OpenAI官網)

和你高中時最頭疼物理考試一樣,AI最困難的也是物理這門課。一直以來,AI生成視頻的難點,就在于它做不到像人類一樣自主理解真實的物理世界。

想想看,一拳砸向玻璃,和一拳錘向純棉床被,結果有什麽不同?玻璃可能會碎,劃傷拳頭甚至流血,而床被只會凹陷再回彈。這些區別對我們來說,簡單到不需要大腦思考,但AI卻無法判斷,所以經常生成不符合常識的畫面。

但基于OpenAI給出的例子來看,Sora似乎找到了解決問題的思路。按照官方技術報告的描述,Sora已經能夠部分還原現實世界中的物理法則了。

視頻模擬了咖啡的流體動力學,甚至還有船體周圍的泡沫提示詞爲:兩艘海盜船在一杯咖啡內航行時互相戰鬥的逼真特寫視頻

如此逼真的效果,甚至細致到咖啡的紋理變化和船周的泡沫。一經發布,推特上就有網友評論“GG Pixar(指皮克斯動畫)”。“GG”是Good Games的縮寫,表示“打得好,我認輸”。馬斯克則風趣地回應,是人類要“GG”了。馬斯克隱晦地將網友們的視線從視頻效果移開,對准了更大的世界。

馬斯克回應截圖

當大家都在對“視頻模型Sora”津津樂道時,經常會忽略OpenAI對其下的定義——“作爲世界模擬器的視頻生成模型Sora”。這也就透露出OpenAI的“終極目的”——並不是顛覆某個行業,而是作出世界模擬器,開發虛擬物理世界。

截圖來自OpenAI官網

AI的發展離不開三要素:人力、數據和算力。

每一個大模型的誕生都需要經曆數據的“洗禮”。曾有專家分析,ChatGPT訓練數據高達1.76萬億個。數據材料的來源可以借助公開渠道,但數據的標記、清洗、整理都需要消耗大量的人力。據傳,在OpenAI這家AI獨角獸公司裏,數據標記的工作都是由博士及以上學曆的高等人才完成。高精准度的數據也給ChatGPT帶來了在市場上領先其它大模型的泛用性。

另一方面,OpenAI的首席執行官Sam Altman也正在全力提升算力優勢。前不久,Sam Altman宣布要拉來7萬億美元融資,用來完成他雄心勃勃的芯片項目計劃。

7萬億美元是什麽概念?這個數值比全球前兩名的科技公司——微軟和蘋果,總市值加在一起還要高!很顯然,他的野心決不止于某一個行業。而是要入局全球芯片制造,讓OpenAI在通往AGI(通用人工智能)的道路加速前進,甚至是邁向“贏者通吃”的局面。

OpenAI官網展示不同算力下視頻生成效果

不過,夢想和現實終有差距。AI界的“買家秀”和“賣家秀”問題不斷上演。僅在官方公布的視頻中, Sora就出現了一些明顯的問題。YouTube科技圈頭部博主Marques Brownlee發現,Sora生成的奶奶吹蠟燭視頻,乍一看很真實驚豔,但細看畫面中人物的手指,就會發現其不正常的運動軌迹。更別提蠟燭火焰的方向錯誤百出了。

原素材放慢、放大後效果

Sora雖然離真實世界還有一些距離,但相比Runway、Pika等模型而言,可以說跨了一大步。英偉達的高級研究科學家Jim Fan也將Sora稱爲“數據驅動的物理引擎”。不過,也有網友認爲這是過度神化了Sora的能力。

截圖來自OpenAI官網的Sora技術報告

在Sora技術報告的最後一段,OpenAI官方寫道:“我們相信,Sora 今天所擁有的能力表明,視頻模型的持續擴展是開發物理和數字世界以及生活在其中的物體、動物和人的強大模擬器的一條有前途的道路。”這一說法毫不掩飾自己的野心和方向,但一石激起千層浪。

對于Sora到底懂不懂物理世界,業內觀點不一,討論激烈。“Sora明顯還不能理解物理世界。但AI將來能否做到這一點,我還是有信心的。”中國人工智能學會第八屆理事會理事曹立宏向PConline說道。

在贊美或是神化的爭論中,不少行業也逐漸減少焦慮情緒,開始理清思路。

“現在每個人都被AI捆綁上了船,下船必死”。 科幻導演郁剛看到Sora發布的新聞後這樣說道。雖然目前Sora只有官方公布的視頻效果,但許多影視從業者和郁剛導演一樣,在震驚之後,更多的是對行業未來發展的興奮。

原本需要三五年的時間才能達到的視頻效果,Sora現在就做到了。對于涉及科幻電影制作的郁剛導演來說,之前如果有好的劇本需要先到處找投資。但是現在Sora直出的2K高清視頻已經足夠替代曾經最耗財的動態預演部分。這意味著,影視內容在資本層面所受的限制或許可以大大降低,讓內容重新回歸藝術的創作。

素材來自Sora團隊

“(Sora)效果超乎想象……就像以前的工業革命,淘汰了手作坊但興起了大量的機械工程。現在Sora就是影視行業的工業革命。”資深影視工作者肖家立向PConline說道。

在去年,肖家立的團隊就已經開始將Midjourney等AI工具納入工作流之中,用來制作分鏡腳本。由于現在AI工具的生成內容更類似于抽卡機制,並不能保證每次都在統一水平,甚至是統一風格。目前還只是用于生成參考畫面,並非商用。據肖家立的分享,身邊的同行們或多或少“都會研究一下,把AI當工具用”。

素材來自OpenAI官網

先進工具的出現總是讓人喜憂參半。

一年前ChatGPT橫空出世,不少聲音高呼“寫作已死”“編程將亡”。 每一個新發布的OpenAI公告都在挑撥著某些行業焦慮的神經。如今環顧市場,振聾發聩的觀點遠比AI生成的文字堆砌更有傳播力。2023年的AI崗位平均月薪超4.6萬元但仍面臨著人才緊缺。

同樣的劇情在Sora發布時按下開機鍵。不過這一次,更多的人意識到,新工具改變了工作模式,並非替代了崗位本身。AI能夠完成從1到N的簡單落地,但從0到1仍依賴我們自身的創造能力。技術進步的意義就在于此,讓我們擺脫重複性的瑣碎工作,將精力放在創造更大價值上。

個體之外,OpenAI等科技巨頭仍在大步前行,各行各業的重塑和變革都無法避免。龍年的“第一把火”已經點燃,AI的發展完成了一座又一座的裏程碑,相信這個時代最大的AI浪潮離我們越來越近了。

0 阅读:30

太平洋科技

簡介:PConline以科技敬生活。