從短劇、音頻到二次元社區，大模型創業者如何用AI重塑內容形式及生産模式？

AI時代，在大模型能力還在進化、還在苦苦尋找PMF之前，創業者之間的交流和共識似乎變得更爲重要。

一次成功的嘗試，或者是失敗的反思；

或者是最近的創業新方向和新收獲；

或者是對于某個垂直領域的新觀察。

……

3月23-24日，由上海市人工智能行業協會（SAIA）主辦的 2024 全球開發者先鋒大會（2024 GDC）在上海成功舉辦。同期，3月22日，Founder Park 也邀請了四位創業者，在大會周邊進行了一場閉門交流分享，暢談他們在過去一年內AI創業的得與失，進行了一場大模型創業的認知碰撞與對齊。

我們節選了嘉賓分享中，對于AI如何影響內容創作者、如何改造不同內容的生産流程，甚至如何滿足小衆人群的內容閉環的一些精彩討論。

交流嘉賓介紹：

朱江井英科技創始人CEO

胡修涵：捏Ta 創始人

呂睿韬（秀才）：喜馬拉雅珠峰 AI 産品研發總監

尹伯昊：猴子無限創始人CEO

再次，特別感謝上海市人工智能行業協會、出門問問、上海西岸集團對本次活動的支持。

01 AI短劇≠AI+短劇，而是全新的內容生態

分享嘉賓：井英科技創始人CEO 朱江

在這部分，他分享了目前對于AI短劇行業的觀察和心得。

今天的短劇和免費小說有非常大的關系。最早拍短劇的人，就是免費小說的廣告演員，還有那些給免費小說投廣告的廣告代理公司。大家發現，這種短劇其實本身就挺好看的，不一定非要去看小說了。2021 年開始就有一批先行者，到2022年發生了一個關鍵的點，就是抖音和微信小程序之間打通了。這導致大量的公司可以通過抖音買量，然後跳轉到微信小程序裏。原來那些做免費小說、新媒體的人通過短劇的方式，把 ROI 跑起來了。短劇的前身其實就來自于免費小說。今天短劇的興起可以講就是免費小說的一個升級版，是視頻化的小說。

爲什麽是小說，因爲一次性看不完，需要反複看，和抖音短視頻的邏輯是不一樣的，這是一個很好分發的點。

從體驗上來看的話，在AI上面還要往前走，交互上也會有新的變化，你要想它其實不是個劇了，能看、能互動，這是一種新的內容，只是現在看起來是視頻化的，

換句話說，如果今天用AI去做Vision Pro的空間視頻，可能就會變成另外一種媒介。但可能還是需要一個過程。

這次創業，我們用 AI 來生成視頻內容，也是做短視頻的，從廣告到短劇全都覆蓋。但是我有個非常大的體會，就是一定要做優質內容的創作。優質的內容創作在市場上是有價值的。但凡一個娛樂型的、充分競爭型的內容市場，優質是一個入門的門票。沒有優質內容，最終遲早要被淘汰。

我們會覺得豎屏短劇不是短視頻，是個新東西。其實是個長視頻，只是切短了之後變成了一集一集的連續爽點，很密集的呈現方式。長視頻在于追，短視頻在于刷，體驗是不一樣。

豎屏短劇這種形態是個新的分發渠道的機會，就是國內、海外用戶刷豎屏短劇在哪刷？沒有一個人有這個心智，國內海外的用戶都沒有一個固定渠道。

第二個問題其實更關鍵，內容供給。

我們設想，如果要 1000 萬 DAU 的話，大概需要 1000 部好劇，按照現在的爆款率，需要1萬部劇打底。現在中國的整個的供給量是多少呢？一年 3000 到 5000 部劇。

現在內容的消耗量根本撐不住這麽大的DAU。所以我的判斷是短劇的需求端被驗證了，但是問題在供給側。如果不用 AI 生成方式的話，不可能成爲一個平台，這是我的判斷。

現在的月活的短劇用戶量已經是1.2 億，這些內容刷完了就走了，留存不下來。當你真的要聚成一個內容平台的量級，是不可能用現在的工作室方式去拍的。

這個跟以前的網文小說不一樣，作家寫作，只有時間成本。但是你說一堆人湊在一起，演員、服裝、道具、攝像，他不可能爲了興趣去拍短劇，團隊成員都要吃飯的。所以制作方一定要付錢，成本是一方面，制作內容的效率也很低。AI 的好處是在于，它並不是提高內容上限，但是AI可以把團隊的事情變成一個人就可以做。如果你能夠達到優質的基線，讓這些有能力的創作者一個人就能創作的時候，這個內容供給才能夠打開。只有用AI降本增效到這個程度，平台才能夠出現。

我覺得今天短劇的賽道，也還只是下半場的開場。

中國市場真人拍攝的短劇，年産量才 3000到5000 部。我去年和客戶、投資人都在講，今後用戶一定分不出來AI和真人拍攝的區別，未來就是 AI 內容的時代。

從現在的角度來說，至少站在海外平台的視角來看，競爭還沒有絕對的勝負的方式，現階段存在一個階段性的機會，因爲Netflix、Disney以及其他的視頻平台現在對于豎屏短視頻的認知還沒到這個點。國內的話，大平台可以一次性把內容團隊都收了，就沒什麽機會了。

提問：AI 在多長時間之內有機會成爲視頻的創作者？

這個是很好的問題，我們覺得短劇還是一個PGC，但AI有點區別。

我覺得 AI 時代不太一樣，不是PUGC， PUGC 是專業的人去創作，而AI是讓一部分本來不專業的人，因爲 AI 解決了下限的問題，用戶用AI工具成爲了可以生産內容的專業人士。

我們會覺得其實真正最終能代替抖音的未來平台，現在的AI體驗還要往前走，只有AI短劇是不夠的。

短劇可以是AI時代的內涵段子，但不是真正的今日頭條或者抖音，但是它是在那條路上，是其中很重要的一塊。而其他內容體驗的提升有賴于其他 AI 能力的補充。

提問：AI時代的個人創作者會呈現非常強的頭部效應嗎？

坦白來講我們內部也有分歧。一種觀點是認爲超級個體會崛起，厲害的人會變得更強，因爲效率提升了。還有一種觀點就是，能人的數量也變多了，不會變成像Netflix或者愛奇藝的上遊一樣被少數的內容制作方所控制的局面。

所以我感覺，一開始超級的內容創作者會崛起，但是慢慢會有更多的人進來。頂部可能是個百萬量級的存在，然後腰部也會有更多創作者數量的提升。

02 AI讓小衆群體的內容閉環不再是問題

分享嘉賓：捏Ta 創始人胡修涵

在這部分，他分享了捏Ta 切入二次元內容社區的觀察和判斷。

我第一次理解數據驅動不能解決很多東西，包括不少內容的問題，是在聯合利華工作的時候。

聯合利華當時會給廚師做分享菜譜的社群工具，用來作爲提升調味料銷量的一種方式。爲什麽是建社群？其實明明有不少不那麽曲線救國的方式：直接發優惠券、線下超市鋪貨等，爲什麽要社群，其實是他們在整合零散渠道的優質內容，進行社會化創新。

如果把菜譜當成內容，廚師就是創新菜的驅動力，在食材之外，調味料也是菜譜的關鍵要素。但這個部分，制作調味料的廠商其實很難理解怎麽做創新，因爲沒有那麽多的數據反饋和數據驅動，只有銷量數據，而銷售數據其實滯後于民衆的口味變化。

那什麽反饋是最快的？

如果一個廚師在一道川菜裏放了甜口的調味料並且大受好評，周圍的廚師就會很樂意分享這個食譜，如果能第一時間獲取到這個菜譜，就可以進行調味料的創新。某種程度上來說，這是廚師的Github。

而爲什麽一直沒有內容的Github呢？

因爲內容的 Github很難做，大家要凝聚共識，要互相討論，但內容又是個很主觀的事情，所以編輯部需要有主編拍板，因爲要有核心創作的最後決策。

但是這件事對于更高效的AI時代的內容創新，已經不是最高效方案了。比如說小衆愛好的內容創作，一直有內容創新的瓶頸，因爲它的供給和消費的循環沒法建立起來，人數太少了，沒有足夠的創作者去創造內容，就會導致消費也循環不起來，然後社群就會消亡。

但是這件事情本身的價值其實很大，小衆人群的內容可以構成共識，而共識會形成很大的價值。

那麽，今天的AI就可以改變這種現狀。

AI改變了內容創作的協作流程，但不是像Reddit那樣進行像素級別的協作，那只有行爲藝術價值，但結果沒價值。

但如果在角色上，或者基于某些特定的概念，如果我們有共同的創作目的，我相信在AI的幫助下，是可以自下而上産生好內容的。我們花了一年時間，至少做了30多個新媒體賬號，在小紅書和視頻號上跑出來成功的案例，而且這個是跟非AI內容一起競爭取得的結果，我們覺得這算是找到了Content Market Fit了。

這其中最重要的一點就是 AI as Composer，not Creator。

最終的內容還是由專業的人來供給，大家一起參與把一個角色玩起來變成一段劇情，這段劇情可能是PGC創作或者其他的用戶來供給，我們可以把角色世界觀、場景以及發生的劇情重新拆出來，一點點控制變量，讓AI去補到足夠好，最後的結果還是有人願意看的，有足夠消費屬性的。這樣最終通往一個真正的AI-native內容形態。

比如說這張圖，其實就是用戶提議做CP圖，柯南和灰原哀，然後AI生成了這樣的圖，這張圖在B站獲得了兩百多的點贊。東西是人想的，但是AI很容易把這個想法還原出來，甚至還能帶點意外驚喜。

基于這樣的形式和內容要求，我們在初期其實也是切入到幻想和二次元類別。因爲這些類別上有成熟的創作模式，比如Lofter上的同人內容。

在此基礎上，會發現這個模式其實不支持長敘述，只能支持一定程度的短敘事。同樣是互動敘事，橙光模式就不適合，因爲橙光的遊戲是追求長敘事，講究前期的引導和後期的解密，是常見的草蛇灰線的模式。什麽樣的內容適合做呢？像《名偵探柯南》《哆啦A夢》這樣長線由劇場版推動、短線由單元劇推動，然後基于角色base、事件base來展開的內容內核就很好。

用戶會因爲角色或者事件參與進來，還有就是用戶對于角色的故事線（角色驅動）是有預期的，比如成長環境、家族關系、社交等，都是可列舉和填充的，但如果是故事支線驅動（情節驅動）的，這個分支就沒法枚舉，無法預料。

這些內容的創作者，也不是目前已知的優質創作者，因爲他們（現有優質創作者）都被他現在能做好的內容形式綁定了，只能去一個Ta不被看成是優質創作者的地方淘金，然後通過各種創作活動或者比賽，挖掘出其中的好苗子，而不是一開始就征集到好的創作者。

而最終，每個人都能參與創作，也能享受看故事的樂趣，看自己的故事的樂趣。

03 大模型的核心是降低用戶創造內容的成本

分享嘉賓：喜馬拉雅珠峰 AI 産品研發總監呂睿韬（秀才）

珠峰AI將在今年推出他們的語音大模型，在語音生成上能力更強。秀才則從語音生成的角度分享了他對于大模型如何改造內容生産的理解。

從定義來說，什麽是大模型？我們覺得人就是一個大模型。人從小到大、從無到有，進行了不同角色的轉化，不同能力象限的提升。把人拆解的話，我們認爲人是由三部分組成的，分別是形+語+意。

形是是指人的外設，包括形象、動作、神態表情等。

語就是語音交互，從寶寶出生到成長，一直是語音交互的，語音信息裏40%是文本， 60% 是富語言信息（情感情緒、韻律、口吻等）。文本本身是一個概念抽象的內容，但是語音的富語言信息是有情感的、有特性的，語音更有溫度、更多樣性，所以語音也是人“成長”過程中很核心的一環。

意就是思想智慧，構建這部分的就是大語言模型。

所以我們的訴求就是打造一個具有角色人物視覺外設，有情感、有垂直任務能力的大模型。一定是垂直任務能力，只有在一個垂直任務能力上做好，單點擊穿才是有壁壘的，什麽都做 60 分不如做一個90 分，選擇的核心邏輯是聚焦。

我們對整個模型的思考，核心應該是讓用戶充分把AI用起來。這一代的大模型核心是把創造的邊際成本降低，讓用戶充分參與進來。大模型就是超越用戶現有的能力，對用戶做增益。那我們覺得語音這條線的增益就是讓用戶可以具備超越自身限制的語音語言能力。

我們構建的第三代語音大模型，相比行業內第二代模型，不僅僅對音色的還原度極大提高外，還完美還原韻律腔調和口吻，同時支持音頻prompt和文本prompt兩種方式提示方式調整音頻創作效果。

用戶使用15秒的聲音作爲音頻prompt餵給大模型，可以迅速得到完美複刻，而且是原有韻律和腔調的，然後用文字prompt來調節輸入音頻文本的音色，或者音頻中要包含的各種情感，都可以直接調整。這就是一個創造力再造的過程，把創造的能力不斷放大。

大家一定要重視數據工程産品的建設。相較于文本標注來說，視頻標注和語音標注非常難，我們現在會先用模型自動化標注提供算料處理效率和質量，另外我們甚至還有100多個“音視頻導演”來做數據處理管線的設計，只有用專業的人才能做出高質量的數據。強大的數據工程産品是構建富有産品競爭力多模態大模型的基石。

AI讓所有人都可以成爲創造者

現在很多家都在做數字人，我們在這方面的思考是，我們認爲未來的這種交互形式，或者說內容形式，一定是 AI 生成的。我覺得未來只有AIGC， PGC 和 UGC 只是 AIGC 的過程，它們給 AIGC 提供養料，未來都會被AIGC替代掉。

數字人這個事情，GPT讓我們擁有更多的文本能力上限，把我們的能力邊際打開。我覺得2024 年一定是超級個體元年，用上AI之後，人人都是創造者，而且是快速的創造。

提問：什麽叫好的數字人交互？我們本身也是做數字人的，現在的交互就是把文本、語音、表情、動作四個單獨的模態疊加在一塊，但效果很普通。很多用戶反而會喜歡迪士尼動畫裏的那種效果。

合成數據，動漫、遊戲的數據都往裏面放，而不是單純真人。數字人不是一味追求真實性，而是追求演繹效果。一味地還原不是用戶最終想要的，用戶想要的是表達和演繹的增益，包括形象增益、知識增益還是表達增益。“理解”用戶、“成爲”用戶、“超越”用戶。

文采家

從短劇、音頻到二次元社區，大模型創業者如何用AI重塑內容形式及生産模式？

極客公園