OpenAI全新VoiceEngine：僅需15秒音頻樣本即可複刻任何人的聲音

OpenAI近日推出了一項突破性的語音合成技術Voice Engine，用戶只需提供一段15秒的音頻樣本，這項技術就能生成與原聲極爲相似的人工智能語音。這一技術的潛在應用廣泛，從幫助兒童閱讀到改善遠程醫療服務，再到爲患有言語障礙的患者恢複聲音，其影響深遠。然而，由于可能被濫用引發安全顧慮，OpenAI當前僅提供有限的訪問權限，並持謹慎態度。

最近，OpenAI在其官方網站上公布了其Voice Engine技術，這是一種新型的語音生成模型。根據用戶提供的短短15秒的音頻樣本和一段文本輸入，Voice Engine便能生成近乎真實的人工智能語音。這項技術的早期應用場景很廣泛，包括但不限于輔助兒童閱讀、翻譯視頻和播客內容、提升偏遠地區社區服務的質量以及幫助那些患有突發性或退化性言語病症的患者恢複聲音。

據悉，Voice Engine技術從2022年底開始研發，現已爲文本轉語音API和ChatGPT的朗讀功能提供預設語音，但OpenAI在其商標申請中依然表現出對于未來是否大規模部署這項技術的保守態度。該公司認爲，盡管技術在各個領域的應用前景非常誘人，但是也存在諸多潛在的濫用風險，例如被用作制造虛假信息或模仿他人聲音。

盡管存在爭議，Voice Engine的技術展示還是引起了廣泛關注。一些報告中指出，OpenAI已經展示了基于Voice Engine技術的聲音複刻樣本，並強調了其逼真度。OpenAI表示，他們會對使用技術的企業和開發者進行嚴格篩選，只允許符合道德標准和法律規定的應用出現。

除了Voice Engine，OpenAI還發布了一系列有關如何安全、合規地使用人工智能技術的指導原則。這些指導原則指出，盡管人工智能可以帶來巨大的社會和經濟效益，但必須盡力減小其可能帶來的風險。OpenAI還強調，他們會持續監控技術的使用情況，並根據需要調整相關政策。

總的來說，Voice Engine是OpenAI在人工智能語音技術領域的一次重大突破，盡管仍然面臨著諸多挑戰，但其潛在價值和影響力不言而喻。隨著技術的不斷成熟和完善，我們有理由相信，Voice Engine將會在未來成爲改變人們生活方式的重要力量。

OpenAI的Voice Engine代表了人工智能技術在語音合成領域的重大進步，其能力在于通過極短的音頻樣本複制出逼真的人聲。然而，它也引發了社會對于技術潛在濫用的擔憂。OpenAI對此展現出負責的態度，對技術的發布持保守策略，並在確保安全和遵循倫理的前提下推進技術的發展。未來，若能妥善管理這些風險，Voice Engine有望在多個領域內發揮重要作用，特別是在教育、健康保健和社會服務等領域。

文采家

OpenAI全新VoiceEngine：僅需15秒音頻樣本即可複刻任何人的聲音

智創獅