大模型新貴還是繞不過雲計算大佬

钛媒體APP 2024-04-26 16:01:38
“AI or die”

至少有那麽一小段時間,雲計算行業真的開始擔心亞馬遜雲科技會落後。

彼時微軟押中OpenAI,風光一時無兩,激動人心的故事背後是一場豪賭,就連比爾·蓋茨也曾警告薩提亞·納德拉不要投資OpenAI,隨後ChatGPT的現象級熱度讓一切質疑消弭于無形,OpenAI GPT和微軟Azure的組合似乎穩贏。

圖片來源:unsplash

在“名不見經傳”的OpenAI爆火之前,谷歌一直是人工智能領域技術的標杆,OpenAI也是站在谷歌的肩膀上才有所成就,比如Transformer架構最早由谷歌推出,湧現現象由谷歌研究員發現。如果AI是雲服務未來最大的變量,那麽谷歌雲一定是最有力的競爭者,位次還要在微軟Azure之前。

不得不向微軟Azure和谷歌雲脫帽致敬,他們加速了人工智能改變一切的節奏,也讓雲服務的焦點轉向AI。這是一場“AI or die”的競賽,雲巨頭不僅要具備AI能力,還要比直接競爭對手有更突出的差異化優勢。

當外界普遍爲亞馬遜雲科技擔心時,Adam Selipsky顯然不這麽想,亞馬遜雲科技遍布全球的龐大基礎設施和繁榮的合作夥伴生態,是其長久以來的領先壁壘,外界都在期待亞馬遜雲科技的新底牌。

那些認爲微軟Azure和谷歌雲能夠憑借大模型超過亞馬遜雲科技,或者說縮小與其差距的觀點,也同時抱有另一種期待,即一旦亞馬遜雲科技將AI納入其提供給客戶的強大服務生態系統,亞馬遜雲科技失去的任何陣地都會很快被彌補回來。

這就是2023年4月Amazon Bedrock誕生時的背景。相比于微軟和谷歌主推的OpenAI和Google PaLM,亞馬遜雲科技采取了不同的策略。

起初Amazon Bedrock主打多模型接入,亞馬遜雲科技的基礎模型 (Amazon Titan),和各種第三方模型(如AI21 Labs、Anthropic、Stability AI 等),都可以通過API的方式接入。同時發布的還有代碼生成器以及用于訓練和推理的雲上算力。

此後Amazon Bedrock不斷更新,增加全新基礎模型、基礎模型供應商以及 Agents功能,提供微調、知識庫、代理、模型評估等各種豐富的功能,同時還能與亞馬遜雲科技其他工作負載無縫集成。

圖片來源:pixabay

總結來說就是三大方面,簡化選擇:多樣化業界基礎模型選擇; 簡化定制:提供持續預訓練,fine-tuning, RAG等方式;簡化集成:Agent on Amazon Bedrock。

最新一次的重磅更新,亞馬遜雲科技數據和人工智能副總裁Swami Sivasubramanian形容其爲“Significant new capabilities make it easier to use Amazon Bedrock to build and scale generative AI applications – and achieve impressive results”。

重大更新、更易使用、效果顯著,成爲Amazon Bedrock本次更新的關鍵詞。

大模型向下看,仍舊是雲平台

Amazon Bedrock對外發布已有一年,過去一年,大模型依然在不斷叠代,甚至叠代得有些過于快速,以至于企業客戶不知道把應用做到什麽程度,Amazon Bedrock給出的答案是,雲廠商不只負責大模型,而是對最終的業務效果負責。

Swami Sivasubramanian表示,Amazon Bedrock聚焦于客戶所需的關鍵領域,以適當的成本和速度構建可投入生産的企業級生成式 AI 應用程序。

當所有人都在關注大模型的時候,更應該關注支撐大模型所必需的雲服務,通過一系列的更新,Amazon Bedrock打造了一個端到端的、對客戶業務效果負責的平台,也讓業內再次把目光聚焦到亞馬遜雲科技。

首先,新增了Llama 3 的Llama 3 8B 和Llama 3 70B 版本模型,目前最強的開源模型正式GA。Llama 3 8B 擅長文本摘要、分類、情感分析和翻譯,適合有限資源和邊緣設備場景。Llama 3 70B 在內容創建、對話式人工智能、語言理解、研發、企業、准確摘要、細致分類/情感分析、語言建模、對話系統、代碼生成和指令跟蹤方面表現出色。

同時Amazon Bedrock還預告了Amazon Titan Text Embeddings V2,Embeddings V2 提供256、512 和1024 向量空間尺寸,優先考慮降低成本,同時保留RAG 用例97%的准確性,性能優于其他領先模型。

以及即將支持Cohere的Command R和Command R+ 企業FM。Command R+是Cohere最強大的模型,針對長上下文任務進行了優化,而Command R則針對大規模生産工作負載進行了優化。

值得關注的是,Amazon Bedrock的模型評估工具全面可用,能夠根據特定應用場景的指標(如相關性、風格和品牌聲音)對模型進行評估,爲客戶評估、比較和選擇適合其應用程序的最佳模型,將評估模型的時間從幾個星期縮短到幾個小時,評估後還會提供評估報告,爲更多模型使用者提供參考。

钛媒體App觀察到,現階段客戶並不希望被一個模型綁定,基礎模型在進化,應用場景也在調試,客戶希望更多選擇、更低成本、更易調試不同的模型,來測試自己的業務效果,模型評估工具就很有必要且應景。

另外還有非常實用的Amazon Titan圖像生成器現已全面推出,客戶可以利用自然語言實現低成本、大量高效地生成圖像,並且每張圖像都包含不可見水印,有助于降低知識産權風險。

其次,如何讓企業更安全地定制模型,並將其集成到特定業務用例,Amazon Bedrock實現了自定義模型導入,客戶現在可以導入和訪問流行的開放模型架構(包括 Flan-T5、Llama 和 Mistral)構建自定義模型,作爲Amazon Bedrock中完全托管的應用程序編程接口(API)。

如此,客戶可以采用在 Amazon SageMaker 或其他工具上定制的模型,並將其輕松添加到Amazon Bedrock,並且經過自動驗證後無縫訪問其自定義模型,就像Amazon Bedrock提供的模型一樣,效果和體驗拉滿,這也完全體現了Amazon Bedrock的開放性。

最後是安全,Amazon Bedrock的Guardrails現已全面上市,可幫助客戶防止有害內容並管理應用程序內的敏感信息。客戶能夠定義內容策略、設置應用程序行爲邊界並實施針對潛在風險的保護措施。 據了解,與Amazon Bedrock上FM本身提供的保護相比,它可以幫助客戶阻止多達85%的有害內容。

GenAI,延續亞馬遜雲科技的第一性原理

不得不說,輪到行業繼續向亞馬遜雲科技脫帽致敬了,老大哥依舊是老大哥。

Amazon Bedrock僅用一年時間就扭轉了風向,行業依然關注大模型本身的技術進步,但更關注大模型能不能爲我所用,這涉及到龐大的基礎設施、工程能力、生態系統等。

亞馬遜雲科技沒有選擇只做大模型,而是以另一種方式,也是他們所擅長的方式,將人工智能融入到原有的生態系統中,數以萬計的客戶正在使用Amazon Bedrock來構建和擴展大模型應用程序。

亞馬遜雲科技就此構建了完備的生成式 AI 全棧布局,企業構建生成式AI 應用的三層架構,包括:用于基礎模型訓練和推理的基礎設施、使用基礎模型進行構建的工具、利用基礎模型構建的開箱即用的應用程序。

在底層算力層,一方面,亞馬遜雲科技繼續提供來自英偉達的計算實例,包括最新的NVIDIA Grace Blackwell GPU的Amazon EC2實例等;另一方面是亞馬遜雲科技自研芯片,包括推理芯片Inferentia和Trainium系列。

中間層是Amazon Bedrock 以及各種附加功能。上層是包括Amazon Q在內的應用程序,Amazon Q可以連接到企業自己的數據、信息和系統,可以根據客戶的業務定制Amazon Q,企業中的營銷人員、項目經理以及銷售代表等,都可以利用Q進行定制對話、解決問題、生成內容、采取行動等等,據悉,亞馬遜雲科技即將帶來進一步的更新。

如果說大模型改變了雲計算行業的遊戲規則,那麽如今行業人士會發現,亞馬遜雲科技制定的遊戲規則,在更廣泛的層面還在發揮著作用。

OpenAI GPT和Google PaLM足夠引人注目,但同時也爲微軟Azure和谷歌雲制造了新的競爭問題,市面上還有很多模型公司,Amazon Bedrock爲這些模型公司建立了一個相同的起點,客戶得以同等體驗不同的模型。

在钛媒體App看來,亞馬遜雲科技不論是做雲還是做生成式AI,其基本理念和邏輯如出一轍,所以亞馬遜雲科技不必搖擺去思考到底怎麽做、做什麽,而是直接按照第一性原理,做出最適合亞馬遜雲科技的Amazon Bedrock。

早年Andy Jassy做雲計算的理念是——“將IT基礎設施細分到最小單元,讓程序員可以最大自由來選擇與組合”,亞馬遜雲科技的確是這麽做的,到了大模型依然如此。

翻閱Swami Sivasubramanian在Amazon Bedrock剛發布時的觀點,“我們生活在一個機器學習非常激動人心的時代。我可能每年都這麽說,但是今年它甚至更特別,因爲這些大型語言模型和基礎模型確實可以支持如此多的用例,在這些用例中,人們不必組建單獨的團隊來構建特定于任務的模型。機器學習模型開發的速度將真正提高。”

“但在未來幾年裏,除非我們讓這些模型對每個人都更容易使用,否則你不會達到你想要的最終狀態。這就是我們在SageMaker早期的機器學習中所做的,這也是我們在Bedrock及其所有應用程序中需要做的。”他說。

人工智能是比IT更複雜的技術堆棧,亞馬遜雲科技依舊兌現了此前的承諾,讓企業內的任何開發人員都能夠自由構建生成式AI應用,而無需關注複雜的機器學習或底層基礎設施,也讓人工智能成爲到達雲計算應許之地的關鍵一躍。

(本文首發于钛媒體App,作者 | 張帥,編輯 | 劉湘明)

0 阅读:130

钛媒體APP

簡介:中國財經科技信息服務提供商。