8月23日消息,Facebook母公司meta Platforms于周二發布了一款人工智能模型,能夠在數十種語言之間進行語音翻譯和轉錄,為跨語言交流提供了
潛在的基礎工具。
meta公司在一篇博客文章中表示,其SeamlessM4T模型可以支持近100種語言的文本和語音之間的翻譯,以及35種語言的語音互譯。該模型整合了之
前只能在不同模型中使用的技術。
首席執行官馬克·扎克伯格(Mark Zuckerberg)曾表示,他設想這樣的工具可以促進來自全球各地的用戶在元宇宙中進行互動,元宇宙是他押注公司未來
的一組相互連接的虛擬世界。
meta稱,該模型對非商業用途的公眾開放。
作為全球最大的社交媒體公司,meta今年發布了一系列主要免費的人工智能模型,其中包括一個名為Llama的大型語言模型,對微軟支持的OpenAI和
谷歌旗下的Alphabet的專有模型帶來了巨大挑戰。扎克伯格表示,對meta來說,開放的人工智能生態系統更有利,因為公司通過有效地集思廣益地開
發面向社交平臺的消費者工具,比起收費訪問模型,能獲得更多利益。
然而,meta面臨與該行業其他公司相似的法律問題,涉及用于訓練模型的數據來源。
今年7月,喜劇演員莎拉·西爾弗曼(Sarah Silverman)和其他兩位作者對meta和OpenAI提起了侵權訴訟,指控這兩家公司未經許可使用他們的書籍作為
訓練數據。
對于SeamlessM4T模型,meta的研究人員在一篇研究論文中表示,他們從400萬小時的“來自公開可用的網絡數據存儲庫的原始音頻”中收集了音頻
訓練數據,但沒有具體說明是哪個存儲庫。
meta的發言人未回答關于音頻數據來源的問題。
研究報告稱,文本數據則來自去年創建的數據集,這些數據集從維基百科和相關網站上抓取內容。(辰辰)