NVIDIA 在語音人工智慧的突破性研究成果,讓企業能夠為每個品牌創造獨一無二的聲音

圖_ NVIDIA Riva SDK 包括世界級的自動語音辨識及文字轉語音功能,可以根據不同口音和領域客製化。

NVIDIA 在語音人工智慧的突破性研究成果

讓企業能夠為每個品牌創造獨一無二的聲音

 

NVIDIA Riva Custom Voice 軟體可用於支援虛擬助理、客服中心語音及

其它語音應用程式;Riva Enterprise 版本可用於大規模部署

 

NVIDIA (輝達) 宣布推出一款工具,只要透過 30 分鐘的音訊資料,便能在短短一天內量身打造出宛如真人的聲音。

NVIDIA Riva 語音人工智慧 (AI) 軟體裡的 NVIDIA Riva Custom Voice 功能,讓數百萬間公司能在數小時內,僅透過少量資料就能以 Riva 開發出的量身打造的生動語音內容。

企業可以使用 Riva Custom Voice 打造一個擁有獨特聲音的虛擬助理,客服中心可以用以快速開發易於辨識的品牌聲音以服務客戶;而開發人員則能用它來建立多種應用程式,以協助有言語表達及語言障礙者。

NVIDIA AI 軟體產品管理部門副總裁 Kari Briski 表示:「真人般的互動始終是 AI 領域最大的挑戰之一,尤其對使用特定行話的產業來說更是如此。現在這些公司可以使用語音 AI,以品牌獨特又生動聲音來傾聽及回應客戶,有助於促進更具吸引力和更愉悅的互動。」

圖_ NVIDIA Riva SDK 包括世界級的自動語音辨識及文字轉語音功能,可以根據不同口音和領域客製化。

 

Riva Custom Voice 可在最新版本的 NVIDIA Riva 語音 AI 軟體開發套件中取得。Riva SDK 包括世界級的自動語音辨識及文字轉語音功能,可以根據不同口音和領域客製化,還能將語音服務擴展到雲端、資料中心或邊緣的數十萬個串流內容。

語音技術產業生態系

NVIDIA 的對話式 AI 軟體在不到三年的時間已經超過 25 萬次下載,在多個產業中被廣泛採用。

全球企業雲端通訊、視訊會議、協同合作及客服中心解決方案的頂尖服務供應商 RingCentral,將 Riva 自動語音辨識技術用於該公司視訊會議的即時字幕功能,提高與會者的參與度。

RingCentral 執行副總裁暨產品與工程部門總經理 Nat Natarajan 表示:「我們的目標是打造更智慧的會議,在 NVIDIA Riva 的助力下,現在就能在 NVIDIA GPU 上訓練即時轉錄模型,提高辨識各種口音的準確性。我們預計將於日後推出多個同時進行的串流內容,而 Riva 可以輕鬆擴展,在不到 300 毫秒的時間內,就能即時處理這些串流內容。我們很高興能與 NVIDIA 合作,共同發展更美好的未來。」

全球最大的金融服務集團之一中國平安也正使用虛擬助理,縮短等待時間以改善客戶體驗。該集團使用 Riva 打造即時語音應用程式,而這些應用程式的準確性不斷提高。

中國平安首席科學家肖京表示:「中國平安利用聊天機器人助理,每天處理數百萬筆客戶查詢內容。使用 NVIDIA 預先訓練好的自動語音辨識模型,再用我們的資料進一步進行微調,系統準確率提升了 5%,讓我們能提供更吸引人及更可靠的服務。」

數十個軟體開發商也在生產環境中使用 NVIDIA 的對話式 AI。Gosoft Contact Center 與擁有超過 20 個業務領域的 CP All 合作,其零售領域為泰國超過一萬間 7-11 便利商店提供服務。透過使用泰語訓練出的高準確度 AI 語音機器人的協助下,每天能處理多達 24 萬通電話。

Plabook Education 與 Data Monsters 正在與美國各地學區合作,透過該公司的 AI 數位虛擬化身閱讀小幫手,找出發音錯誤的單字及衡量閱讀的準確性,幫助兒童學習閱讀。

供貨時程與定價

進行小規模研發的單位可以在 NVIDIA NGC 容器登錄免費取得 NVIDIA Riva。開發人員可以參加 Riva 公開測試計畫並立即試用,以及接受 NVIDIA 即將推出的功能通知。

需要進行大規模部署且希望獲得 NVIDIA 專家技術支援的客戶,NVIDIA 亦宣布預計將於明年初推出 NVIDIA Riva Enterprise 計畫。

Riva  GTC 大會

NVIDIA 創辦人暨執行長黃仁勳在 GTC 主題演講中展示了 Riva 的語音 AI 功能,包括在 Riva Custom Voice 的展示中,如何只用 30 分鐘的資料,就能創造出跟真人一樣的語音內容。

另外,透過 Project Tokkio、DRIVE Concierge 和 Project Maxine,也能看到 Riva 被運用在製作互動式虛擬化身的 Omniverse Avatar 平台。Project Tokkio 與 DRIVE Concierge 展示了用於客服和車內環境中的虛擬化身,而 Project Maxine 則強調多種語言間的即時翻譯和文字轉錄功能。

本次 GTC 規劃了超過 20 場對話式 AI 的演講,包括來自 Hugging Face、Snap、T-Mobile 等公司的專家演講。主題涵蓋用以開發與整合 GPU 加速語音和語言 AI 應用程式所使用最先進的演算法、工具、面臨的難題及其影響。

免費報名參加 NVIDIA GTC,以瞭解更多關於 NVIDIA Riva 的資訊,線上 GTC 將舉行至 11 月 11 日。敬請觀看 NVIDIA 創辦人暨執行長黃仁勳於 11 月 9 日發表的主題演講

數碼領域

寵物友善 Arlo 智能攝影機 讓您感到安全又放心

數碼領域
2024-03-27 0
寵物友善 Arlo 智能攝影機   讓您感到安全又放心 Arlo Essential 室內攝影機 (第二代)提供2K視頻、130 度視野範圍,夜視功能和雙向音頻   將寵物留在家可能會感到擔心,特別是當您外出旅行時。寵物主人常常想知道應選用哪種攝影機來監視他們的毛孩子最為合適,室內攝影機可 ...

SAP與NVIDIA攜手加速推動全球企業應用生成式AI

數碼領域
2024-03-19 0
SAP與NVIDIA攜手加速推動全球企業應用生成式AI 客戶可利用 NVIDIA AI Foundry 和全新NVIDIA NIM的大型語言模型 (LLM) 釋放SAP雲端解決方案中業務數據的潛力 SAP和NVIDIA宣佈擴展合作夥伴關係,共同協助企業客戶加速在 SAP雲端解決方案和應用中發揮數據和 ...

Be the first to comment

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料