小米自研語音技術 助語言障礙人士擁抱科技
「Own My Voice」項目旨在讓使用者擁有獨特定制的語音
小米是一家以製造智能手機和智能硬件,
參與該項目的受贈人現在可以選用比傳統電子語音像真度更高的聲音與他人交流。 作為小米技術委員會「Own My Voice」預研項目的一部分,是次的成功彰顯了小米對「技術向善」的承諾,實現了「讓全球每個人都能享受創新科技帶來的美好生活」的使命。
為什麼小米要啟動這個項目?
現實中,許多語言障礙人士都希望擁有一把專屬於自己的聲音來進行日常交流。小米以科研關心用戶生活,致力於通過創新技術滿足現代人多元化的需求,因此成立了「Own My Voice」項目,邀請語言障礙用戶作參與研發。 小米集團技術委技術向善議題召集人朱汐表示:「我們很高興能夠探索創新科研帶來的多重價值,回應用戶對自我身份的需求和身份的構建。 」
小米如何開展這個項目?
為研發出最合適每位用家的聲音,計劃研發小組在小米內部招募了200多名志願者來捐贈他們的聲音。研發小組以聲紋適配算法將志願者捐贈的聲音特徵與用者的聲音特徵進行匹配,以找出最合適的聲音作為用家的基本聲音參考。考慮到個人化和隱私因素,我們對被選中的聲音進行了複雜的聲學參數調整,以形成新的原始聲音。
小米更利用自研的超級擬人技術訓練 AI 系統,令合成聲音的節奏和語調變得更自然,以真實地表達人類的情感和語調。
「Own My Voice」項目將多種最先進的演算法與小米自主研發的語音技術相結合,確保合成語音保持獨特、安全和像真的特性,為語音障礙用戶定制語音合成開創先河。
項目意義
「Own My Voice」項目的成功背後全賴小米人工智能實驗室語音技術專家努力開發超級擬人技術。自 2017 年以來,他們在國際聲學、語音和信號處理會議 (ICASSP) 等頂級國際會議的論文集中發表了 37 篇演講論文。
自研的超級擬人技術雖然在本質上是合成聲音。然而,經過研發人員的調整和AI系統訓練,超級擬人技術可以使合成的聲音在語調、停頓、語速等方面和真人無異,從而擺脫電子機械音的生硬感,讓聲音更加自然。目前,該技術已應用於多款搭載小米AI語音助手小愛同學的智能產品上。 「Own My Voice 」項目展示了超級擬人技術的廣泛應用,發展無障礙科技,改善用戶體驗。
朱汐補充道:「如果我們及早發現和解決少數群體的需求,技術傳播的過程就可以大大縮短,讓有特別需求的用戶以毫不拖延的速度享受新技術的好處。」
展望未來,小米將繼續接收語音用家的意見反饋,並進一步廣闊項目的可行性。集團將繼往開來,以科技賦能無障礙技術,努力通過科技創新滿足人們多樣化的需求。
發表迴響