Hume AI 推出 Voice Control 功能 透過滑桿操作即可實現個人化的語音定制

Home » AI日報 » Hume AI 推出 Voice Control 功能 透過滑桿操作即可實現個人化的語音定制

Hume AI 推出了名為 Voice Control 的新技術,這是基於可解釋性的AI語音客製化方法,無需語言描述,僅透過滑桿操作即可實現個人化的語音客製化。幫助開發者精準調整AI語音的個人化特徵,同時避免語音克隆的潛在風險。

它可以讓你像混音器一樣調整AI生成的聲音,讓它更符合你的需求。你可以改變聲音的性別感、自信度、熱情、柔和度等等,共10個不同的維度。例如,你想讓聲音聽起來更有自信、更放鬆,或是更熱情,都可以用簡單的滑桿調整。

技術特點
語音屬性控制
Voice Control 提供了10個可調語音維度,包括:
性別感(Masculine/Feminine):聲音的性別傾向,從較陽剛到更柔和。
自信度(Confidence):聲音的篤定程度,從害羞到自信。
熱情(Enthusiasm):聲音的情緒活躍度,從平靜到熱情。
放鬆度(Relaxedness):聲音的緊張感,從緊繃到放鬆。
平滑度(Smoothness):聲音的質感,從斷斷續續到流暢。 其他維度還包括聲音的鼻音度、活力、緊緻度等。
精確可控
提供從-100到100的連續調整範圍,使用者可以根據需要細緻調整聲音特性。
調整後的語音屬性在不同會話中一致可重現。
避免語音克隆風險
不直接複製真人語音,而是透過語音模型產生獨特語音,降低隱私和安全風險。
操作簡便
無程式碼介面:使用者可以直接透過滑桿即時預覽和調整語音效果。
即時產生:快速產生符合需求的語音,適用於即時應用。
應用場景
品牌化語音設計:為品牌或產品打造獨特的語音形象。
情感化語音互動:用於醫療、客戶服務、虛擬助理等需要情感表達的場景。
創意表達:為影片、遊戲或虛擬角色客製化專屬聲音。
技術實現與整合
創建過程:
選擇基礎語音模型。
使用滑桿調整10個語音屬性。
即時預覽修改效果。
部署到Empathic Voice Interface (EVI)平台。
技術優勢:
語音調整獨立性強,各特性之間互不干擾。
修改後的語音在不同設備和場景中表現穩定。
未來展望
增加更多可調節語音維度。
提升極端參數調整下的語音品質穩定性。
開發更先進的語音分析與視覺化工具。

返回頂端