Hume AI 推出 Voice Control 功能透過滑桿操作即可實現個人化的語音定制

Hume AI 推出了名為 Voice Control 的新技術，這是基於可解釋性的AI語音客製化方法，無需語言描述，僅透過滑桿操作即可實現個人化的語音客製化。幫助開發者精準調整AI語音的個人化特徵，同時避免語音克隆的潛在風險。

它可以讓你像混音器一樣調整AI生成的聲音，讓它更符合你的需求。你可以改變聲音的性別感、自信度、熱情、柔和度等等，共10個不同的維度。例如，你想讓聲音聽起來更有自信、更放鬆，或是更熱情，都可以用簡單的滑桿調整。

技術特點
語音屬性控制
Voice Control 提供了10個可調語音維度，包括：
性別感（Masculine/Feminine）：聲音的性別傾向，從較陽剛到更柔和。
自信度（Confidence）：聲音的篤定程度，從害羞到自信。
熱情（Enthusiasm）：聲音的情緒活躍度，從平靜到熱情。
放鬆度（Relaxedness）：聲音的緊張感，從緊繃到放鬆。
平滑度（Smoothness）：聲音的質感，從斷斷續續到流暢。其他維度還包括聲音的鼻音度、活力、緊緻度等。
精確可控
提供從-100到100的連續調整範圍，使用者可以根據需要細緻調整聲音特性。
調整後的語音屬性在不同會話中一致可重現。
避免語音克隆風險
不直接複製真人語音，而是透過語音模型產生獨特語音，降低隱私和安全風險。
操作簡便
無程式碼介面：使用者可以直接透過滑桿即時預覽和調整語音效果。
即時產生：快速產生符合需求的語音，適用於即時應用。
應用場景
品牌化語音設計：為品牌或產品打造獨特的語音形象。
情感化語音互動：用於醫療、客戶服務、虛擬助理等需要情感表達的場景。
創意表達：為影片、遊戲或虛擬角色客製化專屬聲音。
技術實現與整合
創建過程：
選擇基礎語音模型。
使用滑桿調整10個語音屬性。
即時預覽修改效果。
部署到Empathic Voice Interface (EVI)平台。
技術優勢：
語音調整獨立性強，各特性之間互不干擾。
修改後的語音在不同設備和場景中表現穩定。
未來展望
增加更多可調節語音維度。
提升極端參數調整下的語音品質穩定性。
開發更先進的語音分析與視覺化工具。