人聲合成 - Casiotone

人聲合成：重新定義演奏樂器的科技

試想像，一款前所未有的電子琴，可以根據您演奏的樂句「唱出」預先編程的歌詞。與傳統的電子琴和合成器不同，與專業的錄音室製作設備相比，Casiotone CT-S1000V 代表了開創性新技術的全新演奏樂器概念：人聲合成。

自 1980 年代以來，以 PCM 為基礎的技術讓電子琴演奏者可以獲得無數真實的樂器聲音。但要複製出令人信服的人類歌聲，始終遙不可及。不僅是因為人聲即使在恆定的音高下也會表現出巨大的音色變化，歌詞亦增加了另一層複雜性。即使是一個特定的字，旋律和詞組的差異，以及它前後的字，都會需要改變波形。

雖然已經有一些產品以電子琴格式複製人聲，但它們需要專門的操作和演奏技術或預編程歌詞的精細校準和演奏。這些因素限制了音樂家的接受程度。

Casio 的人聲合成技術，將真實重現人聲放在電子琴手觸手可及之處，克服了這些問題。CT-S1000V 的面世表示任何人都可以隨時隨地創作人類歌聲，無需特殊技術。

- 可以實時「唱歌」的樂器

- 「音符模式」和「樂句模式」控制歌詞進程

- 實時控制人聲音色

- 組合功能以創造複雜的人聲質感

- 使用 Lyric Creator 應用程式上載原創歌詞

- 人聲合成：自 PCM 以來第一個重大的聲音生成大躍進

可以實時「唱歌」的樂器

「人聲合成」是一項突破的新技術，可讓樂器演奏者輕鬆創作歌唱的人聲，由 Casio 與名古屋工業大學的研究人員共同開發。以早期機器學習研究的發音模型為基礎，用於調製來自一系列虛擬人聲補丁的音調，稱為「演唱者」，結合內置的預設歌詞和輸入到 Lyric Creator 應用程式的用戶編程歌詞，通過電子琴製作流暢的歌唱。人聲是由模擬人類聲帶的 PCM 音源產生的音調與根據歌詞輸入生成短語的濾波器結合而成，也可以通過實體旋鈕實時調整以進一步調校特徵，譬如年齡和性別。

這項技術與之前通過電子琴或聲碼器觸發預先錄製的人聲方法截然不同，後者將人聲實時與合成器音調結合。除了無需特殊技巧外，人聲合成亦讓您可將預編程的歌詞與您所想的任何旋律或和聲配對，為樂器和歌詞表達開闢了嶄新的可能性和境界。

「音符模式」和「樂句模式」控制歌詞進程

歌詞前進的方式由兩種模式之一決定：音符模式，演奏的音符形成旋律，歌詞隨著演奏的每個音符前進；以及樂句模式，即在彈奏時以固定的節拍自動逐句播出歌詞。

「音符模式」根據彈奏的音符觸發歌詞的每個音節，並在鬆開琴鍵時應用終端輔音，從而產生流暢、自然的人聲。還有一些功能可以防止因彈錯音符而失位的風險。Casio 的 SP-3 和 SP-20 踏板（分開發售）或其他市面出售的腳踏開關可用於調整歌詞前進和後退，或使歌詞位置復位。您還可以使用低音部鍵選擇下一個要發音的音節，並控制演奏和弦時音節的前進方式。

雖然「音符模式」和現有的人聲合成軟件在很大程度上要求預先固定人聲旋律，但在「樂句模式」中，CT-S1000V 會在演奏時自動向前移動歌詞，讓您可即興創作。只需提前設定歌詞及其節奏細分和 BPM，然後自由隨意演奏便可聽到歌詞及時播出。

此模式帶領您超越簡單的旋律概念，基於進階電子琴技術，創造出複雜的人聲演唱。同時，如您只懂基本的電子琴技術，您仍然可以自信演奏，因為即使不小心按錯鍵，樂句都不會「中斷」。「樂句模式」的另一好處是自然的語音連接，可以創造流暢的人聲。這也提供一個很好的作曲平台，讓您可以通過電子琴的直觀介面來製作新的人聲演唱並進行編曲。

事實上，正是「樂句模式」使 CT-S1000V 不僅是一個含有新聲音發生器和音調的新電子琴，而是將其轉為一種為音樂表達開闢全新可能性的樂器。

實時控制人聲音色

CT-S1000V 有 22 種人聲預設，或「演唱者」，每種都有自己的特點，從「合唱團」、「Bossa Nova」、「兒童」甚至「聲碼器」。每個都包含多種波形和元素，例如白噪聲，這些演唱者經過精確調整，以在母音和輔音上產生清晰的效果，無論是演奏單音旋律還是更複雜的和聲。

同時，CT-S1000V 控制台面板的實體控制旋鈕可實時控制顫音和滑音等參數，以及決定您所選演唱者的年齡和性別的音色特徵。通過調整起音和釋放以及發音速度，您可以在單詞和音節之間塑造更自然的過渡，並巧妙控制產生的人聲進入耳朵的時間。更重要的是，您可以上載 16 位元/44.1 kHz WAV 檔案和創造自己的「用戶自建演唱者」，同時結合不同的參數以幫助發掘完全原創的聲音。正是這種實驗使 CT-S1000V 如此獨特和令人愉悅，而這一切都以 Casio 的人聲合成技術為基礎。

演唱者例子

合唱團

中型女聲合唱團的聲音。輔音發音清晰，即使在彈奏和弦時也能聽到。

三重合唱

男聲三重唱。輔音發音清晰，即使在彈奏和弦時也能聽到。

聲碼器 1

類似聲碼器的聲音因 80 年代的士高熱門歌曲而流行，其下方有一個分層低八度的音高。

: BOSSA NOVA

Bossa nova 風格的女聲。

歌劇

帶有獨特顫音的歌劇聲音。

死亡之聲

一種被稱為「咆哮」的激烈人聲，用於死亡金屬類型。聲音中不包含基音。

幽靈

在初始階段添加向上變調，產生有趣的幽靈般聲音。

動物

一種獨特的聲音，可以在模仿雞、牛、獅子、貓和山羊的同時讀出歌詞。

組合功能以創造複雜的人聲質感

通過結合 CT-S1000V 許多內置功能進一步擴展人聲合成和創作可能性。例如，琶音器從按住的鍵生成琶音和弦和其他樂句，但也可以與「音節隨機器」結合使用，以隨機順序從歌詞中發出音節，創造超凡脫俗的語音簇。

內置 DSP 效果結合樂器音色，將解開更多動態組合。在「重觸」功能啟動的情況下，按住琴鍵可重現快速、完美定時連續敲擊琴鍵的效果。您可以將「重觸」與「按住」功能結合使用，即使在釋放琴鍵後也可以重新觸發，從而促進實體上無法演奏的質感和編排。

上載原創
歌詞，使用
Lyric Creator 應用程式

有關您的智能裝置型號和作業系統的兼容資訊，請查看 App Store/Google Play。

應用程式用戶指南

將智能裝置連接至樂器

輸入歌詞

可以使用 iOS 或 Android 裝置通過 Casio 自家的 Lyric Creator 應用程式以英語和日語輸入喜愛的歌詞和原創作品。文字會自動劃分為音節單元（儘管可以手動分配分區並將多個音節組合），將結果數據匯出至 CT-S1000V 後，您就可以開始演奏了。

設定節拍

在「樂句模式」下，歌詞的播放節拍是通過將音符值（八分音符、四分音符等）分配給各個音節單元並插入休止符來確定。單獨的歌詞音調，包括速度數據，可以通過 CT-S1000V 本身調整。速度也可以從 DAW 或其他外部 MIDI 裝置同步到 MIDI 時鐘，以確保無論您的創作多麼新奇，您的人聲樂句始終合拍。

2025 年 1 月 23 日 Lyric Creator ver2.0.0 現已推出！

全新功能讓您以更靈活舒適的方式創作歌詞

推出全新功能，從而簡化歌詞樂句的音符值設定。除音符的標準輸入方式以外，現在更可在線譜上拖放音符以編輯音符值。每個音符值都以虛擬音格顯示，讓您更輕易以直覺方式調整音符的長度和位置。這樣便能更準確地微調音調和間息，而一般的音符輸入方式並不能達成此效果。現在，螢幕上會顯示小節線，能夠簡化如跨小節切分音的複雜節奏編輯方法。
除此以外，應用程式內的新加功能可按不同速度直接播放歌詞樂句。這樣，您便可在歌詞數據傳輸到樂器前即時檢查樂曲節奏，以及歌詞樂句的效果。

精準的樂句和語音

對真正精準方法有興趣的用戶可以更深入編輯構成單一音節的音素。除了製作更清晰的語音用詞外，此過程還可用於近似地區口音或模仿英語和日語以外語言中單詞的發音。（請注意，可用的音素庫僅包含標準英語和日語中出現的聲音。）

連接歌詞鏈以獲得更長的序列

雖然 Lyric Creator 對可以輸入的歌詞長度（最多 100 個八分音符）設定限制，但上載到 CT-S1000V 後，就可連接個別歌詞，形成更長的序列。此功能允許在輸入階段對各部分進行微調，然後再將它們組合到 CT-S1000V 中以創作一首完整的歌曲。

創造自己的演唱者

Lyric Creator 應用程式還可將儲存在智能裝置的 WAV 音頻樣本（16 位元/44.1kHz，單聲道/立體聲，最長 10 秒）轉換為原始演唱者補丁，以便將其載入 CT-S1000V。編輯介面允許設定年齡、性別、音域和顫音等特徵。

CT-S1000V 的 22 個「演唱者」預設均經過設計，通過將不同波形與白噪聲等元素混合，實現最大清晰度的發音，因此「用戶自建演唱者」波形可能無法達到相同的清晰度水平。但是通過一些實驗，您可以創造新的聲音，包括類似 CT-SV1000V 的動物預設抽象聲音。

通過從以下連結下載免費的「用戶自建演唱者」兼容波形樣本 (SawC4+WhiteNoise.wav) 開始創作實驗：
https://support.casio.com/en/support/download.php?cid=008&pid=20

將 CT-S1000V 連接至您的智能裝置

在智能裝置上安裝 Lyric Creator 應用程式後，您可以通過 USB 線將裝置連接到 CT-S1000V，開始傳輸歌詞、音序、人聲樣本等。連接後，您還可以使用應用程式查看 CT-S1000V 內部驅動器的可用空間、刪除檔案和編輯檔案名稱。程式檔案使用專有格式匯出，可在 CT-S1000V 用戶之間分享。您還可以從 DAW 匯入 Music XML 歌詞數據和音符值。

將智能裝置連接至樂器

人聲合成：自 PCM 以來第一個重大的聲音生成大躍進

Casio 的音源發展史

脈衝編碼調變 (PCM) 技術誕生於 1970 年代開始的音頻行業研究和開發，對來自模擬源（如實體樂器和人聲）的聲波以數碼重現，大大影響了我們的日常音樂景觀。

母音輔音合成

Casiotone 201

PD 音源

CZ-101

iPD 音源

VZ-1

1980 年，Casio Computer Co., Ltd. 以利用數碼技術為每個人帶來演奏音樂的樂趣為目標，並以 Casiotone 201 及其開創性的母音輔音合成方法首次進入樂器市場。然後，在 1980 年代中期，隨著錄製的音樂從唱片轉向數碼 CD，並且樂器製造競爭對手爭相開發用於音樂創作的數碼合成平台，Casio 推出了以獨特相位失真 (PD) 音源為基礎的 CZ-101 合成器。1988 年，隨著 VZ-1 及其整合相位失真 (iPD) 技術推出，Casio 對數碼合成的貢獻又向前邁進了一步。

1980 年代是電子樂器對流行音樂產生巨大影響的時期。採用 PCM 技術的新電子琴和合成器成為焦點，讓歌手能夠使用全新的聲音製作唱片，探索新的表演風格。與此同時，記憶體的改進繼續壓低數碼樂器的價格，對普通消費者亦不再遙不可及。

1985 年，Casio 發佈了 MT-500 電子琴，它以 PCM 為基礎的音符生成，呈現數碼鼓聲和鈸聲，為傳奇的 SK-1 取樣電子琴奠下成功的基礎，該電子琴於 1986 年推出時銷量達 100 萬部。緊隨其後的是 1988 年的 CT-640，這是一種完全基於 PCM 音調生成的電子琴。

大約在同一時期，PCM 技術也催生了聲音越來越真實的電子鋼琴。以 PCM 為基礎的 CDP-3000——Casio 第一款配備琴鎚動作琴鍵的電子鋼琴——是 1988 年的另一新產品，而 1991 年隨著 Casio 推出目前仍然廣受歡迎的 CELVIANO 系列，以及 AP-7 及其進階鋼琴 (AP) 音源，Casio 可說全面擴展至電子鋼琴市場。在接下來幾年，記憶體的改進繼續以更實惠的價格推動更高的性能和音質。

但 PCM 音源並非沒有局限。

雖然它們是忠實重現儲存聲音的理想選擇，但由於演奏變化多端，PCM 音源難以重現音色和清晰度的細微變化。Casio 於是發起了旨在解決這個問題並推進 PCM 架構的開發計劃，並於 1993 年推出 CTK-1000：一種電子鋼琴，其整合交叉聲音架構 (iXA) 音源將以 PCM 為基礎的音調生成與觸鍵感應和 DSP 功能結合。

我們當前的許多產品仍然使用基於 PCM 的音源，並結合獨特的 Casio 技術來重現由於音符衰減和演奏變化等因素而導致的複雜音調變化。我們的電子鋼琴陣容包括具有原聲及智能共鳴器 (AiR) 音源的 Privia 和 CELVIANO 系列，以及具有 AiR Grand 音源的 CELVIANO Grand Hybrid。同時，Casiotone 系列也配備以 PCM 為基礎的「Acoustic Intelligent multi-eXpression」（聲學智能的多重表現形式，AiX）音源。

PCM 為基礎的音源

SK-1

CT-640

CDP-3000

CELVIANO AP-7

CTK-1000

Privia PX-S1100

CELVIANO Grand Hybrid GP-510BP

Casiotone CT-S1

但是，雖然這些進步使以 PCM 為基礎的音調生成能夠忠實重現大量樂器聲音，但它仍然無法重現最基本和歷史上最重要的樂器：人聲。複製歌聲必須應對一系列挑戰。不僅不同的聲樂技巧會產生極其複雜的音調變化，而且歌詞內容也呈現大量需要處理的變數。從詞彙的多樣性到音節之間的轉換，以及不同的旋律或短語可以完全改變既定單詞的必要波形方式。儘管近年來基於 PCM 的方法以及聲碼器和其他技術取得了進展，但重大缺陷繼續阻礙其被廣泛採用。

現在，2022 年，Casio 的長期開發努力終於取得成果，全新的聲音生成技術——人聲合成——帶來了一種全新的樂器：Casiotone CT-S1000V。這款新樂器將「人聲合成」與革命性的「樂句模式」結合，可以執行極其複雜的任務，人聲歌唱終於觸手可及，而且介面簡單直觀，任何人都可以使用。正如過去 30 年給我們的生活方式帶來了巨大的變化一樣，我們希望這項最新的創新樂器能夠在音樂表演和作曲領域產生類似的影響。

人聲合成

Casiotone CT-S1000V