index TTS2
這是無意間在討論區中看到的關鍵字
好奇查下去才發現,又是個功能強大的新AI應用
介紹官網在此
IndexTTS2: A Breakthrough in Emotionally Expressive and Duration-Controlled Auto-Regressive Zero-Shot Text-to-Speech
這套由中國BiliBlil開發的文字轉語音(Text To Speech)AI應用在9月8日發表了第2代
名稱就是開頭的index TTS2
它的強大之處包含了兩個以往不好做到與很難做到的功能
幾近零樣本的語音複製與可控制的帶情緒語音
先不講究專有名詞,直接看展示影片就會明白上面講的兩件事是什麼
首先第一個,讓子彈飛的經典對話,翻譯翻譯什麼叫驚喜
沒錯,幾近完美地複製原角色說話的聲紋與語氣
裡面的英語都是文字輸出後讓AI產出的
我覺得複製的部分還原了至少9分像了
帶情緒的部分更是與原語氣差不了多少
第二個,我選了展示的最後一個影片
著名的梗圖產生動畫,MyGO
會選這個是要展示除了英語外,index TTS2它要產生中文語音也沒問題
只是畢竟是中國開發的,要靠簡體字它才認得文字
網頁中還有其它展示啦
就不一一截取到這裡展示了
總之在連假前發現,驚嘆其功能
然後趁著連假稍微玩了一下,體驗一下這最新科技
寫一下這一篇小介紹
