黑客 hk349 gmm/高斯混合模型和瞳孔追蹤
. 石磊準備的第二操作系統,是基於gmm/高斯混合模型的計算方式,主要用於開發語音系統。
所謂的高式混合模型,是一種用高斯概率密度函數精確的量化事務,將一個事務分解成若干個高斯概率密度函數,也就是正態分布曲線,而形成的一種模型。
gmm模型通常用作語音識別,在計算機領域中,獲得了廣泛的應用。雖然gmm模型製作的語音識別,會有大約20-30的錯誤識別率,但只要語音足夠標準,而且配合行為動態識別引擎監控唇語,這個錯誤識別率會大大的降低。
唇語方面的嘴唇行為動態,通過行為動態識別引擎,完全可以捕捉成功的識別。至於語音命令足夠標準,那就不是石磊可以控制的了,畢竟各地方言不同,只能基於普通話為標準。
石磊可以肯定的給予回應,想要玩好《勇者世界》,那麼一定要有一口標準的普通話。也許隨著《勇者世界》的風靡,在夏國境內,還會掀起一股學習普通話的熱潮呢!
如果真是這樣,《勇者世界》有可能會得到夏國官方的推薦,若真的可以得到官方推薦,那《勇者世界》絕對會飛黃騰達!
gmm高斯混合模型並不複雜,在自然語言處理中,這只是淺層學習神經網絡。在零六年的時候,加拿大多倫多大學的教授,在頂級科學刊物《科學》上,發布了一篇名為學術論文,其中介紹了深層學習神經網絡的問題。很多隱層的人工神經網絡具備優秀的特徵學習能力,學習得到的特徵對數據有更本質的刻畫。這就是與淺層學習神經網絡對應的深層學習神經網絡。
石磊重生之前,2012年的時候,由斯坦福大學和一名大規模計算機系統專家,共同使用16000個core.cpu,建造的名為deep.neural.networks/深層神經網絡模型,曾經做出過從英文同聲翻譯至夏國語,這個翻譯過程十分流暢,根本沒有半分卡頓,錯誤率方面連百分之一都不到!
天使議會的那個偽人工智慧,便是使用dnn深層神經網絡模型構建的!
可惜石磊暫時沒有時間,開發基於dnn的深層神經網絡模型,只能做基於gmm的淺層神經網絡,製作語音識別系統,然後利用行為動態識別引擎,識別唇語的方案,減少識別錯誤率。
關於語音系統,開發出來之後,不僅僅可以引用在《勇者世界》中,還可以應用在很多方面。
特別是結合行為動態識別引擎之後,那就是一個十分強悍的系統。擁有語音識別系統後,石磊便可以語音控制計算機。
到時候,石磊甚至可以一個人模擬兩個人的進攻,也可以自己和自己戰鬥,為他自己的身份做更好的掩飾。
還有一些監控系統,也可以做到更好的程度。比如醫療監控系統,某些不能動彈的患者卻可以說話,那麼這樣的患者,就可以通過語音進行操作醫療系統,呼喚護士或者醫生等等服務。
關於基於gmm的語音系統,在石磊心中,還有一個想法,那就是
回歸開發《勇者世界》的主題,在擁有行為動態識別引擎,以及gmm語音系統輔助配合,才可以形成真正的體感遊戲。
至於另一個難點,人物動作系統的問題,石磊打算開發第三輔助操作系統。也就是利用行為動態識別引擎,專門追蹤玩家的瞳孔,然後利用軟體計算,確定玩家的視線焦點。
關於瞳孔追蹤技術,目前這個年代還沒有被申請專利,石磊正好可以將這項技術霸占過來。這項技術原本的專利人是諾基亞,只可惜後世諾基亞衰落,全面被安卓秒殺。
瞳孔追蹤技術,應用在《勇者世界》中,好處有很多。結合行為動態識別引擎、gmm語音系統,便可以完美的實現一些高難度的體感操作動作。
比如說輕功,在現實中,玩家絕對不可能實現的體感操作。舉一個例子說明,如果玩家在一處懸崖峭壁上,想要使用輕功飛身下去。
這個時候,使用體感操作,總不可能找一個地方跳下去吧?於是,瞳孔追蹤技術就可以應用上來,使用瞳孔追蹤技術,然後小幅度的跳躍動作,就可以從懸崖上跳下去。
至於懸崖的各處落腳點,則需要玩家的焦點視線確定,然後根據瞳孔追蹤技術,