符號前面是你要說的話,后面是瀏覽器執(zhí)行的操作),在語言里選Microsoft Simplified Chinese Recognizer,在語音選擇里選Microsoft Simplif...">
瀏覽量:56次
最近做字幕的時候發(fā)現(xiàn)一個通過聲音控制IE瀏覽器的方法。本來是要制作字幕的,后來想想如果純手工制作字幕的話那么效率肯定非常低,做為程序員,本能的想到了讓計算機來幫忙。做字幕就是從聲音識別出文字,然后在校對時間軸。很機械化的操作,非常適合計算機的來做。通過搜索很快找到了解決方案。使用Microsoft Speech SDK+Python+PythonWin。雖然微軟的語音識別引擎已經(jīng)很強大了,但是要用它來制作字幕還有很長的路要走。字幕做不成了,不過用它來操控瀏覽器還是錯錯有余的。發(fā)現(xiàn)使用語音功能操作IE瀏覽器還是非常方便,只要設(shè)置好語句,IE瀏覽器就可以自動進行相關(guān)的操作。
下面是我已經(jīng)實現(xiàn)的一些功能。(=>符號前面是你要說的話,后面是瀏覽器執(zhí)行的操作)
“顯示瀏覽器”=>打開瀏覽器,“谷歌”=>進入谷歌的頁面,“百度”=>進入百度的頁面,“優(yōu)酷”=>進入優(yōu)酷的頁面等等,“后退”=>返回上一個頁面,“最大化”=>最大化瀏覽器,“下拉”=>下拉網(wǎng)頁,“上拉”=>上拉網(wǎng)頁,“放大”=>放大網(wǎng)頁,“縮小”=>縮小網(wǎng)頁,“關(guān)閉瀏覽器”=>關(guān)閉瀏覽器。
搭建測試環(huán)境:
+PythonWin+wxPython和啟動語音識別的腳本文件。從這里打包下載。
,
,PythonWin,wxPython
>所有程序->— >PythonWin,選擇Tools -> COM MakePy utility -> Microsoft Speech Object Library
,在語言里選Microsoft Simplified Chinese Recognizer,在語音選擇里選Microsoft Simplified Chinese
環(huán)境搭建完成不過由于Python+PythonWin的強大威力,不單單只有IE瀏覽器可以進行該操作,只要軟件能夠支持com的應(yīng)用就都可以顯示語音操控,比如微軟的Windows Media Player,Word,Excel等軟件。強烈建議大家自己手動去發(fā)掘和制作更多有意思的功能。
[聲明]本網(wǎng)轉(zhuǎn)載網(wǎng)絡(luò)媒體稿件是為了傳播更多的信息,此類稿件不代表本網(wǎng)觀點,本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。故此,如果您發(fā)現(xiàn)本網(wǎng)站的內(nèi)容侵犯了您的版權(quán),請您的相關(guān)內(nèi)容發(fā)至此郵箱【779898168@qq.com】,我們在確認后,會立即刪除,保證您的版權(quán)。
官網(wǎng)優(yōu)化
整站優(yōu)化
渠道代理
400-655-5776