Monday, October 10, 2011

語音輸入成大勢所趨

美國時間十月四日早上,蘋果公佈了新一代 iPhone 4S,其主要賣點為一個名叫 Siri 的語音輸入助理,用家可以用語言,而不是觸控輸入,完成各種從前必須手動觸碰螢幕的指令。例如跟 iPhone 說:「讀出短訊」,iPhone便會發聲讀出整段文字,再跟iPhone 說:「回覆 xxx」要回覆的文字內容便立即出現在短訊回覆柵裏,無需再在小小的觸控鍵盤上逐個字輸入,整個過程就尤如跟一個真人私人助理對話一樣。



在手機上做語音輸入,蘋果並非先驅,Google 的搜尋程式,於年多前已可供用家利用語音輸入搜尋文字,而且支援中英夾雜的廣東話,香港人可以用自己最熟悉的語言進行網上搜尋,既簡單亦有親切 感;Windows Phone 7 亦有類似 Siri 的語音操作系統,可見語音輸入已成為下一代智能手機必備功能。

語音輸入的好處
相比起鍵盤輸入,語音輸入自然是一大進步。君不見道路上經常有人眼睛盯著手機打短訊,碰到其他人亦不以為意;若然換上語音輸入,他們便可以一邊走路,一邊繼續跟他人以短訊聯繫,回復正常生活。

此外,語音操作可助將智能電話進一步推廣至長者用家。現時的圖示操作雖然已經很簡單方便,但對新科技不熟悉且帶點恐懼的長者來說,能用自己最熟悉的語言來跟智能電話「對話」,比記著哪個圖示代表甚麼程式來得更自然,令他們更容易掌握如何操作智能手機。

將來可發展模式
不管是 iPhone SiriGoogle 的語音搜尋、還是 Windows Phone 7 的語音操作,現時還在起步階段,要改善的地方還不少。例如 Siri只支援英、法、德三種語言,用家亦必須按指定的字眼去跟 iPhone 「談話」;Google 的語音操作還只停留在搜尋和文字翻譯階段,其他以文字為主的程式( Gmail) 還沒有跟語音扯上關係;Windows Phone 7 亦不支援以中文語音輸入操作。三者各有其特色,如能互相取長補短 (期望在沒有引發官司的前題下),得益的必然會是用家。可能三數年後,再看不到有人在街上邊走路邊打短訊了!

順帶一提,今天這篇文章有一半是嘉嘉在手機上,以倉頡輸入法一碼一字地輸入完成,若能換上語音輸入,在路上寫文章便會輕鬆多了!


********************************************************************************************
如果你喜歡這篇文章,請按以下 Google +1 按鈕,又或分享到 Facebook 給你的朋友。多謝支持!

2 comments:

  1. 歐美同非歐美語系差別大,即使多年嘅MSOffice仲係未做到中文語法檢查,就算連中文拼寫(詞語)都未做到,好似Siri 咁要語音加語法實在太難,除非指定要用某啲關鍵字做指令,但咁就唔夠人性化。內地研究Linux中文化時都好多人提過要做中文編程語言結果得出類似結論。

    ReplyDelete
  2. 很明白現時科技還沒有做到人工智能般的語言辨識技術, 但創新就必須要廣闊的視野. 不以限制來確立發展方向, 可以帶來技術上的革新, 遇到問題時, 是以解決而不是迴避的態度去面對.

    Google 現時的廣東話語音搜查, 也是建基於一個不斷收集口音的資料庫, 世界上越多人使用, 其準確度亦因此提高. 同一道理, 如果語言指令也可以用資料庫收集, 可使用的指令關鍵字亦可以不斷增加, 而需要的只是收集時間和資料庫儲存的問題.

    ReplyDelete