智能音箱在華有沒有市場(chǎng)?外媒:機(jī)器學(xué)會(huì)漢語真難
2017-07-27 10:51:19 來源:網(wǎng)易科技報(bào)道 熱度:
7月27日消息,在中國,研究人員往往把2017年稱之為交互式計(jì)算元年。無論是語音識(shí)別技術(shù)還是自然語言處理技術(shù),都取得了巨大的進(jìn)展;無論是阿里巴巴還是百度都在開發(fā)語音通信相關(guān)技術(shù),而兩家的語音交互式產(chǎn)品都已經(jīng)進(jìn)入了市場(chǎng)。

阿里巴巴發(fā)布的天貓精靈(Tmall Genie)智能音箱與亞馬遜的智能音箱產(chǎn)品Echo類似,內(nèi)置了阿里巴巴的數(shù)字助理阿里精靈。用戶可以通過語音來在線下單,查詢當(dāng)日天氣,播放音樂或是控制家中的其他智能設(shè)備。
同樣,百度旗下的DuerOS語音交互式平臺(tái)也是一種數(shù)字助理,不同的是其將電視機(jī)頂盒以及HTC智能手機(jī)等產(chǎn)品功能融入其中。除此之外,DuerOS與阿里精靈等數(shù)字語音助理的功能類似。百度稱已經(jīng)獲得了DuerOS開發(fā)套件的大量訂單。
百度DuerOS業(yè)務(wù)部門主管Kun Jing預(yù)計(jì),由于亞馬遜Echo等智能音箱的成功刺激到中國科技投資者的興趣,今年將會(huì)有更多公司進(jìn)入語音交互領(lǐng)域。
市場(chǎng)研究公司IDC預(yù)計(jì),到2020年,51%的自動(dòng)駕駛領(lǐng)域、68%的智能手機(jī)和可穿戴設(shè)備都將整合進(jìn)基于語音交互的人工智能系統(tǒng)。Jing認(rèn)為,正如觸控屏讓用戶與移動(dòng)設(shè)備的交互更為便捷一樣,會(huì)話界面將會(huì)使交互更加自然,吸引更多用戶進(jìn)入互聯(lián)世界。
基于語音的交互式計(jì)算對(duì)于中國來說也是一個(gè)選擇。目前在標(biāo)準(zhǔn)化鍵盤上輸入漢字,主要依賴于漢字發(fā)音的漢語拼音。但由于中國普通話有四個(gè)音調(diào),而每個(gè)音調(diào)的漢字都代表著不同的含義,這導(dǎo)致用戶必須從菜單中挑選出正確的漢字。像“yi”這樣的發(fā)音對(duì)應(yīng)的漢字多達(dá)60幾個(gè)。當(dāng)然,一些輸入法可以根據(jù)上下文輸入來確定最有可能的漢字,但準(zhǔn)確率依舊不盡人意。因此,微信用戶經(jīng)常會(huì)通過語音聊天而不是輸入漢字,也就不足為奇了。
現(xiàn)在,語音助理技術(shù)能夠?qū)⒂脩舻陌l(fā)音轉(zhuǎn)換成文本命令,并根據(jù)文本的含義來做出相應(yīng)。這一技術(shù)對(duì)基于任務(wù)的命令非常有效,比如可以查詢天氣情況或是查詢特定漢語的英文翻譯,但目前還無法進(jìn)行多主題的流暢對(duì)話。
不得不承認(rèn)的是,中文語言的復(fù)雜性仍是解決會(huì)話計(jì)算問題的巨大挑戰(zhàn)。在漢語言中,相同漢字排列順序不同,其含義也不同。甚至于即便以相同的次序排列漢字,前后文意思不同也會(huì)導(dǎo)致語義不同。此外,書面漢語并不像英文單詞那樣用空格加以劃分,因此對(duì)于漢語言的自然語言處理來說,研究人員必須要讓算法在漢字之間插入空格,從而確定漢字組合的正確含義。何況漢語還沒有時(shí)態(tài)之分,沒有過去式、現(xiàn)在或是將來之分,這使得機(jī)器分析用戶要表達(dá)的時(shí)間更為困難。
除此之外,面對(duì)漢語,自然語言處理研究人員還需要應(yīng)對(duì)方言等其他挑戰(zhàn)。很多方言晦澀難懂,沒有固定的搭配。
專門研究自然語言處理的清華大學(xué)副教授吳志勇(音譯)指出,為了能真正理解講話者的意圖并進(jìn)行適當(dāng)?shù)臏贤?,?jì)算機(jī)需要對(duì)講話者的語調(diào)變化以及重音節(jié)進(jìn)行深入分析。而清華大學(xué)副教授賈佳(音譯)則認(rèn)為,計(jì)算機(jī)還需要理解人類情緒,因?yàn)槿藗冊(cè)谧鰶Q斷時(shí)往往并不是完全依賴于邏輯。
為了讓其系統(tǒng)更加智能化,今年百度在其平臺(tái)上引入了“培訓(xùn)師”模式,允許軟件開發(fā)人員通過系統(tǒng)內(nèi)置的注釋機(jī)器人提供語言處理的相關(guān)數(shù)據(jù)。注釋機(jī)器人在收到開發(fā)者的反饋之后,會(huì)從中進(jìn)行學(xué)習(xí),然后對(duì)結(jié)果進(jìn)行更正。
對(duì)于中國的自然語言處理研究人員來說,其最大的優(yōu)勢(shì)在于規(guī)?;臄?shù)據(jù)。當(dāng)前支持自然語言處理的神經(jīng)網(wǎng)絡(luò)需要大量的數(shù)據(jù)訓(xùn)練。公司擁有的數(shù)據(jù)量越大,神經(jīng)網(wǎng)絡(luò)的智能化程度就越高。諸如百度和阿里巴巴這樣的公司都得益于其擁有的龐大用戶群。截止2016年底,百度月平均用戶數(shù)位6.65億。而截止到今年三月份,阿里巴巴月平均用戶數(shù)位5.07億。
但阿里巴巴人工智能實(shí)驗(yàn)室研究人員王剛(音譯)表示,研究人員需要設(shè)計(jì)出這樣一種高效率的神經(jīng)網(wǎng)絡(luò),無需大量數(shù)據(jù)訓(xùn)練就能夠從容處理自然語言。他認(rèn)為,在現(xiàn)實(shí)世界中人們往往會(huì)用不同的方式表達(dá)同一個(gè)意思,機(jī)器無法通過訓(xùn)練窮舉所有例證。他和同事曾提出一種讓機(jī)器在較少數(shù)據(jù)訓(xùn)練情況下學(xué)會(huì)理解主題的方法:也就是使用相關(guān)主題的數(shù)據(jù)。比如在訓(xùn)練神經(jīng)網(wǎng)絡(luò)進(jìn)行運(yùn)動(dòng)醫(yī)學(xué)方面的自然語言處理時(shí),大可以利用運(yùn)動(dòng)數(shù)據(jù)以及醫(yī)學(xué)相關(guān)數(shù)據(jù)。王剛指出,這種方法的效果不及使用特定數(shù)據(jù)。但在缺乏相關(guān)數(shù)據(jù)的情況下,也可以通過這種方法來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
總之,就像Ainemo創(chuàng)始人宋晨楓認(rèn)為,在中國市場(chǎng)智能語音助理成功的關(guān)鍵在于內(nèi)容和服務(wù)。該公司曾于今年六月份發(fā)布了一款名為“小魚”的家用語音助理機(jī)器人。
宋晨楓計(jì)劃在智能語音助理中添加教育和保健的相關(guān)內(nèi)容。據(jù)悉,“小魚”家用語音機(jī)器人采用了百度的DuerOS會(huì)話平臺(tái)。宋晨楓指出,語音為包括老人和幼兒在內(nèi)的特殊人群訪問互聯(lián)網(wǎng)提供了新的內(nèi)容和方法。
責(zé)任編輯:汪驕陽