語音市場發(fā)展趨于成熟,創(chuàng)業(yè)公司更應(yīng)關(guān)注語義
電子產(chǎn)品世界:在對話機(jī)器人領(lǐng)域,創(chuàng)業(yè)公司應(yīng)該怎樣選擇切入點?
洪強(qiáng)寧:語音轉(zhuǎn)文本和文本轉(zhuǎn)語音,現(xiàn)在都有比較專業(yè)的公司在做,而且很多企業(yè)做得已經(jīng)很好了,對于創(chuàng)業(yè)公司而言,我們覺得現(xiàn)在再去做語音就是技術(shù)的浪費(fèi)了,而更應(yīng)該將資源用到像語義這樣發(fā)展還不是很完備的方向。
現(xiàn)在在做語義的大概有兩種形態(tài):一種形態(tài)是做基礎(chǔ)語義服務(wù)的,并不在乎具體的應(yīng)用場景,例如情感探測、實體抽取等;另外一種是做應(yīng)用場景的,像我們是在考慮機(jī)器人在具體應(yīng)用場景下該怎樣去回答問題,和場景與行業(yè)聯(lián)系的非常緊密。
在真實的應(yīng)用場景中,需要用到語音識別的時候,我們會調(diào)用第三方的服務(wù)來生成文本,例如科大訊飛等廠商的語音識別做得已經(jīng)很好了,我們可以直接使用他們的技術(shù)完成前面語音識別部分,而從文本理解是什么含義的時候則是用到我們自己的技術(shù),因為這項技術(shù)還沒有一家公司聲稱做出了一個任何場景都可以使用的平臺,針對售前對話機(jī)器人,我們的技術(shù)效果是更好的;同時,這也是我們的核心競爭力和技術(shù)壁壘,我們需要在這上面去深入研究。
機(jī)器人服務(wù)平臺要先做專用領(lǐng)域
電子產(chǎn)品世界:如何理解現(xiàn)在的通用機(jī)器人服務(wù)平臺和專用機(jī)器人服務(wù)平臺?
洪強(qiáng)寧:工程團(tuán)隊的一個非常大的產(chǎn)出是在機(jī)器人服務(wù)平臺上,但是創(chuàng)建對外開發(fā)的機(jī)器人服務(wù)平臺目前從商業(yè)上看還不是一個好的時機(jī),因為現(xiàn)在對話機(jī)器人仍然是和場景緊密結(jié)合的,現(xiàn)在還不太可能脫離場景去搭建一個通用的機(jī)器人服務(wù)平臺。
實際上,前兩年已有通用的機(jī)器人服務(wù)平臺出現(xiàn),但是效果都不是很好。因而我們更加傾向于做行業(yè)專用的平臺,先使機(jī)器人服務(wù)平臺在售前應(yīng)用中用起來效果非常好,之后再在這個基礎(chǔ)上做泛化,做到其他場景中去。
現(xiàn)在我們正在規(guī)劃一個大的機(jī)器人服務(wù)平臺,這個是一個工程化的事情,需要做云平臺、PAAS架構(gòu),需要在服務(wù)功能飛速增長的時候有一個非常好的、穩(wěn)定的服務(wù),能夠包括像大數(shù)據(jù)處理等。這個機(jī)器人服務(wù)平臺是我們內(nèi)部自己用的,是為了加快算法調(diào)優(yōu)的速度,使算法工程師不再需要去關(guān)心一些工程上的技術(shù)細(xì)節(jié),更專注到算法調(diào)優(yōu)本身。
對話設(shè)計師將會成為新崗位
電子產(chǎn)品世界:AI創(chuàng)業(yè)公司更需要怎樣的人才,對工程團(tuán)隊有怎樣的要求?
洪強(qiáng)寧:對于AI創(chuàng)業(yè)公司來說,更需要的是項目落地人才,即能夠把AI的技術(shù)應(yīng)用到具體場景中的人才。如果是純研究算法的人,對于高?;蛘呤茄芯吭簳。鴮τ趧?chuàng)業(yè)公司則會更關(guān)注落地的能力,我們追求的是效果,而不是炫酷的技術(shù),有的時候會發(fā)現(xiàn)深度學(xué)習(xí)的效果還不如一些傳統(tǒng)方法的時候,我們也會選擇傳統(tǒng)的方法。
同時,工程團(tuán)隊也需要懂AI算法。工程團(tuán)隊如果完全不懂算法的話是無法和算法工程師進(jìn)行配合的,工程團(tuán)隊做的很大一部分是建立機(jī)器人服務(wù)平臺,算法工程師是平臺的用戶,因而工程團(tuán)隊需要知道算法工程師需要的東西是什么,從而給他們提供好用的工具,也需要了解AI是怎么做的,至少需要知道數(shù)據(jù)是怎樣組織的、訓(xùn)練是怎么一回事、模型是怎么加載的,在這些地方,哪些是性能的瓶頸,這都需要工程團(tuán)隊的工程師完全了解的。
電子產(chǎn)品世界:做對話機(jī)器人的公司相對于其他AI行業(yè)會有怎樣的特別需要?
洪強(qiáng)寧:在對話機(jī)器人領(lǐng)域,產(chǎn)品經(jīng)理有一個很重要的工作職責(zé)是做對話設(shè)計,這個也可能是未來可能產(chǎn)生的一個新崗位?,F(xiàn)在對話機(jī)器人的技術(shù)還做不到完全像人一樣溝通,這個崗位要考慮的是當(dāng)機(jī)器和人對話的時候,如何設(shè)計機(jī)器人的語言,使整個對話變得更自然,這個技術(shù)在真實落地的應(yīng)用中是一件很重要的事情。
AI人才緊缺現(xiàn)狀與高薪資現(xiàn)狀
電子產(chǎn)品世界:如何理解AI人才緊缺和高薪資這一現(xiàn)狀?
洪強(qiáng)寧:掌握新技術(shù)的人就是整個社會的推動力,社會也一定對這種人才的需求是非常旺盛的。其實我們現(xiàn)在身處第四次工業(yè)革命的開始階段,在變革的早期,這樣的人才很少,掌握這類技能的人才被市場爭搶在所難免。在任何技術(shù)早期,你掌握了這項技術(shù),薪資都會相對較高,但是同時也會有這樣一個趨勢:AI技術(shù)越來越成為程序員一個基礎(chǔ)技術(shù)。例如谷歌在面試程序員的時候,不論你面試的是哪個崗位,都會考察你的AI能力。
這就類似云計算的發(fā)展,云計算發(fā)展這么多年,現(xiàn)在工程師如果不懂云計算的基礎(chǔ)知識就不是一個合格的程序員。未來,十年以后,如果不懂得AI的工程師就不是一個合格的程序員。隨著掌握AI技術(shù)的人群越來越多,薪資水平也將會逐漸回到一個相對合理的狀態(tài)。
AI創(chuàng)業(yè)公司與大公司競爭的優(yōu)勢
電子產(chǎn)品世界:與大公司相比,創(chuàng)業(yè)公司有哪些競爭優(yōu)勢?
洪強(qiáng)寧:相比巨頭公司,創(chuàng)業(yè)公司動作更快,關(guān)注點更超前。創(chuàng)業(yè)公司更多專注于場景,而對于單個場景的投入,大公司往往是不足的,只有可能觸及到平臺利益時,大公司才會投入大量資源與創(chuàng)業(yè)公司競爭,而只要創(chuàng)業(yè)公司在這之前建立起很好的競爭壁壘,是不害怕這樣的競爭。
AI行業(yè)其實一個很好的范例,AI行業(yè)需要的是數(shù)據(jù)的積累,而不論是大公司還是小公司都需要時間的積累收集數(shù)據(jù)和處理數(shù)據(jù),例如收集數(shù)據(jù)、清洗數(shù)據(jù)、理解數(shù)據(jù)以及結(jié)合應(yīng)用場景的過程,而這些都需要時間和經(jīng)驗的積累,并不是說大公司會比小公司擁有有更多的競爭優(yōu)勢。
對話機(jī)器人的準(zhǔn)確率評判指標(biāo)
電子產(chǎn)品世界:如何評判對話機(jī)器人的準(zhǔn)確率,現(xiàn)在對話機(jī)器人準(zhǔn)確率是多少?
洪強(qiáng)寧:對話機(jī)器人大概可以分為兩類:閑聊機(jī)器人和任務(wù)導(dǎo)向機(jī)器人。對于閑聊機(jī)器人,對話輪次是一個評價指標(biāo),時間越長,機(jī)器人做的就越好;而對于任務(wù)導(dǎo)向機(jī)器人,主要有兩個評價指標(biāo):任務(wù)完成率和攔截率。
對于任務(wù)導(dǎo)向機(jī)器人,我們是希望他可以幫我辦事的,這個時候,對話輪次就不再是一個很好的指標(biāo),相對短的輪次反而會更好;針對此類機(jī)器人,單輪對話會有準(zhǔn)確率的概念,具體指機(jī)器人對用戶提問響應(yīng)是否正確就是準(zhǔn)確率,此時任務(wù)完成率會作為核心指標(biāo)。
而有些準(zhǔn)確率的數(shù)據(jù)是不可信的,例如機(jī)器人自己對自己作出決策和評價,即攔截率。這是指你說的話,機(jī)器人覺得可以回答的比率;而準(zhǔn)確率是指我答了,而且還答對的比率。因而準(zhǔn)確率是要比攔截率要低一些的。
現(xiàn)在的準(zhǔn)確率還是要人來判斷的,而為了降低工作量,機(jī)器人可以先做一個預(yù)判,然后人再做更正。針對對話機(jī)器人,具體準(zhǔn)確率要分應(yīng)用場景,越復(fù)雜、用戶說的話越發(fā)散,準(zhǔn)確率會越低, 大體上應(yīng)該會在百分之七十多到百分之九十多之間波動。 如果是單輪問答,主要還會取決于知識庫的建立情況,一般在百分之八十多到百分之九十多之間波動。
對話機(jī)器人要達(dá)要到人的平均水平,至少還要十年
電子產(chǎn)品世界:當(dāng)下很多智能產(chǎn)品并不夠智能,對話機(jī)器人也還處在“低配智能”階段,還要多久我們才能到達(dá)“高配智能”階段?
洪強(qiáng)寧:現(xiàn)在對話機(jī)器人,甚至AI還處在早期大航海時代,大家都在嘗試在各種應(yīng)用場景下使用這個技術(shù),根據(jù)反饋去優(yōu)化和調(diào)整。我們會全力以赴地關(guān)注用戶的反饋,快速更新技術(shù),并不斷完善我們的產(chǎn)品。
就智能的程度而言,現(xiàn)在確實是受限的,不光是對話機(jī)器人,整個AI行業(yè)都存在這個問題,不管是深度學(xué)習(xí),還是傳統(tǒng)機(jī)器學(xué)習(xí)方法,都面臨著準(zhǔn)確率不為100%的現(xiàn)狀。通過學(xué)習(xí)大量的現(xiàn)有知識,然后生成一個模型,用這個模型去匹配現(xiàn)有的知識,預(yù)測之后的輸入可以給出一個怎樣的輸出,這樣的一個模型永遠(yuǎn)都會與真實模型有一定的誤差。雖然可以用深度學(xué)習(xí)的方法不斷增加學(xué)習(xí)信息,準(zhǔn)確率會越來越高,但永遠(yuǎn)都無法達(dá)到100%。
我們并不能期望對話機(jī)器人不出錯,要期望的是對話機(jī)器人出的錯要比人少。我覺得現(xiàn)在談像人一樣的對話機(jī)器人還尚早,至少還要兩三年,對話機(jī)器人在某些特定場景能夠達(dá)到人的平均水平;而要談通用對話機(jī)器人能夠達(dá)到人的平均水平,甚至在某些特定場景超越人類,至少還要十年之久
相關(guān)推薦
中國內(nèi)地勞動力成本提升問題,越來越成為PC制造環(huán)節(jié)上的制約因素。統(tǒng)計數(shù)據(jù)顯示,過去5年,內(nèi)地勞動力成本提升了2倍。春節(jié)臨近,PC市場將迎來一波消費(fèi)高峰。與此同時,由于今年春節(jié)比往年來得早,很多工人都將提前回家過年,導(dǎo)致生產(chǎn)線人手不足。為了滿足1~2月份PC市場的消費(fèi)旺季,多家PC代工巨頭紛紛要求零部件供應(yīng)商大幅增加出貨量,以確保1~2月份的PC供應(yīng)。中國內(nèi)地勞動力成本提升問題,越來越成為PC制造環(huán)節(jié)上的制約因素。統(tǒng)計數(shù)據(jù)顯示,過去5年,中國內(nèi)地勞動力成本提升了2倍,用自動化生產(chǎn)線取代人工從而降低人工成本,正在成為PC代工廠的趨勢。近期以來,不少PC制造訂單從中國回流日本,用自動化生產(chǎn)線來應(yīng)對中