近日,阿里巴巴公開(kāi)一項(xiàng)“語(yǔ)音識(shí)別方法及裝置”相關(guān)專(zhuān)利,該專(zhuān)利于2019年7月4日申請(qǐng),2021年1月22日公開(kāi),公開(kāi)號(hào)為CN112259089A。
根據(jù)專(zhuān)利摘要,本申請(qǐng)實(shí)施例提供了一種語(yǔ)音識(shí)別方法及裝置,涉及人工智能領(lǐng)域。其中,所述方法包括:獲取第一音頻樣本的音頻數(shù)據(jù)幀與第一音頻樣本對(duì)應(yīng)的文本標(biāo)注數(shù)據(jù)的上下文相關(guān)音素的第一強(qiáng)制對(duì)齊結(jié)果;基于第一強(qiáng)制對(duì)齊結(jié)果,確定第一音頻樣本的音頻數(shù)據(jù)幀關(guān)于待訓(xùn)練的喚醒聲學(xué)模型的音素標(biāo)注數(shù)據(jù);基于音素標(biāo)注數(shù)據(jù),對(duì)待訓(xùn)練的喚醒聲學(xué)模型進(jìn)行訓(xùn)練,其中,喚醒聲學(xué)模型的輸出層中設(shè)置有針對(duì)喚醒詞的喚醒詞相關(guān)輸出部分和喚醒詞無(wú)關(guān)輸出部分。
通過(guò)本申請(qǐng)實(shí)施例,使得訓(xùn)練后的喚醒聲學(xué)模型在兼顧語(yǔ)音喚醒性能的同時(shí),能夠有效降低對(duì)設(shè)備端的計(jì)算資源的使用。
阿里巴巴的這項(xiàng)專(zhuān)利很有可能用在智能設(shè)備上,如智能音響。2017年7月5日,阿里巴巴集團(tuán)阿里云智能事業(yè)群推出AI智能終端品牌——天貓精靈,讓用戶(hù)以自然語(yǔ)言對(duì)話(huà)的交互方式,實(shí)現(xiàn)影音娛樂(lè)、購(gòu)物、信息查詢(xún)、生活服務(wù)等功能操作,成為作為消費(fèi)者的家庭助手。
去年5月,在天貓精靈發(fā)布會(huì)上,提出了“雙百計(jì)劃”,即將投入 100億元進(jìn)行生態(tài)建設(shè),與合作伙伴共同推出 100 款千萬(wàn)級(jí)智能產(chǎn)品。