場(chǎng)景驅(qū)動(dòng)技術(shù)迭代:京東言犀斬獲ACM Multimedia 2021年最佳演示獎(jiǎng)
來源:中金在線
?
2021-11-03 12:04:04
隨著人工智能的深入發(fā)展,技術(shù)早已走出了實(shí)驗(yàn)室,與場(chǎng)景不斷融合,同時(shí),在適配場(chǎng)景的過程中進(jìn)行技術(shù)迭代和算法創(chuàng)新,形成技術(shù)+場(chǎng)景“雙輪驅(qū)動(dòng)”的良性循環(huán)。
近日,第29屆ACM國(guó)際多媒體頂級(jí)會(huì)議ACM圓滿結(jié)束,京東探索研究院AI團(tuán)隊(duì)?wèi){借多模態(tài)交互數(shù)字人技術(shù)斬獲“ACMMultimedia2021年最佳演示獎(jiǎng)”。這項(xiàng)技術(shù)在京東已經(jīng)廣泛用于智能客服場(chǎng)景。得到國(guó)際頂級(jí)學(xué)術(shù)領(lǐng)域的認(rèn)可,也意味著京東智能客服言犀也已經(jīng)從單純的技術(shù)突破過渡到了技術(shù)與場(chǎng)景雙向循環(huán)的階段。未來,言犀將依托京東深厚的場(chǎng)景優(yōu)勢(shì),在更多場(chǎng)景不斷實(shí)踐落地,推動(dòng)技術(shù)與實(shí)體經(jīng)濟(jì)的深度融合。
500)this.width=500" align="center" hspace=10 vspace=10 alt="場(chǎng)景驅(qū)動(dòng)技術(shù)迭代:京東言犀斬獲ACMMultimedia2021年最佳演示獎(jiǎng)">
據(jù)悉,ACM國(guó)際多媒體頂級(jí)會(huì)議(ACMInternationalConferenceonMultimedia,簡(jiǎn)稱ACMMultimedia)自1993年以來每年召開一次,已成為多媒體領(lǐng)域的頂級(jí)盛典。大會(huì)致力于推動(dòng)多媒體的研究和應(yīng)用,是人工智能多模態(tài)研究領(lǐng)域的頂級(jí)國(guó)際學(xué)術(shù)會(huì)議。
該論文提出了一種具備多模態(tài)交互能力的虛擬數(shù)字人ViDA-MAN,為即時(shí)語音查詢提供實(shí)時(shí)視聽響應(yīng)。與傳統(tǒng)的基于文本或語音的系統(tǒng)相比,ViDA-MAN可以生成生動(dòng)的語音、自然的面部表情和身體姿勢(shì);在給定語音請(qǐng)求的條件下,ViDA-MAN能夠以亞秒級(jí)延遲響應(yīng)高質(zhì)量視頻。ViDA-MAN無縫集成了多模態(tài)技術(shù),包括聲學(xué)語音識(shí)別(ASR)、多輪對(duì)話、文本到語音(TTS)、談話頭部視頻生成等,提供身臨其境的用戶體驗(yàn)。ViDA-MAN能夠與用戶就多個(gè)話題進(jìn)行對(duì)話,包括聊天、天氣、設(shè)備控制、新聞推薦、預(yù)訂酒店,以及通過結(jié)構(gòu)化知識(shí)回答問題。
500)this.width=500" align="center" hspace=10 vspace=10 alt="場(chǎng)景驅(qū)動(dòng)技術(shù)迭代:京東言犀斬獲ACMMultimedia2021年最佳演示獎(jiǎng)">
目前多模態(tài)交互數(shù)字人技術(shù),正通過京東云這個(gè)統(tǒng)一平臺(tái)在零售、金融等多個(gè)場(chǎng)景大規(guī)模落地。在零售領(lǐng)域,虛擬主播帶貨已廣泛應(yīng)用,通過數(shù)字人多模態(tài)交互技術(shù),包含語音、情緒、視覺形象等,以“擬人化”的形象為商品配上帶貨主播和專屬客服。在金融領(lǐng)域,京東智能客服言犀推出的VTM數(shù)字員工,是全國(guó)首個(gè)能獨(dú)立全程辦理銀行真實(shí)交易的數(shù)字人,拓展了數(shù)字人在銀行場(chǎng)景中的應(yīng)用邊界,實(shí)現(xiàn)了數(shù)字人應(yīng)用場(chǎng)景從傳統(tǒng)的咨詢、查詢、導(dǎo)覽到業(yè)務(wù)辦理的突破,重塑了銀行網(wǎng)點(diǎn)的用戶體驗(yàn)和服務(wù)方式,大幅提升了銀行業(yè)遠(yuǎn)程銀行的接待能力與服務(wù)效率,降低了運(yùn)營(yíng)成本。
多模態(tài)交互數(shù)字人是京東智能客服言犀的一大應(yīng)用場(chǎng)景。在今年11.11,京東智能客服也正發(fā)揮積極作用,涵蓋售前、售中、售后、物流等零售的各個(gè)服務(wù)環(huán)節(jié),為消費(fèi)者提供7×24小時(shí)全天候的咨詢服務(wù)。在京東11.11開場(chǎng)10分鐘,京東智能客服累計(jì)咨詢服務(wù)量超181萬次,同比提升165%。
京東是一家同時(shí)具備實(shí)體企業(yè)基因和屬性、擁有數(shù)字技術(shù)和能力的新型實(shí)體企業(yè),擁有豐富的場(chǎng)景和產(chǎn)業(yè)Know-how。未來,京東智能客服·言犀將依托前沿的AI技術(shù)和深厚的場(chǎng)景優(yōu)勢(shì),為客戶提供涵蓋客戶服務(wù)、營(yíng)銷導(dǎo)購(gòu)、流程自動(dòng)化的整體智能化解決方案,并據(jù)應(yīng)用場(chǎng)景不斷適配技術(shù),進(jìn)行跨場(chǎng)景、多模態(tài)的交互與融合,技術(shù)上推動(dòng)人工智能技術(shù)從感知智能和認(rèn)知智能到?jīng)Q策智能的跨越,應(yīng)用上推動(dòng)服務(wù)、營(yíng)銷、運(yùn)營(yíng)一體化創(chuàng)新,不僅為京東逾5億用戶提供智能化咨詢服務(wù),同時(shí)也為零售、政務(wù)、金融、交通、制造等行業(yè)提供產(chǎn)品與解決方案,助力政企數(shù)智化升級(jí)。
近日,第29屆ACM國(guó)際多媒體頂級(jí)會(huì)議ACM圓滿結(jié)束,京東探索研究院AI團(tuán)隊(duì)?wèi){借多模態(tài)交互數(shù)字人技術(shù)斬獲“ACMMultimedia2021年最佳演示獎(jiǎng)”。這項(xiàng)技術(shù)在京東已經(jīng)廣泛用于智能客服場(chǎng)景。得到國(guó)際頂級(jí)學(xué)術(shù)領(lǐng)域的認(rèn)可,也意味著京東智能客服言犀也已經(jīng)從單純的技術(shù)突破過渡到了技術(shù)與場(chǎng)景雙向循環(huán)的階段。未來,言犀將依托京東深厚的場(chǎng)景優(yōu)勢(shì),在更多場(chǎng)景不斷實(shí)踐落地,推動(dòng)技術(shù)與實(shí)體經(jīng)濟(jì)的深度融合。
據(jù)悉,ACM國(guó)際多媒體頂級(jí)會(huì)議(ACMInternationalConferenceonMultimedia,簡(jiǎn)稱ACMMultimedia)自1993年以來每年召開一次,已成為多媒體領(lǐng)域的頂級(jí)盛典。大會(huì)致力于推動(dòng)多媒體的研究和應(yīng)用,是人工智能多模態(tài)研究領(lǐng)域的頂級(jí)國(guó)際學(xué)術(shù)會(huì)議。
該論文提出了一種具備多模態(tài)交互能力的虛擬數(shù)字人ViDA-MAN,為即時(shí)語音查詢提供實(shí)時(shí)視聽響應(yīng)。與傳統(tǒng)的基于文本或語音的系統(tǒng)相比,ViDA-MAN可以生成生動(dòng)的語音、自然的面部表情和身體姿勢(shì);在給定語音請(qǐng)求的條件下,ViDA-MAN能夠以亞秒級(jí)延遲響應(yīng)高質(zhì)量視頻。ViDA-MAN無縫集成了多模態(tài)技術(shù),包括聲學(xué)語音識(shí)別(ASR)、多輪對(duì)話、文本到語音(TTS)、談話頭部視頻生成等,提供身臨其境的用戶體驗(yàn)。ViDA-MAN能夠與用戶就多個(gè)話題進(jìn)行對(duì)話,包括聊天、天氣、設(shè)備控制、新聞推薦、預(yù)訂酒店,以及通過結(jié)構(gòu)化知識(shí)回答問題。
目前多模態(tài)交互數(shù)字人技術(shù),正通過京東云這個(gè)統(tǒng)一平臺(tái)在零售、金融等多個(gè)場(chǎng)景大規(guī)模落地。在零售領(lǐng)域,虛擬主播帶貨已廣泛應(yīng)用,通過數(shù)字人多模態(tài)交互技術(shù),包含語音、情緒、視覺形象等,以“擬人化”的形象為商品配上帶貨主播和專屬客服。在金融領(lǐng)域,京東智能客服言犀推出的VTM數(shù)字員工,是全國(guó)首個(gè)能獨(dú)立全程辦理銀行真實(shí)交易的數(shù)字人,拓展了數(shù)字人在銀行場(chǎng)景中的應(yīng)用邊界,實(shí)現(xiàn)了數(shù)字人應(yīng)用場(chǎng)景從傳統(tǒng)的咨詢、查詢、導(dǎo)覽到業(yè)務(wù)辦理的突破,重塑了銀行網(wǎng)點(diǎn)的用戶體驗(yàn)和服務(wù)方式,大幅提升了銀行業(yè)遠(yuǎn)程銀行的接待能力與服務(wù)效率,降低了運(yùn)營(yíng)成本。
多模態(tài)交互數(shù)字人是京東智能客服言犀的一大應(yīng)用場(chǎng)景。在今年11.11,京東智能客服也正發(fā)揮積極作用,涵蓋售前、售中、售后、物流等零售的各個(gè)服務(wù)環(huán)節(jié),為消費(fèi)者提供7×24小時(shí)全天候的咨詢服務(wù)。在京東11.11開場(chǎng)10分鐘,京東智能客服累計(jì)咨詢服務(wù)量超181萬次,同比提升165%。
京東是一家同時(shí)具備實(shí)體企業(yè)基因和屬性、擁有數(shù)字技術(shù)和能力的新型實(shí)體企業(yè),擁有豐富的場(chǎng)景和產(chǎn)業(yè)Know-how。未來,京東智能客服·言犀將依托前沿的AI技術(shù)和深厚的場(chǎng)景優(yōu)勢(shì),為客戶提供涵蓋客戶服務(wù)、營(yíng)銷導(dǎo)購(gòu)、流程自動(dòng)化的整體智能化解決方案,并據(jù)應(yīng)用場(chǎng)景不斷適配技術(shù),進(jìn)行跨場(chǎng)景、多模態(tài)的交互與融合,技術(shù)上推動(dòng)人工智能技術(shù)從感知智能和認(rèn)知智能到?jīng)Q策智能的跨越,應(yīng)用上推動(dòng)服務(wù)、營(yíng)銷、運(yùn)營(yíng)一體化創(chuàng)新,不僅為京東逾5億用戶提供智能化咨詢服務(wù),同時(shí)也為零售、政務(wù)、金融、交通、制造等行業(yè)提供產(chǎn)品與解決方案,助力政企數(shù)智化升級(jí)。