首頁>要聞要聞
“雙十一”第11年 AI定義網(wǎng)購新玩法
本報記者 崔 爽
“雙十一”來到第11年,,直播風頭正勁?!八信边@句來自主播李佳琦的口頭禪,,成為直播時代的宣言,無數(shù)人為之掏空口袋,。今年“雙十一”期間,,淘寶直播已經(jīng)成為商家標配,服飾,、美妝,、食品等行業(yè)商家紛紛拿起了直播工具,有人甚至戲稱:現(xiàn)在還不開直播的店鋪,,就跟沒有詳情頁一樣,。
為了更好的觀看體驗,淘寶自主研發(fā)了全新的音視頻實時通信架構(gòu),,實現(xiàn)了大規(guī)模低延時直播,,從原先5秒至7秒的延時降低至2秒以內(nèi),,提升了用戶和主播的互動效率,,此外,人工智能技術(shù)還可以實時識別主播正在講解的商品,,陳列在直播頁面中,。
沒錯,時代的風吹到哪,,技術(shù)先行抵達,。直播、短視頻當?shù)?,這類“雙十一”新玩法的背后,,也有不斷進步的AI。
AI助手為主播分憂
進出直播間的剁手黨成千上萬,,分分鐘形成刷屏之勢,,主播分身乏術(shù)。這時候,,他的AI秘書就登場了,。給主播打下手,,提供主播問答、商品問答,、優(yōu)惠券問答等服務都不在話下,,也就是說,你在直播間問的問題,,大多都是AI助手在解答,。
據(jù)阿里巴巴達摩院資深總監(jiān)、阿里巴巴集團智能服務事業(yè)部總經(jīng)理趙昆介紹,,AI秘書使用了自然語言理解和基于知識圖譜問答等技術(shù),,能夠精確解析直播間觀眾對于商品和主播的多種復雜表達和問法,在直播場中實現(xiàn)多對一溝通的高效快速響應,,大比例提高直播間的客戶問題的回復率,、解決率。
除了基于文字,,AI客服還可以進行基于圖片的智能問答,。趙昆表示,AI客服利用圖片解析算法理解圖片內(nèi)容,,結(jié)合用戶的問題,,自動理解和識別截取可以回答用戶的圖片作為回答,并高亮圖片中的精確答案位置,。目前,,智能圖片問答已經(jīng)覆蓋了家電數(shù)碼、零食果蔬,、母嬰洗護等多個行業(yè),。
方便了剁手黨,賣家同樣受惠于AI,?!半p十一”期間,賣家需要在短時間內(nèi)制造大量宣傳圖,、海報圖等,,圖像智能生成技術(shù)就派上了用場?;趫D像智能生成技術(shù),,AI設計師可以改變傳統(tǒng)的設計模式,在短時間內(nèi)完成大量橫幅廣告,、海報圖和會場圖的設計,。賣家只需要任意輸入想達成的風格、尺寸,,系統(tǒng)就能代替人工完成素材分析,、摳圖,、配色等耗時耗力的設計項目,實時生成多套符合要求的設計解決方案,。
據(jù)阿里巴巴達摩院資深算法專家謝宣松介紹,,目前該系統(tǒng)已經(jīng)達到了高級設計師的水準,每秒可以提供幾十種方案,、可以設計8000張不同的海報,,去年“雙十一”期間,這位AI設計師就累計為20萬企業(yè),、商家設計了近600萬張圖片,,消費者在天貓網(wǎng)站看到的各種海報和活動商品圖片幾乎都出自它手。
圖片之外,,短視頻也成了標配,。謝宣松介紹,短視頻智能設計產(chǎn)品基于圖像智能識別技術(shù)和視頻智能生成技術(shù),,幫助用戶在極短時間內(nèi)完成大量的商品營銷類短視頻的設計和制作,。“用戶只需要輸入商品詳情頁鏈接或者從本地上傳圖片視頻素材,,它就可以進行圖片素材解析過濾,、商品理解和定位、視頻素材剪裁準備,、視頻劇本導演,、視頻渲染生成等一系列復雜的設計工作,并可以依據(jù)用戶的風格尺寸等簡單的個性化要求進行輸入,,提供流媒體內(nèi)容生成視頻的解決方案,。”謝宣松解釋說,。
機器翻譯幫助貨通全球
賣貨到全世界,,語言不通怎么辦,?“雙十一”之前,,機器翻譯技術(shù)已經(jīng)經(jīng)歷了升級,對話機器人可以幫助全世界中小賣家將產(chǎn)品詳情與評論自動翻譯成當?shù)卣Z言,,還實現(xiàn)了實時AI語言翻譯的客戶服務與業(yè)務咨詢,,涵蓋64種語言方向。當然,,獲取商品信息光靠看商家網(wǎng)頁還不夠,,有問題找客服,海外消費者也不例外,。在國內(nèi),,承擔客服職責的是對話機器人,,這兩年,它還有了國際版,,專門服務海外業(yè)務平臺,。
據(jù)趙昆介紹,對話機器人精通英語,、法語,、泰語、西班牙語,、阿拉伯語等11種語言,,兩周就能學一門新外語。
“今年,,對話機器人新學了阿拉伯語,、法語和繁體中文,并且推出了馬來語—英語,、泰語—英語等混合語言問答功能,。”趙昆說,,“混合語言問答的情況在馬來西亞等地很常見,,在當?shù)氐目头鼍爸校蟛糠钟脩粲糜⒄Z咨詢,,少數(shù)用戶用馬來語咨詢,,并且常有英語、馬來語混用,。對話機器人不僅要同時理解這兩種語言,,還必須理解復雜的語言混用情況,并給出相應的回答,?!?/p>
不過,它使用的并不是機器翻譯技術(shù),,而是一種自然語言處理技術(shù)跨語言學習(Cross-lingual Learning),。“小語種缺乏大規(guī)模訓練語料,,很難通過過去的機器學習技術(shù)習得,,跨語言學習能夠克服資源匱乏的瓶頸?!壁w昆解釋說,,跨語言學習是一種多語言的自然語言處理技術(shù),它通過語言之間的知識遷移,,借助中文,、英文等語料資源充足的語言,,幫助算法模型提升理解小語種的能力,從而快速拓展機器人的多語種支持功能,。借助跨語言學習技術(shù),,對話機器人還能掌握更多語言,甚至包括土耳其語,、烏爾都語等小語種,。
“通俗地說,語言是符號,,不同的語言是不同的符號系統(tǒng),。想象語言所指的每個事物/知識都對應一個確定的身份標識,后者在不同的語言中被不同的符號所代表,,或者說,,不同語言所用的符號映射到同一個語義空間??缯Z言學習做的是幫助機器理解語言所指的身份標識,,并借助資源豐富的語言去學習資源匱乏的語言?!壁w昆進一步解釋,。
他表示,基于語言之間的交叉映射關系,,對機器來說,,在資源匱乏的情況下,通過將多種語言混合,,學習語言間的共性,,反而能比學習單一語言效果更好。2017年對話機器人初次在海外落地,,用6個月學會了印尼語,,又用6個月在智能客服崗位上達成堪比中文機器人的解決能力,而現(xiàn)在,,多語機器人新學一門語言的時間已經(jīng)縮短到兩周,。
聲紋識別開啟語音購元年
今年“雙十一”,語音購物千呼萬喚始出來:消費者只要對天貓精靈說出想要購買的商品,,就能直接下單,;如果開通了“聲紋支付”功能,,還可以直接語音付款,。
“語音購元年”,聽起來科技感十足,,據(jù)報道,,已有數(shù)百萬人體驗了語音購物,,其中超過半數(shù)的用戶是首次嘗試。聲紋識別技術(shù)采用基于深度網(wǎng)絡的注意力嵌入式模型,,通過網(wǎng)絡結(jié)構(gòu)的參數(shù)設計,,模擬了基于人耳感知的頻譜特征,可以在一定程度上消除同一人在不同場景發(fā)音下的頻譜特征差異干擾,,顯著提升遠場交互下的聲紋識別性能,。
說話就能付錢,如何確保安全,?阿里巴巴人工智能實驗室語音技術(shù)首席科學家聶再清介紹,,作為首個達到商用級別的聲紋識別技術(shù)智能音箱,天貓精靈的聲紋識別率已達99%,,這是它支持聲紋支付功能的基礎,,在支付級應用下,用戶只要通過3次不超過10秒的交互語音,,聲紋識別技術(shù)就可以準確刻畫用戶的魯棒性聲紋特征,,實現(xiàn)超過99%的識別準確度。
不僅如此,,運用中文識別的自然語言理解算法,,語音設備可以準確定位消費者需要購買的商品,以平臺大數(shù)據(jù)為基礎,,依托聲紋推薦能力,,為消費者進行個性化推薦?!霸谡Z音購場景,,天貓精靈基于注意力記憶網(wǎng)絡可以自主學習各個行業(yè)導購員的經(jīng)驗,并結(jié)合用戶特點呈現(xiàn)最優(yōu)的導購流程,,成為最懂用戶和最懂行業(yè)的智能導購員,。”聶再清說,。
此外,,今年“雙十一”,消費者還可以體驗AR試妝產(chǎn)品,,AR試妝通過標準化工具拿到彩妝色號,、材質(zhì)等數(shù)字信息,通過AI+AR技術(shù)讓用戶看到同樣商品在自己臉上呈現(xiàn)出的不同效果,。通過高效實時的精準人臉識別技術(shù),,即便在人臉晃動和大角度偏轉(zhuǎn)時,都能有很好的穩(wěn)定性表現(xiàn),以毫秒級別畫出商品在用戶臉上的逼真效果,。新玩法背后是新技術(shù),。在屢屢刷新的成交額、令人瞠目的商業(yè)數(shù)字之外,,不斷突破的技術(shù)正貼地而行,。
編輯:張佳琪
關鍵詞:語言 技術(shù) ai