在智能金融時(shí)代浪潮下,以技術(shù)為驅(qū)動(dòng)力的度小滿堅(jiān)持將科技與金融相結(jié)合,致力于通過以人工智能為代表的新技術(shù)為金融行業(yè)賦能。日前,由度小滿AI-Lab團(tuán)隊(duì)編寫的兩篇論文更是分別入選了ACM MM和CIKM國(guó)際頂級(jí)會(huì)議。
多模態(tài)學(xué)習(xí)?,助力度小滿提升視覺風(fēng)險(xiǎn)技術(shù)實(shí)力
ACM MM是計(jì)算機(jī)科學(xué)領(lǐng)域中多媒體領(lǐng)域的頂級(jí)國(guó)際會(huì)議,涵蓋了多個(gè)媒體領(lǐng)域的前沿研究與進(jìn)展,包括圖像,文字,音頻,傳感器等,被中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)列為A類會(huì)議。度小滿論文中具有實(shí)體對(duì)齊網(wǎng)格的位置增強(qiáng)Transformer被ACM MM錄用。
在該論文中,度小滿的科研人員提出了具有實(shí)體對(duì)齊網(wǎng)格的位置增強(qiáng)Transformer。與之前的模型相比,度小滿的科研人員在不需要復(fù)雜規(guī)則的情況下,顯式地引入了目標(biāo)檢測(cè)和OCR識(shí)別的視覺實(shí)體的連續(xù)相對(duì)位置信息。同時(shí)度小滿的科研人員根據(jù)物體與OCR實(shí)體映射關(guān)系,用直觀的實(shí)體對(duì)齊網(wǎng)格代替復(fù)雜的圖形結(jié)構(gòu)。在該網(wǎng)格中,不同位置的離散實(shí)體和圖像的區(qū)塊信息可以充分交互。
該模型能夠整合目標(biāo)檢測(cè)、OCR以及基于Transformer的文本表示等多種方法的優(yōu)勢(shì),增強(qiáng)算法對(duì)于圖像中場(chǎng)景信息的理解,更精準(zhǔn)的融合圖像與文本多模態(tài)的信息,進(jìn)一步助力證件識(shí)別、人臉與活體檢測(cè)等業(yè)務(wù)場(chǎng)景,提升度小滿在視覺風(fēng)控方面的技術(shù)能力。
預(yù)訓(xùn)練模型,可廣泛運(yùn)用于獲客、信貸等業(yè)務(wù)場(chǎng)景
CIKM是由ACM主辦的信息檢索和數(shù)據(jù)挖掘等領(lǐng)域的國(guó)際頂級(jí)會(huì)議,由國(guó)際計(jì)算機(jī)學(xué)會(huì)ACM SIGIR分會(huì)主辦。CIKM成功匯聚了一批相關(guān)領(lǐng)域的優(yōu)秀研究人員,交流信息與知識(shí)管理研究、數(shù)據(jù)和知識(shí)庫等方面的最新發(fā)展,在相關(guān)領(lǐng)域享有非常高的學(xué)術(shù)聲譽(yù)。度小滿論文中基于BERT的動(dòng)態(tài)多粒度排序模型被CIKM錄用。
據(jù)悉,該模型有效地提升了長(zhǎng)文本理解與排序任務(wù)的性能,特別是其中所用到的預(yù)訓(xùn)練語言模型已經(jīng)成為度小滿在自然語言處理方面的基礎(chǔ)架構(gòu),在獲客、信貸等業(yè)務(wù)場(chǎng)景被廣泛地使用,為業(yè)務(wù)模型提供了更加豐富的文本表示和精準(zhǔn)的文本特征,在保障業(yè)務(wù)穩(wěn)健發(fā)展中起到了十分重要的作用。
度小滿在科技創(chuàng)新上取得的研究成果無疑是值得肯定的,而這也是所有金融科技企業(yè)應(yīng)有的發(fā)展態(tài)度。對(duì)于金融服務(wù)行業(yè)而言,提高創(chuàng)新技術(shù)在金融領(lǐng)域的整合運(yùn)用,不僅可以創(chuàng)新和優(yōu)化金融服務(wù)模式,更將帶給用戶更便捷、更可靠的服務(wù)。
標(biāo)簽: