阿里研發(fā)AI技術(shù)0.15秒識別攔截外語臟話圖

田寧
2021-09-27 15:03

9月27日消息,阿里安全算法團隊宣布,其研發(fā)用于網(wǎng)絡(luò)臟話的AI(OCR)技術(shù),已能識別近30種語言,包括嵌入圖片中的英文、阿拉伯、俄語、法語、西語、日語、韓語、泰語、越南語、波斯語、孟加拉、尼泊爾、僧伽羅、朝鮮、蘇丹、德語、荷蘭語,以及馬來語、塔加洛語、土耳其語、意大利語、印尼語等國語言,甚至還包括三種中國少數(shù)民族語言。

format-jpg

據(jù)了解,在部分國際平臺中,“買家”在商品評論中以英語評論圖罵人,或者在交互場景中,買賣雙方以俄語臟話圖片對陣。國際平臺風控團隊和算法團隊復盤了很多案例,發(fā)現(xiàn)除了多語種臟話,多語種垃圾廣告以及不良信息也會暗藏在圖片中,試圖對抗風控。

阿里安全高級算法工程師沄帆介紹,要識別多語種文字,就要了解各個語言文字特點,以及影響算法識別的問題。每種文字體系都有自己的字體,不同字體會導致同一字符出現(xiàn)字形上的差異,相同的單詞在不同的語種里也可能有不同的含義。

format-jpg

除此之外,還有臟話圖以置換正常字符順序,對抗風控的情況出現(xiàn),即使調(diào)換字符順序,人還是可以輕而易舉地判斷單詞的含義,但這種“攻擊”試圖以打亂字母順序的方式騙過機器識別。

通過一年多努力研究,阿里安全算法團隊對這些點進行了逐個突破,通過改進多語言樣本生成方案與多語種識別模型框架,在多種圖片語言的識別上做到了高識別率,以及做到識別1張臟話圖只需0.15秒的速度。

目前該技術(shù)也已應用在阿里多項國際業(yè)務(wù)中,總體識別準確率可達95%以上,并對各種藝術(shù)字體、復雜背景以及手寫圖進行了針對性識別優(yōu)化。

format-jpg

1、該內(nèi)容為作者獨立觀點,不代表電商派觀點或立場,文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
相關(guān)閱讀
近日,國際權(quán)威研究機構(gòu)Gartner公布《AI開發(fā)者服務(wù)關(guān)鍵能力報告》,報告顯示,在語言AI領(lǐng)域,阿里巴巴排名第二。
8月11日消息,阿里巴巴集團日前公布新一季度業(yè)績,阿里收入增長4%至251.23億元,阿里巴巴集團董事會主席兼CEO、阿里智能集團董事長兼CEO張勇表示,新一代人工智能發(fā)展帶來的模型訓練和推理場景,對AI服務(wù)的需求非常旺盛,但是由于短期內(nèi)GPU在中國市場供應的緊缺,使得這樣的需求只得到了部分滿足,AI相關(guān)服務(wù)所帶來的增量機會剛剛開始得到釋放。
12月26日消息,阿里官宣成為2025年央視春晚計算AI獨家合作伙伴,將支持全球華人上看春晚,這是央視春晚史上首次引入技術(shù)合作伙伴。12月2日,中央廣播電視總臺在北京舉辦了2025年春晚版權(quán)文創(chuàng)與廣告合作簽約發(fā)布會。在此次活動現(xiàn)場,阿里巴巴宣布成為2025年央視春晚獨家電商互動平臺。
9月20日消息,中金發(fā)布研究報告稱,維持阿里巴巴-SW“跑贏行業(yè)”評級,目標價109港元。管理層在阿里棲大會上表示,看好生成式AI的發(fā)展,認為數(shù)位世界與物理世界會逐步被AI重塑,其中自動駕駛和機械人產(chǎn)業(yè)是重要應用。中金指,阿里致力AI時代實現(xiàn)計算體系全面升級,相信其可通過“一多芯”等技術(shù)創(chuàng)新,彌補供給短板,更能彰顯領(lǐng)先的廠商價值。
8月15日消息,阿里巴巴發(fā)布2024年六月底止季度財報。該季度阿里巴巴收入2432.36億元,同比增長4%;歸屬于普通股股東的凈利潤為242.69億元,凈利潤為240.22億元,同比下降27%。電商、兩大核心業(yè)務(wù)繼續(xù)取得積極進展:淘天集團線上GMV保持穩(wěn)定增長,阿里聚焦“公共+AI”,公共業(yè)務(wù)收入雙位數(shù)增長、AI相關(guān)產(chǎn)品收入三位數(shù)增長。
3月6日消息,阿里巴巴旗下的阿里宣布將面向日本企業(yè)推廣基于生成式AI基礎(chǔ)模型的商業(yè)提案,并與當?shù)刈稍児竞拖到y(tǒng)開發(fā)公司合作。阿里日本服務(wù)公司的區(qū)域總經(jīng)理與謝野正宇表示,計劃在未來三年內(nèi)將使用該公司模型的項目增加到1000個以上。
10月20日消息,在2021棲大會上,阿里巴巴集團副總裁、阿里計算平臺事業(yè)部負責人賈揚清發(fā)布統(tǒng)一AI平臺“阿里靈杰”,集成阿里整體AI能力對外開放,開發(fā)者可“開箱即用”。同時阿里還首次提出AI平臺的“4S”標準,為人工智能行業(yè)發(fā)展提供借鑒。據(jù)透露,基于“阿里靈杰”的分布式訓練優(yōu)化技術(shù),達摩院多模態(tài)大模型M6已升級至全球首個突破10萬億參數(shù)的AI模型,規(guī)模超越此前谷歌發(fā)布的1.6萬億Switch Transformer模型。
8月29日消息,在德勤中國全國合伙人大會上,阿里巴巴集團董事會主席兼CEO、阿里智能集團董事長兼CEO張勇談道,AI時代一定會出現(xiàn)新的領(lǐng)軍企業(yè),是全新生態(tài)形成的過程。新一代AI將在兩個層面帶來極大改變,一方面對企業(yè)來說,AI將極大提升生產(chǎn)力和效率,另一方面對用戶來說,有可能出現(xiàn)下一代搜索、社區(qū)等新物種的爆發(fā)。
阿里巴巴集團公布新一季度業(yè)績,阿里收入增長4%至251.23億元,經(jīng)調(diào)整EBITA利潤增長106%至3.87億元。AI熱潮帶來的算力和模型服務(wù)需求,正在推動阿里重回增長。
展望未來,張勇表示,阿里巴巴決定未來將所有產(chǎn)品接入AI大模型。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看