阿里研發(fā)AI技術0.15秒識別攔截外語臟話圖

田寧
2021-09-27 15:03

9月27日消息,阿里安全算法團隊宣布,其研發(fā)用于網(wǎng)絡臟話的AI(OCR)技術,已能識別近30種語言,包括嵌入圖片中的英文、阿拉伯、俄語、法語、西語、日語、韓語、泰語、越南語、波斯語、孟加拉、尼泊爾、僧伽羅、朝鮮、蘇丹、德語、荷蘭語,以及馬來語、塔加洛語、土耳其語、意大利語、印尼語等國語言,甚至還包括三種中國少數(shù)民族語言。

format-jpg

據(jù)了解,在部分國際平臺中,“買家”在商品評論中以英語評論圖罵人,或者在交互場景中,買賣雙方以俄語臟話圖片對陣。國際平臺風控團隊和算法團隊復盤了很多案例,發(fā)現(xiàn)除了多語種臟話,多語種垃圾廣告以及不良信息也會暗藏在圖片中,試圖對抗風控。

阿里安全高級算法工程師沄帆介紹,要識別多語種文字,就要了解各個語言文字特點,以及影響算法識別的問題。每種文字體系都有自己的字體,不同字體會導致同一字符出現(xiàn)字形上的差異,相同的單詞在不同的語種里也可能有不同的含義。

format-jpg

除此之外,還有臟話圖以置換正常字符順序,對抗風控的情況出現(xiàn),即使調(diào)換字符順序,人還是可以輕而易舉地判斷單詞的含義,但這種“攻擊”試圖以打亂字母順序的方式騙過機器識別。

通過一年多努力研究,阿里安全算法團隊對這些點進行了逐個突破,通過改進多語言樣本生成方案與多語種識別模型框架,在多種圖片語言的識別上做到了高識別率,以及做到識別1張臟話圖只需0.15秒的速度。

目前該技術也已應用在阿里多項國際業(yè)務中,總體識別準確率可達95%以上,并對各種藝術字體、復雜背景以及手寫圖進行了針對性識別優(yōu)化。

format-jpg

1、該內(nèi)容為作者獨立觀點,不代表電商派觀點或立場,文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務,如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
相關閱讀
近日,國際權(quán)威研究機構(gòu)Gartner公布《AI開發(fā)者服務關鍵能力報告》,報告顯示,在語言AI領域,阿里巴巴排名第二。
8月11日消息,阿里巴巴集團日前公布新一季度業(yè)績,阿里收入增長4%至251.23億元,阿里巴巴集團董事會主席兼CEO、阿里智能集團董事長兼CEO張勇表示,新一代人工智能發(fā)展帶來的模型訓練和推理場景,對AI服務的需求非常旺盛,但是由于短期內(nèi)GPU在中國市場供應的緊缺,使得這樣的需求只得到了部分滿足,AI相關服務所帶來的增量機會剛剛開始得到釋放。
12月26日消息,阿里官宣成為2025年央視春晚計算AI獨家合作伙伴,將支持全球華人上看春晚,這是央視春晚史上首次引入技術合作伙伴。12月2日,中央廣播電視總臺在北京舉辦了2025年春晚版權(quán)文創(chuàng)與廣告合作簽約發(fā)布會。在此次活動現(xiàn)場,阿里巴巴宣布成為2025年央視春晚獨家電商互動平臺。
9月20日消息,中金發(fā)布研究報告稱,維持阿里巴巴-SW“跑贏行業(yè)”評級,目標價109港元。管理層在阿里棲大會上表示,看好生成式AI的發(fā)展,認為數(shù)位世界與物理世界會逐步被AI重塑,其中自動駕駛和機械人產(chǎn)業(yè)是重要應用。中金指,阿里致力AI時代實現(xiàn)計算體系全面升級,相信其可通過“一多芯”等技術創(chuàng)新,彌補供給短板,更能彰顯領先的廠商價值。
8月15日消息,阿里巴巴發(fā)布2024年六月底止季度財報。該季度阿里巴巴收入2432.36億元,同比增長4%;歸屬于普通股股東的凈利潤為242.69億元,凈利潤為240.22億元,同比下降27%。電商、兩大核心業(yè)務繼續(xù)取得積極進展:淘天集團線上GMV保持穩(wěn)定增長,阿里聚焦“公共+AI”,公共業(yè)務收入雙位數(shù)增長、AI相關產(chǎn)品收入三位數(shù)增長。
3月6日消息,阿里巴巴旗下的阿里宣布將面向日本企業(yè)推廣基于生成式AI基礎模型的商業(yè)提案,并與當?shù)刈稍児竞拖到y(tǒng)開發(fā)公司合作。阿里日本服務公司的區(qū)域總經(jīng)理與謝野正宇表示,計劃在未來三年內(nèi)將使用該公司模型的項目增加到1000個以上。
10月20日消息,在2021棲大會上,阿里巴巴集團副總裁、阿里計算平臺事業(yè)部負責人賈揚清發(fā)布統(tǒng)一AI平臺“阿里靈杰”,集成阿里整體AI能力對外開放,開發(fā)者可“開箱即用”。同時阿里還首次提出AI平臺的“4S”標準,為人工智能行業(yè)發(fā)展提供借鑒。據(jù)透露,基于“阿里靈杰”的分布式訓練優(yōu)化技術,達摩院多模態(tài)大模型M6已升級至全球首個突破10萬億參數(shù)的AI模型,規(guī)模超越此前谷歌發(fā)布的1.6萬億Switch Transformer模型。
8月29日消息,在德勤中國全國合伙人大會上,阿里巴巴集團董事會主席兼CEO、阿里智能集團董事長兼CEO張勇談道,AI時代一定會出現(xiàn)新的領軍企業(yè),是全新生態(tài)形成的過程。新一代AI將在兩個層面帶來極大改變,一方面對企業(yè)來說,AI將極大提升生產(chǎn)力和效率,另一方面對用戶來說,有可能出現(xiàn)下一代搜索、社區(qū)等新物種的爆發(fā)。
4月24日消息,在“教育數(shù)字化2.0”戰(zhàn)略全面推進的背景下,阿里巴巴宣布“少年助學計劃”已為全國鄉(xiāng)村學校建設300所AI教室,惠及25萬師生,這一數(shù)字教育普惠工程,正依托AI大模型、計算等技術,通過云端算力與人工智能的深度融合,為教育公平注入科技動能。
阿里巴巴集團公布新一季度業(yè)績,阿里收入增長4%至251.23億元,經(jīng)調(diào)整EBITA利潤增長106%至3.87億元。AI熱潮帶來的算力和模型服務需求,正在推動阿里重回增長。
田寧
電商脈搏,媒體前沿洞察。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看