快手于冰:AI大模型進入爆發(fā)期,有望開啟AGI時代
8月10日消息,快手高級副總裁、研發(fā)線負責人于冰表示,AI大模型作為當下最重要的革命性技術,進入爆發(fā)期,有望開啟AGI時代,而多模態(tài)內容生成與理解是其核心能力。
于冰認為,當前,多模態(tài)AI大模型因其在文本、代碼、圖像和視頻等多種內容上突出的生成與理解能力,有望為視頻生產、理解、分發(fā)、消費等全鏈路打開新的技術視角,突破傳統(tǒng)音視頻編碼的技術天花板,突破基于用戶行為的搜廣推算法的傳統(tǒng)思路,將視頻內容創(chuàng)作從PGC、UGC帶動進入AIGC時代,創(chuàng)造AI大模型驅動的視頻內容創(chuàng)作工具,激發(fā)創(chuàng)作者的創(chuàng)意空間,高效率、低成本地生產高質量的視頻內容。
而短視頻、直播作為最典型的多模態(tài)媒介,快手也抓住平臺基因,在AI大模型領域重度投入,全方位探索技術突破。于冰介紹,目前,快手在AI大模型的布局體系分為三個層級:基于具備高性能、高并發(fā)、高算力的“大基建”,構建快手多模態(tài)的AI“大模型”,進而在搜廣推、內容創(chuàng)作、用戶增長、研發(fā)效能等領域內打造“大應用”。
圖注:快手高級副總裁、研發(fā)線負責人于冰
(圖源網易科技)
他提到,在多模態(tài)AI大模型的加持下,AI技術和工具可全方位地賦能影視創(chuàng)作者,助其在創(chuàng)作、拍攝、后期等各階段激發(fā)創(chuàng)意、提升效率和內容質量,影視制作的周期也能大幅提高,過去花費數年拍攝的大片有望數月完成。
快手自2011年成立至今,回顧過往經歷,于冰表示,業(yè)務發(fā)展會經歷入局、成長、成熟等多個階段,在業(yè)務發(fā)展的不同階段,快手所采取的研發(fā)策略也各有側重。創(chuàng)新成長期更注重持續(xù)投入,探索新產品、新周期;而成熟階段則需聚焦優(yōu)化效率,兼顧體驗,既保證產品體驗的競爭力,又保證業(yè)務的穩(wěn)健成長。
于冰以快手音視頻業(yè)務為例,目前該業(yè)務已步入成熟期,研發(fā)策略重點也轉移至提升效率、優(yōu)化成本,追求單位成本下算力、存儲和網絡使用效率的提升??焓只谧匝幸曨l質量評估KVQ、視頻增強修復KEP和KRP、視頻壓縮編碼算法KVC等一系列核心技術,形成數據驅動的視頻處理閉環(huán),在兼顧體驗的同時極致壓縮視頻。
(圖源快手官網首頁截圖)
2022年,快手技術toB業(yè)務StreamLake推出了首款自研智能視頻處理芯片SL200,該芯片集成了快手領先的視頻編解碼、圖像處理、AI推理、內容自適應編碼等關鍵技術,具備高質量、高密度、智能化的特點。目前,SL200芯片已全面應用于快手的直播和短視頻業(yè)務,實現成熟技術通過StreamLake對產業(yè)賦能。
而在數字人領域,于冰介紹,快手全鏈路自研了光場掃描重建、超寫實人像建模、智能綁定、動作捕捉與驅動、物理仿真等數字人核心技術,推出“快手虛擬演播助手(KVS)”和“快手智播”兩大解決方案。未來,結合智能編曲、圖像/視頻生成、LLM等AI能力,快手數字人技術將繼續(xù)在文旅、教育、游戲、直播電商等領域廣泛應用,助力客戶打造高品質低成本的3D和2D數字人。
2、電商號平臺僅提供信息存儲服務,如發(fā)現文章、圖片等侵權行為,侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯系:info@dsb.cn
