近日,北京經(jīng)開(kāi)區(qū)融媒體中心在當(dāng)虹科技的技術(shù)支持下,正式啟用融合了DeepSeek-R1和DeepSeek Janus Pro的BlackEye多模態(tài)視聽(tīng)大模型,率先開(kāi)啟“DeepSeek+視聽(tīng)+行業(yè)端側(cè)”的大模型應(yīng)用之旅,為新聞生產(chǎn)注入全新動(dòng)能。
“僅需幾十秒,就可快速生成一段高精度視頻,大大節(jié)省了視頻生產(chǎn)的時(shí)間和成本?!薄耙曨l橫轉(zhuǎn)豎一直是我們視頻業(yè)務(wù)的難點(diǎn),這次終于有了好用的工具?!薄拔纳曨l、圖生視頻、智能橫轉(zhuǎn)豎、智能慢動(dòng)作、智能摳像,有一說(shuō)一,功能真的太全面了”……北京經(jīng)開(kāi)區(qū)融媒體中心記者、編輯們表示,有了多模態(tài)視聽(tīng)大模型這位“賽博同事”,內(nèi)容生產(chǎn)質(zhì)效正在飛速提升。
據(jù)悉,北京經(jīng)開(kāi)區(qū)融媒體中心布局應(yīng)用的多模態(tài)視聽(tīng)大模型,是其聯(lián)合專注大視頻領(lǐng)域的國(guó)家級(jí)專精特新“小巨人”企業(yè)當(dāng)虹科技打造。該大模型在當(dāng)虹科技BlackEye多模態(tài)視聽(tīng)大模型融合DeepSeek-R1和DeepSeek Janus Pro基礎(chǔ)上,完成視聽(tīng)傳媒垂類場(chǎng)景數(shù)據(jù)調(diào)優(yōu)訓(xùn)練?;贒eepSeek-R1強(qiáng)大的模型推理能力,該大模型融合了多種深度神經(jīng)網(wǎng)絡(luò)組件,包括Transformer、Diffusion等組件,通過(guò)文本、圖像、視音頻、三維模型等多種模態(tài)的編碼、解碼、多模態(tài)潛空間對(duì)齊、多模態(tài)語(yǔ)言推理及生成等技術(shù),實(shí)現(xiàn)不同模態(tài)信息之間的推理和預(yù)測(cè)生成,具備了更強(qiáng)大的多模態(tài)理解能力,可以更好地理解和處理視聽(tīng)內(nèi)容,顯著提升傳媒文化領(lǐng)域內(nèi)容生產(chǎn)、審核、推薦和用戶體驗(yàn)等方面的效率與質(zhì)量。
小亦觀察到,通過(guò)多模態(tài)視聽(tīng)大模型進(jìn)行一段10分鐘的養(yǎng)生視頻創(chuàng)作,大模型可一鍵理解視頻內(nèi)容,并由DeepSeek-R1進(jìn)行深度思考,給出健康科普、食材挑選、烹飪技巧等三個(gè)角度的短視頻腳本,并結(jié)合BlackEye文生視頻、圖生視頻等生成式算法,以及AI超分、AI插幀、AI橫豎屏同步制作等分析式算法,短時(shí)間就能制作出精美的專業(yè)級(jí)視頻。
目前,該多模態(tài)視聽(tīng)大模型可以生成電影、連環(huán)畫(huà)、3D卡通等八種風(fēng)格的2K視頻并可通過(guò)AI超分算法進(jìn)一步提升至4K。同時(shí),為了適應(yīng)手機(jī)豎屏觀看需求,還可將橫屏視頻智能轉(zhuǎn)化為豎屏,AI橫豎屏同步制作效率大幅提升。
“多模態(tài)視聽(tīng)大模型的應(yīng)用,標(biāo)志著北京經(jīng)開(kāi)區(qū)融媒體中心在AI技術(shù)應(yīng)用領(lǐng)域邁出關(guān)鍵一步?!北本┙?jīng)開(kāi)區(qū)融媒體中心有關(guān)負(fù)責(zé)人表示,作為率先擁抱前沿AI技術(shù)的區(qū)級(jí)融媒體中心,北京經(jīng)開(kāi)區(qū)融媒體中心已通過(guò)本地化部署,在保障數(shù)據(jù)安全的基礎(chǔ)上實(shí)現(xiàn)了大模型與新聞場(chǎng)景的深度適配。未來(lái),北京經(jīng)開(kāi)區(qū)融媒體中心將持續(xù)借助AI 技術(shù)能力,進(jìn)一步加大在新聞挖掘、內(nèi)容創(chuàng)作、新聞分發(fā)、用戶互動(dòng)等領(lǐng)域的應(yīng)用力度,積極探索 AI 技術(shù)在媒體行業(yè)的創(chuàng)新應(yīng)用場(chǎng)景,為用戶提供更豐富、更優(yōu)質(zhì)、更智能的新聞服務(wù),引領(lǐng)區(qū)級(jí)融媒體中心在新時(shí)代的智能化發(fā)展浪潮。