(本文作者系國家廣播電視總局發(fā)展研究中心 趙京文)
導(dǎo)讀
近期,人工智能大模型公司DeepSeek(深度求索)憑借其低成本高效推理的大模型,引發(fā)了社會各界的廣泛關(guān)注。在政界、科技界、金融界、傳媒界等多個領(lǐng)域,DeepSeek所帶來的“蝴蝶效應(yīng)”正悄然展開。對于廣電視聽行業(yè)而言,DeepSeek的出現(xiàn)恰似一縷春風(fēng),為我們在技術(shù)、內(nèi)容、產(chǎn)業(yè)等多層面的“深度求索”注入了新的動力與活力,也帶來了諸多啟示,值得深入剖析與借鑒。
首先,堅持成本效益與技術(shù)創(chuàng)新并重。DeepSeek以低成本復(fù)現(xiàn)了當(dāng)前最先進(jìn)的模型,在成本創(chuàng)新方面展現(xiàn)出的巨大潛力,對于背負(fù)大量設(shè)備等“重資產(chǎn)”的廣電視聽行業(yè)提供了新的轉(zhuǎn)型機遇和發(fā)展思路。通過優(yōu)化算法結(jié)構(gòu)和開源生態(tài),DeepSeek成功將訓(xùn)練和推理成本大幅降低,僅為OpenAI等同類產(chǎn)品的5%-10%。這一成本優(yōu)勢,對于技術(shù)資源有限但內(nèi)容需求龐大的廣電視聽行業(yè)來說,無疑具有巨大的吸引力。
不少廣電視聽機構(gòu)已經(jīng)面臨著高昂的運行維護(hù)成本和巨大的技術(shù)更新迭代壓力,若想涉足AI大模型研發(fā)和應(yīng)用領(lǐng)域,往往還需要購置昂貴的計算設(shè)備、處理海量的數(shù)據(jù)、承擔(dān)漫長的訓(xùn)練周期。DeepSeek的出現(xiàn)打破了這一局面,其創(chuàng)新的稀疏激活混合專家(MoE)架構(gòu),僅激活與任務(wù)相關(guān)的參數(shù),算力消耗相比傳統(tǒng)架構(gòu)降低約90%,極大地提高了推理效率,減少了對昂貴硬件資源的依賴。
同時,DeepSeek的開源生態(tài)模式,允許開發(fā)者自由獲取、修改和使用其代碼,借助全球AI開發(fā)者社區(qū)的力量,不僅降低了研發(fā)成本,還提升了迭代速度,使得市場主體能夠基于DeepSeek進(jìn)行二次開發(fā)和定制化,快速推出符合自身業(yè)務(wù)需求的AI應(yīng)用,無需從零開始研發(fā),大大縮短了產(chǎn)品研發(fā)周期,提高了市場響應(yīng)速度。這種低成本、高效率的模式,為廣電視聽行業(yè)的轉(zhuǎn)型發(fā)展提供了極具價值的借鑒,也提供了一種輕量化、高效化的數(shù)智化技術(shù)路徑。
其次,數(shù)據(jù)價值挖掘與高效利用至關(guān)重要。DeepSeek的高質(zhì)量語料庫是提升模型性能的關(guān)鍵所在。在使用DeepSeek-R1時,我們能明顯感受到其生成內(nèi)容的“人味”,語言較之同類產(chǎn)品更加優(yōu)美且富有哲思。這背后,是DeepSeek創(chuàng)新數(shù)據(jù)蒸餾技術(shù)的功勞。通過自動識別高價值數(shù)據(jù)片段和對抗訓(xùn)練生成合成數(shù)據(jù),DeepSeek實現(xiàn)了訓(xùn)練效率的大幅提升,同時將高質(zhì)量代碼數(shù)據(jù)的獲取成本從每100個tokens的0.8元降至0.12元。
廣電視聽行業(yè)本身擁有海量的高質(zhì)量、大規(guī)模、安全可信的語料和視聽數(shù)據(jù)資源,是AI大模型應(yīng)用的“沃土”。通過深度學(xué)習(xí),廣電視聽行業(yè)可以進(jìn)一步提升大模型的智能分析和生成能力,更好地滿足垂類需求,為用戶帶來更加優(yōu)質(zhì)、個性化的視聽體驗。行業(yè)也應(yīng)更加重視技術(shù)迭代引發(fā)的內(nèi)容、網(wǎng)絡(luò)、數(shù)據(jù)安全風(fēng)險,提高全業(yè)務(wù)安全保障水平。
再者,開放融合才能實現(xiàn)互利共贏。DeepSeek的開源模式和支持在消費級硬件、端側(cè)部署的特性,降低了AI應(yīng)用部署的技術(shù)門檻。與一些先行者選擇封閉的技術(shù)路線不同,DeepSeek將代碼、模型權(quán)重和訓(xùn)練日志全部公開。DeepSeek創(chuàng)始人梁文鋒認(rèn)為,“在顛覆性技術(shù)面前,閉源形成的護(hù)城河是短暫的。即使OpenAI閉源,也無法阻止被別人趕超?!边@種開源精神也為整個行業(yè)帶來了更多的創(chuàng)新機會和合作空間。
自DeepSeek推出以來,包括英偉達(dá)、微軟、亞馬遜、華為等在內(nèi)的國內(nèi)外眾多芯片廠商、云計算廠商、軟件廠商以及終端廠商紛紛宣布部署上線,提供原版或蒸餾小尺寸版本。DeepSeek的這一特性使得廣電視聽機構(gòu)能夠在本地環(huán)境中高效處理數(shù)據(jù)和生成內(nèi)容,有望降低運營成本,提高數(shù)據(jù)處理的靈活性和安全性。同時,DeepSeek的高性價比模型也使得更多企業(yè)有可能在端側(cè)設(shè)備上部署AI應(yīng)用,推動終端設(shè)備的智能化進(jìn)程。例如,微軟推出針對NPU(神經(jīng)網(wǎng)絡(luò)處理器)優(yōu)化的DeepSeek-R1模型,支持Copilot+PC等設(shè)備,實現(xiàn)了半連續(xù)運行的主動智能體驗,為智能手機、汽車等端側(cè)設(shè)備提供了高效的本地化部署方案。這也將為廣電視聽行業(yè)帶來更加便捷、高效的內(nèi)容分發(fā)和交互方式。這啟示我們,推動跨領(lǐng)域合作與多元化發(fā)展是廣電視聽行業(yè)拓展業(yè)務(wù)邊界、實現(xiàn)可持續(xù)發(fā)展的關(guān)鍵。
最后,還應(yīng)關(guān)注DeepSeek獨特的組織機制和人才管理理念。DeepSeek不受制于短視商業(yè)邏輯,采用扁平化管理,摒棄繁瑣流程,讓團(tuán)隊成員自由調(diào)用資源,專注于技術(shù)創(chuàng)新。同時,DeepSeek在選人用人上不迷信學(xué)歷和背景,注重人才的基礎(chǔ)能力、好奇心和自驅(qū)力,吸引了一批真正熱愛技術(shù)的“樸素探索者”。據(jù)報道,DeepSeek-V3模型的關(guān)鍵訓(xùn)練架構(gòu)MLA最初源于一位年輕研究員的個人興趣。正是這種對個人興趣的尊重和鼓勵,使得DeepSeek能夠從一個小小的興趣點出發(fā),組建專項團(tuán)隊,開展大規(guī)模驗證與攻關(guān),最終取得了突破性進(jìn)展。
梁文鋒曾表示,“我們創(chuàng)新缺少的不是資本,而是信心,以及組織高密度人才的能力,調(diào)動他們高效地進(jìn)行創(chuàng)造力與好奇心驅(qū)動的創(chuàng)新?!?strong>為加快適應(yīng)信息技術(shù)迅猛發(fā)展新形勢,廣電視聽行業(yè)同樣需要這種創(chuàng)新定力和高效的協(xié)作機制,建立適應(yīng)全媒體生產(chǎn)傳播的一體化組織架構(gòu)、業(yè)務(wù)流程,建立靈活的用人機制、暢通的晉升渠道、有效的激勵機制,更加注重人才的創(chuàng)新能力和內(nèi)在驅(qū)動力。
當(dāng)技術(shù)的變革席卷行業(yè),DeepSeek的破局之道為廣電視聽行業(yè)提供了新的發(fā)展思路。站在AI大模型推動的范式轉(zhuǎn)移臨界點,廣電視聽行業(yè)既要保持對技術(shù)發(fā)展的審慎洞察,更要把握這場由底層架構(gòu)革新催生的機遇,借鑒DeepSeek式的創(chuàng)新經(jīng)驗,以“深度求索”的勇氣直面挑戰(zhàn),努力開創(chuàng)廣電視聽高質(zhì)量發(fā)展的全新局面。