文生視頻需要大量的“文本-視頻”配對(duì)數(shù)據(jù),而目前缺乏多樣化的數(shù)據(jù)集,且數(shù)據(jù)標(biāo)注的工作量較大。因而此前視頻大多為5-15秒,而Sora將視頻時(shí)長(zhǎng)提升至1分鐘,支持生成多個(gè)鏡頭,同時(shí)基本維持了角色和視覺(jué)風(fēng)格的一致性,并能在一定程度上“理解”現(xiàn)實(shí)世界。
Sora到底是什么?
2月16日,OpenAI發(fā)布文生視頻模型Sora。它能夠根據(jù)用戶輸入的提示詞、文本指令或靜態(tài)圖像,生成長(zhǎng)達(dá)一分鐘的視頻,其中既能實(shí)現(xiàn)多角度鏡頭的自然切換,還包含復(fù)雜的場(chǎng)景和生動(dòng)的角色表情,且故事的邏輯性和連貫性極佳。
Sora具有三大突出亮點(diǎn):一是60秒長(zhǎng)視頻,可以保持視頻主體與背景的高度流暢性與穩(wěn)定性;二是在一個(gè)視頻內(nèi)實(shí)現(xiàn)多角度鏡頭,分鏡切換符合邏輯且十分流暢;三是理解真實(shí)世界的能力,對(duì)于光影反射、運(yùn)動(dòng)方式、鏡頭移動(dòng)等細(xì)節(jié)處理得十分優(yōu)秀,極大地提升了真實(shí)感。
文生視頻需要大量的“文本-視頻”配對(duì)數(shù)據(jù),而目前缺乏多樣化的數(shù)據(jù)集,且數(shù)據(jù)標(biāo)注的工作量較大。因而此前視頻大多為5-15秒,而Sora將視頻時(shí)長(zhǎng)提升至1分鐘,支持生成多個(gè)鏡頭,同時(shí)基本維持了角色和視覺(jué)風(fēng)格的一致性,并能在一定程度上“理解”現(xiàn)實(shí)世界。
技術(shù)角度來(lái)看,Sora采用了“擴(kuò)散+Transformer”的視頻生成大模型技術(shù)路線,可謂有了里程碑式的技術(shù)進(jìn)步。相比以往使用的同為擴(kuò)散模型的U-Net,Transformer架構(gòu)的參數(shù)可拓展性強(qiáng),即參數(shù)量增加,性能加速提升,同時(shí)支持任意分辨率、長(zhǎng)寬比、時(shí)長(zhǎng)的視頻訓(xùn)練數(shù)據(jù),不會(huì)因?yàn)閴嚎s導(dǎo)致訓(xùn)練數(shù)據(jù)質(zhì)量下降。此外,Sora訓(xùn)練了能在時(shí)間和空間上壓縮視頻的自編碼器,這也是其能夠大幅提升生成視頻時(shí)長(zhǎng)的原因。
Sora有何商業(yè)價(jià)值?
安爵資產(chǎn)董事長(zhǎng)劉巖:Sora模型的出現(xiàn)預(yù)示著行業(yè)變革的來(lái)臨。在內(nèi)容創(chuàng)作與媒體領(lǐng)域,它將徹底改變視頻制作的傳統(tǒng)方式,助力創(chuàng)作者以更高效、更低成本的方式創(chuàng)作出高質(zhì)量視頻,從而推動(dòng)整個(gè)行業(yè)的工作效率提升。對(duì)于廣告、電影預(yù)告片和短視頻等行業(yè),Sora模型更是可能帶來(lái)顛覆性的創(chuàng)新。同時(shí)其在模擬世界方面的能力為虛擬現(xiàn)實(shí)、游戲開(kāi)發(fā)等領(lǐng)域開(kāi)辟了巨大的潛力空間。
工銀瑞信:商業(yè)角度來(lái)看,從“idea或IP→內(nèi)容生產(chǎn)→內(nèi)容分發(fā)”的產(chǎn)業(yè)鏈,長(zhǎng)期預(yù)計(jì)視頻生產(chǎn)的成本將大幅降低。目前AI生成視頻的水平還有待提升,可能更適合做對(duì)視頻質(zhì)量要求低的互聯(lián)網(wǎng)廣告素材,如游戲買(mǎi)量素材等。由于Sora基本處于閉源狀態(tài),技術(shù)細(xì)節(jié)并未公布,相比于GPT有較多開(kāi)源模型而言,國(guó)內(nèi)視頻生成模型方面尚有差距,利好有idea但落地較慢的動(dòng)畫(huà)電影公司、IP公司,以及能夠降本增效的游戲行業(yè)。
文本生成視頻模型迎來(lái)重大突破
OpenAI發(fā)布SoraAI視頻生成模型,文本生成視頻模型迎來(lái)重大突破。隨著文生圖、圖片對(duì)話技術(shù)的成熟,文生視頻可能成為多模態(tài)大模型下一步發(fā)展的方向。該技術(shù)有望極大降低短劇制作的成本,并且會(huì)進(jìn)一步向影視、自媒體、游戲等領(lǐng)域滲透,提高視頻創(chuàng)作效率等。
智能視頻(Intelligent Video)是利用計(jì)算機(jī)視覺(jué)和人工智能技術(shù),對(duì)視頻內(nèi)容進(jìn)行自動(dòng)分析、識(shí)別和理解,從而提取出有用的信息,實(shí)現(xiàn)視頻監(jiān)控、智能分析、行為識(shí)別、人臉識(shí)別等多種應(yīng)用。智能視頻技術(shù)可以大大提高視頻監(jiān)控的效率和準(zhǔn)確性,減少人工干預(yù)和誤報(bào)率,為安防、交通、醫(yī)療、教育等領(lǐng)域提供更為智能化和高效化的解決方案。
根據(jù)中研普華研究院撰寫(xiě)的《2023-2028年中國(guó)智能視頻行業(yè)競(jìng)爭(zhēng)分析及發(fā)展前景預(yù)測(cè)報(bào)告》顯示:
智能視頻行業(yè)發(fā)展分析
智能視頻的核心技術(shù)包括計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等。通過(guò)對(duì)視頻幀進(jìn)行逐幀分析,智能視頻系統(tǒng)可以識(shí)別出目標(biāo)對(duì)象、分析其行為軌跡、檢測(cè)異常事件等。同時(shí),利用大數(shù)據(jù)和云計(jì)算技術(shù),可以對(duì)大量視頻數(shù)據(jù)進(jìn)行存儲(chǔ)、分析和挖掘,從而發(fā)現(xiàn)隱藏在視頻數(shù)據(jù)中的有用信息,為決策提供數(shù)據(jù)支持。
目前,智能視頻已經(jīng)在多個(gè)領(lǐng)域得到廣泛應(yīng)用。在安防領(lǐng)域,智能視頻監(jiān)控可以自動(dòng)識(shí)別出入侵者、異常行為等,并及時(shí)發(fā)出報(bào)警,提高安全防范能力。在交通領(lǐng)域,智能視頻可以實(shí)時(shí)監(jiān)測(cè)交通流量、違章行為等,為交通管理提供有力支持。在醫(yī)療領(lǐng)域,智能視頻可以幫助醫(yī)生進(jìn)行手術(shù)操作、病情監(jiān)測(cè)等,提高醫(yī)療效率和質(zhì)量。在教育領(lǐng)域,智能視頻可以輔助教師進(jìn)行教學(xué)、學(xué)生學(xué)習(xí)情況監(jiān)測(cè)等,提高教學(xué)效果和學(xué)習(xí)體驗(yàn)。
隨著人工智能和計(jì)算機(jī)視覺(jué)技術(shù)的不斷發(fā)展,智能視頻的應(yīng)用領(lǐng)域和場(chǎng)景將不斷擴(kuò)大和深化。同時(shí),隨著5G、物聯(lián)網(wǎng)等技術(shù)的普及和應(yīng)用,智能視頻也將與其他技術(shù)相互融合,形成更為智能化和高效化的解決方案,為各個(gè)領(lǐng)域的發(fā)展提供有力支持。
從發(fā)展現(xiàn)狀來(lái)看,智能視頻行業(yè)正在快速發(fā)展,市場(chǎng)規(guī)模持續(xù)擴(kuò)大。隨著人工智能、大數(shù)據(jù)、云計(jì)算等技術(shù)的不斷進(jìn)步,智能視頻在各個(gè)領(lǐng)域的應(yīng)用也越來(lái)越廣泛。
例如,在安防領(lǐng)域,智能視頻監(jiān)控設(shè)備已經(jīng)廣泛應(yīng)用于各種場(chǎng)景,有效地提高了安全防范能力。在娛樂(lè)領(lǐng)域,智能視頻技術(shù)也為用戶提供了更加豐富和個(gè)性化的體驗(yàn)。此外,隨著5G技術(shù)的普及和應(yīng)用,智能視頻行業(yè)也迎來(lái)了新的發(fā)展機(jī)遇。
智能視頻行業(yè)的發(fā)展?jié)摿薮蟆?/strong>隨著人工智能技術(shù)的不斷發(fā)展和應(yīng)用,智能視頻將在更多領(lǐng)域得到應(yīng)用,如智能家居、智能交通、智能醫(yī)療等。
同時(shí),隨著人們對(duì)視頻內(nèi)容質(zhì)量和體驗(yàn)的要求不斷提高,智能視頻技術(shù)也將不斷提升,為用戶提供更加高質(zhì)量和個(gè)性化的視頻體驗(yàn)。此外,隨著政策的不斷推動(dòng)和市場(chǎng)的不斷擴(kuò)大,智能視頻行業(yè)的競(jìng)爭(zhēng)格局也將更加激烈,這將進(jìn)一步推動(dòng)行業(yè)的發(fā)展和創(chuàng)新。
隨著人工智能、大數(shù)據(jù)、云計(jì)算等技術(shù)的快速發(fā)展,智能視頻行業(yè)在算法優(yōu)化、視頻處理、數(shù)據(jù)分析等方面取得了顯著的進(jìn)步。例如,深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等技術(shù)的應(yīng)用,使得智能視頻在目標(biāo)檢測(cè)、人臉識(shí)別、行為分析等方面更加精準(zhǔn)和高效。同時(shí),新的視頻編解碼技術(shù)、邊緣計(jì)算等也為智能視頻行業(yè)的發(fā)展提供了新的動(dòng)力。
5G網(wǎng)絡(luò)的普及和用戶需求的多元化,短視頻平臺(tái)之間的競(jìng)爭(zhēng)也從內(nèi)容數(shù)量轉(zhuǎn)向內(nèi)容質(zhì)量和創(chuàng)新能力。因此,短視頻平臺(tái)需要不斷提升自身的技術(shù)水平和服務(wù)水平,打造差異化的產(chǎn)品特色和用戶體驗(yàn),增強(qiáng)智能視頻分析用戶粘性和忠誠(chéng)度。
5G技術(shù)的發(fā)展和應(yīng)用,以及農(nóng)村互聯(lián)網(wǎng)的進(jìn)一步普及,智能視頻分析仍然具有很樂(lè)觀的增長(zhǎng)前景。同時(shí),AR、VR、無(wú)人機(jī)拍攝、全景技術(shù)等視頻拍攝技術(shù)的日益成熟和應(yīng)用,也會(huì)給觀眾帶來(lái)越來(lái)越好的視覺(jué)體驗(yàn),進(jìn)而有力地促進(jìn)行業(yè)的發(fā)展。
智能視頻分析的需求正在快速增長(zhǎng),特別是隨著實(shí)時(shí)安全監(jiān)控應(yīng)用的需求增加,實(shí)時(shí)發(fā)現(xiàn)安全隱患或目標(biāo)異常行為的功能已經(jīng)具有越來(lái)越重要的現(xiàn)實(shí)意義,智能視頻分析產(chǎn)品在這種日益增長(zhǎng)的需求帶動(dòng)下,正在成為視頻監(jiān)控應(yīng)用的新熱點(diǎn)。
隨著人們對(duì)視頻內(nèi)容質(zhì)量和體驗(yàn)的要求不斷提高,智能視頻的市場(chǎng)需求也在持續(xù)增長(zhǎng)。特別是在高清、超高清視頻、VR/AR、智能家居等新興領(lǐng)域,智能視頻技術(shù)的應(yīng)用將更加廣泛。這為智能視頻企業(yè)提供了巨大的市場(chǎng)機(jī)會(huì)和發(fā)展空間。
政策支持與推動(dòng):政府對(duì)于智能視頻行業(yè)的發(fā)展也給予了大力支持。例如,推動(dòng)人工智能、大數(shù)據(jù)等技術(shù)的發(fā)展,鼓勵(lì)跨界合作和創(chuàng)新,提供資金支持等。這些政策為智能視頻行業(yè)的發(fā)展提供了良好的環(huán)境和機(jī)遇。
在激烈的市場(chǎng)競(jìng)爭(zhēng)中,企業(yè)及投資者能否做出適時(shí)有效的市場(chǎng)決策是制勝的關(guān)鍵。中研網(wǎng)撰寫(xiě)的智能視頻行業(yè)報(bào)告對(duì)中國(guó)智能視頻行業(yè)的發(fā)展現(xiàn)狀、競(jìng)爭(zhēng)格局及市場(chǎng)供需形勢(shì)進(jìn)行了具體分析,并從行業(yè)的政策環(huán)境、經(jīng)濟(jì)環(huán)境、社會(huì)環(huán)境及技術(shù)環(huán)境等方面分析行業(yè)面臨的機(jī)遇及挑戰(zhàn)。同時(shí)揭示了市場(chǎng)潛在需求與潛在機(jī)會(huì),為戰(zhàn)略投資者選擇恰當(dāng)?shù)耐顿Y時(shí)機(jī)和公司領(lǐng)導(dǎo)層做戰(zhàn)略規(guī)劃提供準(zhǔn)確的市場(chǎng)情報(bào)信息及科學(xué)的決策依據(jù),同時(shí)對(duì)政府部門(mén)也具有極大的參考價(jià)值。
想了解關(guān)于更多智能視頻行業(yè)專業(yè)分析,可點(diǎn)擊查看中研普華研究院撰寫(xiě)的《2023-2028年中國(guó)智能視頻行業(yè)競(jìng)爭(zhēng)分析及發(fā)展前景預(yù)測(cè)報(bào)告》。同時(shí)本報(bào)告還包含大量的數(shù)據(jù)、深入分析、專業(yè)方法和價(jià)值洞察,可以幫助您更好地了解行業(yè)的趨勢(shì)、風(fēng)險(xiǎn)和機(jī)遇。
關(guān)注公眾號(hào)
免費(fèi)獲取更多報(bào)告節(jié)選
免費(fèi)咨詢行業(yè)專家
2023-2028年中國(guó)智能視頻行業(yè)競(jìng)爭(zhēng)分析及發(fā)展前景預(yù)測(cè)報(bào)告
中研普華通過(guò)對(duì)智能視頻行業(yè)長(zhǎng)期跟蹤監(jiān)測(cè),分析智能視頻行業(yè)需求、供給、經(jīng)營(yíng)特性、獲取能力、產(chǎn)業(yè)鏈和價(jià)值鏈等多方面的內(nèi)容,整合行業(yè)、市場(chǎng)、企業(yè)、用戶等多層面數(shù)據(jù)和信息資源,為客戶提供深...
查看詳情
產(chǎn)業(yè)規(guī)劃 特色小鎮(zhèn) 產(chǎn)業(yè)園區(qū)規(guī)劃 產(chǎn)業(yè)地產(chǎn) 可研報(bào)告 商業(yè)計(jì)劃書(shū) 細(xì)分市場(chǎng)研究 IPO上市咨詢
今年1月,住房和城鄉(xiāng)建設(shè)部、國(guó)家金融監(jiān)督管理總局聯(lián)合下發(fā)《關(guān)于建立城市房地產(chǎn)融資協(xié)調(diào)機(jī)制的通知》(下稱“《通知2...
2023年,生成式人工智能(AIGC)浪潮席卷科技圈,海外各大科技公司紛紛逐浪AIGC,國(guó)內(nèi)也一度掀起“百模大戰(zhàn)”。金融行...
疫后經(jīng)濟(jì)環(huán)境復(fù)蘇帶動(dòng)居民整體收入改善,消費(fèi)勢(shì)頭明顯提升。休閑娛樂(lè)、智能出行等使用場(chǎng)景的恢復(fù)使得消費(fèi)者對(duì)于智能手...
眾所周知,奢侈品牌概念寬泛,階梯級(jí)次分化明顯,其中以Hermes、Chanel、Louis Vuitton、Gucci、Prada、Dior等為代表...
水是構(gòu)成人體的重要組成部分,是七大營(yíng)養(yǎng)素(礦物質(zhì)、脂類、蛋白質(zhì)、維生素、碳水化合物、水和膳食纖維)之一,對(duì)人體...
2023年,國(guó)內(nèi)生豬產(chǎn)能持續(xù)居高不下,業(yè)界普遍認(rèn)為,生豬養(yǎng)殖行業(yè)經(jīng)歷了“史上最長(zhǎng)虧損期”。相關(guān)數(shù)據(jù)顯示,去年全年全...
中研普華集團(tuán)聯(lián)系方式廣告服務(wù)版權(quán)聲明誠(chéng)聘英才企業(yè)客戶意見(jiàn)反饋報(bào)告索引網(wǎng)站地圖 Copyright ? 1998-2023 ChinaIRN.COM All Rights Reserved. 版權(quán)所有 中國(guó)行業(yè)研究網(wǎng)(簡(jiǎn)稱“中研網(wǎng)”) 粵ICP備05036522號(hào)
微信掃一掃