機(jī)器學(xué)習(xí)行業(yè)發(fā)展分析
一、機(jī)器學(xué)習(xí)行業(yè)發(fā)展概況
第一,2010年2月,加州大學(xué)伯克利分校教授喬丹和卡內(nèi)基梅隆大學(xué)教授米歇爾同時(shí)當(dāng)選美國(guó)工程院院士,同年5月份,喬丹教授又當(dāng)選為美國(guó)科學(xué)院院士。隨后幾年,概率圖模型專(zhuān)家科勒(Daphne Koller)當(dāng)選為美國(guó)工程院院士,理論計(jì)算機(jī)學(xué)家和機(jī)器學(xué)習(xí)專(zhuān)家、Boosting的主要建立者之一夏皮爾(Robert Schapire)當(dāng)選為美國(guó)工程院院士和科學(xué)院院士。期間,斯坦福大學(xué)的統(tǒng)計(jì)學(xué)家弗萊德曼和提布施瓦尼(Robert Tibshirani)、伯克利分校的華裔統(tǒng)計(jì)學(xué)家郁彬,以及卡內(nèi)基梅隆大學(xué)統(tǒng)計(jì)學(xué)家沃塞曼也先后被選為美國(guó)科學(xué)院院士。這是一個(gè)非常有趣的現(xiàn)象,因?yàn)檫@些學(xué)者都在機(jī)器學(xué)習(xí)領(lǐng)域做出了非常重要的貢獻(xiàn),比如弗萊德曼的工作包括分類(lèi)回歸樹(shù)、多元自適應(yīng)回歸(Multivariate Adaptive Regression Splines,MARS)和梯度推進(jìn)機(jī)(Gradient Boosting Machines,GBM)等經(jīng)典機(jī)器學(xué)習(xí)算法,而提布施瓦尼是最小絕對(duì)收縮和選擇算子(Least Absolute Shrinkage and Selection Operator,LASSO)的提出者。此外,優(yōu)化算法專(zhuān)家鮑德(Stephen Boyd)當(dāng)選美國(guó)工程院院士,他和范登貝格(Lieven Vandenberghe)的合著《凸優(yōu)化》(Convex Optimization)可以說(shuō)風(fēng)靡機(jī)器學(xué)習(xí)界。
第二,2011年的圖靈獎(jiǎng)授予了加州大學(xué)洛杉磯分校教授珀?duì)?JudeaPearl),他主要的研究領(lǐng)域是概率圖模型和因果推理,這是機(jī)器學(xué)習(xí)的基礎(chǔ)問(wèn)題。圖靈獎(jiǎng)通常頒給純理論計(jì)算機(jī)學(xué)者,或者早期建立計(jì)算機(jī)架構(gòu)或框架的學(xué)者。而把圖靈獎(jiǎng)授予珀?duì)柦淌诰哂蟹较驑?biāo)的意義。此外,2015年《科學(xué)》和《自然》雜志連續(xù)發(fā)表了4篇關(guān)于機(jī)器學(xué)習(xí)的綜述論文。而且,近幾年在這兩個(gè)雜志上發(fā)表的計(jì)算機(jī)學(xué)科論文幾乎都來(lái)自機(jī)器學(xué)習(xí)領(lǐng)域。
第三,機(jī)器學(xué)習(xí)切實(shí)能被用來(lái)幫助工業(yè)界解決問(wèn)題。特別是當(dāng)下的熱點(diǎn),比如說(shuō)深度學(xué)習(xí)、AlphaGo、無(wú)人駕駛汽車(chē)、人工智能助理等對(duì)工業(yè)界的巨大影響。當(dāng)今IT的發(fā)展已從傳統(tǒng)的微軟模式轉(zhuǎn)變到谷歌模式。傳統(tǒng)的微軟模式可以理解為制造業(yè),而谷歌模式則是服務(wù)業(yè)。谷歌搜索完全是免費(fèi)的,服務(wù)社會(huì),他們的搜索做得越來(lái)越極致,同時(shí)創(chuàng)造的財(cái)富也越來(lái)越豐厚。
財(cái)富蘊(yùn)藏在數(shù)據(jù)中,而挖掘財(cái)富的核心技術(shù)則是機(jī)器學(xué)習(xí),因此谷歌認(rèn)為自己是一家機(jī)器學(xué)習(xí)公司。深度學(xué)習(xí)作為當(dāng)今最有活力的機(jī)器學(xué)習(xí)方向,在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解、語(yǔ)音識(shí)別、智力游戲等領(lǐng)域的顛覆性成就,造就了一批新興的創(chuàng)業(yè)公司。工業(yè)界對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的人才有大量的需求。不僅僅需要代碼能力強(qiáng)的工程師,也需要有數(shù)學(xué)建模和解決問(wèn)題的科學(xué)家。
現(xiàn)在計(jì)算機(jī)界戲稱(chēng)機(jī)器學(xué)習(xí)為“全能學(xué)科”,它無(wú)所不在。除了有其自身的學(xué)科體系外,機(jī)器學(xué)習(xí)還有兩個(gè)重要的輻射功能。一是為應(yīng)用學(xué)科提供解決問(wèn)題的方法與途徑。對(duì)于一個(gè)應(yīng)用學(xué)科來(lái)說(shuō),機(jī)器學(xué)習(xí)的目的就是把一些難懂的數(shù)學(xué)翻譯成讓工程師能夠?qū)懗龀绦虻膫未a。二是為一些傳統(tǒng)學(xué)科,比如統(tǒng)計(jì)、理論計(jì)算機(jī)科學(xué)、運(yùn)籌優(yōu)化等找到新的研究問(wèn)題。因此,大多數(shù)世界著名大學(xué)的計(jì)算機(jī)學(xué)科把機(jī)器學(xué)習(xí)或人工智能列為核心方向,擴(kuò)大機(jī)器學(xué)習(xí)領(lǐng)域的教師規(guī)模,而且至少要保持兩三個(gè)機(jī)器學(xué)習(xí)研究方向具有一流競(jìng)爭(zhēng)力。有些計(jì)算機(jī)專(zhuān)業(yè)有1/3甚至1/2的研究生選修機(jī)器學(xué)習(xí)或人工智能。
機(jī)器學(xué)習(xí)現(xiàn)在已成為統(tǒng)計(jì)學(xué)的一個(gè)主流方向,許多著名大學(xué)的統(tǒng)計(jì)系紛紛從機(jī)器學(xué)習(xí)領(lǐng)域招聘教授,比如斯坦福大學(xué)統(tǒng)計(jì)系新進(jìn)的兩位助理教授來(lái)自機(jī)器學(xué)習(xí)專(zhuān)業(yè)。計(jì)算在統(tǒng)計(jì)領(lǐng)域已經(jīng)變得越來(lái)越重要,傳統(tǒng)多元統(tǒng)計(jì)分析是以矩陣分解為計(jì)算工具,現(xiàn)代高維統(tǒng)計(jì)則是以?xún)?yōu)化為計(jì)算工具。
二、機(jī)器學(xué)習(xí)技術(shù)發(fā)展水平
機(jī)器學(xué)習(xí)可以跟蹤每個(gè)客戶(hù)在購(gòu)買(mǎi)過(guò)程中的位置,并定制其建議。亞馬遜擁有互聯(lián)網(wǎng)上最好的推薦引擎之一,機(jī)器學(xué)習(xí)推薦帶動(dòng)了銷(xiāo)售額的55%。了解客戶(hù)購(gòu)買(mǎi)模式有助于提高銷(xiāo)售額,并使預(yù)測(cè)庫(kù)存需求更加容易,特別是對(duì)于季節(jié)性和基于趨勢(shì)的項(xiàng)目。
三、機(jī)器學(xué)習(xí)行業(yè)市場(chǎng)規(guī)模分析
圖表:2019-2022年機(jī)器學(xué)習(xí)行業(yè)市場(chǎng)規(guī)模
2022年中國(guó)機(jī)器學(xué)習(xí)應(yīng)用規(guī)模約為237億元,下游應(yīng)用領(lǐng)域以金融為首;2022年,中國(guó)金融領(lǐng)域機(jī)器學(xué)習(xí)產(chǎn)業(yè)規(guī)模占比為37.5%,工業(yè)領(lǐng)域產(chǎn)業(yè)規(guī)模占比為12.1%,工業(yè)領(lǐng)域產(chǎn)業(yè)規(guī)模后期長(zhǎng)空間較大。
四、機(jī)器學(xué)習(xí)應(yīng)用領(lǐng)域分析
1、自動(dòng)駕駛
在消費(fèi)領(lǐng)域,我們看到最多的機(jī)器學(xué)習(xí)應(yīng)用,莫過(guò)于無(wú)人駕駛技術(shù)。許多無(wú)人駕駛汽車(chē)還處在測(cè)試階段,在公共道路上實(shí)現(xiàn)完全自動(dòng)駕駛的想法還處在起步階段。
當(dāng)自動(dòng)駕駛汽車(chē)在公路上行駛時(shí),必須能夠?qū)崟r(shí)響應(yīng)周?chē)那闆r,這一點(diǎn)至關(guān)重要。這意味著通過(guò)傳感器獲取的所有信息必須在汽車(chē)中完成處理,而不是提交服務(wù)器或云端來(lái)進(jìn)行分析,否則即使是非常短的時(shí)間,也可能造成不可挽回的損失。
因此,機(jī)器學(xué)習(xí)將是汽車(chē)數(shù)字基礎(chǔ)設(shè)施的核心,使它能夠從觀察到的環(huán)境條件中進(jìn)行學(xué)習(xí)。對(duì)于這些數(shù)據(jù),一個(gè)特別有趣的應(yīng)用是映射——汽車(chē)需要能夠自動(dòng)響應(yīng)現(xiàn)實(shí)世界的周?chē)h(huán)境,以更新地圖。因此,每輛車(chē)都必須生成自己的導(dǎo)航網(wǎng)絡(luò)。
自動(dòng)駕駛已經(jīng)成為近兩年傳統(tǒng)車(chē)企與科技公司爭(zhēng)奪的熱點(diǎn)領(lǐng)域,大眾、本田、豐田、福特、通用、博世等傳統(tǒng)車(chē)企或零部件企業(yè)通過(guò)自主研發(fā)或合作等方式,開(kāi)發(fā)自動(dòng)駕駛汽車(chē);高通、三星、英特爾等公司通過(guò)開(kāi)發(fā)自主駕駛芯片來(lái)?yè)屨甲詣?dòng)駕駛領(lǐng)域的一席之地;谷歌、特斯拉、亞馬遜、微軟等科技巨頭更是通過(guò)技術(shù)優(yōu)勢(shì)提前布局自動(dòng)駕駛。
在我國(guó),自動(dòng)駕駛更是提到了國(guó)家戰(zhàn)略的高度,全國(guó)各地紛紛啟動(dòng)無(wú)人駕駛汽車(chē)示范區(qū)項(xiàng)目。百度開(kāi)放自動(dòng)駕駛平臺(tái),幫助汽車(chē)行業(yè)及自動(dòng)駕駛領(lǐng)域的合作伙伴快速搭建屬于自己的完整的自動(dòng)駕駛系統(tǒng)。
2、制造業(yè)
與自動(dòng)駕駛汽車(chē)一樣,隨著物聯(lián)網(wǎng)的發(fā)展,制造業(yè)企業(yè)可以從安置在生產(chǎn)線各環(huán)節(jié)的傳感器收集大量的生產(chǎn)數(shù)據(jù)。
然而,這些數(shù)據(jù)并沒(méi)有被充分利用。隨著從復(fù)雜系統(tǒng)收集到眾多參數(shù)的數(shù)據(jù),數(shù)據(jù)分析變成了一項(xiàng)艱巨的任務(wù)。機(jī)器學(xué)習(xí)在制造業(yè)中的最大應(yīng)用將是異常檢測(cè)。
據(jù)統(tǒng)計(jì),到2030年,全球的淡水需求預(yù)計(jì)將超過(guò)供應(yīng)近40%。為協(xié)助各企業(yè)實(shí)現(xiàn)凈零水循環(huán)使用的目標(biāo),美國(guó)水處理公司Ecolab(藝康集團(tuán))正通過(guò)包括Azure和Dynamics CRM Online在內(nèi)的微軟云平臺(tái)幫助全球企業(yè)實(shí)現(xiàn)可持續(xù)運(yùn)營(yíng)。
與全球各地?cái)?shù)以千計(jì)傳感器相連的云平臺(tái)能收集實(shí)時(shí)用水?dāng)?shù)據(jù),并通過(guò)機(jī)器學(xué)習(xí)和商業(yè)智能分析全球各地的生產(chǎn)用水運(yùn)營(yíng)解決方案,不僅提高效率,還能降低水、能源消耗及運(yùn)營(yíng)成本。
2017年,機(jī)器學(xué)習(xí)也將推動(dòng)工業(yè)自動(dòng)化的實(shí)現(xiàn),通過(guò)觀察生產(chǎn)線和數(shù)據(jù)流來(lái)學(xué)習(xí),并能夠精確優(yōu)化生產(chǎn)過(guò)程,降低生產(chǎn)成本,加快生產(chǎn)周期,從而節(jié)省人工分析數(shù)據(jù)的時(shí)間成本和資金成本。
天機(jī)智能作為深圳長(zhǎng)盈精密的全資子公司,通過(guò)自動(dòng)化改造,幫助公司提升生產(chǎn)工藝裝備的自動(dòng)化和智能化水平。該公司用機(jī)器取代了90%的勞動(dòng)力,生產(chǎn)率提高了80%,產(chǎn)品缺陷率也顯著減少了2.5倍。目前,工廠只有60名工人檢測(cè)和管理生產(chǎn)線,以及維護(hù)計(jì)算機(jī)系統(tǒng)。