亚洲一区激情国产日韩,色综合久久六月婷婷中文字幕,久久国产精品二国产精品,免费永久国产在线视频

          • 資訊
          • 報(bào)告
          當(dāng)前位置:中研網(wǎng) > 市場分析 > 深度分析 > IT與通訊

          人工智能背后的人工——標(biāo)數(shù)據(jù)的人

          • 2018年2月24日 ZhangHongYuan來源:甲子光年 777 47
          • 繁體

          • 2018-2023年中國醫(yī)療IT行業(yè)競爭分析及發(fā)展前景預(yù)測報(bào)告

            隨著國內(nèi)經(jīng)濟(jì)的發(fā)展,醫(yī)療IT市場發(fā)展面臨巨大機(jī)遇和挑戰(zhàn)。在市場競爭方面,醫(yī)療IT企業(yè)數(shù)量越來越多,市場正面臨著供給與需求的不對稱,醫(yī)療IT行業(yè)有進(jìn)一步洗牌的強(qiáng)烈要求,但是在一些醫(yī)療IT細(xì)分...

          5到10年后,當(dāng)人工智能全面普及,科技先驅(qū)和新一代商業(yè)巨子注定會(huì)被時(shí)代的聚光燈銘記。但今天,我們卻想說一個(gè)關(guān)于人工智能“從未被講出”的故事,寫一群時(shí)代大幕后的“隱形者”——標(biāo)數(shù)據(jù)的人。

          IT,人工智能,人工智能背后的人工

          5到10年后,當(dāng)人工智能全面普及,科技先驅(qū)和新一代商業(yè)巨子注定會(huì)被時(shí)代的聚光燈銘記。

          但今天,我們卻想說一個(gè)關(guān)于人工智能“從未被講出”的故事,寫一群時(shí)代大幕后的“隱形者”——標(biāo)數(shù)據(jù)的人。

          智能時(shí)代滾滾巨輪之下,一批批用于“人臉識別”“自動(dòng)駕駛”“自然語言處理”的標(biāo)注好的數(shù)據(jù),正是出自這些學(xué)歷不高,每天對著電腦工作8到10小時(shí)的人手中——他們是“人工智能背后的人工”。

          記者采訪了多個(gè)數(shù)據(jù)標(biāo)注服務(wù)商、數(shù)據(jù)標(biāo)注工作室和數(shù)據(jù)標(biāo)注者。據(jù)業(yè)內(nèi)人士估計(jì),中國全職的“數(shù)據(jù)標(biāo)注者”已達(dá)到10萬人,兼職人群的規(guī)模則接近100萬。

          他們中有職高學(xué)生,有嘗試過40份工作的聾啞人,有從工地輾轉(zhuǎn)而來的新生代農(nóng)民工……他們源源不斷地為人工智能的發(fā)展供應(yīng)最重要的“數(shù)據(jù)燃料”——在現(xiàn)有的技術(shù)框架下,數(shù)據(jù)量越大,質(zhì)量越好,算法模型就表現(xiàn)越好。可以說,數(shù)據(jù)決定著整個(gè)人工智能行業(yè)的發(fā)展態(tài)勢。

          但標(biāo)注工作本身是一個(gè)勞動(dòng)密集型工種,收入并不高。隨著技術(shù)的進(jìn)一步發(fā)展,未來還有被取代的可能。許多數(shù)據(jù)標(biāo)注者的父輩是參與了中國房地產(chǎn)奇跡的農(nóng)民工。如今,父輩手里的鐵鏟變成了年輕人的鼠標(biāo)、鍵盤,但和父輩一樣,他們?nèi)允沁吘壵?。今年春?jié),他們也像父輩一樣踏上了歸鄉(xiāng)的旅途,不僅是從城市回到鄉(xiāng)村,也是從科技前線回到古老的火爐前。

          小志從貴陽坐了四小時(shí)的大巴回到山區(qū)家中,第一件事就是將錢塞到母親手里;

          犇犇給父親買了新的電動(dòng)剃須刀;

          何軍家在河南周口,打算把錢都存著娶媳婦,過年期間要見幾個(gè)相親對象;

          小袁想再掙點(diǎn)錢后換一副助聽器,現(xiàn)在這個(gè)他已戴了好多年,把他不斷長大的耳蝸磨出了新新舊舊的傷……

          我們無法預(yù)判他們的命運(yùn),但選擇講出他們的故事。這些科技進(jìn)步背后的“無名者”值得一次認(rèn)真的注視。

          數(shù)據(jù)折疊

          人工智能的世界里,存在不為人知的“數(shù)據(jù)折疊”:

          一邊是炫酷的科技、神奇的智能應(yīng)用;一邊是大量人工每天重復(fù)地生產(chǎn)機(jī)器學(xué)習(xí)的“食物”——標(biāo)注好的數(shù)據(jù)。

          北京和貴陽,是數(shù)據(jù)標(biāo)注世界里的兩座“雙子星”城市。北京聚集了大量人工智能公司;貴陽近年來著力發(fā)展“大數(shù)據(jù)戰(zhàn)略”,已擁有相對完整的數(shù)據(jù)服務(wù)產(chǎn)業(yè)生態(tài)。

          2017年,僅北京中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)規(guī)模就超過700億元;貴陽2017年的大數(shù)據(jù)產(chǎn)業(yè)及其關(guān)聯(lián)產(chǎn)業(yè)規(guī)??偭砍^1500億元。AI行業(yè)的總規(guī)模也在持續(xù)增加,根據(jù)麥肯錫2017年4月發(fā)布的一份報(bào)告,到2025年,AI應(yīng)用的總市場可能達(dá)到1270億美元。

          但標(biāo)注數(shù)據(jù)的人,生活在這些巨額數(shù)字之外,拿著不高的工資,活動(dòng)在“第二空間”。

          從三里屯驅(qū)車1小時(shí),行駛30公里,就到了北京郵電大學(xué)宏福校區(qū)。這里有北郵和華騰碩博合辦的電子商務(wù)培訓(xùn)班,學(xué)生總數(shù)300多人,高峰時(shí)期,有120多人參與數(shù)據(jù)標(biāo)注的兼職項(xiàng)目。

          標(biāo)注工作室占滿了某棟教學(xué)樓二層的5個(gè)房間,150臺(tái)電腦前坐著一群十八九歲的學(xué)生,正盯著電腦屏幕給圖片拉框。他們流程化地操作鼠標(biāo)——這些枯燥的工作,最終將用于熱鬧炫酷的無人駕駛項(xiàng)目。

          從做數(shù)據(jù)標(biāo)注的教室窗口向外望,可以看到北郵的教一,那里有國際學(xué)院和計(jì)算機(jī)專業(yè)學(xué)生專用的機(jī)房。

          兼職標(biāo)數(shù)據(jù)的培訓(xùn)班學(xué)員一個(gè)月的收入在2000元左右。如果全職做,人均工資約4000到5000元。而坐在教一的未來算法工程師,剛畢業(yè)時(shí),起薪就可能達(dá)到30萬元/年。

          培訓(xùn)班學(xué)員參與的標(biāo)注項(xiàng)目,采用了目前數(shù)據(jù)標(biāo)注行業(yè)的主流模式之一——“外包”。

          某數(shù)據(jù)標(biāo)注主管告訴記者,AI數(shù)據(jù)標(biāo)注的外包市場2011年開啟,2015年真正開始,2016年下半年出現(xiàn)收縮,2017年又有了新一輪的爆發(fā)。

          外包盛行,是因?yàn)槿斯ぶ悄艿陌l(fā)展需要大量人力對非結(jié)構(gòu)的數(shù)據(jù)進(jìn)行加工,以用于機(jī)器學(xué)習(xí)。而創(chuàng)業(yè)團(tuán)隊(duì)和巨頭公司,為了集中精力研發(fā)或保持團(tuán)隊(duì)的高學(xué)歷占比,很少完全自建數(shù)據(jù)標(biāo)注團(tuán)隊(duì)。

          外包江湖門派眾多、良莠不齊。

          從業(yè)者是這樣打招呼的,“你是發(fā)包方還是外包方?”

          BAT、人工智能創(chuàng)業(yè)公司,學(xué)術(shù)團(tuán)體,以及政府、銀行等機(jī)構(gòu)都可能成為發(fā)包方。BAT和人工智能公司需求最大,學(xué)術(shù)團(tuán)體次之,政府、銀行等傳統(tǒng)機(jī)構(gòu)的需求最小但有不斷增長的趨勢。某數(shù)據(jù)標(biāo)注主管告訴記者,他目前所接觸到的上述三類業(yè)務(wù)需求的比例為7:2:1。

          某數(shù)據(jù)標(biāo)注公司負(fù)責(zé)人透露,商湯、曠視這類大的人工智能公司,一年在數(shù)據(jù)上的支出有數(shù)千萬。

          在“外包方”一端,有 “眾包”和“工廠”兩種模式。前者是把任務(wù)通過平臺(tái)轉(zhuǎn)接給網(wǎng)民,如“百度眾包”“京東眾智”“龍貓數(shù)據(jù)”;后者是自己經(jīng)營團(tuán)隊(duì),對整個(gè)流程進(jìn)行控制,如貴陽夢動(dòng)科技經(jīng)營了一個(gè)500人的“數(shù)據(jù)工場”;BasicFinder與二十來家“數(shù)據(jù)工廠”有長期業(yè)務(wù)合作,少則幾十人,多則兩三百人。而在規(guī)范的機(jī)構(gòu)之外,還游離著三五人到十幾人規(guī)模不等的“小作坊”。

          許多機(jī)構(gòu)在眾包和自營工廠兩方面都有涉足,眾包平臺(tái)上也有許多以團(tuán)隊(duì)為單位接單的“公會(huì)”。

          算法公司和人才多集中在北深杭等科技核心區(qū)域,而作為一個(gè)“勞動(dòng)密集型”的中低收入行業(yè),數(shù)據(jù)標(biāo)注人員散落三四線城市。

          在距離貴陽市中心50公里的百鳥河數(shù)字小鎮(zhèn),有一個(gè)規(guī)模500人的“數(shù)據(jù)工場”,500名標(biāo)注員中,近一半是附近一家扶貧高職“盛華職業(yè)學(xué)院”的學(xué)生。

          他們很珍惜這個(gè)接近“白領(lǐng)”的兼職機(jī)會(huì),1月能掙到1500元,經(jīng)濟(jì)上足以自立,省點(diǎn)還可以補(bǔ)貼家用,相比其他兼職選擇:去餐廳辛苦端盤子或頂著風(fēng)雨送外賣,數(shù)據(jù)標(biāo)注相對輕松且體面。

          盛華學(xué)院大數(shù)據(jù)專業(yè)老師,同時(shí)也是貴陽夢動(dòng)科技人工智能服務(wù)部總監(jiān)的曹珊告訴記者,她曾帶著七個(gè)學(xué)生來北京某人工智能公司參加圖像標(biāo)注培訓(xùn),通過后可留下來實(shí)習(xí),但競爭激烈,五十九人只留十個(gè),其中不少是北京本地學(xué)校的競爭者。最終,這7位來自貴陽的同學(xué)都留了下來。

          這些年輕的數(shù)據(jù)標(biāo)注者,一頭連著最前沿的科技,一頭連著他們的家鄉(xiāng)——那里往往是貧困、閉塞的所在,是科技的影響力最微弱的“第三空間”。

          小志是曹珊的學(xué)生,數(shù)據(jù)工廠臘月二十七才放假,小志坐了四小時(shí)大巴回到山區(qū)的家里,父母都務(wù)農(nóng),身體也不好,家里除了房子和田,唯一像樣的財(cái)產(chǎn)是一頭牛。

          進(jìn)高職前,小志甚至都沒碰過電腦,唯一會(huì)的操作是按開關(guān)鍵。電腦極大地打開了他的世界,但也讓他一度沉迷游戲。最嚴(yán)重的時(shí)候,課不上了,數(shù)據(jù)不標(biāo)了,覺也不睡了。

          曹珊為此和小志長談了多次,目前小志的生活漸漸步入正軌,成了數(shù)據(jù)標(biāo)注的小組長,手里帶著十多個(gè)同學(xué)。

          但未來工作前途的不可預(yù)期,相對低的收入,較大的家庭負(fù)擔(dān),仍然是這些年輕人無法擺脫的苦惱。

          父輩的積累相當(dāng)頑固,無論是財(cái)富、聲望,還是貧窮和負(fù)擔(dān)。

          父輩與我:從建筑工地到“智能工地”

          犇犇的人生在某種程度上,是對父親的繼承。

          他是西安某數(shù)據(jù)標(biāo)注工作室的標(biāo)注員,犇犇和他所在的工作室代表了數(shù)據(jù)標(biāo)注行業(yè)的另一種典型模式“小作坊”。

          今年26歲的犇犇,先后做過廚師、進(jìn)過工廠、推廣過數(shù)種數(shù)字貨幣,但沒有一份工作做得長久。

          犇犇父親在他這個(gè)年紀(jì)時(shí),是鎮(zhèn)上棉紡站的一名工人。2005年棉紡站關(guān)門,下崗后的父親去甘肅當(dāng)過兩年鉆井工人,此后一直在做建筑。

          直到2017年12月初,犇犇還不知道數(shù)據(jù)標(biāo)注這個(gè)工種。

          當(dāng)時(shí)他接到靈的一個(gè)電話,邀請他一起做數(shù)據(jù)標(biāo)注工作室。靈和犇犇曾一起推廣數(shù)字貨幣,行情最好時(shí),一筆交易能拿兩萬提成。但好好的幣,玩著玩著沒了,他們的這次合作鎩羽而歸。

          經(jīng)歷上一次失敗后,靈又殺進(jìn)數(shù)據(jù)標(biāo)注領(lǐng)域,很快,她組建了15人規(guī)模的工作室,團(tuán)隊(duì)成員都跟犇犇一般大,氛圍很好,他們常常一邊標(biāo)數(shù)據(jù),一邊聊天,時(shí)間并不難熬。

          最難受的是眼睛。從早上九點(diǎn)到晚上六點(diǎn),工作內(nèi)容就是盯著屏幕給圖片拉框。拉框要求十分精細(xì),偏差絲毫都不行。犇犇眼睛干澀時(shí),會(huì)起身去樓道抽煙。

          眼睛的難受熬熬就能過去,更愁人的是工資不高。

          犇犇笑著說,入不敷出啊。他在供一套鄭州的房子,每個(gè)月要還4700的房貸,而工資撐死就五六千。

          在犇犇看來,這份工作也沒什么前途:“跟電子廠一樣,多做多得。”

          犇犇的夢想是在全國開很多養(yǎng)老院,因?yàn)樾r(shí)候的鄰居是獨(dú)居的七十歲老人,“沒人養(yǎng)很可憐”。

          但開養(yǎng)老院對現(xiàn)在的犇犇來說太難了,他養(yǎng)自己都難。

          數(shù)據(jù)標(biāo)注的晉升之路只有兩條,每條都是窄門:

          要么進(jìn)數(shù)據(jù)公司,爬完標(biāo)注員-標(biāo)注組長-數(shù)據(jù)經(jīng)理-數(shù)據(jù)總監(jiān)這個(gè)鏈條,層層打怪升級;要么進(jìn)人工智能公司當(dāng)數(shù)據(jù)標(biāo)注員,然后憑借超人毅力自學(xué)技術(shù)曲線救國。

          前一條路不需要學(xué)歷,但是千百人過獨(dú)木橋,且依舊是在數(shù)據(jù)標(biāo)注圈子里打轉(zhuǎn);后一條路能真正學(xué)到東西,但對學(xué)歷有要求。

          犇犇只有高中學(xué)歷,連高考都沒參加。因?yàn)椴辉冈僮x書,他跟父親起過很大爭執(zhí),父親深知打工有多苦。高三的那個(gè)暑假,犇犇也去體驗(yàn)了一把:跟著父親去工地上搬磚。

          現(xiàn)在,他成了一名“智能工地”上的新型“搬磚者”。

          對科技、社會(huì)和自身的關(guān)系,如今犇犇有清醒的認(rèn)知:“人工智能就像是一個(gè)孩子,標(biāo)注好的圖片就像是孩子的食物,而我們就是制作食物的人,最苦最累的我們做了,成名的只是那些制造孩子的人。”犇犇說。

          兩代人的命運(yùn)在此重疊。

          農(nóng)民工一磚一瓦壘起了實(shí)體城市的高樓;數(shù)據(jù)標(biāo)注者一框一線搭建起了算法的智能。前者是城市的邊緣者,高樓起來了,他們?nèi)允沁吘壵?后者是科技世界的邊緣者,機(jī)器變聰明了,他們還是邊緣者。

          犇犇會(huì)最終棲居在數(shù)據(jù)標(biāo)注這份工作上嗎?他給的答案是不確定的,他不知道這份工作是否不出幾年就被取代,也不知道自己是否就此乖乖認(rèn)命。

          中國有五千多萬的農(nóng)民工以建筑為生,到了五六十歲還在工地上忙碌。數(shù)據(jù)標(biāo)注的市場才剛打開,「甲子光年」從從業(yè)者口中得知,截止2018年年初,以數(shù)據(jù)標(biāo)注為生的全職標(biāo)注員規(guī)模達(dá)近十萬,這個(gè)數(shù)字未來會(huì)繼續(xù)增長,未來將達(dá)數(shù)十萬。數(shù)字標(biāo)注也將成為新生代農(nóng)民工的聚集地。

          野蠻生長,坑與機(jī)會(huì)并存

          相比聚光燈之下的人工智能科技公司,數(shù)據(jù)標(biāo)注行業(yè)是個(gè)在暗處的行業(yè),存在大量灰色地帶。

          作為一個(gè)勞動(dòng)密集型行業(yè),進(jìn)入門檻并不高,壓低“成本”、“薄利多量”,就成了許多團(tuán)隊(duì)的競爭手段。

          許多公司招的標(biāo)注員都是沒有交五險(xiǎn)一金的臨時(shí)工。7、8萬的啟動(dòng)資金,就可以在四五線小城組起一個(gè)“工作室”。

          AI公司也傾向壓低成本——某數(shù)據(jù)標(biāo)注公司主管告訴記者,部分人工智能公司對數(shù)據(jù)標(biāo)注的重視不夠,過分壓低預(yù)算,把項(xiàng)目外包給一些不靠譜的團(tuán)隊(duì);這些團(tuán)隊(duì)做不完、做不了,又會(huì)把任務(wù)轉(zhuǎn)包給另一些小團(tuán)隊(duì),或重新找到大的數(shù)據(jù)標(biāo)注公司,使質(zhì)量和交期都無法保證。

          “低價(jià)競爭和行業(yè)不規(guī)范導(dǎo)致的層層外包是行業(yè)的噩夢。”京東眾智平臺(tái)的負(fù)責(zé)人李工告訴記者。

          對小團(tuán)隊(duì)來說,外包直接折損了利潤。

          做過室內(nèi)裝修的何軍,在2017年底投入十萬積蓄作為啟動(dòng)成本,在河南周口成立了一個(gè)40人團(tuán)隊(duì)的數(shù)據(jù)工作室。他2018年的最大計(jì)劃,就是“爭取接到一手項(xiàng)目”。

          “利潤其實(shí)不高”,何軍一邊抖著腿,一邊掰著手指頭細(xì)細(xì)算賬,“你看啊,一個(gè)拉框平均4分錢,一個(gè)員工一天能做大約4500個(gè),一共180塊。過關(guān)率90%,再除去審核的成本,再給每個(gè)標(biāo)注員每天發(fā)110元左右的工資,平均下來工作室每天也就從每個(gè)人身上賺30塊吧。”何軍第一個(gè)月虧了本,第二個(gè)月勉強(qiáng)持平。

          “開年就去跑工商注冊,然后一家家聯(lián)系大公司,得接到一手項(xiàng)目,給員工的多發(fā)點(diǎn)工資,現(xiàn)在太低了?!焙诬娬f。

          小團(tuán)隊(duì)只能接二手甚至是好幾手的項(xiàng)目,一手項(xiàng)目就像江湖傳說,聽過沒見過。

          處境相似的趙聰也特別想接到一手項(xiàng)目。他是2017年10月入場的標(biāo)注者,自己攢了三個(gè)人的團(tuán)隊(duì)兼職做數(shù)據(jù)標(biāo)注。“我們的項(xiàng)目都是從小公司手里接的,連發(fā)包方的名字都不知道”,趙聰說,“利潤很低”,三個(gè)人,三個(gè)月,三個(gè)項(xiàng)目,每人也就獲得了一千塊收入。

          大平臺(tái)也反感層層外包,因?yàn)檫@嚴(yán)重?cái)_亂行業(yè)秩序。

          “數(shù)據(jù)標(biāo)注看起來門檻很低,但其實(shí)管理的門檻并不低。價(jià)格、產(chǎn)能、交期和質(zhì)量都要兼顧。很多小團(tuán)隊(duì),拿到的項(xiàng)目自己消化不了,最后又會(huì)找到我們?!盉asicFinder的杜霖說。

          而針對一些特定的復(fù)雜任務(wù),還需要進(jìn)行足夠的培訓(xùn),有的培訓(xùn)期需要1到3個(gè)月。在理解客戶需求、保證數(shù)據(jù)的多樣性、隨機(jī)性上,許多小團(tuán)隊(duì)也欠缺必要的能力。

          層層外包,對數(shù)據(jù)標(biāo)注員的直接影響是:攤薄了收入,錢被中間環(huán)節(jié)分掉:一手的項(xiàng)目在誰手上,價(jià)格多高,會(huì)經(jīng)歷多少層級,每層有多少利潤,都是謎。

          還有另一個(gè)角色在攪亂這趟渾水——代理人。

          代理人說白了就是拉項(xiàng)目跑活兒的人,關(guān)系戶,是中國人情社會(huì)里長出的變量。一些小公司會(huì)高薪養(yǎng)代理人,以期打通關(guān)鍵節(jié)點(diǎn)。

          趙聰無奈地說,“靠關(guān)系吃飯的社會(huì)”,最末端的標(biāo)注者最缺這種關(guān)系資源。

          杜霖認(rèn)為,這個(gè)行業(yè)經(jīng)歷了早期的瘋狂生長,最終一定會(huì)經(jīng)歷一番洗牌,變得更為規(guī)范化、透明化。屆時(shí)質(zhì)量會(huì)取代成本,成為需求方最優(yōu)先考慮的變量:

          “人工智能公司的本質(zhì)需求是能找到靠譜團(tuán)隊(duì)。大家最后都會(huì)明白,背著抱著一邊沉,想省的錢都省不掉,要保證質(zhì)量,就是一分錢一分貨。 ”

          大浪淘沙,有兩類機(jī)構(gòu)會(huì)最終留下來:注重質(zhì)量及服務(wù)的中小型數(shù)據(jù)標(biāo)注公司,以及自有整套數(shù)據(jù)技術(shù)的平臺(tái)。

          而犇犇、何軍以及趙聰都有可能被行業(yè)清洗出去。

          還有5年,只有5年

          經(jīng)營小工作室的何軍已經(jīng)開始緊張了,他聽說算法升級后,將不再需要大量人工標(biāo)注。由于對技術(shù)動(dòng)向缺乏把握,他時(shí)常處于一種對未來的不安之中。

          杜霖則認(rèn)為,至少在5年內(nèi),數(shù)據(jù)標(biāo)注行業(yè)的增長空間還很大,數(shù)據(jù)標(biāo)注的市場才剛打開,數(shù)據(jù)需求將緊隨人工智能的大規(guī)模落地引來一波爆發(fā)式增長。

          首先,人工智能行業(yè)本身的發(fā)展,將進(jìn)一步帶動(dòng)數(shù)據(jù)標(biāo)注行業(yè)。目前能被建模量化的數(shù)據(jù)只占真實(shí)世界中的極少一部分?,F(xiàn)有的數(shù)據(jù)標(biāo)注業(yè)務(wù)主要集中在安防和自動(dòng)駕駛領(lǐng)域,未來,隨著AI深入更多垂直行業(yè),新需求將不斷出現(xiàn)。

          何軍告訴記者,前些天就出現(xiàn)了一個(gè)他沒見過的標(biāo)注內(nèi)容,北航的學(xué)生找上門來,要對“積云”進(jìn)行標(biāo)注。杜霖也跟記者分享,他們做過一個(gè)很有意思的標(biāo)注項(xiàng)目——標(biāo)注指甲區(qū)域,因?yàn)榭蛻粢雒兰讬C(jī)器人。

          其次,在現(xiàn)有的主流“有監(jiān)督學(xué)習(xí)”的算法模型下,為了讓算法有更高的準(zhǔn)確率,數(shù)據(jù)不嫌多。Google的技術(shù)大牛Jeff Dean曾在一次公開課上展示一個(gè)海量數(shù)據(jù)的訓(xùn)練結(jié)果,如下圖所示:橫軸代表數(shù)據(jù)規(guī)模,縱軸代表準(zhǔn)確率,藍(lán)線是深度神經(jīng)網(wǎng)絡(luò)算法,綠線是傳統(tǒng)訓(xùn)練方法。

          可以看到,藍(lán)線的準(zhǔn)確率和數(shù)據(jù)規(guī)模及質(zhì)量持續(xù)成正比,并沒有出現(xiàn)趨于平滑的拐點(diǎn),這說明深度學(xué)習(xí)對數(shù)據(jù)有源源不斷的需求。

          第三,從感知智能到認(rèn)知智能的跨越,需要的數(shù)據(jù)維度會(huì)更大,這可能催生更精細(xì)的數(shù)據(jù)標(biāo)注需求——如對一段對話數(shù)據(jù)的標(biāo)注,不僅要知道對話內(nèi)容、語義,可能還需要標(biāo)注談話者身份、情緒變化等。

          杜霖告訴記者,人工智能公司的總支出中,目前有20%-30%用于數(shù)據(jù),現(xiàn)階段大陸市場數(shù)據(jù)采集及標(biāo)注的規(guī)模保守估計(jì)有五十億。一個(gè)參考是,新三板上市公司數(shù)據(jù)堂2016年的營收達(dá)到了9680萬元人民幣。

          京東眾智平臺(tái)的負(fù)責(zé)人李工對未來也很樂觀,他認(rèn)為,包括采集、標(biāo)注、清洗等流程的數(shù)據(jù)市場未來將達(dá)上百億。

          但這一切都是基于“有監(jiān)督學(xué)習(xí)”這個(gè)大前提。行業(yè)的一個(gè)變量是,如果算法從“有監(jiān)督學(xué)習(xí)”升級為無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)或遷移學(xué)習(xí),數(shù)據(jù)標(biāo)注需求將大大減少。

          技術(shù)進(jìn)步和躍升自有其規(guī)律,目前無監(jiān)督學(xué)習(xí)等新算法仍然只是學(xué)界的探索,尚不能用在大規(guī)模的商業(yè)落地中。

          杜霖判斷,新的革新性算法,至少5年內(nèi)都不會(huì)出現(xiàn)。Novumind創(chuàng)始人吳韌此前接受記者專訪時(shí)則認(rèn)為,深度學(xué)習(xí)加大數(shù)據(jù)就是人工智能的“way to go”,較難出現(xiàn)顛覆性的其他路徑。

          5年,對公司來說是一個(gè)可以布局、掉頭的“窗口期”。京東眾智的李工告訴記者,他們應(yīng)對變化的策略是輕運(yùn)營和“產(chǎn)品化”,著力研發(fā)加速AI落地速度的Pre-A.I.產(chǎn)品,并同時(shí)研發(fā)平臺(tái)技術(shù),做到“數(shù)據(jù)與流程分離架構(gòu)”。數(shù)據(jù)標(biāo)注本身不是他們的核心戰(zhàn)略。

          BasicFinder也有類似布局,他們希望一手對接垂直行業(yè)里的數(shù)據(jù)生產(chǎn)者,一手對接上游的算法模型公司,共同推進(jìn)AI的行業(yè)落地。

          但對數(shù)據(jù)標(biāo)注者個(gè)體來說,5年后,也許就不得不面臨再一次“失業(yè)”。到時(shí),他們還能跟隨時(shí)代的腳步騰挪轉(zhuǎn)移嗎?

          燙手的小袁

          小袁暫時(shí)想不到5年后那么長久的事。

          作為一名換過40份工作的聾啞人,他很慶幸,終于在“數(shù)據(jù)標(biāo)注”領(lǐng)域成了“有用的人”。

          小袁是京東眾智平臺(tái)上“靜公會(huì)”的聾啞人標(biāo)注員,這個(gè)公會(huì)全部由聽障人士組成。

          先后在餐廳、奶粉廠打工的小袁,總是因?yàn)闊o法避險(xiǎn)、難以溝通被辭退:“我是燙手的小袁,因?yàn)槲沂敲@啞人,所以我總是會(huì)燙到身邊的人,被扔出很遠(yuǎn)很遠(yuǎn)?!?/p>

          相比過去的工作,數(shù)據(jù)標(biāo)注的安全性更高,但也需要相互溝通。

          杜霖和殘疾人群體深入交流后發(fā)現(xiàn),聾啞人的世界里多為名詞、缺乏形容詞,比如要向他們解釋這根線標(biāo)得不“直”,就會(huì)比較費(fèi)勁。由于輸入信號會(huì)被擋掉一半,所以聾啞人接受速度只有健全人的三分之一到五分之一。健全人一周能搞定的培訓(xùn),聾啞人要花三周或更久。

          但是他們的優(yōu)點(diǎn)是專注、較勁兒、對視覺信號敏銳,數(shù)據(jù)標(biāo)注行業(yè)對他們來說是機(jī)會(huì)。

          齊工是京東眾智平臺(tái)的培訓(xùn)講師,幾乎每天都去給小袁和工友講課。齊工說,“想當(dāng)把英雄,承擔(dān)更多的責(zé)任?!?/p>

          第一次,他們在工作中找到了歸屬感。像小袁這樣的聾啞人在眾智平臺(tái)上還有一千多名,京東為他們成立專門的“靜公會(huì)”,項(xiàng)目上優(yōu)先照顧。全職每月有三四千收入,兼職每月有一千以上收入。

          杜霖手下也有三個(gè)殘疾人團(tuán)隊(duì),總共約80人。杜霖和京東負(fù)責(zé)人都表示,愿意為更多殘疾人提供工作機(jī)會(huì)。

          在數(shù)據(jù)標(biāo)注這份職業(yè)消失之前,這里是他們的家。其中的少數(shù)人,也許能通過轉(zhuǎn)型為數(shù)據(jù)質(zhì)檢者,獲得更長期的職業(yè)生涯。

          杜霖將公司取名為BasicFinder, 初衷是找到人工智能世界中最本真的一層關(guān)系——數(shù)據(jù)。新生代農(nóng)民工和聾啞人,投身于數(shù)據(jù)標(biāo)注這份工作中,也是希望找到最本真的生活。他們的要求很樸實(shí),用犇犇的話來講是:有一份穩(wěn)定的工作,有一個(gè)幸福的家庭。

          但科技的發(fā)展,必將帶來智能升級,也使整個(gè)行業(yè)更加規(guī)范化。

          這有點(diǎn)像武士的悖論:武士存在是為了消滅敵人,但是消滅了敵人武士也就失去了存在的理由,這個(gè)意義上,他們是在消滅自己。

          數(shù)據(jù)標(biāo)注者的工作是幫機(jī)器更好的學(xué)習(xí),促進(jìn)人工智能行業(yè)的發(fā)展,而當(dāng)行業(yè)發(fā)展到一定階段,可能將不再需要如此眾多的人工標(biāo)注。

          其實(shí)整個(gè)人工智能的發(fā)展歷程也有點(diǎn)像“孤獨(dú)的武士”:人類發(fā)明了機(jī)器,到頭來機(jī)器很可能取代大部分人工,甚至是“發(fā)明者”本人。

          但是,是武士,就必須去消滅敵人。對知識的無限追求既是人類的天賦也是人類的危險(xiǎn),它早已深藏于我們的基因之中,呼喚我們不斷逼近未知邊界。

          更高的智能一定會(huì)到來,認(rèn)知差距將取代財(cái)富差距成為最顯著的人群劃分標(biāo)準(zhǔn)——那可能是一種更無形的“折疊”。

          未來,當(dāng)我們真正享受智能帶來的各種便捷時(shí),歷史會(huì)遺忘這些人工智能領(lǐng)域的“首批工人”嗎?

          這可能是除了技術(shù)水平之外,判斷那個(gè)未來是好是壞的更重要的標(biāo)準(zhǔn)。


          延伸閱讀

          細(xì)分市場研究 可行性研究 商業(yè)計(jì)劃書 專項(xiàng)市場調(diào)研 兼并重組研究 IPO上市咨詢 產(chǎn)業(yè)園區(qū)規(guī)劃 十三五規(guī)劃

          中研網(wǎng) 中研網(wǎng) 發(fā)現(xiàn)資訊的價(jià)值 研究院 研究院 掌握產(chǎn)業(yè)最新情報(bào)        中研網(wǎng)是中國領(lǐng)先的綜合經(jīng)濟(jì)門戶,聚焦產(chǎn)業(yè)、科技、創(chuàng)新等研究領(lǐng)域,致力于為中高端人士提供最具權(quán)威性的產(chǎn)業(yè)資訊。每天對全球產(chǎn)業(yè)經(jīng)濟(jì)新聞進(jìn)行及時(shí)追蹤報(bào)道,并對熱點(diǎn)行業(yè)專題探討及深入評析。以獨(dú)到的專業(yè)視角,全力打造中國權(quán)威的經(jīng)濟(jì)研究、決策支持平臺(tái)! 廣告、內(nèi)容合作請點(diǎn)這里尋求合作

          推薦閱讀

          /UserFiles/image/20180224/20180224112127_3974.jpg

          外媒:在資助AI初創(chuàng)公司方面中國已超過美國

          據(jù)國外媒體報(bào)道,來自技術(shù)分析公司CB Insights報(bào)告顯示,該報(bào)告稱在資助AI初創(chuàng)公司方面中國已經(jīng)超過美國。2017年,中...

          /UserFiles/image/20180224/20180224111002_9323.jpg

          國內(nèi)設(shè)計(jì)師互動(dòng)平臺(tái)站酷完成1500萬美元B+輪融資

          國內(nèi)設(shè)計(jì)師互動(dòng)平臺(tái)站酷宣布完成1500萬美元B+輪戰(zhàn)略融資,投資方為美國上市公司Shutterstock。據(jù)了解,本輪融資將用S...

          /UserFiles/image/20180224/20180224105328_6454.jpg

          京東自主研發(fā)的全球首個(gè)智能物流終端首次公開亮相

          京東自主研發(fā)的全球首個(gè)智能物流終端——“無人智慧配送站”首次公開亮相,該終端可存儲(chǔ)至少28個(gè)貨箱,具有1個(gè)發(fā)貨箱1...

          /UserFiles/image/20180224/20180224105828_4315.jpg

          HTC欲加速各地區(qū)VR部門和手機(jī)部門合并

          曾經(jīng)在智能手機(jī)剛剛興起的時(shí)候,HTC作為最早關(guān)注這一領(lǐng)域的品牌有著出色表現(xiàn),旗下的產(chǎn)品憑借性價(jià)比和技術(shù)優(yōu)勢以及與A...

          /UserFiles/image/20180224/20180224104000_2311.jpg

          貝佐斯身家水漲船高 已領(lǐng)先蓋茨317億美元

          貝佐斯身家水漲船高 已領(lǐng)先蓋茨317億美元據(jù)國外媒體報(bào)道,由于亞馬遜股價(jià)在最近幾個(gè)交易日不斷創(chuàng)下新高,其CEO貝佐斯...

          /UserFiles/image/20180224/20180224104549_2821.jpg

          蘋果公司被評為全球最具創(chuàng)新力企業(yè)

          據(jù)外媒Macrumors報(bào)道,美國著名商業(yè)媒體周三發(fā)表了對蘋果公司首席執(zhí)行官蒂姆·庫克(Tim Cook)的采訪文章,i...

          猜您喜歡

          【版權(quán)及免責(zé)聲明】凡注明"轉(zhuǎn)載來源"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多的信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。中研網(wǎng)倡導(dǎo)尊重與保護(hù)知識產(chǎn)權(quán),如發(fā)現(xiàn)本站文章存在內(nèi)容、版權(quán)或其它問題,煩請聯(lián)系。 聯(lián)系方式:jsb@chinairn.com、0755-23619058,我們將及時(shí)溝通與處理。

          中研普華集團(tuán)聯(lián)系方式廣告服務(wù)版權(quán)聲明誠聘英才企業(yè)客戶意見反饋報(bào)告索引網(wǎng)站地圖 Copyright ? 1998-2020 ChinaIRN.COM All Rights Reserved.    版權(quán)所有 中國行業(yè)研究網(wǎng)(簡稱“中研網(wǎng)”)    粵ICP備18008601號

          研究報(bào)告

          中研網(wǎng)微信訂閱號微信掃一掃