亚洲一区激情国产日韩,色综合久久六月婷婷中文字幕,久久国产精品二国产精品,免费永久国产在线视频

          • 資訊
          • 報告
          當前位置:中研網(wǎng) > 結果頁

          AI+制造業(yè)賦能, 機器視覺開啟掘金新大陸

          AI+制造業(yè)賦能,META發(fā)布SAM助力機器視覺迎來GPT時刻。機器視覺技術使得工業(yè)設備能夠“看到”它正在進行的操作并進行快速決策,完整機器視覺系統(tǒng)由硬件+軟件組成,分別進行成像和圖像處理工作。目前,以“AI+人類感知”融合為代表的新興技術開始逐漸滲透至工業(yè)制造各

          機器視覺技術使得工業(yè)設備能夠“看到”它正在進行的操作并進行快速決策。根據(jù)美國制造工程師協(xié)會(SME)機器視覺分會和美國機器人工業(yè)協(xié)會(RIA)自動化視覺分會對機器視覺的定義:機器視覺是通過光學的裝置和非接觸的傳感器,自動接收和處理一個真實物體的圖像,以獲得所需信息或用于控制機器人運動的裝置。通俗地說,“眼睛”指的是機器視覺利用環(huán)境和物體對光的反射來獲取及感知信息;“大腦”指的是機器視覺對信息進行智能處理和分析,根據(jù)分析結果來執(zhí)行相應的活動。

          據(jù)億歐智庫所稱機器視覺是人工智能領域一個正在快速發(fā)展的分支,即用機器代替人眼來做測量和判斷,是通過光學的裝置和非接觸的傳感器,自動接收和處理真實物體的圖像,以獲得所需信息或用于控制機器人運動的裝置。機器視覺可以代替人眼在多種場景下實現(xiàn)多種功能,按功能主要分為四大類:檢測、測量、定位、識別。(1)檢測:指外觀檢測,其內涵種類繁多。如產(chǎn)品裝配后的完整性檢測、外觀缺陷檢測等。(2)測量:把獲取的圖像像素信息標定成常用的度量衡單位,然后在圖像中精確地計算出目標物體的幾何尺寸;(3)定位:獲得目標物體的位置,可以是二維或者是三位的位置信息。定位的精度和速度是定位功能的主要指標。在識別出物體的基礎上精確給出物體的坐標和角度信息,自動判斷物體位置;(4)識別:基于目標物進行甄別,包括外形、顏色、條碼等。

          人工智能是機器視覺的母身,深度學習為機器視覺的技術堡壘。近十年來,得益于深度學習等算法的突破、算力的不斷提升以及海量數(shù)據(jù)的持續(xù)積累,人工智能逐漸從實驗室走向產(chǎn)業(yè)實踐,以算法、算力和數(shù)據(jù)為主旋律追求極致創(chuàng)新方面不斷突破,為機器視覺實現(xiàn)更新迭代和提高應用價值的重要技術支撐。在人工智能領域的新興技術中,采用BurstDetection算法探測出深度學習是當前受到廣泛關注的人工智能新興技術,深度學習是一種以人工神經(jīng)為架構,對數(shù)據(jù)進行表征學習的算法,“深”主要體現(xiàn)在更深層次的神經(jīng)網(wǎng)絡和對特征的多次變換上,與相同參數(shù)數(shù)量的淺層網(wǎng)絡相比,深度網(wǎng)絡具備更好的特征提取和泛化推廣能力,不斷為圖像識別領域帶來進步。2007年-2009年,斯坦福教授李飛飛牽頭構建起目前圖像分類/檢測/定位最常用數(shù)據(jù)集之一的ImageNet,2010-2017年,基于ImageNet數(shù)據(jù)集的ILSVRC等一些大規(guī)模視覺識別挑戰(zhàn)賽促進神經(jīng)網(wǎng)絡和深度學習技術的發(fā)展,如AlexNet能夠將圖片識別的錯誤率下降14%,GoogleBrain采用多CPU組合方式構建起深層次神經(jīng)網(wǎng)絡并應用于圖像識別,取得突出成效等。

          機器視覺與人工智能逐漸融合,引領向工業(yè)4.0的過渡。機器視覺是工業(yè)自動化的基礎技術之一,通過搭載人工智能發(fā)展東風實現(xiàn)機器視覺的再一次迭代升級。此處東風一方面為深度學習的融合,賦予機器視覺更高的準確性和速度,另一方面則為視覺處理所服務的視覺處理器的能力呈現(xiàn)指數(shù)級增加,奠定機器視覺中深度學習推理/訓練任務的硬件基礎。復盤機器視覺發(fā)展,從能夠自動執(zhí)行簡單任務的自動化機器,轉型為視覺能力不受人類視覺能力極限約束、自主思考,從而能夠長期對各種元素進行優(yōu)化的自主型機器,AI+機器視覺有望能夠滲透入工業(yè)制造達到全新的水平。

          表:機器視覺與人工智能逐步融合

          未來機器視覺將有望搭載更先進AI技術,切入更多差異化工業(yè)應用場景。ChatGPT所引爆的人工智能話題正持續(xù)火熱,根據(jù)中國信息通信研究院和中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟,當前重點逐漸從單點技術轉化為實質應用轉化階段,而視覺人工智能已經(jīng)泛起千層巨浪。我們認為,搭載AI技術的機器視覺可以進一步優(yōu)化性能適配更多工業(yè)應用場景。一是深度學習為機器視覺延伸出多元的模型架構以及對應性能提升,如生成對抗網(wǎng)絡(GAN)能夠通過生成器和鑒別器的對抗訓練,在生成圖像方面的能力超過其他方法;注意力機制中的ViT則將Transformer架構直接應用到一系列圖像塊上進行分類任務,減少大量所需的預訓練資源,即用于在圖像處理方面;在人工智能算法的不斷訓練和學習下,圖像識別誤差不斷縮小,結合機器視覺設備在工業(yè)制造中能夠發(fā)揮優(yōu)異作用。二是AI技術可以對不同工程問題和工程參數(shù)進行建模,利用所采集的高質量數(shù)據(jù)進行模型的機器學習,模型與機械設備和生產(chǎn)現(xiàn)狀深度綁定,以此為基礎開發(fā)智能系統(tǒng),繼而產(chǎn)生即時可變的、可保持最優(yōu)化的生產(chǎn)參數(shù),最后交給基礎自動化執(zhí)行、實現(xiàn)機械化-自動化-數(shù)字化-智能化的全面升級。三是AI倒逼芯片算力持續(xù)提升,計算光學成為下一代機器視覺的突破口,依托算法的升級突破傳統(tǒng)光學成像器件,進一步縮小設備尺寸,挖掘多樣復雜的圖像信息,推動機器視覺技術在工業(yè)場景中的進一步普及。

          SegmentAnythingModel(SAM)項目是一個用于圖像分割的新任務、模型和數(shù)據(jù)集。在數(shù)據(jù)收集循環(huán)中使用高效模型構建了迄今為止最大的分割數(shù)據(jù)集,在1100萬張授權和尊重隱私的圖像上有超過11億個掩碼。該模型被設計和訓練為可提示的,因此它可以將零樣本遷移到新的圖像分布和任務。當該模型進行充分的網(wǎng)絡語料訓練后,發(fā)現(xiàn)其零樣本性能甚至優(yōu)于調整模型(Fine-tunedmodels)。

          SAM通過“提示學習”技術對新數(shù)據(jù)集和任務進行零樣本和少樣本學習。Meta研究者提出了promptable分割任務,目標是在給定任何分割提示時返回有效的分割掩碼。提示符只是指定要在圖像中分割的內容,例如,提示符可以包括識別對象的空間或文本信息。有效輸出掩碼的要求意味著,即使提示是模糊的,并且可能指向多個對象(例如,襯衫上的一個點可能表示襯衫或穿著它的人),輸出也應該是其中至少一個對象的合理掩碼。將提示分割任務作為預訓練目標,并通過提示工程解決一般的下游分割任務。

          SAM由一個的圖像編碼器、一個提示編碼器和一個預測分割掩碼的掩碼解碼器組成。通過將SAM分離為圖像編碼器和提示符快速編碼器/掩碼解碼器,相同的圖像嵌入可以在不同的提示符中重用(及其成本分攤)。給定圖像嵌入,提示編碼器和掩碼解碼器在web瀏覽器中從提示符預測掩碼的時間為50ms。重點關注點、框和掩碼提示,還用自由形式的文本提示呈現(xiàn)初步結果。為使SAM具有歧義性,設計了它來為單個提示預測多個面具,使SAM能夠自然地處理歧義,如襯衫和人的例子。

          SAM有望助力機器視覺發(fā)展,帶動AI+制造業(yè)垂直領域技術革新。SAM已經(jīng)學會了關于物體的一般概念,并且它可以為任何圖像或視頻中的任何物體生成掩膜,甚至包括在訓練過程中沒有遇到過的物體和圖像類型,無需額外的訓練。Meta預計,與專門為一組固定任務訓練的系統(tǒng)相比,基于prompt工程等技術的可組合系統(tǒng)設計將支持更廣泛的應用。SAM可以成為AR、VR、內容創(chuàng)建、科學領域和更通用AI系統(tǒng)的強大組件。比如SAM可以通過AR眼鏡識別日常物品,為用戶提供提示;SAM還有可能在農(nóng)業(yè)領域幫助農(nóng)民或者協(xié)助生物學家進行研究。

          人工智能持續(xù)放大機器視覺技術優(yōu)勢,有望在工業(yè)智改中大展身手。ChatGPT-4為超級人工智能描繪雛形,有望開啟新一輪生產(chǎn)力加速周期,制造業(yè)作為我國產(chǎn)業(yè)核心也將受益于AI的深度融合。與人眼相比,機器視覺在效率、精度、環(huán)境要求、安全性等各因素上都有明顯的優(yōu)勢。同時,在AI深度學習+機器視覺的升級趨勢下,將在工業(yè)自動化、數(shù)字化、柔性化、復雜性生產(chǎn)上貢獻更高的適配度。傳統(tǒng)的機器視覺技術需要將數(shù)據(jù)表示為一組特征,或輸入到預測模型,從而得出預測結果,這是完成制定動作,較難適應未來柔性化的生產(chǎn)需求,尤其是在缺陷類型復雜化、細微化、背景噪聲復雜等場景越來越難適用。搭載AI深度學習功能后,機器視覺將原始的數(shù)據(jù)特征通過多步的特征轉換得到一種更高層次、更抽象的特征表示,并進一步輸入到預測函數(shù)得到最終結果,基于深度學習的機器視覺在理想狀態(tài)下可以結合機器視覺的效率與人類視覺的靈活性,從而完成日趨復雜環(huán)境下的檢測,尤其是涉及偏差或極端環(huán)境,滿足更多下游對瑕疵精度、通用性的嚴苛要求。AI+機器視覺有望賦能制造業(yè),帶動制造業(yè)價值鏈重構。

          國家出臺多項政策利好AI+機器視覺行業(yè)發(fā)展。政策從拓展產(chǎn)業(yè)鏈應用場景、加強先進適用技術與設備研發(fā)以及發(fā)展機器視覺底層技術等方向促進中國機器視覺產(chǎn)業(yè)的發(fā)展,同時AI+機器視覺技術與設備在“十四五”規(guī)劃中受到高度重視,2021年底《十四五智能制造發(fā)展規(guī)劃》中重點強調高分辨率視覺傳感器等基礎零部件和裝置,體現(xiàn)國家對機器視覺產(chǎn)業(yè)的重視和支持,2022年的《十四五數(shù)字經(jīng)濟發(fā)展規(guī)劃》再次強調發(fā)展機器視覺等技術應用于我國智改計劃。良好的政策環(huán)境將在未來一定時期內為國內相關行業(yè)持續(xù)發(fā)展與突破奠定良好的環(huán)境基礎。

          中研網(wǎng)公眾號

          關注公眾號

          免費獲取更多報告節(jié)選

          免費咨詢行業(yè)專家

          延伸閱讀

          推薦閱讀

          AI+電力場景逐步明晰

          2023年3月31號,國家能源局發(fā)布《關于加快推進能源數(shù)字化智能化發(fā)展的若干意見》,針對電力、煤炭、油氣等行業(yè)數(shù)字化5...

          AI +開啟半導體新周期

          根據(jù)SIA的數(shù)據(jù),2023年2月全球半導體銷售額為396.8億美元,同比減少20.7%,環(huán)比減少4.0%,同比增速較上月下降2.2pct...

          中國生態(tài)修復行業(yè)政策及投資前景預測

          生態(tài)修復(ecological remediation)是在生態(tài)學原理指導下,以生物修復為基礎,結合各種物理修復、化學修復以及工程4...

          牛蛙養(yǎng)殖市場前景及發(fā)展趨勢分析2023

          近年來,牛蛙已成為我國水產(chǎn)養(yǎng)殖重要的名特水產(chǎn)品之一,是繼小龍蝦之后下一個千億元產(chǎn)值的網(wǎng)紅水產(chǎn)品。牛蛙屬于高密度...

          納豆行業(yè)前景及現(xiàn)狀分析2023

          目前,納豆行業(yè)受到家長和政府的高度關注,經(jīng)濟發(fā)展的加快也促進了發(fā)展速度的加快。納豆行業(yè)是中國嬰幼兒健康營養(yǎng)領域...

          紅提市場前景及發(fā)展趨勢分析2023

          與普通葡萄相比,紅提在口感和營養(yǎng)上都會更好,可以直接帶皮食用。它有很多甜汁,可以延緩衰老,對保護人體健康具有積...

          猜您喜歡

          【版權及免責聲明】凡注明"轉載來源"的作品,均轉載自其它媒體,轉載目的在于傳遞更多的信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。中研網(wǎng)倡導尊重與保護知識產(chǎn)權,如發(fā)現(xiàn)本站文章存在內容、版權或其它問題,煩請聯(lián)系。聯(lián)系方式:jsb@chinairn.com、0755-23619058,我們將及時溝通與處理。

          中研普華集團聯(lián)系方式廣告服務版權聲明誠聘英才企業(yè)客戶意見反饋報告索引網(wǎng)站地圖 Copyright ? 1998-2023 ChinaIRN.COM All Rights Reserved.    版權所有 中國行業(yè)研究網(wǎng)(簡稱“中研網(wǎng)”)    粵ICP備05036522號

          研究報告

          中研網(wǎng)微信訂閱號微信掃一掃