(資料圖)
天風證券(601162)發布研究報告稱,Meta發布SAM智能摳圖,可以用于識別圖像和視頻中的物體,甚至是人工智能從未被訓練過的物品。利用類NLP技術路線,完成CV底層技術突破,并且具有廣泛的通用性。SAM作為開源且更通用AI系統的強大組件,賦能工業、煤礦、電力、自動駕駛、安防監控等多場景。關注視覺領域技術型公司、多模態公司,此外,關注煤礦、電力、自動駕駛等工業應用類公司。
投資建議:關注視覺領域技術型公司、多模態公司:關注虹軟科技(688088)(688088.SH)、當虹科技(688039.SH)、萬興科技(300624)(300624.SZ)、千方科技(002373)(002373.SZ)、佳都科技(600728)(600728.SH)等;關注煤礦、電力、自動駕駛等工業應用類公司:關注云鼎科技(000409.SZ)、智洋創新(688191.SH)、北路智控(301195.SZ)、梅安森(300275)(300275.SZ)等。
天風證券主要觀點如下:
Meta發布SAM智能摳圖,CV領域或迎來顛覆式技術創新
Meta研究部門發布了一篇名為其“SegmentAnything”的論文,文中介紹了一個全新的SegmentAnythingModel(SAM),可以用于識別圖像和視頻中的物體,甚至是人工智能從未被訓練過的物品。利用類NLP技術路線,完成CV底層技術突破,并且具有廣泛的通用性,足以涵蓋各種用例,不需額外訓練就可開箱即用地用于新的圖像領域,并具備零樣本遷移的能力。
Meta同時發布了迄今為止最大的分割數據集SA-1B,由1100萬張圖像及11億個掩碼組成
該數據集由1100萬張多樣化、高分辨率、保護隱私的圖像,以及11億個高質量分割掩碼組成。SAM模型收集新的分割掩碼速度較以往任何時候都要快,交互式標注一個掩碼只需要大約14秒。與以前的大規模分割數據收集工作相比,SAM模型比COCO完全手動的基于多邊形的掩碼標注快6.5倍,比以前最大的數據標注工作快2倍。此外,SA-1B比任何現有的分割數據集多出400倍的掩碼。并且通過研究證實,這些掩碼具有高質量和多樣性。
SAM作為開源且更通用AI系統的強大組件,賦能工業、煤礦、電力、自動駕駛、安防監控等多場景
與專門為一組固定任務訓練的系統相比,基于prompt工程等技術的可組合系統設計將支持更廣泛的應用,可以預計,在未來,在任何需要在圖像中查找和分割對象的應用中,都有SAM的用武之地。SAM可以成為AR、VR、內容創建、科學領域和更通用AI系統的強大組件。
風險提示:CV技術發展不及預期;應用落地不及預期;國內技術跟進不及預期;行業競爭加劇。
關鍵詞: