別只盯著“四小龍”,CV的市場格局正在悄悄改變
原創(chuàng) 一蓑煙雨 | 2023-09-20 20:27
【數(shù)據(jù)猿導讀】 四小龍所遇到的困境,某種程度上是計算機視覺這個賽道本身面臨一些商業(yè)落地的挑戰(zhàn)。又或者,計算機視覺領域本身在進行結構化的變動。我們關注到一個不那么知名的計算機視覺廠商——格靈深瞳,從其最新的財報來看,雖然整體體量還不如商湯、曠視,但其發(fā)展態(tài)勢比較好。接下來,我們來深入...

在計算機視覺領域,比較知名的是商湯、曠視、云從、依圖這“四小龍”,他們不僅知名度更高,收入水平和估值也更高。從最新的財報來看,這四小龍都不同程度陷入了困境,收入增長乏力,巨額虧損看不到扭轉的態(tài)勢。
四小龍所遇到的困境,某種程度上是計算機視覺這個賽道本身面臨一些商業(yè)落地的挑戰(zhàn)。又或者,計算機視覺領域本身在進行結構化的變動。
我們關注到一個不那么知名的計算機視覺廠商——格靈深瞳,從其最新的財報來看,雖然整體體量還不如商湯、曠視,但其發(fā)展態(tài)勢比較好。接下來,我們來深入分析一下這個公司,看看它有什么不同。
收入穩(wěn)步增長,初步盈利
近幾年,格林深瞳的收入在持續(xù)增長,而且增速還不錯。在一些創(chuàng)新型領域,持續(xù)、穩(wěn)定的收入增長始終是最重要的。高收入增長、高研發(fā)投入、高營銷費用,是企業(yè)業(yè)務規(guī)模擴張階段典型“三高”特征。在這個前提下,適當?shù)奶潛p是可以忍受的。當然,特別夸張的巨額虧損,甚至引發(fā)現(xiàn)金流危機,那也存在嚴重的問題。
2023年上半年,格林深瞳收入1.57億,同比增長34.35%,凈利潤193.8萬元,同比增長115.28%。作為對比,2023年上半年,商湯科技收入14.33億元,同比增長1.26%,虧損31.23億元;云從科技收入1.64億元,同比下降58.16%,虧損3.15億元。
格林深瞳收入情況
雖然跟商湯、曠視相比,格林深瞳的收入體量還小很多,但目前其發(fā)展態(tài)勢較好。并且,格靈深瞳已經(jīng)扭虧為盈了。無論是凈利潤,還是銷售凈利潤,都得到了顯著的改善。這個態(tài)勢如果能夠持續(xù)下去,格林深瞳將能實現(xiàn)穩(wěn)定盈利,這對于計算機視覺企業(yè)而言意義重大。此外,格林深瞳近兩年的銷售毛利率也在穩(wěn)步改善,這是一個不錯的信號。
格林深瞳利潤情況
我們從成本結構上,發(fā)現(xiàn)一個有意思的現(xiàn)象,格林深瞳在整體業(yè)務規(guī)模增長的同時,其銷售和管理費用還降低了。尤其是管理費用,同比下降了18.79%,說明其經(jīng)營效率得到提升。
但另一方面,一般而言,銷售費用、管理費用會隨著公司業(yè)務規(guī)模的擴張而擴張,降本增效有一定的限度,比如明年格靈深瞳的各項費用再壓縮的空間就比較有限。公司的成長,核心還是在于收入規(guī)模的持續(xù)擴張。
格林深瞳成本結構
以視覺產(chǎn)品為核心,布局四個行業(yè)應用
那么,是什么因素在驅動格林深瞳的成長呢?為了弄清楚這個問題,我們需要深入其業(yè)務結構來看。
從技術產(chǎn)品架構上,格靈深瞳底層是“深瞳大腦”,涵蓋數(shù)據(jù)平臺(數(shù)據(jù)采集、治理、標準)和訓練平臺(模型訓練、優(yōu)選擇、管理),在此基礎上不斷優(yōu)化其各項技術。這些技術的核心就是對應的算法模型,包括3D立體視覺、機器人感知與控制、大規(guī)??缇匙粉櫟?。
再往上,就是格靈深瞳面向客戶的三個標準化產(chǎn)品,分別是智源智能前段產(chǎn)品、靈犀數(shù)據(jù)智能平臺、深瞳行業(yè)應用平臺,在三個標準化產(chǎn)品基礎上可以構建面向不同行業(yè)客戶的解決方案。目前,其主要應用在金融、城市管理、商業(yè)零售、軌道交通四個領域。
格林深瞳技術產(chǎn)品體系
拆解格林深瞳的收入與成本結構,其收入1.57億元,主要來自于人工智能產(chǎn)品,其次是技術服務。成本結構中,營業(yè)成本(主要是零部件采購)5973萬,毛利近1億元。各項營業(yè)費用近1億元,其中研發(fā)費用7700萬元,其次是銷售費用2860萬元,以及管理費用1697萬元。
格林深瞳收入拆解
格靈深瞳要進一步提升利潤空間,需要壓縮營業(yè)成本占比,這需要其優(yōu)化供應鏈,提升議價能力,同時可以通過自研部分核心零部件來降低采購費用;此外,銷售和管理費用方面,可以通過降本增效來進一步壓縮費用,但其改進空間已經(jīng)不大。研發(fā)費用是格靈深瞳成本的重要部分,需要提升研發(fā)效率,提升單位投入的產(chǎn)出。
決定格靈深瞳未來發(fā)展的三個關鍵問題
以上是格林深瞳的基本業(yè)務情況。接下來,我們就三個關鍵問題進行更深入的探討。
1、該3D視覺登場了?
在眾多計算機視覺技術提供商中,格靈深瞳憑借其對3D視覺的堅定押注而脫穎而出。盡管在前幾年,3D視覺技術尚未得到廣泛應用,但其潛力巨大。之所以3D視覺在初期沒有成為主流,很大程度上是因為其對數(shù)據(jù)處理和計算要求較高,同時需要更先進的芯片和硬件支持,導致成本相對較高。同時,早期的3D視覺算法模型也不夠成熟。
然而,與2D視覺相比,3D視覺有著無可比擬的優(yōu)勢。首先,3D視覺能夠為物體提供深度信息,幫助實現(xiàn)準確的物體定位和識別。其次,它能夠捕獲真實世界中的物體結構,從而更準確地對物體進行建模和分析。此外,3D視覺還能提供更為豐富的空間信息,幫助進行更為復雜的場景理解和導航。
隨著芯片技術的快速進步和軟件算法的持續(xù)優(yōu)化,3D視覺技術越來越受到關注。其應用場景也從單一的領域擴展到各個行業(yè)中。例如,自動駕駛領域中,3D視覺可以幫助汽車更好地理解路況,預測行人和其他車輛的行動。在醫(yī)療領域,3D視覺能夠為醫(yī)生提供更為真實的人體結構圖,幫助他們進行準確的手術。此外,3D視覺還在建筑、娛樂、零售等眾多領域中得到應用。
某種程度上,計算機視覺領域正在經(jīng)歷一個從2D升維到3D的技術和產(chǎn)業(yè)變革。隨著技術的進步和市場的成熟,3D視覺已逐漸從一個前沿技術發(fā)展為一個廣泛應用的解決方案。這種情況下,格靈深瞳前期在3D視覺領域的積累,有望讓其在這個市場階段取得競爭優(yōu)勢。
2、布局大模型,但投入不足
在格靈深瞳的財報中,有一些涉及到大模型的零星描述。例如,其深瞳大腦可支持幾十億參數(shù)規(guī)模的模型訓練;基于 Transformer 的多層特征投票機制提升正確匹配點云比例,提升點云配準精度。目前,格靈深瞳也在研發(fā)圖像預訓練大模型,用于視頻分類、圖片分類、少樣本檢測模型、少樣本事件任務等場景中。
目前情況來看,大模型還不是格靈深瞳的研發(fā)重點,而且其研發(fā)團隊總共300余人,年研發(fā)投入才1億多元,還不足以支撐其在大模型領域的前沿技術探索。
筆者在《中國CV軍團,危矣?! 》一文中提到過,大模型是深度學習的進化形態(tài)。目前,大模型的成果主要在自然語言領域,明星產(chǎn)品就是ChatGPT。從技術原理上來看,應該也有計算機視覺領域的大模型。并且,結合NLP和計算機視覺技術,是構建多模態(tài)大模型的一個重要方向。
但是,要實現(xiàn)這個目標,還有很多技術難題需要解決。Transformer是專門針對自然語言領域的,是否能基于Transformer來構建計算機視覺領域的千億級參數(shù)規(guī)模的大模型,還是一個未知數(shù)。要構建這樣的計算機視覺大模型,很可能需要對底層的Transformer架構進行改造,甚至研發(fā)出完全不同的基礎架構。
當然,如果某個計算機視覺廠商能夠解決這些問題,首先推出千億、萬億級參數(shù)規(guī)模的CV大模型,在技術性能和應用效果上實現(xiàn)質的飛躍,那對行業(yè)所帶來的震撼絕對不亞于ChatGPT。
從目前情況來看,國內(nèi)也有幾家計算機視覺廠商在推出大模型產(chǎn)品,但是他們的思路基本都停留在模仿、跟隨ChatGPT的階段,基于Transformer來推出一些幾百億甚至只有幾十億參數(shù)規(guī)模的大模型,毫無新意可言,注定在市場上激不起浪花。
3、安防,是計算機視覺最大的應用場景
最后,我們來從應用場景角度來探討一下計算機視覺賽道的未來發(fā)展前景。
筆者一直認為,安防是計算機視覺最大的一個應用市場。但要激活這個市場,有一個前提,就是安防攝像頭的智能化。
現(xiàn)在的安防系統(tǒng),攝像頭的核心功能就是視頻錄入,然后將視頻傳輸?shù)胶笈_進行存儲和分析。視頻數(shù)據(jù)尤其是高清攝像頭產(chǎn)生的視頻數(shù)據(jù),往往數(shù)據(jù)量龐大,如果視頻數(shù)據(jù)都要傳輸?shù)胶笈_才能進行分析,那數(shù)據(jù)傳輸和存儲的壓力就會非常大。
如果換一個思路,前端的攝像頭就具備很強的視頻分析處理能力,大部分的視頻分析需求直接在攝像頭終端就滿足了,只有需要涉及到大數(shù)據(jù)分析的需求需要后臺來處理,這樣就將極大降低數(shù)據(jù)的傳輸和處理壓力。
舉一個例子,如果一個城市下發(fā)了某個犯罪嫌疑人的通緝令,那把數(shù)據(jù)傳輸?shù)胶蠖?,然后向全城的攝像頭終端下發(fā)識別命令。只要該人出現(xiàn)在某個攝像頭的視野范圍內(nèi),攝像頭本身就能夠完成識別、比對、驗證功能,鎖定犯罪嫌疑人,然后立馬把地址、對應的視頻數(shù)據(jù)傳輸?shù)胶笈_。多個攝像頭之間,還可以自動形成局域網(wǎng),分析出該犯罪嫌疑人的行動軌跡,并預測其下一步的行動方向,提前啟動預測區(qū)域內(nèi)的攝像頭。這樣一來,整個系統(tǒng)的效率將得到極大提升,而數(shù)據(jù)傳輸、存儲的成本卻顯著降低了。
再來看另一個場景,在城市街頭發(fā)生了一場車禍,交通攝像頭通過行為、場景識別算法,立馬識別這是一場交通事故,然后將信息上報交通管理后臺,并同步給公安系統(tǒng),攝像頭還可以自動調(diào)整角度、焦距來對該事故現(xiàn)場進行清晰的錄像,固定現(xiàn)場信息,作為后期事故處理的關鍵證據(jù)。相比于現(xiàn)在的交通事故處理方式(事故相關人員打電話報警,等待交警來處理),這一全新的方式效率更高,為交通事故的處理、急救爭取了寶貴的時間,而且事故責任劃分更加清晰,避免了后期的法律糾紛。
要實現(xiàn)上面兩個例子中的場景,就必須要攝像頭實現(xiàn)真正的智能化,能夠具備識別、數(shù)據(jù)處理能力,一方面需要攝像頭內(nèi)置具有很強計算性能的芯片,另一方面還需要內(nèi)嵌強大的識別、數(shù)據(jù)分析算法模型。同時,要通過技術創(chuàng)新和規(guī)?;慨a(chǎn),來降低智能攝像頭的成本,只有成本足夠低,才能實現(xiàn)規(guī)模化商用。
很顯然,無論是硬件設備還是軟件算法,目前的計算機視覺技術產(chǎn)品都很難達到智能攝像頭的要求。但正因為困難,才更有價值。試想一下,如果哪個計算機視覺廠商能夠解決這些技術挑戰(zhàn),推出價格低廉、性能強大的智能攝像頭,那將重構整個智能安防市場,其發(fā)展?jié)摿ψ匀徊豢上蘖俊?/p>
某種程度上,一個企業(yè)的價值來源于其能夠解決的市場問題和滿足的市場需求。解決的問題越困難,滿足的市場需求越大,企業(yè)所能創(chuàng)造的價值也越大,其競爭壁壘也越高。
來源:數(shù)智猿