政府部門、BAT為代表的互聯網企業、運營商是當前中國大數據的主要擁有者。除此之外,利用網絡爬蟲或公開應用程序接口API等途徑對網絡數據進行采集也是一大重要來源。在大數據時代,擁有數據就擁了核心資源:工業時代,石油是最大的巨頭,數據時代,BAT等因為擁有最多、最全的搜索、電商和社交數據,也成為絕對的王者。此外,一些在細分領域擁有入口資源的公司也是稀缺標的,如已發布位置大數據平臺的四維圖新等。
其中,數據存儲是產業鏈的支撐,參與者以傳統數據庫企業為主,國際上有IBM、Oracle、Intel、Green-plum等;國內主要有華為、中興、同有、浪潮、中科曙光等,各家企業針對大數據應用的具體領域開展數據庫架構和數據組織管理研究,形成各自的優勢產品。數據安全是產業發展的重要保障,滲透數據存儲、傳輸、交互的各個環節,主要參與方包括賽門鐵克、360、啟明星辰、綠盟科技、美亞柏科等。而產業鏈最核心的當屬數據分析與挖掘,其能力直接決定著大數據應用的推廣程度和范圍。數據分析一是從大量的結構化、半結構化、非結構化數據中分析出計算機可以理解的語義信息或知識,二是對隱性的知識,如關聯情況、意圖等進行挖掘。當前Hadoop、Spark是使用較為廣泛的兩種開源處理框架,算法層面除分類、聚類、關聯規則挖掘、序列模式挖掘等常用方法外,神經網絡算法受益人工智能關注度再次高漲,國際上主要參與者包括谷歌、亞馬遜、Facebook、IBM、甲骨文、微軟等,國內主要包括海康威視、科大訊飛、BAT、網易、智慧星光、思必馳等。
應用為王,對大數據分析結果進行應用是完成產業商業化目標,實現價值的終點。經過近幾年的發展,大數據應用已滲透政府、電信、金融、人力資源、醫療、物流、等多個行業。分析認為應用市場的成熟程度與數據的完備性息息相關,當前,政府、BAT、運營商是數據源的主要擁有者,因此為這些領域服務的數據應用廠商擁有部分先天優勢,對比市場空間、政策傾向及惠及民生等方面,目前市場更為看好政務大數據及醫療大數據市場。而從產品形態看,整體解決方案商掌握多元技術、跨場景服務能力強、可解決客戶的綜合性需求,因此更容易樹立標桿案例,燈塔效應明顯。
大數據時代對企業的存儲架構、數據中心的基礎設施等提出了挑戰,為了更快、更好、更準確地按需存儲數據,需要企業提高存儲性能和計算能力,這些潛在需求的存在為存儲器和服務器等硬件提供商提供了一個不錯的發展機會。但是,由于國際巨頭在存儲和服務器市場壟斷優勢明顯,中國本土企業很難獲得較大的市場機會。
雖然近幾年,在傳統數據庫軟件市場,國產數據庫比重持續提升,但Oracle、IBM、Microsoft和Sybase依然牢牢占據國內數據庫軟件市場的前四位,擁有超過90%的市場份額。而大數據時代的數據庫軟件將更多是基于新一代的Nosql架構,中國企業無論是技術積累還是市場開拓離國際企業仍有較大差距。因此,短期內不看好中國企業在基礎軟件層的投資機會。