伴隨著5G、大數據、人工智能、物聯網等技術的飛速發展,各行各業的業務場景日益復雜,數據呈現出大規模、多樣性的特點,特別是非結構化數據呈現出爆發式的增長態勢。企業對數據庫技術的需求不再局限于結構化的OLTP數據交易,而是需要進一步擴展到對多樣化數據進行實時處理的場景。傳統的數據湖在事務一致性及實時處理方面有所欠缺,而數據倉庫也無法應對高并發、多數據類型的處理,因此,支持事務一致性、提供高并發實時處理及分析能力的湖倉一體架構應運而生。湖倉一體架構在成本、靈活性、統一數據存儲、多元數據分析等多方面具備優勢,正逐步轉化為下一代數據管理系統的核心競爭力。
湖倉一體是一種新型的開放式架構,打通了數據倉庫和數據湖,將數據倉庫的高性能及管理能力與數據湖的靈活性融合了起來,底層支持多種數據類型并存,能實現數據間的相互共享,上層可以通過統一封裝的接口進行訪問,可同時支持實時查詢和分析,為企業進行數據治理帶來了更多的便利性。湖倉一體可在數據入湖后原地進行數據處理與分析,能有效避免數據冗余及流動導致的算力、網絡及成本開銷,可以作為超大型ODS存儲貼源數據,實現全量數據的實時處理。
湖倉一體架構在數據管理中主要具有以下幾大關鍵特征:
一是支持分析多種類型數據。 湖倉一體架構可為多應用程序提供數據的入庫、轉換、分析和訪問。數據類型包括結構化與非結構化類型,如文本、圖像、視頻、音頻等,以及半結構化數據,如JSON等。
二是數據可治理,避免產生數據沼澤。 湖倉一體架構可以支持各類數據模型的實現和轉變,支持DW模式架構,例如星型模型、雪花模型等,可保證數據的完整性,同時具有健全的治理和審計機制,能夠避免數據沼澤現象的出現。
三是事務支持。 在企業中,數據庫往往要為業務系統提供并發的數據讀取和寫入。湖倉一體架構對事務ACID的支持,可確保并發訪問,尤其是SQL訪問模式下的數據一致性、正確性。
四是BI支持。 湖倉一體支持直接在源數據上使用BI工具,這樣可以提高分析效率,降低數據延時。另外,相比于在數據湖和數據倉庫中分別操作兩個副本的方式,湖倉一體更具成本優勢。
五是存算分離。 湖倉一體采用存算分離架構,可使系統能夠擴展到更大規模的并發能力和數據容量,能滿足新時代對于分布式數據架構的要求。
六是開放性。 湖倉一體采用開放、標準化的存儲格式(例如行存、列存、塊存),能提供豐富的API支持。因此,各種工具和引擎(包括機器學習和Python/R庫)可以高效地對數據進行直接訪問。
從落地性來看,湖倉一體技術架構落地目前有三種方式:
第一個融合方向是基于Hadoop體系的數據湖向數據倉庫能力擴展,湖中建倉,從數據湖進化到湖倉一體。湖倉一體結合了數據湖和數據倉庫特點,直接在用于數據湖的低成本存儲上實現與數據倉庫中類似的數據結構和數據管理功能。目前主要有Netflix等開源企業在探索此技術路線。
第二個是基于自身云平臺或第三方對象存儲(如OSS、S3、Ceph等),基于Hadoop或自研技術進行湖倉一體能力的搭建。探索此技術路線的通常是各大云廠商,如AWS、阿里云、華為云等。
第三個融合方向是以數據庫技術為基礎,自研分布式平臺,從調度、計算到存儲不依賴第三方平臺,形成可以靈活在公有云、私有云、裸金屬等場景獨立部署使用的能力。技術方向上更注重于實時高并發場景及非結構化數據數據治理,并逐步向更廣泛的分析場景發展,主要廠商以Snowflakes、Databricks、巨杉數據庫等為代表。
三個技術方向均是廠商依托自身技術優勢進行的架構融合,均有自身優劣勢及技術特性,能夠滿足不同場景下的客戶需求。
同時,本報告指出了湖倉一體架構未來的發展趨勢:一是隨著企業對海量大數據的實時處理需求越來越迫切,湖倉一體架構將成為越來越多用戶的主流選擇,助力各行各業數字化轉型;二是以人為軸的數據開發和優化,將越來越難以滿足企業實際需求,屆時人工智能技術將介入數據庫的自動調優、自動整理過程,助力提升湖倉一體架構的智能化。
在報告的最后,賽迪顧問對用戶和廠商提出了一些發展建議。對用戶而言,要重視專業化服務能力和成功案例的可移植性,選擇適合自身情況的數據管理產品。對廠商而言,要重視研發投入,加快產品與新興技術融合,同時不斷提高專業化服務水平,重視實施與交付能力的提升。
關于巨杉數據庫
在此次報告中,巨杉數據庫作為湖倉一體典型廠商入選?;诤}一體的架構特性,巨杉數據庫可構建數據基礎設施平臺,整合結構化、半結構化、非結構化數據的統一存儲與管理,為面向全量數據業務提供:SQL、NoSQL、Object等多種接口。此外,通過特有的跨引擎事務能力,可以有效簡化多團隊開發流程中對不同引擎、不同結構的數據管理,打通ACID事務支持,提升業務開發、數據處理、運維管理能力,釋放全量數據價值,提升企業數據處理的“人效”及“能效”。目前,巨杉數據庫已經在超過100家金融銀行客戶規?;暇€使用,全面覆蓋國有銀行、股份制銀行、省級農信、城商行、保險、證券等金融客戶。
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
5月17日,IOTE?2023國際物聯網展·上海站,在上海世博展覽館如期開幕,這場物聯網行業盛宴匯聚來自全球超350+家行業企業參展。廈門星縱物聯科技有限公司(以下簡稱“星縱物聯”)作為專業的數字感知產品提供商,攜公司全系列產品及多個行業產品解決方案,亮相3號館3C30展位,開展2日來,吸引了諸多合
近日,2022“物聯之星”物聯網行業年度榜單的結果正式公布!青云科技(qingcloud.com,股票代碼:688316)憑借著卓越的產品和應用,脫穎而出,在眾多優秀企業中名列中國物聯網企業投資價值50強?!拔锫撝恰痹u選活動始于2007年,歷經15個年頭的發展和沉淀,是中國物聯網行業規格隆重、影響
2023年5月17日-19日,IOTE?2023國際物聯網展·上海站將在上海世博展覽館盛大開幕。星縱物聯受邀參展,屆時將亮相3號館3C30展位。星縱物聯展位圖作為專業的數字感知產品提供商,星縱物聯以前沿視角洞悉行業未來發展,并在物聯網領域持續深耕多年。展會期間,星縱物聯全系列產品將亮相展臺,從感知層
中國經濟周刊-經濟網訊(記者宋杰)4月27日,第六屆數字中國建設峰會在福州開幕,同期舉行的還有數字中國建設成果展覽會,本屆峰會以“加快數字中國建設,推進中國式現代化”為主題,集中展示數字中國建設最新成果和優秀實踐案例,分享發展經驗。其中,作為央企中國電科集團旗下的數據庫國家隊,人大金倉今年展出面積從
隨著全球物聯網、大數據、人工智能等新技術的發展,“智慧園區”建設已成為發展趨勢,全球產業園區逐漸向著智慧化、創新化、科技化轉變?;谏罡锫摼W行業的豐富經驗和對智能化場景應用的長期洞察,4月20日,由廈門星縱物聯科技有限公司主辦,博銳尚格科技股份有限公司、北京目視科技有限公司、北京思諾文通訊技術有限
把脈中國數據智能化
2023年,幾乎可以被定義為中國互聯網公司的“大模型元年”。ChatGPT的全球爆紅,徹底點燃國內的大模型賽道,曾經的“創業英雄”、如今的商業領袖們親自下場,接連發布生成式人工智能產品與大模型布局。大模型火了,沉寂許久的互聯網行業又有了新的“戰事”。同時,大模型的快速發展也改變了云市場的現狀,企業對
近日,數字化市場研究咨詢機構愛分析發布了《2022愛分析·數據智能廠商全景報告》,愛分析從技術研發能力、服務客戶數量、收入規模等維度對廠商進行了全面專業的評估
2022年11月18日,首個國家級大數據產業創新賽事——2022第一屆中國大數據大賽圓滿落幕。工業和信息化部信息技術發展司數字經濟推進處處長張建倫,中國電子技術標準化研究院副院長孫文龍出席頒獎典禮并致辭
2022年11月17日,在廈門市工業和信息化局的指導下,以“數據確權”為主題的2022數據資產(廈門)論壇在廈門成功舉辦。本次論壇以“數據確權”為主題,由廈門市互聯網域名應用服務產業協會和構信網(公信.中國)聯合主辦
近日,國內知名數字化市場研究咨詢機構愛分析正式發布《2022愛分析·信創廠商全景報告》(以下簡稱“報告”)。報告綜合考慮企業關注度、行業落地進展等因素,遴選出在信創市場中具備成熟解決方案和落地能力的廠商。
10月31日下午,由數博會執委會主辦、數據觀(北京)傳媒科技有限公司承辦、貴陽大數據交易所協辦的第四期數博思享會“實踐先行觀公共數據價值與應用”活動成功舉辦。
近日,由中國國際數字經濟博覽會組委會主辦,中國電子技術標準化研究院、河北省工業和信息化廳承辦的“第一屆中國大數據大賽”(簡稱大數據大賽)正式啟動。
廣州光點信息科技有限公司自主研發的數據中臺產品GI大數據中臺V2.0產品是國內率先推出符合新創標準的中臺產品,基于“大數據+AI”等技術全新打造,集數據采集、融合、治理、服務、管理為一體的旗艦平臺。
廣州光點信息科技有限公司自主研發的數據中臺產品GI大數據中臺V2.0產品是國內率先推出符合新創標準的中臺產品,基于“大數據+AI”等技術全新打造,集數據采集、融合、治理、服務、管理為一體的旗艦平臺