Quick BI產(chǎn)品核心功能大圖(四) Quick引擎加速:十億數(shù)據(jù)亞秒級分析
敖達(dá) | 2021-11-23 14:51
【數(shù)據(jù)猿導(dǎo)讀】 Quick BI產(chǎn)品是在阿里云飛天操作系統(tǒng)上打造的云BI軟件,支持SAAS模式和私有化部署,定位多場景、多端、多行業(yè)的消費式BI,本篇為大家詳細(xì)介紹產(chǎn)品內(nèi)核Quick引擎。

隨著數(shù)字化進(jìn)程的深入,數(shù)據(jù)應(yīng)用的價值被越來越多的企業(yè)所重視?;跀?shù)據(jù)進(jìn)行決策分析是應(yīng)用價值體現(xiàn)的重要場景,不同行業(yè)和體量的公司廣泛依賴BI產(chǎn)品制作報表、儀表板和數(shù)據(jù)門戶,以此進(jìn)行決策分析。
在利用BI產(chǎn)品進(jìn)行數(shù)據(jù)分析過程中,數(shù)據(jù)處理“慢”會為業(yè)務(wù)帶來很多的困擾,可以想象一下:
給老板看的報表加載展示非常慢,有的時候還會崩潰,本想做好向上匯報,但卻給老板帶來了糟糕的體驗~
分析師或業(yè)務(wù)同學(xué),做數(shù)據(jù)探索式分析,拖拽一個指標(biāo)需要幾分鐘才能看到結(jié)果,嚴(yán)重影響工作效率,打斷分析思路~
“慢”雖然只是一種難以精確定義的體感,但想要解決以上問題,就需要BI產(chǎn)品擁有很強(qiáng)的大數(shù)據(jù)處理架構(gòu)和能力,可以橫向擴(kuò)展支持不斷增長的數(shù)據(jù)量和計算任務(wù)。
Quick BI:阿里云飛天操作系統(tǒng)上的云BI
Quick BI產(chǎn)品是在阿里云飛天操作系統(tǒng)上打造的云BI軟件,支持SAAS模式和私有化部署,定位多場景、多端、多行業(yè)的消費式BI,本篇為大家詳細(xì)介紹產(chǎn)品內(nèi)核Quick引擎。
Quick BI基于阿里云橫向可擴(kuò)展的架構(gòu)底座,不但擁有可視化分析、中國式報表、自助分析等傳統(tǒng)BI能力,同時擁有企業(yè)級安全底座、移動端和三方系統(tǒng)開放集成能力。
Quick BI構(gòu)建了自己的計算內(nèi)核Quick引擎,托管在阿里云上的SAAS服務(wù)實測數(shù)據(jù)十億級數(shù)據(jù)在0.5秒以內(nèi)完成聚合分析,另外由于依托阿里云,計算資源支持橫向擴(kuò)展,通過增加服務(wù)器還可以提供更強(qiáng)大的數(shù)據(jù)分析計算能力。
Quick引擎:多模式BI計算引擎
Quick引擎作為Quick BI的計算底座,是一個多模式的BI計算引擎,支持?jǐn)?shù)據(jù)庫直接連接、抽取加速、實時加速、查詢緩存、維值加速等多種計算模式,為不同用戶提供最適合自身場景的高效計算方案。
上圖為Quick引擎架構(gòu)圖,從Quick BI產(chǎn)品使用鏈路上,分為數(shù)據(jù)源、數(shù)據(jù)集和數(shù)據(jù)作品三部分。數(shù)據(jù)源是底層的數(shù)據(jù)庫連接,數(shù)據(jù)集用于對數(shù)據(jù)源里的表進(jìn)行建模(表關(guān)聯(lián)、字段類型建模等),把一張或多張表變成一個上層數(shù)據(jù)作品(儀表板、電子表格、即席分析)可用的數(shù)據(jù)對象。
Quick引擎架構(gòu)在數(shù)據(jù)源和數(shù)據(jù)集之間,用來處理上層數(shù)據(jù)作品發(fā)送到數(shù)據(jù)集最終下放到數(shù)據(jù)源上的查詢,在技術(shù)實現(xiàn)上Quick引擎分為三條鏈路,數(shù)據(jù)庫直連、數(shù)據(jù)庫實時加速、數(shù)據(jù)庫抽取,在這三條鏈路進(jìn)行了技術(shù)層抽象。
從用戶使用視角來看,我們提供如下5種計算模式:
(1)直連模式:計算負(fù)載直接跑在連接到BI產(chǎn)品的數(shù)據(jù)庫或數(shù)倉上,支持幾十種數(shù)據(jù)源,所有版本用戶都可使用,非常適用于底層計算資源滿足查詢負(fù)載的場景;
(2)抽取加速:把客戶數(shù)據(jù)庫或數(shù)倉的數(shù)據(jù)抽取到Quick引擎的高性能列式存儲引擎中,支持全量模式和增量模式,分析計算負(fù)載直接跑在Quick BI引擎中,充分利用Quick引擎性能的同時,減少客戶數(shù)倉的負(fù)擔(dān),專業(yè)版客戶可用,非常適用于企業(yè)沒有獨立數(shù)倉或數(shù)倉負(fù)載過重的情況;
(3)實時加速:基于阿里云DLA(Data Lake Analysis)內(nèi)存計算引擎,實時查詢從客戶數(shù)據(jù)庫取數(shù)據(jù),中間用DLA內(nèi)存引擎加速計算,專業(yè)版客戶可用,目前支持阿里云Max Compute數(shù)倉,非常適合Max Compute數(shù)倉實時分析,更多數(shù)據(jù)庫支持開通中;
(4)查詢緩存:所有版本用戶可用,應(yīng)用端報表、儀表板在訪問時臨時查詢結(jié)果被緩存下來,在配置的緩存有效時間內(nèi),接下來其他用戶相同的查詢直接取緩存結(jié)果,加快返回速度同時避免重復(fù)計算的資源消耗,非常適合應(yīng)用端是重復(fù)查詢較多的場景,比如可視化展示類;
(5)維值加速:所有版本用戶可用,基于直連模式和維表配置實現(xiàn),通過配置維值加速使得高頻且耗時的維度字段查詢計算直接在數(shù)據(jù)庫維表上進(jìn)行,而不是在原始的明細(xì)表上進(jìn)行,比如即席分析和查詢控件的維值查詢,在這類場景下相比不進(jìn)行維值加速可快速返回結(jié)果且節(jié)省計算資源;
Quick引擎使用場景指南
在正式開始介紹每種引擎具體用法時,先結(jié)合每種引擎特點給出一個場景使用指南,方便用戶在不同場景下選擇最合適的引擎。
Quick引擎通過數(shù)據(jù)集不同配置會采用不同計算模式,依據(jù)數(shù)據(jù)集不同情況,建議如下:
(1)若數(shù)據(jù)集默認(rèn)采用直連模式,如果查詢性能良好,則可不進(jìn)行額外配置,如果無法滿足要求,則進(jìn)行以下判斷
(2)若數(shù)據(jù)集主要被用在儀表板、報表中,偏固定數(shù)據(jù)展示類的,沒有被很多查詢控件控制
a. 實效性要求不是非常高,很適合配緩存,基本可以解決問題了(可能80%以上可以解決)
b. 實效性要求不是非常高,如果配了緩存還不行,比如某個數(shù)據(jù)集被做了很多報表,第一次緩存查詢就吃不消,MySQL類非OLAP數(shù)據(jù)庫建議用抽取加速,ADB類的OLAP數(shù)據(jù)庫,建議首先優(yōu)化下數(shù)據(jù)建模(比如是不是大表join大表),其次建議采用抽取加速分擔(dān)些負(fù)載
c. 實效性要求很高,每次看,都想看最新數(shù)據(jù),ODPS數(shù)據(jù)源可以用DLA實時加速
(3)數(shù)據(jù)集主要被用在即席分析、電子表格分析這類偏個性分析查詢中,或者有非常多查詢控件的儀表板報表中,配緩存意義不是很大,建議:
a. 底層數(shù)據(jù)庫不是OLAP,比如MySQL,運行很慢,首先建議采用抽取加速,其次建議優(yōu)化數(shù)據(jù)建模
b. 底層數(shù)據(jù)庫是OLAP,比如ADB,運行很慢,建議首先優(yōu)化下數(shù)據(jù)建模,如大表join大表,其次建議采用抽取加速分擔(dān)些負(fù)載
c. 底層數(shù)據(jù)庫是ODPS,運行很慢,如果實效性要求高,建議DLA實時加速,實效性要求不高,建議抽取加速
(4)數(shù)據(jù)集維度字段被頻繁用于查詢控件或即席分析,推薦為該字段配置維值加速
Quick引擎 - 直連模式
直連模式是Quick引擎查詢的默認(rèn)模式,所有的查詢會發(fā)送給底層數(shù)據(jù)庫或數(shù)倉執(zhí)行,Quick BI直連模式支持幾十種云和自建數(shù)據(jù)庫。
在數(shù)據(jù)集頁面點擊“新建數(shù)據(jù)集”,選擇已配置的數(shù)據(jù)源,左側(cè)面板會展示該數(shù)據(jù)源里的所有表,拖入一張或多張表到面板中,即可在數(shù)據(jù)預(yù)覽區(qū)域進(jìn)行字段配置,配置完成后保存數(shù)據(jù)集,方可進(jìn)行后續(xù)分析。數(shù)據(jù)集保存后,后續(xù)所建的分析查詢默認(rèn)直連模式。
Quick引擎 - 抽取加速
當(dāng)直連模式查詢過多或者數(shù)據(jù)量過大時,會導(dǎo)致底層數(shù)據(jù)庫負(fù)載過重查詢變慢,上層儀表表展示和分析就會變慢,出現(xiàn)文章開頭所講的困擾,此時可以考慮Quick引擎的抽取加速。
抽取加速是專業(yè)版特有功能,目前覆蓋MySQL、ADB for MySQL和MaxCompute三種數(shù)據(jù)源,支持全量抽取和增量抽取數(shù)據(jù)到Quick引擎的高性能列式存儲分析型數(shù)據(jù)庫中,抽取后的數(shù)據(jù)查詢直接在列式分析數(shù)據(jù)庫中完成而無需發(fā)到客戶數(shù)據(jù)庫上,提升數(shù)據(jù)查詢性能,同時減少客戶數(shù)據(jù)庫負(fù)載。
點擊數(shù)據(jù)集菜單,選擇“加速配置”,在第一個 “Quick引擎”Tab點擊開啟引擎,選擇抽取加速:
• 加速時間可選“手動觸發(fā)”和“定時加速”,定時加速設(shè)置時間后定期觸發(fā)抽取任務(wù)
• 智能聚合抽取支持“全表加速”、“預(yù)計算”、“全表計算+預(yù)計算”三種模式,其中全表加速抽取全表數(shù)據(jù),預(yù)計算基于歷史查詢智能預(yù)計算查詢結(jié)果,節(jié)省抽取空間
• 勾選按日期加速,可以選擇日期字段,每日根據(jù)日期字段增量抽取
配置完成后,點擊保存,抽取任務(wù)即會自動觸發(fā),抽取完成后,之后的數(shù)據(jù)查詢將在抽取引擎數(shù)據(jù)庫中完成。
Quick引擎抽取加速性能測試,10億數(shù)據(jù)sum、count、avg和median等聚合均在0.5秒內(nèi)返回,具備十億級數(shù)據(jù)亞秒級分析的能力,如下表為性能測試結(jié)果。
數(shù)據(jù)量 sum聚合 count聚合 avg聚合 median聚合
1億 0.043 s 0.044 s 0.040 s 0.061 s
10億 0.3 s 0.21 s 0.25 s 0.35 s
同時由于Quick BI是依托于阿里云飛天底座的產(chǎn)品架構(gòu),具備橫向擴(kuò)展的能力,Quick引擎隨著機(jī)器數(shù)量的增加數(shù)據(jù)處理能力會不斷增強(qiáng),理論上具有無限擴(kuò)展的能力。
Quick引擎 - 實時加速
當(dāng)直連模式出現(xiàn)性能問題,同時對數(shù)據(jù)的實效性要求較高,天粒度更新無法滿足要求,而需要小時或分鐘粒度數(shù)據(jù)更新,由于抽取加速是天粒度數(shù)據(jù)更新而無法采用,此時可以考慮另一種選擇,采用實時加速來進(jìn)行高實效數(shù)據(jù)的查詢加速。
與抽取加速一樣,實時加速也是專業(yè)版特有功能,目前支持MaxCompute數(shù)據(jù)源,基于阿里云DLA(Data Lake Analysis)內(nèi)存計算引擎,查詢時把數(shù)據(jù)實時加載到DLA中進(jìn)行計算,提升查詢性能,可以把離線型數(shù)倉MaxCompute通過實時加速變成在線分析型數(shù)倉。
在數(shù)據(jù)集加速配置頁面,開啟Quick引擎,切換到實時加速,保存即可開啟數(shù)據(jù)集實時加速模式。
Quick引擎 - 查詢緩存
查詢緩存的原理是應(yīng)用端報表、儀表板在訪問時臨時查詢結(jié)果被緩存下來,在配置的緩存有效時間內(nèi),接下來其他用戶相同的查詢直接取緩存結(jié)果,命中緩存的查詢可以立即返回結(jié)果,沒有命中緩存的查詢會被發(fā)到底層數(shù)據(jù)庫進(jìn)行查詢,查詢返回后該查詢也會被緩存下來供接下來使用。
結(jié)果緩存是一種應(yīng)用范圍很廣且非常有效的數(shù)據(jù)查詢加速方式,它適用于所有數(shù)據(jù)源,對不同版本用戶都可用,對一定時間內(nèi)存在重復(fù)查詢的數(shù)據(jù)集都可以配置查詢緩存,特別是重復(fù)查詢較多的場景,比如儀表板展示類,可以大幅提升查詢性能。
在加速配置頁面,開啟查詢結(jié)果緩存,可配置不同緩存時間,表示緩存生效的有效期,如果數(shù)據(jù)是非小時粒度實效性,建議選擇12小時。
Quick引擎 - 維值加速
在直連查詢中,關(guān)于維度值的查詢是比較耗時的,比如商品名稱、客戶名稱、城市名稱等,因為這類查詢在直連模式下需要去底層數(shù)據(jù)庫做去重聚合操作,要掃描全表數(shù)據(jù),所以比較耗時。而在某些場景下,這類查詢操作可能會非常頻繁的出現(xiàn),比如即席分析的維度值分析和查詢控件的維度值查詢,在這類場景下可以通過配置維值加速提升查詢性能。
在加速配置頁面,開啟維值加速,該數(shù)據(jù)集是一張訂單明細(xì)表,在前端儀表板頁面經(jīng)常需要基于客戶名稱和產(chǎn)品名稱查詢成交情況,因此把這兩個字段配置維值加速,分別對應(yīng)上底層數(shù)據(jù)庫兩張用戶和商品維表的字段,之后維度值的查詢將直接從這兩張維表中取,而無需去明細(xì)表做聚合,從而提升查詢速度。
以上是關(guān)于Quick BI的計算內(nèi)核Quick引擎的功能和使用場景的介紹,依托阿里云的計算底座,Quick引擎實現(xiàn)了十億級數(shù)據(jù)亞秒級分析的能力,讓上層分析可視化應(yīng)用在大數(shù)據(jù)時代真正飛起來。
想了解更多Quick BI信息,請點擊阿里云產(chǎn)品鏈接:https://www.aliyun.com/product/bigdata/bi
來源:阿里數(shù)據(jù)
刷新相關(guān)文章
我要評論
活動推薦more >
- 【大會嘉賓】威馬汽車集團(tuán)戰(zhàn)2021-08-02
- 【大會嘉賓】聯(lián)通智慧足跡CM2021-08-02
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
不容錯過的資訊
-
12021醫(yī)藥數(shù)字化轉(zhuǎn)型論壇在滬成功召開
-
2四年打磨,只為一劍! 百分點科技DeepMa
-
3元宇宙營銷峰會| 以科技,近未來,共商
-
4數(shù)據(jù)+AI技術(shù),賦能企業(yè)業(yè)務(wù)和管理流程
-
5Dataphin核心功能(四)安全: 基于數(shù)據(jù)
-
6數(shù)智化時代,驅(qū)動企業(yè)轉(zhuǎn)型升級的“三駕馬
-
7全面云原生化,阿里云自研數(shù)據(jù)庫幫助雙11
-
8新技術(shù)·新安全·新生態(tài)∣第三屆世界物聯(lián)
-
9歡句科技完成A輪融資 紅杉種子、順為領(lǐng)
-
10亞馬遜云科技顧凡:持續(xù)創(chuàng)新的關(guān)鍵是企業(yè)