查詢效率提升近200倍!AntDB數(shù)據(jù)庫助力省級醫(yī)保信息平臺建設(shè)
本文介紹了在西北某省醫(yī)保信息平臺架構(gòu)演進升級過程中,AntDB對于新建平臺數(shù)據(jù)分析能力、數(shù)據(jù)同步能力、數(shù)據(jù)運維管理能力的提升。本次AntDB數(shù)據(jù)庫多引擎能力的上線,解決了該醫(yī)保系統(tǒng)數(shù)據(jù)同步不準確、數(shù)據(jù)查詢結(jié)果不準確、復(fù)雜數(shù)據(jù)查詢慢等問題。數(shù)據(jù)庫的高可用架構(gòu)可以保證業(yè)務(wù)的連續(xù)性及數(shù)據(jù)安全性,保證用戶數(shù)據(jù)的安全可靠。
一、醫(yī)療行業(yè)信息化平臺建設(shè)需求
省醫(yī)保局的醫(yī)保信息系統(tǒng)數(shù)據(jù)平臺以醫(yī)保數(shù)據(jù)為核心,以地區(qū)資源整合為主線,以提供醫(yī)保數(shù)字服務(wù)為導(dǎo)向,實現(xiàn)全量數(shù)據(jù)互通匯聚,實現(xiàn)企業(yè)級數(shù)據(jù)管理和集成共享,構(gòu)建醫(yī)保大數(shù)據(jù)中心,實現(xiàn)對各類數(shù)據(jù)資源的統(tǒng)一管理、管控、共享,為醫(yī)保運營監(jiān)管和業(yè)務(wù)發(fā)展提供支撐。加快推動醫(yī)保信息化、標準化、便利化建設(shè),推進醫(yī)保服務(wù)事項“網(wǎng)上辦”改革,高頻醫(yī)保服務(wù)事項實現(xiàn)跨省通辦。
二、數(shù)據(jù)統(tǒng)一管理面臨的挑戰(zhàn)
打通“數(shù)據(jù)流轉(zhuǎn)”路徑是數(shù)據(jù)管理的重要工作之一。某市醫(yī)保業(yè)務(wù)平臺現(xiàn)有的信息系統(tǒng)架構(gòu),采用的是直連底層生產(chǎn)數(shù)據(jù)庫查詢的方式,存儲了大量的原始業(yè)務(wù)數(shù)據(jù),需要進一步的數(shù)據(jù)聚合和關(guān)聯(lián),并建立統(tǒng)一的數(shù)據(jù)標準以實現(xiàn)互聯(lián)互通。同時,其經(jīng)辦系統(tǒng)和監(jiān)督系統(tǒng)對性能有較高要求,現(xiàn)有數(shù)據(jù)庫無法滿足大批量的數(shù)據(jù)查詢要求,亟待升級改造。
客戶的主要痛點訴求,如下:
1. 提升業(yè)務(wù)響應(yīng)速度:面對大數(shù)據(jù)量查詢、寬表數(shù)據(jù)查詢等場景,需解決現(xiàn)有架構(gòu)數(shù)據(jù)查詢緩慢的問題,提升整體業(yè)務(wù)系統(tǒng)響應(yīng)速度;
2. 增加數(shù)據(jù)分析能力:面對多表關(guān)聯(lián)、聚合分析等復(fù)雜查詢時,需從架構(gòu)層面進行規(guī)劃升級,增加統(tǒng)一架構(gòu)下的數(shù)據(jù)分析能力;
3. 數(shù)據(jù)一致性保障:面對多系統(tǒng)多終端的并發(fā)查詢,需解決同時讀寫數(shù)據(jù)查詢結(jié)果不一致的問題,保障事務(wù)提交的準確性。
三、為什么選擇亞信安慧AntDB
基于上述需求,客戶分別從數(shù)據(jù)采集能力、數(shù)據(jù)存儲管理能力、數(shù)據(jù)分析與挖掘能力等方面進行了相關(guān)技術(shù)及架構(gòu)的調(diào)研,最終在數(shù)據(jù)庫方向,選擇了采用亞信安慧AntDB數(shù)據(jù)庫的多引擎、超融合解決方案。
客戶的數(shù)據(jù)平臺建設(shè)方案,是通過在業(yè)務(wù)系統(tǒng)和生產(chǎn)數(shù)據(jù)庫中間搭建數(shù)據(jù)中臺,進行數(shù)據(jù)治理和數(shù)據(jù)開發(fā)等工作,實現(xiàn)數(shù)據(jù)管理、標準、服務(wù)一體化,如下圖。數(shù)據(jù)中臺主要由MPP數(shù)據(jù)庫和離線數(shù)倉構(gòu)成,其中MPP(Massively Parallel Processing 大規(guī)模并行處理))數(shù)據(jù)庫由AntDB團隊承建,并負責與原有庫進行數(shù)據(jù)與業(yè)務(wù)對接。
圖1:醫(yī)療行業(yè)信息系統(tǒng)數(shù)據(jù)平臺架構(gòu)圖
亞信安慧承建的MPP數(shù)據(jù)庫主要包括匯聚庫和應(yīng)用庫,匯聚庫負責從生產(chǎn)中心同步數(shù)據(jù)進行預(yù)處理,隨后離線數(shù)倉對生產(chǎn)數(shù)據(jù)進行抽取及加工,加上增量明細軌跡數(shù)據(jù),在離線數(shù)倉按層級加工出T+1數(shù)據(jù)。然后會將在離線數(shù)倉數(shù)據(jù)應(yīng)用層加工完成的寬表應(yīng)用類數(shù)據(jù),同步到應(yīng)用庫,供上層應(yīng)用系統(tǒng)查詢使用。
亞信安慧AntDB數(shù)據(jù)庫的多引擎產(chǎn)品,能夠滿足客戶多種業(yè)務(wù)類型的數(shù)據(jù)處理、分析、查詢等需求,提供數(shù)據(jù)中臺中MPP數(shù)據(jù)庫組件的功能。AntDB提供的不僅僅是軟件產(chǎn)品,更是一整套完善的數(shù)據(jù)管理體系,包含各類生態(tài)工具,方便企業(yè)用戶快捷、高效地管理企業(yè)數(shù)據(jù)資產(chǎn)。
圖2:AntDB可根據(jù)客戶需求提供模塊化能力
通過該數(shù)據(jù)平臺的建設(shè),可以幫助客戶有效提高信息系統(tǒng)的準確性和分析效率,保證經(jīng)辦類系統(tǒng)的查詢效率,滿足監(jiān)察系統(tǒng)的統(tǒng)計需求。MPP數(shù)據(jù)庫對于數(shù)據(jù)中臺的價值,主要體現(xiàn)在三個方面: 1. 具備較高的數(shù)據(jù)入庫效率和數(shù)據(jù)分析處理能力; 2. 具備配套數(shù)據(jù)同步工具,支持MPP數(shù)據(jù)庫數(shù)據(jù)和生產(chǎn)庫之間的數(shù)據(jù)同步; 3. 具備較高的寬表數(shù)據(jù)查詢分析性能。
四、AntDB“可插拔式引擎”助力架構(gòu)升級
該數(shù)據(jù)平臺建設(shè)項目中,匯聚庫選用了AntDB-T(交易型),同步工具選用自研產(chǎn)品AntDB-MTK遷移工具,應(yīng)用庫選用AntDB-A(分析型),運維管理工具使用自研AntDB-CC運維平臺,整體邏輯架構(gòu)圖如下:
圖3:項目建設(shè)邏輯架構(gòu)示意圖(AntDB部分)
亞信安慧AntDB數(shù)據(jù)庫產(chǎn)品具備以下特性:
1.原生分布式、高效數(shù)據(jù)處理:匯聚庫對于數(shù)據(jù)庫產(chǎn)品的水平擴展能力和數(shù)據(jù)處理能力,有較高要求。AntDB-T分布式關(guān)系數(shù)據(jù)庫內(nèi)置分布式并行執(zhí)行引擎,在多個數(shù)據(jù)節(jié)點之間組網(wǎng)傳輸數(shù)據(jù),利用多節(jié)點并發(fā)處理數(shù)據(jù),可以使聚集、排序、關(guān)聯(lián)等操作獲得倍數(shù)級的性能提升。
2.數(shù)據(jù)同步及校驗工具:匯聚庫實時從生產(chǎn)中心提取千萬級數(shù)據(jù),需要同步數(shù)據(jù)同源端保持一致性。AntDB MTK數(shù)據(jù)遷移工具包解決了該項目中數(shù)據(jù)不能及時、完整同步的問題,實現(xiàn)了數(shù)倉數(shù)據(jù)與生產(chǎn)系統(tǒng)數(shù)據(jù)的一致性保障。
3.超強數(shù)據(jù)分析能力:應(yīng)用庫采用的亞信安慧AntDB-A是MPP架構(gòu)的OLAP數(shù)據(jù)庫,具備高性能和實時分析能力,海量數(shù)據(jù)下返回查詢結(jié)果僅需亞秒級響應(yīng)時間,可滿足報表分析、自定義查詢、數(shù)據(jù)湖查詢加速等場景。
4.智能運維管控:分布式架構(gòu)節(jié)點數(shù)眾多,需要運維平臺對數(shù)據(jù)庫集群進行統(tǒng)一管理。AntDB CC數(shù)據(jù)庫智能運維管理平臺可提供智能化的運維管控和數(shù)據(jù)庫的集群管理,自動監(jiān)控包括常規(guī)數(shù)據(jù)庫服務(wù)器、數(shù)據(jù)庫關(guān)鍵指標等數(shù)據(jù),并進行預(yù)設(shè)告警通知,提升了數(shù)據(jù)庫的可維護性。
五、項目應(yīng)用效果
項目應(yīng)用場景為典型的分析型場景,應(yīng)用庫共6T左右的數(shù)據(jù)量。針對大批量寬表數(shù)據(jù)分析場景,AntDB-A相較于傳統(tǒng)行存數(shù)據(jù)庫,SQL性能提升200倍,對比國外同類型產(chǎn)品,關(guān)鍵SQL處理效率最大提升12倍。
圖4:AntDB產(chǎn)品相比原有產(chǎn)品關(guān)鍵SQL處理效率提升
項目上線后,AntDB-A基于自身超高的數(shù)據(jù)壓縮技術(shù)和數(shù)據(jù)分析能力,數(shù)據(jù)存儲空間降低87.5%,為用戶節(jié)省大量存儲成本;數(shù)據(jù)分析查詢效率提升接近200倍,數(shù)據(jù)庫查詢響應(yīng)時間提升到毫秒級。AntDB MTK解決了之前數(shù)據(jù)同步不準確的問題,保證了不同平臺之間數(shù)據(jù)同步的準確性。AntDB CC智能運維平臺降低了分布式數(shù)據(jù)庫多節(jié)點運維的復(fù)雜度,為用戶節(jié)省近70%運維成本。
(責任編輯:華康)