全球分布式云大會(huì)是分布式云技術(shù)和商業(yè)交流的旗艦級(jí)平臺(tái),2023全球分布式云大會(huì)·北京站將于6月28日-29日正式召開,本次大會(huì)以“云智筑基”為主題,探究人工智能(AI)在大模型全新的發(fā)展風(fēng)口,構(gòu)建新型泛在算力網(wǎng)絡(luò)的趨勢(shì),如何利用分布式云、分布式數(shù)據(jù)庫(kù)、分布式存儲(chǔ)、邊緣云等構(gòu)建新型算力網(wǎng)絡(luò),打造更強(qiáng)大的數(shù)字經(jīng)濟(jì)價(jià)值引擎。
本次大會(huì)來(lái)自騰訊云、火山引擎、阿里云、華為云、百度智能云、螞蟻集團(tuán)等云計(jì)算數(shù)字科技服務(wù)商,以及中國(guó)電信、中國(guó)移動(dòng)、中國(guó)聯(lián)通三大運(yùn)營(yíng)商等數(shù)技術(shù)專家,從分布式云行業(yè)前瞻性發(fā)展趨勢(shì),底層云計(jì)算基礎(chǔ)設(shè)施突破性關(guān)鍵技術(shù),分享高尖精技術(shù)和實(shí)踐案例,共同打造云計(jì)算領(lǐng)域的饕餮技術(shù)盛宴。
在06月28日騰訊云數(shù)據(jù)庫(kù)高級(jí)架構(gòu)師黃平中分享了《TDSQL助力政企核心系統(tǒng)國(guó)產(chǎn)化》的主題演講。
TDSQL產(chǎn)品發(fā)展路徑
早期騰訊并未像較多傳統(tǒng)企業(yè)一樣選擇如Oracle類型的純商業(yè)數(shù)據(jù)庫(kù),而是從一開始就選擇開源路線。2002年騰訊成立第一個(gè)數(shù)據(jù)庫(kù)團(tuán)隊(duì),2004年騰訊內(nèi)部啟動(dòng)分布式數(shù)據(jù)庫(kù)項(xiàng)目,并一直持續(xù)至2012年,在該階段中,騰訊持續(xù)進(jìn)行內(nèi)部應(yīng)用驗(yàn)證,其中包含內(nèi)部的金融業(yè)務(wù),如騰訊充值財(cái)付通及騰訊游戲等業(yè)務(wù)。
2014年微眾銀行上線,微眾銀行是一家互聯(lián)網(wǎng)銀行,全行采用了自主設(shè)計(jì)金融級(jí)高可用單元化架構(gòu),適配改造銀行核心系統(tǒng),為金融行業(yè)提供自主可控的核心技術(shù)力。
此后,騰訊持續(xù)深耕騰訊云開放生態(tài),實(shí)現(xiàn)成熟的自研數(shù)據(jù)庫(kù)在云端的產(chǎn)品化;超過10萬(wàn)客戶持續(xù)打磨;助力金融企業(yè)的信息化建設(shè)和數(shù)字化轉(zhuǎn)型。在2015年、2016年騰訊云陸續(xù)推出公有云版本與私有云版本。
當(dāng)前,騰訊具備豐富的金融級(jí)業(yè)務(wù)系統(tǒng)建設(shè)經(jīng)驗(yàn),有能力為客戶建設(shè)合規(guī)、安全、可靠的IT基礎(chǔ),已有大量的成熟案例,其中包含了部委、國(guó)有銀行等政企行業(yè)標(biāo)桿用戶。
TDSQL:企業(yè)級(jí)智能數(shù)據(jù)管理平臺(tái)
騰訊云數(shù)據(jù)庫(kù)致力于打造企業(yè)級(jí)數(shù)據(jù)管理平臺(tái),從金融級(jí)高可靠高可用、領(lǐng)先的架構(gòu)與性能、智能化運(yùn)維管理及企業(yè)級(jí)數(shù)據(jù)安全合規(guī)等四方面賦能數(shù)字企業(yè),釋放數(shù)據(jù)生產(chǎn)力。
金融級(jí)的高可靠、高可用意味著數(shù)據(jù)庫(kù)作為一個(gè)重要的PaaS層軟件能持續(xù)支撐好業(yè)務(wù),保障業(yè)務(wù)連續(xù)性,包含數(shù)據(jù)庫(kù)服務(wù)器故障或者出現(xiàn)機(jī)房級(jí)的故障時(shí),避免出現(xiàn)數(shù)據(jù)丟失或業(yè)務(wù)停服太久等情況。騰訊云數(shù)據(jù)庫(kù)已做到99.999%以上可用性、支持跨區(qū)容災(zāi)、兩地三中心、多地多中心、強(qiáng)同步復(fù)制、全局事務(wù)強(qiáng)一致性、故障自動(dòng)恢復(fù)等,在高可靠、高可用方面滿足大型國(guó)有銀行核心系統(tǒng)建設(shè)需求。
第二是在架構(gòu)和性能方面,在保障產(chǎn)品本身自主可控前提下,幫助產(chǎn)品實(shí)現(xiàn)較高性能的要求,今年三月,騰訊云TDSQL在TPC-C標(biāo)準(zhǔn)測(cè)試中性能達(dá)到每分鐘8.14億筆交易(tpmC),打破世界紀(jì)錄,成本僅為同類數(shù)據(jù)庫(kù)的1/3,在分布式計(jì)算、存儲(chǔ)及管控方面實(shí)現(xiàn)100%核心代碼自研;系列產(chǎn)品中包含首款全serverless架構(gòu)云原生數(shù)據(jù)庫(kù),多模多態(tài),滿足更多行業(yè)場(chǎng)景需求。
第三是智能化的運(yùn)維管理,數(shù)據(jù)庫(kù)從傳統(tǒng)的集中式到目前的分布式后,服務(wù)器的臺(tái)數(shù)從一臺(tái)兩臺(tái)變成了十幾臺(tái)或幾十臺(tái)的集群模式,對(duì)于運(yùn)維或?qū)τ诠芾淼膲毫κ禽^大的,因此,騰訊云認(rèn)為要通過智能化自動(dòng)管理模式降低分布式場(chǎng)景的運(yùn)維和管理操作中存在的壓力,通過界面化的智能運(yùn)維管理平臺(tái)為用戶實(shí)現(xiàn)一站式的全集群運(yùn)維管理服務(wù),降低分布式數(shù)據(jù)庫(kù)的運(yùn)維難度和使用門檻,提升用戶體驗(yàn)。騰訊云TDSQL支持自動(dòng)水平拆分、不停機(jī)彈性擴(kuò)展、在線擴(kuò)容業(yè)務(wù)無(wú)感知,支持全鏈路遷移及部署工具,助力業(yè)務(wù)平滑遷移,可視化操作和智能運(yùn)維分析,可實(shí)現(xiàn)掌上一鍵管理,是企業(yè)去O的理想選擇。
最后是企業(yè)級(jí)數(shù)據(jù)管理中較為核心的訴求——數(shù)據(jù)的安全合規(guī)與安全保障。騰訊云TDSQL內(nèi)核支持三權(quán)分立體系;數(shù)據(jù)庫(kù)防火墻、自動(dòng)脫敏、強(qiáng)制訪問控制;支持物理獨(dú)享、加密、審計(jì)等系列安全方案;支持中國(guó)標(biāo)準(zhǔn)的商用密碼加密算法,符合等保3和密評(píng)相關(guān)要求。
TDSQL產(chǎn)品邏輯架構(gòu)
DSQL產(chǎn)品邏輯架構(gòu)拆分為三部分——工具區(qū)、運(yùn)維區(qū)和業(yè)務(wù)區(qū),參照騰訊在公有云上運(yùn)維經(jīng)驗(yàn)而產(chǎn)生的架構(gòu)設(shè)計(jì)。即通過一套運(yùn)維管控平臺(tái)來(lái)實(shí)現(xiàn)大量節(jié)點(diǎn)服務(wù)器的納管操作,幫助最終用戶建立自身的數(shù)據(jù)庫(kù) DBaaS,實(shí)現(xiàn)統(tǒng)一入口、統(tǒng)一納管,目前在純數(shù)據(jù)庫(kù)軟件部署的環(huán)境中已有一套管控管理多達(dá) 200+ 數(shù)據(jù)庫(kù)服務(wù)器節(jié)點(diǎn)數(shù)的生產(chǎn)案例。
業(yè)務(wù)區(qū)通過計(jì)算與存儲(chǔ)拆分的方式,提供多層次可擴(kuò)展的高可用組件設(shè)計(jì):計(jì)算層節(jié)點(diǎn)互相獨(dú)立且無(wú)狀態(tài)設(shè)計(jì),便于在業(yè)務(wù)負(fù)載突增或故障情況下快速進(jìn)行節(jié)點(diǎn)擴(kuò)容提升集群的鏈接支撐能力;數(shù)據(jù)層通過騰訊自研的 MAR 并行多線程強(qiáng)同步機(jī)制實(shí)現(xiàn)數(shù)據(jù)的高可用管理,保障在故障時(shí)的數(shù)據(jù)不丟失,并且數(shù)據(jù)層也具備在線節(jié)點(diǎn)擴(kuò)容能力,以應(yīng)對(duì)負(fù)載提升的場(chǎng)景,保障在業(yè)務(wù)發(fā)展的過程中數(shù)據(jù)庫(kù)成本投入線性可控。業(yè)務(wù)層還具有列存引擎,通過內(nèi)部同步機(jī)制對(duì)應(yīng)用提供統(tǒng)一的數(shù)據(jù)視圖,增強(qiáng)了產(chǎn)品在部分 HTAP 場(chǎng)景中的復(fù)雜分析能力。
TDSQL:助力政企核心系統(tǒng)替換
在國(guó)產(chǎn)化整體建設(shè)過程中會(huì)遇到較多問題,如水平擴(kuò)縮容、分布式事務(wù)處理、業(yè)務(wù)全鏈路分析、數(shù)據(jù)強(qiáng)一致性、產(chǎn)品組件全面高可用等問題。通過這些問題可以發(fā)現(xiàn),國(guó)產(chǎn)化建設(shè)有一個(gè)很重要的點(diǎn):一旦做全?;慕ㄔO(shè)就將會(huì)面臨一個(gè)大風(fēng)險(xiǎn)——CPU用全新國(guó)產(chǎn)化芯片時(shí)要選擇的數(shù)據(jù)庫(kù)產(chǎn)品是一個(gè)全新的數(shù)據(jù)庫(kù)產(chǎn)品,這對(duì)于很多企業(yè)來(lái)說是一個(gè)大膽的舉動(dòng)。
因此,騰訊云針對(duì)該場(chǎng)景完成分布式場(chǎng)景下數(shù)據(jù)強(qiáng)一致的雙軌運(yùn)行方案。雙軌運(yùn)行方案可一云多芯,支持通用X86與國(guó)產(chǎn)化資源混部;分布式實(shí)例可通過 MAR 技術(shù)實(shí)現(xiàn)數(shù)據(jù)副本集合內(nèi)部出現(xiàn)故障后RPO為0;業(yè)務(wù)可以雙軌運(yùn)行并按需切換,切換保障數(shù)據(jù)的強(qiáng)一致性,且整體架構(gòu)設(shè)計(jì)不會(huì)影響當(dāng)前經(jīng)典的兩地三中心架構(gòu)。
此外,TDSQL高度兼容Oracle,核心系統(tǒng)替換主要有三個(gè)挑戰(zhàn):1.Oracle語(yǔ)法和功能需要做到全兼容;2.Oracle承載大量核心業(yè)務(wù)邏輯,遷移和適配代碼量巨大;3.業(yè)務(wù)適配和測(cè)試需要細(xì)致且全面。
騰訊云 TDSQL主要從三個(gè)層面兼容Oracle:1.內(nèi)核兼容,內(nèi)核與驅(qū)動(dòng)層面做到Oracle語(yǔ)法兼容,做到應(yīng)用層面不改代碼;2.性能兼容,復(fù)雜SQL與核心業(yè)務(wù)邏輯執(zhí)行性能對(duì)齊Oracle;3.習(xí)慣兼容,應(yīng)用開發(fā)習(xí)慣于周邊工具做到兼容配合。
可以看出,騰訊云 TDSQL在某國(guó)有大行核心系統(tǒng)單元化架構(gòu)的實(shí)現(xiàn),該系統(tǒng)替換的是大機(jī)+DB2,承載的客戶數(shù)約為億級(jí)別,整體的賬戶數(shù)達(dá)十億級(jí)別。這也是國(guó)內(nèi)首家銀行做了核心全鏈路國(guó)產(chǎn)化的驗(yàn)證,其中部分鏈路完全采用“TDSQL+中標(biāo)麒麟+鯤鵬”全棧國(guó)產(chǎn)化建設(shè)的鏈路支撐。
另一個(gè)案例是攜手某保險(xiǎn)共同攻堅(jiān)核心系統(tǒng)深度去O,這是一套典型傳統(tǒng)企業(yè)的核心架構(gòu),其中約有近20T的數(shù)據(jù)庫(kù),大量使用Oracle的特性,就是package,在代碼量上面約為300萬(wàn),共計(jì)16000多個(gè)對(duì)象。
在這之中,存儲(chǔ)過程涉及最長(zhǎng)存儲(chǔ)過程約為幾萬(wàn)行到十萬(wàn)行左右,騰訊云在4個(gè)月中完成對(duì)應(yīng)驗(yàn)證(到目前為止),其應(yīng)用代碼的修改僅僅只有不到2%的量級(jí)。通過代碼的兼容性測(cè)試可發(fā)現(xiàn),TDSQL與Oracle的兼容性,或者說經(jīng)過評(píng)估后需要做調(diào)整的代碼在該階段就已在5%以下了,可以說TDSQL能做到很高的Oracle兼容性,這也保障TDSQL在整個(gè)切換的過程中是平滑的遷移改造,最后更是將應(yīng)用代碼的修改降低到2%以內(nèi)的量級(jí)。
TDSQL產(chǎn)品特性小結(jié)
TDSQL在整體產(chǎn)品特性方面可以總結(jié)為4個(gè)維度。
1.世界領(lǐng)先的數(shù)據(jù)處理性能,TDSQL通過TPC-C官方極限性能測(cè)試,性能達(dá)到每分鐘8.14億筆交易(tpmC),排名世界第一,單位造價(jià)是友商的1/3,這也是得益于這些年來(lái)整體硬件軟件發(fā)展的成果。
2. 分布式數(shù)據(jù)庫(kù)能力,如高可靠、強(qiáng)一致、多中心多或、資源池化。
(1)高可用:數(shù)據(jù)庫(kù)各層組件均具備高可用特性,發(fā)生故障后自動(dòng)切換,保障業(yè)務(wù)連續(xù)性。
(2)強(qiáng)一致:數(shù)據(jù)副本可以保障強(qiáng)一致性,在出現(xiàn)數(shù)據(jù)副本故障時(shí),保障數(shù)據(jù)不丟失不錯(cuò)亂。
(3)多中心多活:數(shù)據(jù)庫(kù)架構(gòu)適配多中心多活架構(gòu),保障跨中心數(shù)據(jù)副本的安全性,中心級(jí)別故障自動(dòng)切換。
(4)資源池化:支持資源池化管理,根據(jù)不同業(yè)務(wù)需求劃分對(duì)應(yīng)規(guī)格實(shí)例,靈活管控物理資源投入。
3. 易用性——易開發(fā)、易運(yùn)維、易遷移。從開發(fā)方面看,TDSQL優(yōu)勢(shì)在于符合SQL2016規(guī)范,兼容Oracle、MySQL、pg等開發(fā)習(xí)慣,便于上手。從運(yùn)維方面看,TDSQL用圖形化監(jiān)控運(yùn)維平臺(tái),降低上手難度,而且其內(nèi)核原理相通,可快速?gòu)?fù)用已有技術(shù)棧。從遷移方面看,DBbridge遷移工具支持Oracle、MySQL、DB2的兼容評(píng)估、遷移、校驗(yàn)、回退。
TDSQL助力各行各業(yè)實(shí)現(xiàn)數(shù)據(jù)庫(kù)國(guó)產(chǎn)化
TDSQL案例墻:騰訊云在各個(gè)行業(yè)持續(xù)推動(dòng)實(shí)現(xiàn)數(shù)據(jù)庫(kù)國(guó)產(chǎn)化,致力于協(xié)助政企客戶完成數(shù)據(jù)庫(kù)層重要鏈路國(guó)產(chǎn)化動(dòng)作。