核心技術(shù)是國之重器,加速推進(jìn)核心領(lǐng)域關(guān)鍵技術(shù)突破,完成核心網(wǎng)絡(luò)中的軟硬件國產(chǎn)替代是國家長(zhǎng)期戰(zhàn)略。
“十四五”規(guī)劃更是明確,聚力攻堅(jiān)基礎(chǔ)軟件,加速分布式數(shù)據(jù)庫/混合事務(wù)分析處理數(shù)據(jù)庫等產(chǎn)品研發(fā)推廣。強(qiáng)化基礎(chǔ)組件供給,大力發(fā)展云計(jì)算/大數(shù)據(jù)/人工智能/區(qū)塊鏈等平臺(tái)軟件開發(fā)框架。
自主可控和國產(chǎn)化替代刻不容緩。過去微軟“黑屏悶”事件、美國“棱鏡門”事件、中興制裁事件已經(jīng)說明了沒有核心技術(shù)就會(huì)受制于人,今年俄烏事件發(fā)生后,200多家科技公司宣布暫停在俄羅斯的所有業(yè)務(wù),包括芯片、軟件、云服務(wù)等斷供,哪里還有“科技無國界”?要擺脫被科技制裁的風(fēng)險(xiǎn)唯一出路就是自主研發(fā)、自主可控。
星環(huán)科技自2013年成立以來,就以自主研發(fā)為己任,不僅自主研發(fā)了大數(shù)據(jù)與云基礎(chǔ)平臺(tái)、分布式關(guān)系型數(shù)據(jù)庫、數(shù)據(jù)開發(fā)與智能分析工具的軟件產(chǎn)品全系列產(chǎn)品,為企業(yè)數(shù)字化轉(zhuǎn)型提供了真正的國產(chǎn)數(shù)字底座,以提供數(shù)據(jù)集成、存儲(chǔ)、治理、建模、挖掘、分析和流通能力,可以推動(dòng)數(shù)據(jù)規(guī)范化、資產(chǎn)化、業(yè)務(wù)化,推進(jìn)業(yè)務(wù)數(shù)據(jù)化、智能化,而且產(chǎn)品能力更強(qiáng)更全,領(lǐng)先于國外,在基于容器的數(shù)據(jù)云技術(shù)、分布式技術(shù)、數(shù)據(jù)庫技術(shù)、多模型數(shù)據(jù)的統(tǒng)一處理技術(shù)、SQL編譯技術(shù)、大數(shù)據(jù)開發(fā)與智能分析技術(shù)等6大類技術(shù)上擁有31項(xiàng)具備先進(jìn)性的核心技術(shù),擁有了一大批發(fā)明專利。參加并且通過了工信部自主代碼掃描測(cè)試,完全符合信創(chuàng)驗(yàn)收標(biāo)準(zhǔn),多個(gè)產(chǎn)品進(jìn)入了國家軟硬件技術(shù)圖譜。
在自主研發(fā)創(chuàng)新的同時(shí),星環(huán)科技也在積極參與國家信創(chuàng)工作。星環(huán)科技作為信創(chuàng)工委會(huì)WG24大數(shù)據(jù)工作組的小組組長(zhǎng)及副組長(zhǎng)單位,牽頭制定信創(chuàng)大數(shù)據(jù)行業(yè)標(biāo)準(zhǔn)及規(guī)范,并深度參與產(chǎn)品圖譜編制、產(chǎn)業(yè)白皮書、案例集編撰等工作。
星環(huán)科技全系列產(chǎn)品替代國外進(jìn)口產(chǎn)品 星環(huán)科技擁有成熟的基礎(chǔ)軟件替代解決方案,完全滿足信創(chuàng)驗(yàn)收要求,取得了眾多的成果。
大數(shù)據(jù)基礎(chǔ)平臺(tái)TDH可以完美的替代CDH/HDP和CDP,提升功能、性能、穩(wěn)定性、易用性、擴(kuò)展性、可靠性、安全、國產(chǎn)生態(tài)支持等能力,提供多種模型支持能力,性能的提升可以達(dá)到5到100倍,原廠專業(yè)服務(wù)能力更強(qiáng)。
分布式交易型數(shù)據(jù)庫KunDB可以在交易型OLTP的業(yè)務(wù)場(chǎng)景、高并發(fā)在線數(shù)據(jù)服務(wù)場(chǎng)景,替代Oracle/DB2,并且提升存儲(chǔ)計(jì)算能力、高可用能力、跨分區(qū)事務(wù)能力。
分布式分析型數(shù)據(jù)庫ArgoDB可以在批處理和OLAP、Ad hoc分析等場(chǎng)景,替代Oracle/DB2/TD/SAP HANA,提供海量數(shù)據(jù)分析能力,提升混合負(fù)載、實(shí)時(shí)數(shù)據(jù)分析等能力,軟硬件綜合性價(jià)比得到10到100倍的提升。
分布式圖數(shù)據(jù)庫StellarDB可以在圖查詢、圖分析的場(chǎng)景替代Neo4j,提升圖數(shù)據(jù)存儲(chǔ)檢索能力,支持萬億頂點(diǎn)以上的圖存儲(chǔ)與毫秒級(jí)檢索性能,提供近30種分布式圖算法和10層以上深度鏈路分析能力。
搜索引擎Scope可以在全文檢索、日志分析等場(chǎng)景替代ElasticSearch,提升穩(wěn)定性、性能、集群擴(kuò)展性等能力。
智能分析工具Sophon可以在可視化建模分析場(chǎng)景替代SAS/SPSS,獲得200+算子支撐,提升功能和性能(將本增效)。
國產(chǎn)化替代的10大關(guān)鍵評(píng)價(jià)指標(biāo) 星環(huán)科技的一體化替代方案擁有獨(dú)一無二的優(yōu)勢(shì)
在功能上,星環(huán)科技基礎(chǔ)軟件產(chǎn)品多模架構(gòu),支持關(guān)系表、文本、時(shí)空地理、圖數(shù)據(jù)、文檔、時(shí)序等在內(nèi)的10種數(shù)據(jù)模型;離線數(shù)據(jù)批處理、高并發(fā)的在線數(shù)據(jù)服務(wù)、數(shù)據(jù)集市、數(shù)據(jù)倉庫、數(shù)據(jù)湖、圖存儲(chǔ)分析、空間數(shù)據(jù)存儲(chǔ)、實(shí)時(shí)數(shù)據(jù)處理、數(shù)據(jù)中臺(tái)、數(shù)據(jù)治理等各類大數(shù)據(jù)業(yè)務(wù)場(chǎng)景一站解決。
在性能上,星環(huán)科技基礎(chǔ)軟件產(chǎn)品自研高性能分布式計(jì)算和存儲(chǔ)引擎,整體性能是CDP 5~25倍。整體性價(jià)比是DB2 20倍,是TD 100倍。
在成本上,星環(huán)科技產(chǎn)品高度兼容CDH/HDP、TD、Oracle、DB2,兼容TD、Oracle、DB2的SQL和方言,提供成熟的遷移工具,有大量低成本成功遷移案例。
在安全上,星環(huán)科技基礎(chǔ)軟件產(chǎn)品提供的容器隔離、災(zāi)備、訪問控制、聯(lián)邦學(xué)習(xí)、隱私保護(hù)、可信計(jì)算等技術(shù)保障網(wǎng)絡(luò)層、加固層、治理層、流通層全方位數(shù)據(jù)安全。
在架構(gòu)上,星環(huán)科技基礎(chǔ)軟件產(chǎn)品提供統(tǒng)一SQL引擎、統(tǒng)一計(jì)算引擎、統(tǒng)一分布式存儲(chǔ)管理、統(tǒng)一資源調(diào)度,統(tǒng)一內(nèi)聯(lián)的架構(gòu)高效搞定湖倉集一體、HTAP等復(fù)雜場(chǎng)景,而不是拼湊組件成散裝架構(gòu)。
在開發(fā)上,星環(huán)科技基礎(chǔ)軟件產(chǎn)品提供統(tǒng)一SQL引擎,無需每個(gè)場(chǎng)景一套接口;完整支持SQL2003標(biāo)準(zhǔn),支持PLSQL存儲(chǔ)過程,兼容Oracle、DB2、TD等方言。
在運(yùn)維上,星環(huán)科技基礎(chǔ)軟件產(chǎn)品提供開箱即用的可視化運(yùn)維監(jiān)控、安全管控工具,容器技術(shù)帶來極致的安裝、升級(jí)、補(bǔ)丁體驗(yàn)。
在售后上,星環(huán)科技原廠有超過1100人的研發(fā)與支持團(tuán)隊(duì),超過3萬名星環(huán)科技認(rèn)證的大數(shù)據(jù)工程師,專業(yè)性更強(qiáng)。
在國產(chǎn)化上,星環(huán)科技的軟件產(chǎn)品自主研發(fā),通過了工信部代碼自主研發(fā)率掃描測(cè)試,滿足信創(chuàng)驗(yàn)收要求。
在國產(chǎn)生態(tài)上,星環(huán)基礎(chǔ)軟件產(chǎn)品已完成與主流信創(chuàng)生態(tài)廠商的適配互認(rèn)工作,適配長(zhǎng)城飛騰、華為泰山、浪潮等服務(wù)器,鯤鵬、飛騰CPU,麒麟、統(tǒng)信等操作系統(tǒng),并有官方認(rèn)證,支持基于ARM與X86服務(wù)器服務(wù)器混合部署并有落地案例。
星環(huán)科技有在大數(shù)據(jù)平臺(tái)、數(shù)據(jù)庫產(chǎn)品、數(shù)據(jù)分析平臺(tái)等領(lǐng)域有大量成功替代國外進(jìn)口產(chǎn)品的案例。目前,星環(huán)科技的大數(shù)據(jù)基礎(chǔ)軟件系列產(chǎn)品已在十幾個(gè)行業(yè)1000+用戶應(yīng)用落地。
大數(shù)據(jù)平臺(tái)國產(chǎn)化替代平滑遷移方案 (CDH/HDP/CDP->TDH)
Cloudera(Cloudera 和Hortonworks 合并后)所有產(chǎn)品不再提供社區(qū)版,用戶無法獲取新的功能。2021年1月31日開始,所有Cloudera軟件都需要有效的訂閱,且訂閱費(fèi)昂貴(50個(gè)節(jié)點(diǎn),一年訂閱費(fèi)50萬美元)。此外,CDH 6和HDP 3將是CDH和HDP的最后企業(yè)版本,企業(yè)版用戶無法繼續(xù)獲取新的功能和性能提升。至2022年3月份,CDH/HDP全部停止服務(wù)(EoS),用戶沒辦法獲取售后支持。
Transwarp Data Hub(TDH) 是星環(huán)科技自主研發(fā)的企業(yè)級(jí)一站式多模型大數(shù)據(jù)基礎(chǔ)平臺(tái),基于其領(lǐng)先的多模型統(tǒng)一技術(shù)架構(gòu),8種異構(gòu)存儲(chǔ)引擎可以支持包括關(guān)系表、文本、時(shí)空地理、圖數(shù)據(jù)、文檔、時(shí)序等在內(nèi)的10種數(shù)據(jù)模型。TDH能夠存儲(chǔ) PB 級(jí)別的海量數(shù)據(jù),同時(shí)能夠提供高性能的查詢搜索、實(shí)時(shí)分析、統(tǒng)計(jì)分析、預(yù)測(cè)性分析等數(shù)據(jù)分析功能,被廣泛應(yīng)用在離線數(shù)據(jù)批處理、高并發(fā)的在線數(shù)據(jù)服務(wù)、數(shù)據(jù)集市、數(shù)據(jù)倉庫、數(shù)據(jù)湖、圖存儲(chǔ)分析、空間數(shù)據(jù)存儲(chǔ)、實(shí)時(shí)數(shù)據(jù)處理等各類大數(shù)據(jù)業(yè)務(wù)場(chǎng)景,幫助企業(yè),更全面、更便捷、更智能、更安全地運(yùn)用數(shù)據(jù),加速企業(yè)數(shù)字化轉(zhuǎn)型。
TDH基礎(chǔ)存儲(chǔ)與計(jì)算組件兼容CDH/HDP,可以實(shí)現(xiàn)平滑遷移,大大降低企業(yè)遷移成本低。
同時(shí),星環(huán)科技提供專業(yè)的遷移工具Transwarp? Backup (TBAK),幫助用戶通過簡(jiǎn)單的三步即可實(shí)現(xiàn)數(shù)據(jù)與業(yè)務(wù)的一鍵遷移,高效便捷。整個(gè)遷移過程操作簡(jiǎn)單,配置靈活,通過3步即可完成所有的遷移工作,同時(shí)用戶可以對(duì)遷移過程進(jìn)行全流程實(shí)時(shí)監(jiān)控,保障整個(gè)遷移過程順利進(jìn)行。
第一步,基于TBAK提供可視化的界面進(jìn)行CDH和TDH的集群配置。
第二步,創(chuàng)建CDH遷移方案。TDH提供服務(wù)級(jí)和表級(jí)的遷移策略,以及對(duì)源集群,災(zāi)備集群,調(diào)度策略等進(jìn)行配置。在調(diào)度策略中用戶可以根據(jù)實(shí)際情況進(jìn)行配置,例如可以設(shè)置在業(yè)務(wù)空窗期的每天凌晨2點(diǎn)進(jìn)行數(shù)據(jù)遷移。同時(shí),用戶可以設(shè)置相應(yīng)的告警策略,當(dāng)遷移發(fā)生問題時(shí)可以第一時(shí)間收到告警信息并對(duì)問題進(jìn)行排查和恢復(fù)。
第三步,執(zhí)行遷移任務(wù)和結(jié)果檢查。當(dāng)集群配置完成后,所有的遷移方案將在遷移方案界面進(jìn)行管理和操作。用戶可以選擇相應(yīng)的遷移方案進(jìn)行操作,例如立即執(zhí)行和設(shè)置執(zhí)行策略。若點(diǎn)擊執(zhí)行遷移任務(wù),系統(tǒng)會(huì)進(jìn)入到自動(dòng)遷移狀態(tài),同時(shí)可以監(jiān)測(cè)遷移任務(wù)執(zhí)行的整體狀態(tài)信息,并且可以對(duì)每一步的執(zhí)行情況進(jìn)行實(shí)時(shí)監(jiān)測(cè)。當(dāng)遷移發(fā)生故障時(shí),系統(tǒng)會(huì)發(fā)出執(zhí)行故障的告警,方便用戶對(duì)故障發(fā)生的階段進(jìn)行排查和故障恢復(fù)。
此外,星環(huán)科技積累了大量的遷移成功案例,經(jīng)驗(yàn)豐富,可以保障整個(gè)遷移過程安全可靠。
相比于遷移到CDP或者國內(nèi)封裝的Hadoop商業(yè)版,用戶遷移到星環(huán)科技TDH后,TDH多模型統(tǒng)一架構(gòu)提供統(tǒng)一SQL引擎、統(tǒng)一計(jì)算引擎、統(tǒng)一分布式存儲(chǔ)管理、統(tǒng)一資源調(diào)度,統(tǒng)一內(nèi)聯(lián)架構(gòu)高效搞定湖倉集一體、HTAP等復(fù)雜場(chǎng)景,無需拼湊組件散裝架構(gòu)。同時(shí)在技術(shù)領(lǐng)先性、性能、易用性、穩(wěn)定性、安全性等方面得到全面的提升。此外,TDH由星環(huán)科技自主研發(fā),通過工信部自主代碼掃描測(cè)試,完全自主可控,并且與已完成與主流信創(chuàng)生態(tài)廠商的適配互認(rèn)工作,滿足信創(chuàng)驗(yàn)收要求,幫助各行業(yè)用戶提升大數(shù)據(jù)系統(tǒng)的國產(chǎn)化水平。
數(shù)據(jù)庫國化產(chǎn)替代平滑遷移方案 (Oracle/DB2/MySQL/Teradata/SAP HANA->TDH/ArgoDB/KunDB)
傳統(tǒng)數(shù)據(jù)庫如Oracle,DB2等存在成本高、擴(kuò)容難、性能受限、運(yùn)維難等問題給很多企業(yè)用戶造成了困擾。
前段時(shí)間俄烏事件中,Oracle宣布暫停在俄業(yè)務(wù),其他眾多科技公司也相繼宣布斷供俄羅斯。這些事件再次給國人敲響了警鐘,建設(shè)國產(chǎn)數(shù)據(jù)平臺(tái)迫在眉睫。
星環(huán)科技大數(shù)據(jù)基礎(chǔ)平臺(tái)和數(shù)據(jù)庫產(chǎn)品支持完整的SQL標(biāo)準(zhǔn)語法,兼容Oracle、IBM DB2、Teradata方言,兼容Oracle和DB2等的存儲(chǔ)過程,可以實(shí)現(xiàn)平臺(tái)間的平滑遷移。同時(shí)能夠提供統(tǒng)一的架構(gòu),一站式幫忙用戶解決所有業(yè)務(wù)場(chǎng)景,從降低成本、提升效能、平臺(tái)創(chuàng)新、應(yīng)用創(chuàng)新等多個(gè)方面為用戶帶來收益。
星環(huán)科技建立了一整套從老牌數(shù)據(jù)庫到星環(huán)產(chǎn)品的平滑遷移方法論,大致可以分為分析與設(shè)計(jì)、遷移實(shí)施和上線保障三個(gè)階段。
第一階段,分析和設(shè)計(jì)。結(jié)合用戶的現(xiàn)場(chǎng)情況和需求進(jìn)行分析,并對(duì)數(shù)據(jù)流轉(zhuǎn)和整體架構(gòu)設(shè)計(jì)。如將Oracle遷移到星環(huán)科技TDH,TDH支持多種數(shù)據(jù)源接入,并對(duì)于不同的接入方式提供專業(yè)的組件工具。例如星環(huán)科技Transporter支持定時(shí)批量抽取,實(shí)時(shí)流計(jì)算引擎Slipstream支持實(shí)時(shí)數(shù)據(jù)接入,可用于實(shí)時(shí)數(shù)倉等場(chǎng)景。
第二階段,遷移實(shí)施。遷移分為數(shù)據(jù)遷移和業(yè)務(wù)兩大部分。在數(shù)據(jù)遷移方面,星環(huán)科技可以實(shí)現(xiàn)三種遷移方式,1:1平移、按照大數(shù)據(jù)平臺(tái)特性重新設(shè)計(jì)和遷移種選重點(diǎn)進(jìn)行優(yōu)化,用戶可以根據(jù)實(shí)際情況和自身需求進(jìn)行選擇。在業(yè)務(wù)遷移方面,星環(huán)科技平臺(tái)能夠提供完整的配套產(chǎn)品和組件,同時(shí)又能完整支持SQL標(biāo)準(zhǔn),兼容像Oracle存儲(chǔ)過程等特征,在保障業(yè)務(wù)的同時(shí)實(shí)現(xiàn)低成本、平滑遷移。
第三階段,上線保障。星環(huán)科技可以提供雙軌試運(yùn)行機(jī)制,定期進(jìn)行兩邊的數(shù)據(jù)核對(duì),觀察平臺(tái)的運(yùn)行情況,進(jìn)行后期的細(xì)致調(diào)優(yōu)等相關(guān)工作,保障遷移后能夠順利上線投產(chǎn)。
以金融行業(yè)為例,星環(huán)科技可替換的場(chǎng)景包含:風(fēng)險(xiǎn)控制、數(shù)據(jù)倉庫、報(bào)表平臺(tái)、ODS、數(shù)據(jù)集市、投資交易分析回放、客戶分析和客戶畫像等等。例如風(fēng)控的指標(biāo)管理、實(shí)時(shí)預(yù)警、合規(guī)管理、數(shù)據(jù)維度一直是金融行業(yè)中券商最依賴于數(shù)據(jù)處理的部分,可結(jié)合市場(chǎng)風(fēng)險(xiǎn)、信用風(fēng)險(xiǎn)、反洗錢、投資人適當(dāng)性管理等應(yīng)用場(chǎng)景,星環(huán)科技能夠在機(jī)器學(xué)習(xí)算法和風(fēng)險(xiǎn)模型上提供解決方案。其他例如投資交易、行情預(yù)測(cè)、業(yè)務(wù)運(yùn)營等場(chǎng)景,星環(huán)科技都能夠提供全面的支撐能力。
星環(huán)科技提供完整的數(shù)據(jù)庫平滑遷移方案能夠全方位保障數(shù)據(jù)與業(yè)務(wù)遷移,大大降低企業(yè)遷移成本和遷移風(fēng)險(xiǎn)。同時(shí)相對(duì)于傳統(tǒng)數(shù)據(jù)庫,星環(huán)科技大數(shù)據(jù)平臺(tái)以及數(shù)據(jù)庫產(chǎn)品能夠在架構(gòu)、性能、可擴(kuò)展性、以及對(duì)云和AI的支持等能力上獲得極大的提升,幫助企業(yè)快速實(shí)現(xiàn)國產(chǎn)化替代,構(gòu)建自主可控的高性能數(shù)據(jù)平臺(tái)。
圖數(shù)據(jù)庫國化產(chǎn)替代平滑遷移方案 (Neo4j->星環(huán)分布式圖數(shù)據(jù)庫StellarDB)
Neo4j是一款知名的開源圖數(shù)據(jù)庫,但用戶在使用過程中發(fā)現(xiàn)Neo4j存在一定的局限性,例如Neo4j不支持多數(shù)據(jù)庫實(shí)例應(yīng)用,每個(gè)應(yīng)用都需要單獨(dú)的服務(wù)器部署,不便于管理。當(dāng)數(shù)據(jù)量較大時(shí),Neo4j計(jì)算能力存在瓶頸,無法滿足較高要求的計(jì)算需求。此外,Neo4j不滿足高可用的要求,且缺乏統(tǒng)一的資源管理和權(quán)限管理。
Transwarp StellarDB是星環(huán)科技自主研發(fā)的分布式圖數(shù)據(jù)庫,兼容openCypher查詢語言,提供海量圖數(shù)據(jù)的存儲(chǔ)和分析能力,支持原生圖存儲(chǔ)結(jié)構(gòu),支持萬億邊PB級(jí)數(shù)據(jù)存儲(chǔ)。同時(shí),StellarDB具備毫秒級(jí)點(diǎn)邊查詢能力,10+層的深度鏈路分析能力,提供近30種的圖分析算法,具備數(shù)據(jù)2D和3D展示能力。
在遷移方面,StellarDB支持MySQL、Greenplum等關(guān)系型數(shù)據(jù)庫、HDFS、Hive等大數(shù)據(jù)平臺(tái)數(shù)據(jù)源接入,在4.0版本中StellarDB新增通過Kafka、Flink、Spark Streaming等方式接入流式數(shù)據(jù)源,可以覆蓋所有場(chǎng)景數(shù)據(jù)源。同時(shí)提供專業(yè)的數(shù)據(jù)遷移工具實(shí)現(xiàn)數(shù)據(jù)的快速高效遷移。此外,StellarDB與Neo4j的Cypher語法高度兼容,低成本、安全地實(shí)現(xiàn)原有業(yè)務(wù)的平滑遷移和上線。
相比Neo4j,StellarDB在存儲(chǔ)能力、高性能、圖算法、國產(chǎn)化兼容、運(yùn)維管理能力、知識(shí)圖譜能力、接口工具等方面表現(xiàn)優(yōu)異。
StellarDB支持海量圖數(shù)據(jù)的存儲(chǔ)與檢索,可以支持至少萬億頂點(diǎn)以上的圖存儲(chǔ),在某地電信關(guān)系圖譜場(chǎng)景實(shí)現(xiàn)了9700億邊規(guī)模的存儲(chǔ)和穩(wěn)定運(yùn)行,真正意義上將萬億級(jí)圖數(shù)據(jù)庫能力應(yīng)用落地。
替換Neo4j以后,用戶可獲得更高的性能。批量數(shù)據(jù)導(dǎo)入性能提高2倍以上,在深度鏈路查詢能力方面,StellarDB能夠支持12度以上關(guān)聯(lián)查詢,秒級(jí)返回,經(jīng)測(cè)試驗(yàn)證,6跳查詢相對(duì)于Neo4j提高了50倍以上。在圖算法性能方面,StellarDB4.0具有很大性能優(yōu)勢(shì),PageRank算法和強(qiáng)連通子圖算法性能提升3-6倍,LPA算法性能提升8倍以上,在十億級(jí)邊Twitter-2010數(shù)據(jù)集下,StellarDB秒級(jí)響應(yīng),Neo4j在30min內(nèi)無響應(yīng)結(jié)果。
相比于Neo4j,StellatDB支持分布式集群部署,實(shí)現(xiàn)一站式集群管理,同時(shí)提供企業(yè)級(jí)便捷的管理工具,實(shí)現(xiàn)高效的統(tǒng)一資源管理和權(quán)限管理。
StellarDB提供統(tǒng)一調(diào)度和API接口管理能力,相比之前依賴第三方調(diào)度工具,更方便高效。
在可視化能力方面,StellarDB支持2D和3D的圖可視化展示,利用可視化技術(shù)幫助用戶快速獲取數(shù)據(jù)基于關(guān)聯(lián)性的深度洞察,并且提供可視化的數(shù)據(jù)導(dǎo)入、集群監(jiān)控、圖查詢?nèi)蝿?wù)和圖計(jì)算任務(wù)監(jiān)控等功能。
在國產(chǎn)化方面,StellarDB是星環(huán)科技自研圖數(shù)據(jù)庫,且兼容國產(chǎn)化軟硬件,幫助企業(yè)提高國產(chǎn)化水平,滿足信創(chuàng)要求。
此外,星環(huán)科技是國內(nèi)具備圖數(shù)據(jù)庫、知識(shí)圖譜平臺(tái)、圖挖掘應(yīng)用開發(fā)能力的企業(yè),其全棧自研的圖技術(shù)能力可以助力企業(yè)快速挖掘圖數(shù)據(jù)價(jià)值,推動(dòng)業(yè)務(wù)高效高質(zhì)量發(fā)展。
搜索產(chǎn)品國產(chǎn)化替代平滑遷移方案 (ElasticSearch->星環(huán)分布式搜索引擎Scope)
ES在2021年宣布變更 Elasticsearch 和 Kibana 的其中一項(xiàng)開源許可協(xié)議Apache License 2.0,變更為雙授權(quán)許可,即 Server Side Public License (SSPL) + Elastic License,在一定程度上對(duì)許可協(xié)議加以限制。
此外,隨著數(shù)據(jù)量的劇增以及性能要求的不斷提高,ES在集群擴(kuò)展性、可靠性、數(shù)據(jù)讀寫性能、以及數(shù)據(jù)恢復(fù)速度等方面越來越難以滿足用戶的需求。例如,ES單節(jié)點(diǎn)實(shí)例支持的數(shù)據(jù)量有限,當(dāng)集群超過100節(jié)點(diǎn),會(huì)出現(xiàn)連續(xù)失聯(lián)等穩(wěn)定性問題。當(dāng)節(jié)點(diǎn)磁盤損壞時(shí),需要采取全量數(shù)據(jù)拷貝的方式恢復(fù)數(shù)據(jù),工作量大,TB級(jí)別可達(dá)小時(shí)級(jí)別,數(shù)據(jù)恢復(fù)速度比較慢,無法滿足客戶快速實(shí)現(xiàn)數(shù)據(jù)恢復(fù)的需求。
Transwarp Scope是星環(huán)科技自主研發(fā)的分布式搜索引擎,提供PB級(jí)海量數(shù)據(jù)的交互式多維檢索分析服務(wù),能夠?qū)崿F(xiàn)高可靠、高擴(kuò)展性的全文搜索與靈活查詢。能夠兼容常用的ES讀寫接口,比ES更強(qiáng)的數(shù)據(jù)一致性和可靠性,同時(shí)比ES有更強(qiáng)的穩(wěn)定性,實(shí)現(xiàn)分鐘級(jí)快速恢復(fù)單點(diǎn)故障。在性能方面,Scope可以毫秒級(jí)快速響應(yīng)用戶的檢索需求,入庫與查詢能力有發(fā)幅度的提升。此外,Scope是星環(huán)科技自主研發(fā)的搜索引擎,可以滿足信創(chuàng)驗(yàn)收要求。
基于星環(huán)平滑遷移方案論,從ES到Scope的遷移過程可以分為三個(gè)階段,調(diào)研評(píng)估、方案測(cè)試和上線保障。同時(shí)星環(huán)科技支持多種數(shù)據(jù)遷移方式保障數(shù)據(jù)順利遷移,Scope支持ES接口可以實(shí)現(xiàn)原先ES業(yè)務(wù)的平滑遷移。
在數(shù)據(jù)遷移方面,星環(huán)科技支持三種數(shù)據(jù)遷移方案,使用部分ES遷移工具遷移數(shù)據(jù)、通過HDFS將數(shù)據(jù)遷移到Scope和使用Logstash進(jìn)行數(shù)據(jù)遷移,用戶可以根據(jù)需求靈活選擇。
在業(yè)務(wù)遷移方面,Scope支持ES接口,可以實(shí)現(xiàn)ES的業(yè)務(wù)平滑遷移,同時(shí)針對(duì)部分用戶習(xí)慣使用SQL的方式,Scope支持SQL 2003和全文檢索SQL擴(kuò)展,滿足傳統(tǒng)數(shù)據(jù)庫遷移到ES的需求。
相較于ES,用戶遷移到Scope之后,可以實(shí)現(xiàn)海量存儲(chǔ)能力確保百節(jié)點(diǎn)以上規(guī)模集群穩(wěn)定運(yùn)行,強(qiáng)一致性寫入能力確保讀寫數(shù)據(jù)不丟。在高可用能力方面也有非常大的提升,可以確保錯(cuò)誤分鐘級(jí)重啟恢復(fù)。此外,用戶還可獲得多進(jìn)程架構(gòu),內(nèi)存精細(xì)化控制、負(fù)載均衡、數(shù)據(jù)分區(qū)等能力。
星環(huán)科技Scope在政府、金融等行業(yè)有很多ES國產(chǎn)替代落地經(jīng)驗(yàn),幫助用戶在海量數(shù)據(jù)檢索和分析、可擴(kuò)展性、可靠性、數(shù)據(jù)恢復(fù)等能力上獲得極大的提升,幫助企業(yè)完成搜索產(chǎn)品的國產(chǎn)化替代。
分析工具國產(chǎn)化平滑遷移方案 (SAS/SPSS->星環(huán)智能分析工具Sophon)
大數(shù)據(jù)分析工具可以幫助用戶更靈活、更高效地進(jìn)行數(shù)據(jù)分析,挖掘數(shù)據(jù)價(jià)值。隨著數(shù)據(jù)量的劇增,以及深度學(xué)習(xí)算法的不斷迭代以及創(chuàng)新,市面上如SAS/SPSS等分析工具越來越難以滿足企業(yè)用戶更快速、更高效、更靈活以及更低成本的需求。
例如,用戶在使用SAS過程中可能會(huì)遇到如下幾個(gè)問題:首先,其相對(duì)比較封閉,用戶無法針對(duì)單個(gè)功能授予許可證,使用成本高昂;其次,SAS自建機(jī)器學(xué)習(xí)算法有限,深度學(xué)習(xí)算法依賴外部如Python嵌入支持,用戶無法靈活地獲取新的算法;再次,SAS對(duì)分布式讀寫和計(jì)算存在局限性,對(duì)海量數(shù)據(jù)處理及大規(guī)模機(jī)器學(xué)習(xí)難以有效支撐,對(duì)實(shí)時(shí)計(jì)算更是無能為力。
此外,SAS是過程性語言,代碼量偏多,加上閉源特性,SAS社區(qū)不及開源語言活躍。隨著R、Python的流行,SAS人才日漸稀缺,導(dǎo)致企業(yè)難以組織高質(zhì)量團(tuán)隊(duì)。
星環(huán)科技Sophon Base是具備統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等完備算法和豐富算子的企業(yè)級(jí)分布式機(jī)器學(xué)習(xí)平臺(tái),支持從數(shù)據(jù)接入、數(shù)據(jù)處理,到模型訓(xùn)練、服務(wù)部署、線上監(jiān)控的一站式可視化流程。
在多年的行業(yè)積累和項(xiàng)目實(shí)踐上,星環(huán)科技建立了一套模型遷移方法論,整個(gè)過程被定義為8個(gè)階段——業(yè)務(wù)理解、數(shù)據(jù)理解、元模型理解、數(shù)據(jù)準(zhǔn)備、模型遷移、評(píng)估報(bào)告、應(yīng)用和檢測(cè)。星環(huán)科技SAS平滑遷移過程強(qiáng)調(diào)針對(duì)實(shí)際業(yè)務(wù)問題,解決客戶的業(yè)務(wù)痛點(diǎn),產(chǎn)生實(shí)際價(jià)值。
通過對(duì)用戶業(yè)務(wù)、數(shù)據(jù)、元模型的理解后,進(jìn)行相應(yīng)的數(shù)據(jù)準(zhǔn)備,包括框架設(shè)計(jì)、數(shù)據(jù)處理、方案設(shè)計(jì)等。當(dāng)數(shù)據(jù)準(zhǔn)備好后就會(huì)進(jìn)行模型遷移,這一階段主要是進(jìn)行代碼邏輯架構(gòu)梳理設(shè)計(jì)、模型驗(yàn)證等。模型遷移完成后會(huì)對(duì)遷移效果進(jìn)行評(píng)估,確認(rèn)遷移前后的準(zhǔn)確性、一致性、以及優(yōu)化效果驗(yàn)證。最后是部署上線來支持業(yè)務(wù),對(duì)業(yè)務(wù)進(jìn)行持續(xù)跟蹤,不斷優(yōu)化模型,并對(duì)效果進(jìn)行評(píng)估。通過一整套完整的遷移流程,保障SAS平滑、安全的遷移到星環(huán)Sophon。
星環(huán)科技Sophon可以提供完整的SAS模型遷移能力。相較于SAS,遷移到Sophon后可以支持多源異構(gòu)數(shù)據(jù)的接入、豐富的數(shù)據(jù)處理、多個(gè)框架的模型訓(xùn)練及發(fā)布、模型部署和維護(hù)等全過程,多源數(shù)據(jù)和建模流程靈活組合確保綜合性場(chǎng)景高效支撐。用戶可以獲得Sophon自建的200多個(gè)高性能分布式AI算子以及對(duì)自定義算子的支持,完全覆蓋SAS原有的建模能力。同時(shí),Sophon還能帶來模型可解釋性、聯(lián)邦學(xué)習(xí)等額外的支持,更好地支撐模型的業(yè)務(wù)應(yīng)用。此外,在模型的統(tǒng)一管理、發(fā)布及監(jiān)控方面,Sophon也為企業(yè)客戶提供了簡(jiǎn)潔、易用、穩(wěn)定的解決方案,幫助用戶更好地獲取數(shù)據(jù)價(jià)值。