一、三個(gè) “ wu ” ,走出一條新路
在開(kāi)始研發(fā) KaiwuDB 前,我們?cè)蜃约禾岢鲞^(guò)一個(gè)問(wèn)題:我們究竟“想要”做出一款怎樣的數(shù)據(jù)庫(kù)?又有多少人是真正“需要”這樣的數(shù)據(jù)庫(kù)呢?畢竟,面向傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)應(yīng)用,已有 100 多家數(shù)據(jù)庫(kù)廠商在做。如果我們也做關(guān)系型數(shù)據(jù)庫(kù),意義到底在哪?最終,我們得出的結(jié)論就是:不能一直重復(fù)造 “ 輪 子 ” 。我們需要選定一個(gè)方向、行業(yè)或者領(lǐng)域,實(shí)現(xiàn)創(chuàng)新升級(jí)和行業(yè)引領(lǐng) 。
結(jié)合數(shù)智化轉(zhuǎn)型的背景,不難發(fā)現(xiàn):傳統(tǒng)的金融、保險(xiǎn)、政務(wù)等是 IT 投入較大的行業(yè),他們確實(shí)在數(shù)字化道路上保持前沿,這也意味著在這些領(lǐng)域的創(chuàng)新機(jī)會(huì)相對(duì)有限。對(duì)比之下,如今中國(guó)經(jīng)濟(jì)結(jié)構(gòu)里,新三樣等行業(yè)催生了一列全新的數(shù)字化需求,同時(shí),傳統(tǒng)制造業(yè)的數(shù)字化轉(zhuǎn)型需求還有待滿(mǎn)足,這些都成為了我們的機(jī)會(huì)點(diǎn)。
這也是我們KaiwuDB 名字的由來(lái)。Kaiwu (開(kāi)務(wù)),取自易經(jīng)中的“開(kāi)物成務(wù) ”,意為:通曉萬(wàn)物之理。其中,“ wu ” 亦指 “ 物聯(lián)網(wǎng) ” 。 物聯(lián)網(wǎng)有著龐大的數(shù)據(jù)量和爆炸式的數(shù)據(jù)增長(zhǎng),我們希望扎根物聯(lián)網(wǎng),為亟需轉(zhuǎn)型的傳統(tǒng)制造業(yè)以及新興的物聯(lián)網(wǎng)行業(yè)提供更貼合業(yè)務(wù)的數(shù)據(jù)庫(kù)產(chǎn)品與解決方案。“ wu ” 又為 “ 服務(wù) ” ,我們希望通過(guò)吃透客戶(hù)的場(chǎng)景需求,為客戶(hù)提供更加優(yōu)質(zhì)到位的服務(wù),真正有效解決用戶(hù)的問(wèn)題。最后,“wu“還為“ 悟 ” ,我們希望借由 AI 等各種創(chuàng)新能力幫助用戶(hù)深層次挖掘數(shù)據(jù),悟出數(shù)據(jù)中的隱藏的價(jià)值。在這三”wu“之下,便有了我們KaiwuDB。
說(shuō)到物聯(lián)網(wǎng),很多伙伴的第一反應(yīng)是,這不是時(shí)序數(shù)據(jù)庫(kù)的賽道么? 其實(shí)不盡然。在實(shí)際業(yè)務(wù)場(chǎng)景中,沒(méi)有任何一位客戶(hù),即使是物聯(lián)網(wǎng)行業(yè)的客戶(hù),單純依靠一套時(shí)序庫(kù)完成全部業(yè)務(wù)閉環(huán)。但凡用戶(hù)需要數(shù)字化轉(zhuǎn)型,就一定涉及到整個(gè)底層數(shù)據(jù)基座的煥新升級(jí)。在此過(guò)程中,除涉及到大部分的時(shí)序數(shù)據(jù),也不可避免的需要處理來(lái)自管理、業(yè)務(wù)等方面的流程數(shù)據(jù)。而只有將不同類(lèi)型的數(shù)據(jù)融會(huì)貫通,并通過(guò) AI 提供更好的數(shù)據(jù)分析能力,才能打通整個(gè)基座的 “ 任督二脈 ” ,應(yīng)對(duì)用戶(hù)多維度的業(yè)務(wù)和數(shù)據(jù)處理的管理需求。這就是為什么我們首創(chuàng)提出了 ” 分布式多模數(shù)據(jù)庫(kù) “ 這一概念 。
二、有效 / 高質(zhì)量的多模,裝備戰(zhàn)略缺一不可
如今,市面上不少?gòu)S商都圍繞”多?!霸谧鲆恍┦虑?。比如:將不同類(lèi)型的數(shù)據(jù)模型處理能力通過(guò)簡(jiǎn)單的”粘合“集中在一套數(shù)據(jù)庫(kù)中提供給客戶(hù)。但這樣是否真的可以滿(mǎn)足我們的客戶(hù),還需要打個(gè)問(wèn)號(hào)。
恰巧最近我也在回顧歷史書(shū)籍時(shí)看到“洋務(wù)運(yùn)動(dòng)”,給我啟發(fā)很大。在印象中大家普遍認(rèn)為,當(dāng)時(shí)我們的武器裝備很落后。但事實(shí)是,我們購(gòu)置了不少?lài)?guó)際一流的武器裝備,卻還是輸了戰(zhàn)爭(zhēng)。究其原因,是因?yàn)槲覀儧](méi)有一套系統(tǒng)的方法論,沒(méi)有明確的戰(zhàn)略來(lái)組織不用武器及兵種間的協(xié)調(diào)配合,這其中有很多地方,和多模是非常類(lèi)似的。
比如,如果我們只是將不同的數(shù)據(jù)處理能力打包在一個(gè)庫(kù)里交付客戶(hù),那結(jié)果可能和洋務(wù)運(yùn)動(dòng)那場(chǎng)戰(zhàn)爭(zhēng)一樣,注定失敗。因?yàn)橥ㄟ^(guò)簡(jiǎn)單的打包交付,我們的客戶(hù)依然不清楚如何更好的處理關(guān)系與時(shí)序數(shù)據(jù)、如何進(jìn)行更智能更有策略的數(shù)據(jù)分析等。所以我們?cè)谒伎级嗄r(shí),背后是有立體化戰(zhàn)略支撐,針對(duì)客戶(hù)的每一場(chǎng)戰(zhàn)役,我們都會(huì)給出最優(yōu)的武器裝備組合。我們想做的多模,絕不是單純給用戶(hù)一筐子武器自行發(fā)揮,而是幫助用戶(hù)有機(jī)地打包組合,并提供適合用戶(hù)場(chǎng)景的打法戰(zhàn)略,攻下數(shù)據(jù)價(jià)值挖掘的高地。
三、用多模實(shí)現(xiàn)對(duì)行業(yè)的 one size best fit
One size fits all 是一個(gè)業(yè)界頻繁探討的話(huà)題。首先,我個(gè)人并不是 One size fits all 的信徒?;仡檾?shù)據(jù)庫(kù)整體的發(fā)展歷程,從最開(kāi)始的通用型數(shù)據(jù)庫(kù),到后來(lái)逐漸細(xì)分出不同類(lèi)型的專(zhuān)用數(shù)據(jù)庫(kù),不難發(fā)現(xiàn)真正要實(shí)現(xiàn) “One size fits all” 并不容易 。而多模數(shù)據(jù)庫(kù)也不意味著就一定是籠統(tǒng)的“one size fits all”。
1 、 “ 克制 ” 地做多模
我們?cè)谧龆嗄r(shí),其實(shí)是很“克制”的。所謂克制,可以理解為行業(yè)不需要我們不給,客戶(hù)用著累贅我們不放 。比如,我們現(xiàn)在針對(duì) AIoT 的用戶(hù),重點(diǎn)開(kāi)放了時(shí)序處理能力,關(guān)系處理能力(包括事務(wù)和分析能力)以及AI 的能力等。向量數(shù)據(jù)庫(kù)的能力我們也做了,但并沒(méi)有開(kāi)放出來(lái)。因?yàn)槲覀冃枰仍趯?shí)際場(chǎng)景中去驗(yàn)證向量數(shù)據(jù)庫(kù)能力究竟能在物聯(lián)網(wǎng)場(chǎng)景為用戶(hù)做哪些有價(jià)值的事情。只有在充分驗(yàn)證有效的前提下,我們才會(huì)將這部分能力開(kāi)放給用戶(hù)。我們的“克制”,是想要做到對(duì)用戶(hù)負(fù)責(zé)。
2 、 ” 有機(jī) “ 地做多模
克制的同時(shí),我們還在尋求如何讓多模實(shí)現(xiàn)有機(jī)的結(jié)合。融合是多模的核心,但我們清楚多模是一個(gè)相對(duì)較新的賽道,想要在一夜之間將所有模型的融合做到完美并非易事。所以,我們堅(jiān)持選擇面向重點(diǎn)行業(yè),貼近場(chǎng)景去打磨我們的多模優(yōu)化器、多模執(zhí)行器、多模調(diào)度等。同時(shí),我們非常清楚,就物聯(lián)網(wǎng)賽道而言,我們最關(guān)鍵的武器一定是時(shí)序引擎。所以針對(duì)時(shí)序能力,我們通過(guò)自有的就地計(jì)算、內(nèi)存映射等創(chuàng)新技術(shù),逐步開(kāi)發(fā)我們的存儲(chǔ)引擎、計(jì)算引擎,以實(shí)現(xiàn)更優(yōu)的性能,更好的擴(kuò)展性等。
總結(jié)來(lái)說(shuō),KaiwuDB 面向行業(yè)的多模設(shè)計(jì)原則,與市場(chǎng)上的其他廠商還是有明顯的差異化的。雖然我并不覺(jué)得 One size fits all ,但是我們相信,通過(guò)捕捉特定業(yè)務(wù)場(chǎng)景和行業(yè)底層的共性,配合更多融合性、針對(duì)性的戰(zhàn)略打法,至少可以實(shí)現(xiàn)對(duì)行業(yè)的 best fit 。
四、堅(jiān)信 AI ,但絕不上頭
我們始終認(rèn)為,在談 IoT 時(shí), AI 應(yīng)該放在前頭,這也呼應(yīng)了我們 KaiwuDB 為什么要取自“開(kāi)物成務(wù)”,即要通曉萬(wàn)物之理。我們堅(jiān)信,AI 和數(shù)據(jù)庫(kù)融合是非常有必要的?;乜次锫?lián)網(wǎng)整體趨勢(shì),特別是在過(guò)去的十幾年里,隨著數(shù)據(jù)量的激增,數(shù)據(jù)的單位價(jià)值在不斷下降。“ 數(shù)據(jù)庫(kù)的價(jià)值,取決于數(shù)據(jù)庫(kù)里數(shù)據(jù)的價(jià)值 ” ,這是我當(dāng)年剛?cè)胄械臅r(shí)候,我的首席架構(gòu)師分享給我一句記憶猶新的話(huà)。這也正是我們現(xiàn)在的思路——通過(guò)不斷激發(fā)出數(shù)據(jù)新價(jià)值,數(shù)據(jù)庫(kù)本身才會(huì)更具價(jià)值。AI 就是實(shí)現(xiàn)這個(gè)價(jià)值的一個(gè)很好的加持。
我從事 AI 和數(shù)據(jù)庫(kù)的融合研究近10年,過(guò)程中發(fā)現(xiàn)大家對(duì) AI 和數(shù)據(jù)庫(kù)融合這塊可能會(huì)存在一些誤區(qū):
1、預(yù)期誤區(qū)——總覺(jué)得 AI 無(wú)所不能,但往往最終融合的結(jié)果可能不盡如人意。這導(dǎo)致最后對(duì) AI 的看法非常兩極分化;
2、但凡有新熱點(diǎn),就一定要用上。在我看來(lái),大模型也并非絕對(duì)的靈丹妙藥。即便是在AI領(lǐng)域,也應(yīng)該遵循“ 開(kāi)什么鎖,用什么鑰匙 ” 的原則。
看清 AI 背后的邏輯后,我們給自己定了一個(gè)原則:要?jiǎng)?wù)實(shí),不跟風(fēng)。在面對(duì)一些抉擇時(shí),我們堅(jiān)持 “ 用對(duì)的,不用貴的 ” 。也就是說(shuō),但凡我們開(kāi)放的功能,就是奔著實(shí)實(shí)在在解決客戶(hù)問(wèn)題去的。如果 classic (經(jīng)典的)模型比大模型在某一問(wèn)題上效果更佳,那我們就會(huì)尊重效果,選擇經(jīng)典。
比如我們之前在做自治能力時(shí),有一個(gè)自治框架,我們會(huì)用到一些時(shí)間預(yù)測(cè)方法,而不是全然大模型。 當(dāng)然,如果在某些問(wèn)題上大模型效果好且成本合適,我們也定然會(huì)去選擇。我們是擁躉創(chuàng)新的。但我們也要保持清醒的頭腦,做出理智的探索,“大而無(wú)當(dāng)”的方法也許不會(huì)出錯(cuò),但“小而得當(dāng)”的設(shè)計(jì)興許可以一招制敵。因此,我們的最終評(píng)判標(biāo)準(zhǔn),就是用戶(hù)收到的價(jià)值與效果。
五、擁抱開(kāi)源 —— 開(kāi)放、開(kāi)拓、開(kāi)創(chuàng)
從做 KaiwuDB 的第一天起,我們就在規(guī)劃開(kāi)源。最前面有提到,我們其實(shí)是有一個(gè)非常強(qiáng)烈的初心——幫助有需要的用戶(hù)去做更有價(jià)值的事情。如果我們想把這件事做好,我認(rèn)為一定需要有開(kāi)放的心態(tài),跟大家共創(chuàng)。
同時(shí),我們也意識(shí)到每個(gè)行業(yè)都有很多新興的環(huán)節(jié)與參與方。比如物聯(lián)網(wǎng),或是傳統(tǒng)制造業(yè)的轉(zhuǎn)型,這其中有很多事情,包括智能終端、實(shí)時(shí)操作系統(tǒng)、以及上層應(yīng)用等,是一條很長(zhǎng)的產(chǎn)業(yè)鏈。我們希望通過(guò)開(kāi)源,能夠聯(lián)合產(chǎn)業(yè)鏈上各位友商、上下游的伙伴以及研究機(jī)構(gòu)等打造 ” 朋友圈 “ ,共同協(xié)作把行業(yè)做起來(lái),實(shí)現(xiàn)開(kāi)拓共贏。
最后我們也希望通過(guò)開(kāi)源去開(kāi)創(chuàng)一個(gè)新的賽道 。我們有很多的構(gòu)想和規(guī)劃,比如時(shí)序引擎優(yōu)化、多模架構(gòu)的進(jìn)一步融合等,還等待著我們?nèi)?shí)現(xiàn)。未來(lái)我們希望與廣大開(kāi)源伙伴以及數(shù)據(jù)庫(kù)的專(zhuān)家們一起共創(chuàng),碰撞出更多思維的火花,在這個(gè)賽道上去落地更多的創(chuàng)新與暢想。