图数据库市场的嬴图,“弗成能三角”的六年闭环之路


跟着企业数据增长,寻找有效办法治理复杂、互相接洽关系的数据也日益重要。比起传统的关系型数据库,图数据库更擅善于此。

Business Research Insights的申报显示,2023年全球图数据库范围约6亿美元,估计2032年将达到21.6亿,2023年至2032年复合增长率估计为18.2%。国内也有调研显示,95%企业认为图数据库是重要的数据治理对象,超65%的厂商认为营业上图数据库优于其他选择,今朝应用处景重要集中在金融风控、讹诈检测等。

嬴图的成就单熠熠闪烁。嬴图开创人兼CEO孙宇熙向雷峰网("大众,"号:雷峰网)回想嬴图的成长过程,感慨完成产品“弗成能三角”的闭环并不轻易。从0到1,嬴图如安在图数据库市场中打出本身的名声?已经是第四次创业的孙宇熙,这些年对数据库市场又有何不雅察?

图数据库市场的嬴图,“弗成能三角”的六年闭环之路

嬴图开创人兼CEO孙宇熙


数据库的市场教导是踩坑踩过来的

做好图数据库这个目标,来源于孙宇熙在2016年的一次创业测验测验。

当时他从EMC分开,停止了本身九年的大年夜厂工作生活后,用两三年做了名为全汗青(Allhistory)的文化产品。这个网站的内核是常识图谱,对内容接洽关系性的请求很强。然而,团队在市场调研后发明,当时很多图数据库都算力不足,数据库穿透才能很差,消费大年夜量资本。

孙宇熙没能找到知足的图数据库。2019年,他亲自下场,成立了嬴图。

作为图数据库市场玩家之一的嬴图成立于2019年,已入选Gartner® 2022《图数据库治理体系市场指南》全球代表厂商,以及登上DataTech 50 2024 / ESG FinTech100全球奖项名单,其在全球图数据库行业地位可见一斑。嬴图也于客岁宣布Powerhouse,标记产品架构的彻底改革,为复杂数据计算、分析和存储供给快速强大年夜的动力支撑。

不合于传统的关系型数据库,图数据库具有更高的灵活性,支撑高维建模和动态建模;能进行更高效的复杂查询与计算、多表接洽关系查询,能实现动态、海量、复杂模型的及时计算与分析;并且是白盒化、可解释的。尤其在查询逻辑上,图数据架构在接洽关系查询时,效力会明显高于关系型数据库;跟着查询深度增长,时耗差别会指数级增长。

然而,当时以传统数据库为默认选项的市场,对图数据库的接收若何?

孙宇熙指出,以前几年的数据库市场纷乱,极大年夜考验用户的断定才能。一个悖论是:用户要知道产品短长就要应用产品,但应用产品前去往须要先采购——有些POC只是走一轮过场,让用户在断定产品真实效力时仍举步维艰。并且,图数据库应能做接洽关系分析,但可能是汉字应用习惯导致,有中国IT从业者会习惯性认为数据“库”就是只存不算。

举例来说,把全国工商数据导在图数据库里,若想知道某公司的对外投资收集里有若干股份在百分之几以上的被投公司,只存不算的数据库无法进行递归式穿透,须要把数据导到Apache Spark或Apache Hadoop再写一套法度榜样,之后把成果导到Excel里传回或做成报表,再找一套可视化对象实现。本该及时完成的事项成大年夜范围批处理,要横跨几个部分、花几天,甚至几周才能实现。

很多头部金融机构和银行都走过“采购只存不算的图数据库”的弯路,可以说,数据库的市场教导是大年夜家踩坑踩过来的。尤其早期,涉及到认知层面的碰撞都邑很激烈——当时有的客户并不看重及时性的意义,嬴图的产品立异在他们眼中就一文不值,“当你不认为越快越强是一件功德时,就会陷入螺旋式内卷”。

图数据库市场的嬴图,“弗成能三角”的六年闭环之路嬴图图数据库产品2大年夜核心,分别是底层的及时图数据库与上层的高可视化平台。底层的分布式、可扩大、可弹性的高机能原生图数据库,能承载万亿级点边的超大年夜范围数据集,经由过程超融合同一图计算架构,供给达到及时级其余微秒、毫秒级查询和分析。

产品从1做到99 要五到十年

市场教导须要时光,是一种集体意识。所幸,对及时性的看重一传十、十传百,孙宇熙在这六年里已感触感染到头部和中部客户的认知在产生变更。

嬴图图数据库的存储引擎、计算引擎,甚至查询说话都是自研。新的查询说话是否会给用户带来进修压力?2024年4月,国际标准化组织(ISO)和国际电工委员会(IEC)宣布了图查询说话(GQL)国际标准的第一个正式版本,嬴图9月就在其最新的Powerhouse版本中供给GQL支撑。在孙宇熙看来,标准出现后对技巧人员而言就不存在进修成本了,须要推敲的只是在SQL和GQL之间做决定。

不过,因为今朝市场教导仍需晋升、图数据库的生态体系和行业应用处景有待完美拓宽等,整体而言,图数据库应用仍处于早期阶段。

到今天,孙宇熙都信赖,图数据库是一种最终数据库。如今市场上同类玩家不多,他这么懂得:任何器械有足够的门槛,做的人就必定很少。


创业初期做市场调研时,孙宇熙发明,国内市场内有三百多种不合类型的数据库,但具体落地质量参差不齐。早期他经常被投资人问到一个问题:你这个产品是基于哪篇论文的?

“有基于一篇论文可以做出的产品吗?一个产品平日要基于上百或上千篇论文吧”,孙宇熙答到。

他指出,光是计算引擎就可能要建立在一两百篇论文的基本上,而图数据库还包含存储引擎、图查询说话编译器或优化器、数据库治理组件等,还涉及到大年夜量可视化问题,这些都建基于浩如烟海的文献。在一篇论文基本上做出的产品,只能说是“PPT创业”。

孙宇熙向雷峰网表示,“功能的完美”、“稳定性”、“效力”这三个重要维度,是数据库级别产品的“弗成能三角”——这个三角没有四五年,根本弗成能达到闭环。巨大年夜的时光成本对寸时光寸金的创业公司而言,也是莫大年夜考验。嬴图在相当长一段时光里,做产品研发都依附本身的资金贮备。

国内图数据库市场玩家中也不乏蚂蚁、华为等大年夜厂的身影,但孙宇熙对嬴图在竞争中的优势依然颇有信念。他不雅察到,今朝“old money”头部金融机构依然是数据库的重要客户,但有时互联网的产品放到监管严格、合规流程请求多的金融机构里,轻易不服水土;且有时大年夜厂内部复杂的阵营偏向与立场不合,也会极大年夜影响产品研发。

嬴图成立于2019年,到如今已迈入第七个岁首。头两年公司还在做产品的闭环,第一年大年夜量时光进行内部实验,实现高效的计算引擎;第二年把计算引擎的功能补全,让它跟存储引擎结合,实现端到端闭环。真正贸易化落地是在第三年。

2021年开端,产品进行赓续迭代,一向到公司成立后的第四第五年,这个“弗成能三角”才慢慢闭环并加强。这时孙宇熙回想两年前产品,发明它就是“能用,但不完美”,“挺苦楚的,意味着那不是一个标准化的解决筹划”。与国内浩瀚厂商不合,嬴图并不知足于只供给定制化的解决筹划。以全球金融风险治理范畴为例,2021 年,嬴图为某银行定制的流动性风险治理图中台体系,一经推出就斩获国际独一的 “流动性风险治理成就奖”,还被 IBM 研究院收录为案例。但孙宇熙深知,定制化虽能解一时之需,却难以推动行业的长远成长。所以,打破定制化局限,创造更具价值的立异样本,经由过程金融+科技手段,才是将金融风险治理迈向更普适、高效的背工棋。

在这两年,嬴图数据库在持续的场景拓展过程中,研发团队慎密环绕实际反馈,对产品机能进行全方位、深层次的优化,针对不合场景下的特别需求,从硬件设备到软件算法,从底层体系到交互展示一一精雕细琢,其体系通用性可以或许无缝适配各类情况与用户需求。孙宇熙指出,可拓展性也是产品的一大年夜重要机能。如今市场上大年夜量产品没有可拓展性,只能办事中小玩家——假如面对大年夜玩家的海量数据,有拓展性的情况下还要稳定,且葆有优胜的机能,这几乎又是一个“弗成能三角”。

不过,即便见过很多场景,国内数据库公司仍面对较广泛的成长痛点,即甲方根本把乙方当“外包团队”应用。孙宇熙说道,中国很多甲方高度依附乙方,要乙方协助寻找需求、设计产品,但常识产权理论上都归给甲方。这种合作模式会导致乙方永远在给别人高度定制开辟,所做的内容没有延续性。

他也感触感染到,很多时刻头部金融机构更能明白本身的需求,也是以,嬴图很多早期的客户是头部金融机构,在两边合作中打磨产品。

嬴图的又一挑衅是身处后疫情时代,客户没钱,本钱市场干涸,劣币驱赶良币,价格战愈演愈烈。在孙宇熙看来,这是一件三败俱伤的工作:有企业用十万去做本该用一百万完成的工程,打败竞对拿下单子,但这大年夜概率会是个烂尾工程;客户会因过多烂尾工程而对全部行业产生掉望,投入更少,导致行业间争抢加倍激烈,由此陷入恶性轮回。

要走过辛苦的时代,嬴图很重视开源撙节。比如孙宇熙很早就留心到了,公有云并不便宜。于是他们在团队范围还在十人高低时,便决定本身搭建私有云,这已经够几十人开辟测试应用,即便加上电费、存储硬盘和监控收集等成本,一年下来也只相当于用公有云两个月的成本,且能保障数据安然。

产品做出来还只是第一步,距离真正工业化道阻且长。以金融业为例,他们对产品效力、体系稳定性和精准性请求很高,要把产品从0到1再做到99甚至120分,才有可能被采取。而产品从0到1可能只需花费一年,但1到99就可能要花五到十年时光。“很多器械做到最后都是工程,一个重研究轻工程的公司是极其危险的”。

图数据库市场的嬴图,“弗成能三角”的六年闭环之路嬴图推出的一系列相干专著 。


第四次创业 情感内核稳定是重要招人标准

前段时光,孙宇熙参加了清华一小我工智能和大年夜数据专委会,与师长教师和卒业校友相聚。大年夜家都在聊出海,嬴图如今也得谈论出海的问题。

嬴图的出海筹划里,跟云厂商合作是一个重要偏向。孙宇熙指出,本年事首年代,嬴图已宣布了嬴图Cloud2.1版本,并已在海外上线。因嬴图客户大年夜多是大年夜型企业,海外的云厂商可以整套组件都安排到客户那端,其API、SDK都能直接调用,云上的解决筹划如图数据库等可以迁徙。

这也是他在过往的职业生活中所感触感染到的。

孙宇熙在清华计算机系学EDA,做CPU芯片设计。卒业后,比起做硬件底层,他更爱好做收集、操作体系,在雅虎美国、微软亚太研发集团就职过研发或研发治理相干岗亭,并曾任EMC亚太研发集团CTO和中国研究院院长。

谈起微软,孙宇熙印象深刻的是“扶植性批驳”的企业文化。它确切存在积极的一面,但硬币的另一面也会表示为不合部分甚至同部分内的奥妙博弈或隐形对抗。

也因为此,嬴图从创建之日起就崇尚TEAL文化,强调组织的自立性、完全性和进化性。团队的员工情感(内核)都异常稳定——这是嬴图雇用时侧重推敲的一点,再次才是写代码、调试测试的工夫等,“情感稳定代表心智的成熟和把控本身情感的才能,这并不轻易,有的须要后天极大年夜气概才能学会”。

图数据库市场的嬴图,“弗成能三角”的六年闭环之路嬴图为员工举办的研学沙龙分享活动,特别邀请了国际有名绩效科学范畴的Ken West 博士。其分享内容聚焦于若何经由过程改变潜意识、晋升自我意识以及激发正能量。

嬴图是孙宇熙的第四次创业。他从1999年硕士卒业到如今工作的近25年中,有十五年时光根本都在创业。小公司从融资到退出或跟大年夜公司归并的过程,他已经历过三次,可以说是一个创业爱好者。

在孙宇熙看来,本身能遭受通俗人难以遭受的压力,甚至不认为那是压力。对于过往他并没有太多可惜,“典范的创业者会选择忘记遗憾”,但在很多个有所冲破的时刻,他都认为成就满满——

面对图数据库所需的高计算力,嬴图很早就意识到,须要解决的核心问题是对超等节点极其高效地穿透。如今,嬴图有个名为“超等节点穿透”的核心专利,是全世界首个摸索超等节点排序技巧的专利,也仅此一个。

当时团队测验测验了几周都没能把这串代码跑通。有次孙宇熙在一个国际航班起飞前都还在测验测验。起飞关电脑后,他左思右想睡不着,半梦半醒间有了灵感,打开电脑写了一个多小时,终于把这串代码跑通。

那是在2019年下半年,他已记不清本身当时是找乘务员要了杯酒,照样原地振臂高呼了两声,但无比确切的是当时真的超等高兴。

在2025年的开端,孙宇熙对将来充斥信念。他信赖,跟着市场对图数据库有更好认知,而嬴图又能为客户创造降本增效的产品和解决筹划,再次巨大年夜的机会也在面前。


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部