大家好,欢迎来到IT知识分享网。
早在2010年,OceanBase就开始了分布式 HTAP的征程。时至今日,十二年过去了,OceanBase一如既往的坚持,并且进行了持续的系列升级。作为企业级原生分布式数据库,OceanBase坚持HTAP已经成为初心。
随着OceanBase的分布式 HTAP越来越成熟,不少人心中也升起了疑惑。分布式 HTAP对于我们普通的用户和业内的开发者,又意味着什么?OceanBase的持之以恒,究竟给我们呈现了何种价值?要想得到这个答案,还需要从真正的HTAP入手加以分析。
站在用户角度分析HTAP的优势场景
Gartner 2016 年首次提出 HTAP并给出明确的定义:即同时支持 OLTP 和 OLAP 场景,需要创新的计算存储框架,在一份数据上保证事务的同时支持实时分析,省去费时的 ETL 过程。后来的经典数据库把业务分成 OLTP 和 OLAP,并通过 ETL 定期将数据从 OLTP 数据库抽取到 OLAP 数据库。其后,又在发展过程中分为两种方式,一种是OLTP 数据库的基础上扩展 OLAP 的能力,另一种是在 OLAP 数据库的基础上引入实时写入能力。
在业内看来,真正的 HTAP(real-time operational analytics)要求先有高性能的 OLTP,且能够很好地支持实时分析。OceanBase正式在这一基础上,以原生分布式架构作为底层,展开了分布式 HTAP的全面征程。
对于用户来说,HTAP 的典型优势场景,一方面包括企业级混合负载,既有简单的 Key-Value 查询,也有更加复杂的跑批作业,甚至是实时分析出报表,需要用到大事务/长事务,以及触发器、外键、约束等严格数据校验功能。另一方面还包括实时数据中台。很多场景会使用 MySQL 分库分表,并将所有 MySQL 分库的数据同步到一个专门的汇聚库做实时分析。具备分布式能力的 HTAP 系统能够同时接管 MySQL 交易库和汇聚库的工作负载。
除此之外,还有在线历史数据统一处理的优势,将在线数据和历史数据统一成一份数据,支持更加灵活的查询方式,降低业务复杂度;以及面向用户的实时分析。较之于传统的数据仓库面向企业内部人员的实时性不强特点,提升系统的实时性和并发处理能力的现实价值就显得尤为重要。
HTAP核心技术赋能消费者
基于HTAP的优势场景,OceanBase进行了全面的优化和升级。诸如通过底层采用优化过的 LSM Tree 存储引擎,在支付宝所有业务完全替换 Oracle/MySQL,存储成本只有原来 B+ 树方案的 1/3 左右。这种方案是为小数据量的实时事务处理量身定制的,读写性能很好但相比 LSM Tree 等新型数据结构存储成本更高。
另外,为了让OLTP 数据库具备 OLAP 的能力,尤其是大数据量 OLAP 的能力,OceanBase 的底层采用了一个基于 LSM-Tree 的行列混合式存储方案,大幅降低存储成本,并在 OLTP 和 OLAP 二者性能取得很好的平衡。同时还将 cgroup 集成到数据库引擎内部做逻辑资源隔离作为另一个契合用户需求的新方案。
如今,我们能够真切体会到,在OceanBase 的分布式 HTAP的赋能下,支持复杂查询和大数据量查询所涉及到的优化器、并行执行、向量执行等核心技术有了本质的突破,数据明细层,数据服务层,应用数据层、HTAP 需要支持高效易用的物化视图,外部表,快速数据导入等需要更好地支持 OLAP 的数据开发和建模能力也有了全面的提高,已经能够与各种数据开发工具和 BI 工具完成适配对接。
在行业看来,以 OceanBase 为代表的分布式 HTAP 数据库具备处理大数据量的能力,大大拓宽了 HTAP 数据库的应用场景。随着市场和用户的认可,OceanBase 相继发布了多个升级版本,增强HTAP能力、大幅提升性能、完善企业级功能、加强诊断监控能力、增强企业级安全性等更加契合用户需求的能力也在日益增强。
12年来,OceanBase在分布式 HTAP方面的坚持,给用户带来了诸多切实的价值,而未来,真正距离产品完全成熟还有很长的路要走。基于OceanBase的既往成绩,也将进一步拉升行业的期待值。不久的将来,在OceanBase的主导下,或将实现更多的 HTAP 技术方案和场景价值。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/89758.html