评论

收藏

[Hbase] 宕机惨剧年年都有,高可用之路不好走

数据库 数据库 发布于:2021-12-17 12:32 | 阅读数:487 | 评论:0

没有人能保证自家的系统永远不挂掉,这次没挂掉,下次不一定还能顶住。为了应对高可用的挑战,在架构设计之时,架构师就会将异地多活、同城双活、容灾、降级、自愈等因素考虑进去。还有另外一些同学,试图前置发现问题,引入混沌工程,以毒攻毒,让系统走向高可用、弹性化。而业务规模和业务类型一定是在往大了走,往复杂走,所以高可用一定是一个长久的问题。
通常与高可用一起被提及的还有一个词,高并发。在高并发场景下,如何保证系统的可用?堆机器?这是最简单粗暴的办法,但是有一定成本。有没有不需要新增资源的办法?有,弹性设计。好处是可以动态扩缩容、部署起来很方便,弊端是出了问题不好排查。不过,不是所有研发都有机会上到高并发前线,也不是所有业务并发量都能那么高,所以很多人工作了好几年都没遇到过高并发场景。
作为面向架构师的技术盛会,ArchSummit 此次设计了【高可用高性能业务架构】专题,大家最关心的三个方向——高可用、高性能、高并发,在这里都有相应的实战案例。专题由腾讯专家工程师、微信架构部架构总监许家滔担任出品人,我们会挑选业务云原生架构、推荐系统以及线上生活等热点话题来探讨技术的发展方向,希望能沉淀一些最佳实践和大家一起进步。
DSC0000.jpg

现在确认的议题有:


1“从扛住,到全局高可用。”


DSC0001.jpg

5月底,陈杰老师曾和团队同学发布过一篇同名文章,作为本议题的先导介绍,感兴趣的同学可以先行了解。在本次演讲中,他将围绕 K8s 集群的全局高可用体系进行更加深入更加细节的分析,你将了解到阿里巴巴在使用 K8s 开源项目时,是如何从抗住到建设出高可用体系的,如果你也在做 K8s,相信他们的踩坑经验对你也有启发。


2“从加机器,到不加机器。”


DSC0002.jpg

因为国内的疫情向好发展,出行需求迅速恢复,那么对于同程旅行这样的企业来说,必将迎来流量高峰,甚至会比历史流量还要高,主落地页流量较日常翻三倍。而同程已经提前布局了弹性计算和私有云平台,上线以来经过了多次业务洪峰的检验,总结出峰值流量应对、故障自愈、降本增效的宝贵经验。在此次分享中,同程旅行的架构师彭涛老师,将带来的是弹性计算体系的设计思考与在同程旅行的落地经验。


3“从人工,到人工智能。”​


DSC0003.jpg

大家或多或少了解过 Shopee 这一东南亚电商巨头。既然是电商,那么一定会涉及到物流配送的问题,东南亚因语种多样、语料库缺失、GIS 地理信息薄弱等多种原因,其末端物流发展还处于依靠人工的初级阶段,必然的结果就是效率低下、准确度有限、业务拓展速度也受限,这些天然的限制给技术带来的挑战,比你想象的还要复杂。在这种情况下,Shopee 是怎么做末端物流分拣的?你是否也对此感到好奇?在此次分享中,Shopee 智能分拣团队的负责人黄泽武老师,将给你带来 Shopee 是如何基于大数据、人工智能等技术,在东南亚各个国家实现末端物流分拣的自动化、智能化,从而支撑 Shopee 快速发展的最佳实践。
除了以上议题,本专题还将邀请更多一线专家分享在不同团队、不同业务场景、不同技术栈下的架构经验,包括如何实现业务的快速开发并保证其架构具备良好的扩展性和容错能力,如何分析关乎用户体验的系统瓶颈和构建高性能系统。


关注下面的标签,发现更多相似文章