作为软件质量工程领域产学合作论坛,将产业界问题抛给学界,将学界的成果引向产业界。目前,越来越多的企业选择基于云原生技术构建系统架构,以实现高可靠、易于管理和便于观察的松耦合系统,但由于系统复杂和应用种类繁多,系统的稳定性依旧是一个挑战,是最近两年产学界普遍关注的问题。 本论坛征集/讨论的内容包括:云原生韧性设计、容器技术实践、混沌工程实验、智能监控、可观察性、系统日志分析与优化等
时间 | 议程 | 主持人/演讲嘉宾 |
---|---|---|
11:00 - 11:30 | 面向微服务架构系统的AIOps | 荣国平 |
11:30 - 12:00 | 基于多源异构数据的异常智能分析 | 马宇驰 |
12:00 - 12:30 | 从零打造开源云原生混沌工程平台 | 殷成文 |
12:30 - 13:00 | 百度混沌工程灾难故障场景落地实践 | 郑焱 |
13:30 - 14:00 | 混沌工程的应用现状及发展趋势研究 | 陈屹力 |
特聘教授、SQA实验室负责人
个人简介:朱少民,CCF高级会员、同济大学特聘教授、软件绿色联盟标准评测组组长、QECon大会发起人。近三十年来一直从事软件测试、质量管理等工作,先后获得多项省、部级科技进步奖,已出版了二十多部著作和3本译作,并经常在国内外学术会议或技术大会上发表演讲,曾任IEEE ICST 2019工业论坛主席、IEEE ICST、QRS和DSA、NASAC程序委员、《软件学报》审稿人等。
个人简介:王千祥,华为云计算公司 PaaS技术创新Lab主任,CCF软件工程专业委员会副主任。加入华为之前,他是北京大学计算机系教授,博士生导师,在软件工程领域的CCF A类会议ICSE、FSE、ASE、OOPSLA等上面发表学术论文 60余篇,出版专著一部《应用服务器——原理与实现》,2004年获中创软件人才奖,2007年入选教育部新世纪优秀人才计划, 2008年研究成果获得国家技术发明二等奖。目前主要开展智能化软件研发的研究,包括代码缺陷检测、代码自动修复、代码智能合并、开源成分分析等。
南京大学 副研究员
报告摘要:作为一种架构模式,云原生背景之下,微服务架构得到了更为广泛地应用,催生了多个拥有大量微服务的软件系统,个别系统微服务数量甚至超过十万个,形成了错综复杂的调用关系和难以确定的服务异常传播,给AIOps以及“可观测性”能力的支持带来了巨大挑战。本次报告将围绕面向微服务架构系统的AIOps的机遇和挑战为主题,阐述上述问题、背后的原因以及若干值得探索的研究方向和范式。
个人简介:荣国平,博士,南京大学软件学院副研究员,南京大学-星环科技“星云”数据技术联合研究中心主任,主要研究领域为软件过程、DevOps 、AIOps和数据技术等,主持或参与多项国家级、省部级项目。在TSE、TDSC、IST、SPE、JSS、软件学报等一流期刊以及ICSE,ASE、ESEM,ISSRE,ICSME 等一流国际会议上发表各类论文60余篇。作为首席架构师规划了《开发运维一体化成熟度模型》国家标准的整体架构,出版了第一本中文DevOps教材《原理、方法与实践》。此外,组织了“工业和信息化领域急需紧缺人才(大数据和人工智能)培养工程”丛书,并担任主编。
华为云计算公司 研发工具智能化技术专家
报告摘要:云化场景下,微服务架构与DevOps开发模式下微服务上线节奏快,快节奏大规模的版本上线与测试带来了大量失败和不稳定的测试用例,但分析单个失败用例耗时长达4人时(单微服务测试)或30人时(E2E集成测试),难以满足快速迭代的质量要求,本次分享介绍了华为云在异常智能分析的一些内部实践案例。
个人简介:马宇驰,2017年博士应届加入华为,目前在华为云的PaaS技术创新Lab下属Dev AI Lab担任负责人、研发工具智能化技术专家。
PingCAP 混沌工程团队负责人
报告摘要:Chaos Mesh 是目前最流行的开源混沌工程平台之一,始终以让混沌工程更简单为目标,并不断迭代和完善。本次分享殷成文会从以 Chaos Mesh 为例,介绍如何从零打造开源云原生混沌工程平台,包括 Chaos Mesh 的历史,开源发展的历程,并着重介绍 Chaos Mesh 的实现原理和具体实践,最后会分享 Chaos Mesh 在探索混沌工程生态的探索之路和未来的演进路线。
个人简介:殷成文,现任 PingCAP 混沌工程团队负责人,CNCF 开源项目Chaos Mesh 发起人和维护者。主要负责TiDB Cloud 稳定性治理,推动混沌工程落地和推广工作。曾多次在 KubeCon 和国内云原生相关会议发表 Chaos Mesh 以及混沌工程相关演讲。同时担任信通院分布式系统稳定性实验室高级专家、可信云稳定性标准专家等。
百度资深工程师
报告摘要:混沌工程是一种通过在分布式系统上进行实验,促使系统稳定性在不断受挫中成长,建立抵御生产环境中失控条件的能力以及信心,来帮助系统应对各种不确定性的学科。百度Chaos Gameday活动是常规混沌工程的进阶项目,通过在线上真实环境中对一些全局的黑天鹅事件(如机房断电、骨干网中断等)进行模拟,发现问题、暴露风险,以提升应急响应、组织能力及系统的极端容错能力。 本次分享将介绍百度Chaos Gameday活动的发展历程,结合重大故障场景的落地实践,剖析具体实践过程中的风险控制以及落地路径。
个人简介:郑焱,百度稳定性工程团队技术负责人。2009年入职百度,曾负责百度搜索,地图,feed资讯流等核心产品的业务运维和架构优化工作;当前做为百度稳定性工程团队技术负责人,关注于混沌工程,故障自愈,架构优化等多个技术方向。
中国信息通信研究院云大所副总工程师
报告摘要:在全面上云的背景下,混沌工程作为保障复杂系统稳定性的重要技术手段,提供了主动发现系统稳定性弱点的方法,近几年成为推动企业IT韧性系统建设的强大助力。 本次分享将围绕云原生架构变革,结合重点行业需求,分析混沌工程的核心价值,梳理应对复杂场景稳定性保障手段,重点分析行业应用现状,并探索其混沌工程的未来发展趋势。
个人简介:陈屹力,中国信息通信研究院云大所副总工程师,从事云计算领域产业发展、关键技术研究、标准制定等相关工作,牵头撰写云计算行业20余个标准,曾荣获中国通信学会科学进步奖。目前主要在云原生领域做相关研究,主导国内首个云原生标准体系建设,牵头编制云原生行业发展白皮书等工作。