本篇文章1774字,读完约4分钟

Cio与zhiding.com应用频道8月10日新京报:8月2日,第四届动视上海用户大会隆重召开。在这次盛会上,dynatrace和行业领导讨论了人工智能技术在应用性能管理方面的新可能性,并展示了dynatrace davis人工智能操作和维护助手及其应用场景。

江苏核电股份有限公司网络系统工程师朱旭东在会上针对dynatrace给企业带来的价值提升,谈到了跟踪每笔交易的三点端到端方式,帮助运维人员深入分析问题;自动建立性能基线,及时发现系统故障;并快速定位和响应问题,从而提高运行维护和管理水平。

江苏核电有限公司网络系统工程师朱旭东

以下是来宾发言的记录:

我是江苏核电的朱旭东。与前者相比,我公司应用系统的用户数量有所不同。我们只有成千上万的用户,主要是局域网应用程序。

让我们简单介绍一下江苏核电。田湾核电站位于江苏省连云港市连云区田湾。它是中国罕见的沿海遗址之一。八百万千瓦压水反应堆核电机组计划在现场建造。俄罗斯vver-1000改进型核电机组用于一期工程1号和2号机组(单机容量为106万千瓦),二期工程3号和4号机组(单机容量为112.6万千瓦)。1号和2号机组分别于2007年5月17日和8月16日投入商业运行。在深化政治互信、发展经贸、加强国际战略合作的政策推动下,中俄两国在核能领域开展合作。今年也是江苏核电成立20周年。三期工程5、6号机组采用CNNC m310+改进型,额定功率1118mw。5号机组于2015年12月27日启动,6号机组于2016年9月7日启动。三期工程建设目前已经全面展开。

以下描述了dynatrace不在线时系统操作和维护的困难。我们使用的系统主要是一个业务系统,用户现在对业务系统有很高的依赖性。在这种情况下,用户对系统异常的容忍度也会降低。我们的系统架构很复杂,各种系统之间有许多服务交互。如右图所示,它是一个常用的核心系统,即企业内容管理系统。该系统是基于ibm filenet bpm开发的,通过灵活的业务操作,可以有效地满足不断变化的客户和业务需求。同时,FileNet bpm与外部服务具有强大的交互功能。另外,系统基本上每周都在变化,所以当系统出现故障时,很难快速定位故障点。此外,我们已经建立了基础设施监控平台,但我们还没有建立应用系统监控平台,也没有应用系统性能基线,因此我们无法预测该系统的性能趋势。每当系统出现问题时,我们只能被动地等待用户报告维修,然后在维修完成后进行处理,所以我们不能及时主动地发现问题。此外,当系统出现故障时,尽量使用传统的手段进行分析和处理,如网络、数据库、服务器和中间件。它需要大量的时间和人力,例如数据库的awr报告分析、网络流量分析、系统heapdump/javacore文件分析,这也要求操作和维护人员具有较高的技能。基于存在的问题,我们对应用系统监控平台进行了调研,并于2016年采用了dynatrace。

过去我们需要几天甚至几周的时间来定位问题。dynatrace上线后,我们可以快速定位应用系统故障,甚至半小时左右,以便安排人员解决问题。以下是一个简单的案例研究,是2016年底的案例研究。下午4点左右,线程数量急剧增加,导致高内存利用率并触发垃圾收集。从cpu负载也可以看出,当时cpu负载急剧增加,这是由垃圾收集引起的。

然后,通过查看页面请求的响应时间,我们可以看到页面请求的响应时间在同一时间点增长非常快,然后我们可以发现第一种方法占用了大量的cpu,即outlinereport。我们发现,在一分钟之内,同一个用户通过不同的线程反复调用这个方法,所以我们可以首先定位到这个方法的代码逻辑可能有问题,然后我们将它提交给系统开发团队进行分析和处理。以上是一个简单的案例分析过程。可以看出,使用dynatrace可以快速定位问题和故障。

使用dynatrace后,它给我们带来了什么价值?首先,dynatrace以端到端的方式跟踪每个事务,帮助操作和维护人员深入分析问题。此外,性能基线可以自动建立,并且可以主动和及时地发现系统故障。对我们更有帮助的是,它可以帮助操作和维护人员快速发现问题并快速定位。此外,基于dynatrace建立了标准的系统故障排除流程,以快速响应并提高操作和维护管理水平。

这就是我要分享的。谢谢你。

标题:江苏核电朱旭东: Dynatrace为江苏核电带来了三方面价值的提升

地址:http://www.nxxlxh.com/nczx/9356.html