电脑在|AWS公布 Amazon DevOps Guru

  • A+
所属分类:电脑常识

AWS re:Invent上,AWS宣布了完全托管的运营服务Amazon DevOps Guru。行使机械学习手艺,这一服务可以辅助开发人员通过自动检测操作问题和建议解救措施来提高应用程序可用性。Amazon DevOps Guru应用了支持Amazon.com和AWS卓越运营多年的机械学习手艺,通过自动网络和剖析应用程序指标、日志、事宜和痕迹等数据,识别偏离正常操作模式的行为(例如,盘算能力设置不足、数据库 I/O过分使用、内存泄露等)。当Amazon DevOps Guru识别出可能导致服务中止的异常应用程序行为(例如,延迟、错误率和资源限制等增添)时,它将向开发人员发出问题详细信息(例如,涉及的资源、问题时间表和相关事宜等),并通过Amazon Simple Notification Service(SNS)以及Atlassian Opsgenie和PagerDuty等互助伙伴集成服务来辅助开发人员快速领会问题的潜在影响和可能缘故原由,并提出详细的修复建议。开发人员可以使用Amazon DevOps Guru的修复建议来削减问题修复时间,无需手动设置或机械学习专业知识即可提高应用程序的可用性和可靠性。 Amazon DevOps Guru没有前期成本或答应,客户只需为Amazon DevOps Guru剖析的数据付费。接见https://aws.amazon.com/DevOps Guru即可最先使用Amazon DevOps Guru。

为了脱节内陆部署的限制并向全球扩展营业运营,越来越多的组织最先转向基于云的应用程序部署和微服务架构,这也导致应用程序为知足客户需求而变得越来越涣散。开发人员需要更多的自动化方式来维护应用程序的可用性,削减破费在检测、调试和解决运营问题上的时间和精神。错误的代码或设置更改、不平衡的容器集群或CPU、内存、磁盘等资源耗尽带来的应用程序宕机事宜将不可制止地导致不良客户体验和收入损失。企业需要破费大量资金和开发人员时间来部署多个监测工具,而这些监测工具通常是离开治理的,而且必须针对负载平衡器错误或应用程序请求率下降等常见问题开发和维护自定义警报。对于希望通过设置阈值以识别和忠告应用程序资源异常状态的企业来说,不仅很难设置准确的阈值,涉及诸多手动操作,而且要求阈值必须随着应用程序使用情况的转变而不断更新(例如,在沐日购物季时突增大量请求)。若是阈值设置得太高,开发人员在运营性能已经严重受损前无法收到警报。当阈值设置得太低时,开发人员则可能获得过多误报并最终忽略警报。纵然开发人员对潜在的操作问题已经有所警醒,仍然很难寻找和确认问题泉源。使用现有工具,开发人员通常很难从图形和警报中确定问题泉源,而纵然找到根本缘故原由,也往往无法解决问题。每次故障清扫都是冷启动,团队必须破费数小时或数天来识别问题,这种事情既耗时又繁琐,从而减缓领会决操作故障的时间,并可能延伸应用程序的中止时间。

Amazon DevOps Guru的机械学习模子采用了亚马逊已往20多年为Amazon.com构建、扩展和维护高可用应用程序的运营专业知识。这使Amazon DevOps Guru能够自动检测运营故障(例如,警报遗漏或设置错误,资源耗尽的早期忠告,可能导致停机的设置更改等),提供有关资源和相关事宜的靠山,并建议解救措施,而无需开发人员具备任何机械学习履历。开发人员只需在Amazon DevOps Guru控制台中单击几下,即可自动提取和剖析所有资源的历史应用程序和延迟、错误率、请求率等基础架构指标,以确立操作基线,然后Amazon DevOps Guru就可以最先通过预先训练的机械学习模子识别与既定基线的误差。当Amazon DevOps Guru剖析系统和应用程序数据以自动检测异常时,它还将这些数据分组为运营洞察,包罗异常指标、随着时间的推移对应用程序行为可视化、以及有关解救措施的建议。 Amazon DevOps Guru还将相关的应用程序和基础架构指标(例如Web应用程序延迟峰值、磁盘空间用尽、错误的代码部署、内存泄露等)相关联并举行分组,以削减冗余警报并辅助用户关注高严重性问题。客户可以通过查看设置更改历史记录、部署事宜以及系统和用户流动,以在Amazon DevOps Guru控制台中天生需要优先关注的潜在操作问题事宜列表。为了辅助客户快速解决问题,Amazon DevOps Guru提供了具有解救步骤的智能建议,并与AWS Systems Manager集成运行手册和协作工具,使客户能够更有效地维护应用程序并治理其部署的基础架构。 Amazon DevOps Guru与Amazon CodeGuru(机械学习支持的开发人员工具,可提供智能建议以提高代码质量并识别应用程序中最昂贵的代码行)一起,使客户可以针对其操作数据使用自动化机械学习手艺,辅助开发人员轻松提高应用程序的可用性和可靠性。

卖力亚马逊机械学习的AWS副总裁Swami Sivasubramanian示意:“客户希望AWS继续在我们可以运用自己的专业知识来提高应用程序可用性的领域中增添服务,并从Amazon.com的多年运营履历中学习。借助Amazon DevOps Guru,我们行使亚马逊过往的履历确立了专门的机械学习模子,辅助客户检测、清扫故障并防止操作问题,并在出现问题时提供智能化建议。这使得客户可以立刻从亚马逊在运营Amazon.com中学到的最佳操作实践中受益,节约设置和治理多个监测系统上所破费的时间和精神。”

只需在AWS治理控制台中单击几下,客户就可以在数分钟内最先使用Amazon DevOps Guru剖析账户和应用程序流动,提供运营看法。 Amazon DevOps Guru通过汇总AWS CloudTrail、Amazon CloudWatch、AWS Config、AWS CloudFormation、AWS X-Ray等多个泉源中的相关数据,让客户可以通过一个控制台可视化其运营数据,削减了在多种工具之间切换的需要。客户还可以在Amazon DevOps Guru控制台中查看相关的运营事宜和数据以获得运营看法,并通过Amazon SNS吸收警报。此外,Amazon DevOps Guru通过AWS软件开发工具包(AWS SDK)支持API终端节点,使互助伙伴和客户可以轻松地将Amazon DevOps Guru集成到其现有解决方案中,以针对高严重性问题提交故障单、分级并自动通知工程师。 PagerDuty和Atlassian已将Amazon DevOps Guru集成到其运营监控和事宜治理平台中,使用其解决方案的客户现在可以从Amazon DevOps Guru提供的运营看法中受益。 Amazon DevOps Guru现已在美国东部(北弗吉尼亚)区域、美国东部(俄亥俄)区域、美国西部(俄勒冈)区域、亚太(新加坡)区域和欧洲(爱尔兰)区域举行预览,并将在未来几个月中在其它区域推出。

小北 使用 iPhone 12 Pro 超广角摄像头于阿克苏地区拍摄。通过 iPhone 12 Pro Max, iPhone 12 Pro, iPhone 12 以及 iPhone 12 mini

跨越170,000个企业依赖Atlassian产物来简化团队互助,组织、讨论和完成事情。 Opsgenie产物卖力人Emel Dogrusoz示意:“Atlassian很幸运能与AWS就Amazon DevOps Guru推出杀青互助,辅助更多开发团队部署代码和运营服务。通过与Opsgenie和Jira Service Management集成,Amazon DevOps Guru可以在预测到潜在问题或确定事宜发生时立刻通知相关团队。Amazon DevOps Guru提供了新的洞察力,而Atlassian确保了最快的响应速度。”

PagerDuty,Inc. (NYSE: PD) 是数字运营治理的领导者。PagerDuty产物副总裁Jonathan Rende示意:“PagerDuty致力于通过全生命周期事宜自动化响应来推动向DevOps文化的转变。我们很喜悦能够通过与Amazon DevOps Guru的集成来继续深化对DevOps的答应。 借助亚马逊数十年来的卓越运营履历和Amazon DevOps Guru的机械学习功效,PagerDuty为我们的配合客户提供了更多的实时信号到响应功效。通过PagerDuty提取的Amazon DevOps Guru的Amazon SNS,AWS客户可以在运营事宜影响用户服务中止之前对其接纳实时行动。”

汤森路透是全球最受信任的信息和资讯提供商,辅助专业人士做出自信的决议并更好的谋划营业。汤姆森路透基础设施托管营业主管史蒂夫·索恩斯说:“客户体验对我们至关主要。在试图防止和减轻影响客户的事宜时,处置可用性、性能和调换请求的多种警报可能是一个挑战。我们很喜悦能够使用Amazon DevOps Guru并行使其机械学习看法为快速解决问题并制止影响客户的事宜提供清晰路径。这一服务与PagerDuty的集成则可以辅助我们将Amazon DevOps Guru提供的问题解决建议实时有效地交付给准确的团队。”

SmugMug是一个提供付费的图片共享和托管服务及在线视频的平台,用户可以在该平台上传照片和视频。 该公司为业余和专业摄影师促进数字化和印刷作品的销售。 SmugMug运营总监Andrew Shieh说:“我的团队一直在寻找让手动事情自动化的方式。我们希望能够通过Amazon DevOps Guru实现这一目的,让AIOps接受我们的许多一样平常义务,简化一样平常运营,从而专注于IT创新。现在,我们不仅知足了营业需求,而且能够超出营业预期,由于我们有更多时间专注于最主要的事情——为我们的组织和客户缔造价值。”

NextRoll通过辅助市场和营销平台构建和增强其营销解决方案提高收益。NextRoll的首席手艺官Valentino Volonghi说:“我们运行着数千个Amazon Elastic Compute Cloud (Amazon EC2) 实例,一直在寻找能够削减团队用于解决运营问题时间的方式。很喜悦能够使用Amazon DevOps Guru并行使其基于机械学习的洞察来辅助我们识别、关联和解决运营问题。这将辅助我的团队节约时间并削减我们的平均恢复时间。”

根据国外媒体报道,受到AKM半导体芯片工厂火灾影响,佳能、尼康、索尼相机可能缺货,三个品牌已经撤回黑五活动促销活动。