问题:远程办公室的员工会使用基于云的应用语言能动程序但是经常会遇到应用语言能动程序性能不佳,打开慢拥堵等问题。
主张:公司的IT组织会认为是服务器内存鈈足的原因而服务器提供商会认为是企业网络的原因。但是都没有证据
如何快速隔离基于云的应用语言能动程序的问题,提高性能体驗提高工作效率,成为了企业关注的问题
解决问题需要什么信息?
服务器ping往返时间看起来似乎还可以至少当工程师在中央办公室偶爾进行测试时看起来还不错。但是此测试仅验证了客户端网络和云环境之间的网络路径当问题发生时,他们需要数据包级别的详细信息之所以很难做到这一点,是因为问题并不总是在工程师在现场时就发生的他们需要一种方法来简单、持续地从客户端捕获信息,以便問题得以解决
应用语言能动程序最近已迁移到云中,因此网络工程团队不再有权访问服务器端进行捕获
一旦在问题期内正确捕获了问題,就可以测量诸如网络往返时间、服务器响应时间、TCP重传频率和其他TCP离群值之类的统计信息以隔离真正的问题域(无论是客户端、网絡还是云服务器)。
通过将IOTA串联在客户端网络和边缘路由器之间这样IT工程师能够在远程站点上实现***。这个优势使他们能够看到多个愙户的活动而不仅仅是一个。他们可以将问题时期和时间之内的客户活动与良好的性能进行对比
几个小时后,客户报告说他们再次遇箌了性能问题工程师们可以从中央办公室使用基于Web的界面立即访问IOTA,并开始进行故障排除几分钟之内,他们就可以访问隔离问题域所需的核心细节
第1步-确定正确的时间周期
首先,工程师需要过滤问题发生的时间从主页仪表板的开始屏幕中,他们可以跨越问题发生的時间范围并查看该时间段内的IP对话。他们观察到了问题客户机和服务器的地址
第2步-检查服务器响应时间
现在他们有了正确的时间周期,他们需要查看服务器与客户端之间的对话的运行状况使用UserExperience – Application Latency 仪表板,他们可以测量服务器的应用语言能动程序响应时间无论流量是否加密。他们注意到服务器响应时间的最大延迟为206毫秒将其与正常的性能时段进行比较,此度量没有显着变化服务器即使在出现问题期间,也能像往常一样做出响应
第3步-对TCP进行故障排除
接下来,工程师可以使用“TCP Troubleshoot”仪表板查看流量流本身的运行状况并设置往返于服務器IP的流量过滤器。
这就是问题所在在某些时候,客户端和服务器之间的网络往返时间将飙升至超过两整秒!重传统计数据还显示在此问题期间大量丢失了数据包。
将这些数据与正常性能期间的数据包统计数据进行比较工程师可以看到,当客户端拥有良好的体验时網络往返时间很短,并且没有重传
这有助于他们发现,在性能问题期间网络流量下降并且延迟很高。通常这是由网络拥塞或错误的鏈接引起的。
他们还能做些什么来找出根本原因呢
第4步-检查应用语言能动程序带宽
在问题期间,工程师们能够全面调查网络站点的使用凊况通过将带宽仪表板设置为与性能问题相同的时间范围,工程师们能够看到特定应用语言能动程序(Microsoft 365)的利用率出现峰值同样的情況也发生在上一次问题中。
只需单击几下他们就可以看到哪个用户正在将如此多的数据传输到365,以及多久执行一次他们发现,每一个愙户抱怨表现缓慢时都会出现这种效果的高峰。
使用这些仪表板可以使工程师指出问题的主要症状(数据包丢失和高延迟是由网络拥塞引起的),从而将其引导到根本原因(有人不小心将其计算机配置为每小时对Microsoft 365进行一次完全备份!)
IOTA提供了正确的数据正确的时间,與一个简单的工作流程让工程师可以简单和远程访问的数据,解决网络问题