03.04 异常断网调查
摘要
路由器在使用过程中会出现异常掉线的问题,必须重启才能恢复。杭州电子科技大学网络与计算协会 与 杭电信息技术中心、某运营商、某路由器厂商、某芯片厂商、某 APP 开发方 一同排查后,定位到是 某 APP 在特定网络环境下特定请求的回复在搭载某型号芯片的某路由器上导致有线连接异常,由路由器厂商发布修复固件,并在校内排查处理产生特定回复的异常路径。
基本信息
- 问题简述:某路由器 + 某运营商 用户在打开 某 APP 时,路由器有线端口异常中断,需要重启恢复
- 问题首次出现时间:2.28 晚 22:30
- 排查时间:3.3-3.7
- 问题发现渠道:学生主动反馈 + 运营商接诉请求协助
- 主理人:Ljcbaby
- 参与方:网络与计算协会、信息技术中心、某运营商、某路由器厂商、某芯片厂商、某 APP 开发方
- 问题定性:特定网络环境下的设备兼容性问题,被特定变更诱发后出现
排查过程
第一天,我们先排查了运营商末端设备的问题,然后发现故障疑似集中在某型号的路由器上。一方面,我们开始使用问卷回收一些反馈信息,同时联系路由器厂商尝试获取支持。
当晚,我们获得稳定复现的案例和外部现场信息。将现场信息同步给运营商厂商,并尝试联系 APP 开发方协助排查。
次日,我们在社团内协调了同型号设备并成功搭建了复现环境,并拿到了第一套完整的内外部的故障现场。
在此基础上,设备厂商联合芯片厂商一起进行了现场复现,并在第三日得到了修复固件和大概原因。
定位结论
搭载某型号芯片的某路由器 在收到 特定数据包时触发端口异常。
解决措施
- 社团建议某芯片厂商向各终端厂商修复该问题。经过某路由器厂商授权后,小范围分发特定型号测试通过的修复固件。
- 尽快在校内排查处理产生特定回复的异常路径,缓解搭载特定型号芯片的所有路由器受到的影响。