烽火OLT排障思路--三板斧 OLT作为局端设备,主要用于对终端业务的控制和承载,同时,在整个接入网络中,OLT也作为承上启下的“业务桥梁”,承担着故障处理“分水岭”的重要责任。一旦OLT设备发生异常故障,就会给终端业务造成十分严重和广泛的影响。那么作为接入技术人员,在日常维护工作中,如何根据故障类型和范围,来判断是否为OLT故障引起的原因呢?我们从故障类型着手,来分析和总结一下,如何快速判断和定位由OLT设备导致的故障。 第一关于ONU或HGU无法授权或者授权正常后出现掉注册问题的分析: 首先要检查是否为某个PON口下的单台终端无法注册,还是多板卡多PON口下都出现类似情况,如果是极个别情况,一般就跟OLT没有关系,需要具体查找ONU原因;要是发现大面积都是无法正常授权或注册的,则需要查找OLT原因。具体的检查思路为: 检查PON口的认证模式是否跟局方要求的相符; 确认下挂终端设备是否为互通型,需要检查OLT上的互通开关是否打开; ONU固件版本太低,或者OLT线卡版本和ONU版本相差太大; 如果下面终端设备出现流氓ONU,也会导致某PON口下大面积掉注册情况。 如果发现部分槽位或全部槽位的办法不能正常工作,需要检查OLT的供电电压和电流是否正常。 第二发生语音业务故障时如何分析和定位是否由OLT设备异常引起: 首先也是先确定故障范围,是某一个用户故障,还是整台OLT下都出现了类似问题。通常情况,只有出现大面积的语音业务故障时,才需要把排障重点放到OLT设备上,具体的分析思路为: 检查OLT主控盘上的语音业务配置信息是否存在,并检查到MGC的注册是否正常; 检查OLT上联口能否学到上层交换设备送下来的语音VLAN和相应MAC地址信息; 联系软交换平台确认MGC业务和路由是否正常。 如果发现是PON内通话有问题,PON外是正常,此时需要检查OLT上的ARP语音代理功能是否正常。 第三发生宽带业务故障时如何分析和定位是否由OLT设备异常引起: 宽带业务异常常见的主要现象为:不能拨号上网,网速很慢,经常掉线等。首先也是先确定具体的故障情况和故障范围,是某一个用户故障,还是整台OLT下都出现了类似问题。通常情况,只有出现大面积的宽带业务故障时,才需要把排障重点放到OLT设备上,具体的分析思路为: 检查OLT主控盘上宽带业务配置信息是否存在,并检查到相关VLAN信息是否正常; 检查OLT上联口能否学到上层交换设备送下来的宽带VLAN和相应MAC地址信息; 如果发现大面积用户反映网速慢或经常掉线,需要检查板卡PON口和上联口的即时性能,是否出现流量瓶颈。 如果发现OLT下有MAC地址环回或者漂移现象,则需要在OLT上设置QOS规则进行过滤和丢弃。 如果出现VPN用户不能正常上网,就需要把PC设置成VPN的静态IP,然后挂到OLT的上联口进行测试,如果可以,就判断为PON内问题,如果同样不行,就是局方上层网络问题。 第四 PON网管和OLT发生通信异常的情况,分为以下几种: 部分OLT出现间歇性脱管,但可以ping通,需要检查网管跟OLT之间的路由; 如果是单个OLT出现脱管,但可以ping通,需要检查这个OLT的CPU和内存利用率,MTU值,OLT的任务运行情况,SNMP参数配置,ACL访问控制列表等配置是否异常。 如果单个OLT出现脱管,也不能ping通,则需要到设备现场进行观察板卡告警灯状态,一般需要检查供电和主控盘是否正常。 第五 TL1工单执行落地问题原因分析: 出现单个OLT下工单落地情况,需要检查OLT的CPU和内存利用率,OLT的任务运行情况,SNMP参数配置,内存是否溢出等情况。 出现多个OLT工单落地情况,需要检查OLT上行到网管的路由是否正常。 前期开通测试时,出现某个工单执行失败,需要把此工单指令通过人工方式,在网管上直接录入查看返回结果,来判断是工单指令本身错误还是设备有异常。 第六当OLT上的板卡出现挂死或者脱管情况分析: 如果是全部业务板卡出现脱管,私网不通,重启也不好时,需要检查供电是否正常,主控盘是否损坏,有备用主控的话一定要切换到备板; 如果单个线卡盘出现挂死或脱管,首先要确认私网能否ping通,检查线卡的软硬件版本是否统一,检查线卡盘的内存利用率是否异常,如果重启还是不能恢复,则需要考虑硬件故障,尝试更换解决。 本文来源:https://www.wddqw.com/doc/8fd824e9951ea76e58fafab069dc5022aaea4663.html