快捷搜索:  5G  as  www.ymwears.cn  5g55  双链接  5g优化  电子  5g优化案例

5G配置掉话问题分析指导书

1.1话统 KPI问题分析方法

l掉话 KPI定义

对于 NSA 组网来说,5G 只是 LTE 的一个辅载波,因此 5G 释放分为两种场景, 一种是只有 5G 被释放(用户还可以继续在4G 做业务),一种是4G 和5G 同时被释放,用户无法做业务。因此KPI 分为两类:

l信令流程及统计点

  • 掉话问题分析方法

对于 5G 侧发起的异常释放,当前5G 侧有如下几种异常释放原因话统,可以初步确认是无线原因,还是传输原因,还是X2 消息无响应导致。

N.NsaDc.SgNB.AbnormRel.Radio 无线层导致的LTE-NR NSA DC 场景下 SgNB 异常释放总次数
N.NsaDc.SgNB.AbnormRel.Radio.UeLo st UE LOST 导致的 SgNB 触发 SgNB 异常释放次数
N.NsaDc.SgNB.AbnormRel.NoReply 消息无响应导致的 SgNB 触发 SgNB 异常释放次数
N.NsaDc.SgNB.AbnormRel.Trans 传输层导致的LTE-NR NSA DC SgNB 异常释放总次数

N.NsaDc.SgNB.AbnormRel.Radio.UeLost 统计了 X2 释放请求消息携带“RadioConnection With UE Lost”的情况,主要是 5G 下行 RLC 达到最大重传次数后导致释放。需要排查误码,空口环境等。用N.NsaDc.SgNB.AbnormRel.Radio减去N.NsaDc.SgNB.AbnormRel.Radio.UeLost 就可以得到 X2 释放请求消息携带“Failurein the Radio Interface”的次数。当前主要是分配了专有 Preamble 后,由于没有收到msg3,等待超时后发起释放,对应初始添加SCG 和切换时随机接入失败的场景。N.NsaDc.SgNB.AbnormRel.NoReply 对应 X2 释放请求带“TDCoverallExpiry”的情况。主要场景是 gNodeB 在 X2 口给 LTE 发了 SGNB Modification Required 消息后,一直没有收到 SgNBModification Confirm 消息,也没有收到 SgNB Modification Refuse 消息,直到 X2 等待响应定时器超时(当前版本 20 秒不可配)后发起释放。这种场景需要分析 LTE 侧日志,看 5G 没有收到 X2 响应消息,是因为 X2 传输故障,还是因为LTE 和 UE 空口交互超时,或者是 LTE 其它内部原因导致没有回复。N.NsaDc.SgNB.AbnormRel.Trans 对应 X2 释放请求携带“Transportresource unavailable”的情况, 主要是 5G 检测到传输异常发起释放。传输异常包括S1-U 异常,或者 X2 异常,还有收到核心网发的GTPUERROR IND 导致。

1.1.1关联指标分析

如果根据话统指标隔离到是空口原因掉话,需要分析下空口信道质量和网络负载相关的指标变化。通过KPI 关联分析从正面或者侧面证明网络的变化和差异。通过不同网络的关联KPI 对比,确定网络的限制因素。常用的关联KPI 有:

  • 切换成功率

切换成功率低,说明 UE 无法切换到最强小区,容易导致掉话。因此掉话率高的时候,可以看下切换成功率是否正常。如果切换成功率低,则参考切换问题分析指导书进行分析。5G 站内切换成功率:N.NsaDc.IntraSgNB.PSCell.Change.Succ/ N.NsaDc.IntraSgNB.PSCell.Change.Att * 100%5G 站间切换成功率:N.NsaDc.InterSgNB.PSCell.Change.Succ/ N.NsaDc.InterSgNB.PSCell.Change.Att * 100%

  • 上行平均干扰

主要使用平均值对比,最大值是瞬时采样,并且和网络负荷有关,仅供参考。如果存在持续外部强干扰的话,最小值可能会出现明显差异。由于话统的干扰粒度较大,当话统看到存在干扰时,基本上可以判断存在干扰。但是当话统看到不存在干扰的时候,不一定没有干扰。对于TOP 小区,可以通过 U2000 干扰监测进一步确认是否存在干扰。

  • PRB利用率

PRB利用率用来评估网络负载。PRB利用率高,小区之间下行和上行互相干扰就会更大。下行 PRB 利用率:N.PRB.DL.Used.Avg/ N.PRB.DL.Avail.Avg*100%上行 PRB利用率:N.PRB.UL.Used.Avg/N.PRB.UL.Avail.Avg*100%

  • CCE 聚集级别

  • 平均 CQI

CQI 反应下行信道质量和干扰水平,用单码字衡量即可。平均 CQI:(0*N.ChMeas.CQI.SingleCW.0+1*N.ChMeas.CQI.SingleCW.1+…+15*N.ChMeas.CQI.SingleCW.15)/ (N.ChMeas.CQI.SingleCW.0+ N.ChMeas.CQI.SingleCW.1+…+N.ChMeas.CQI.SingleCW.15)

  • 平均接入距离

随机接入的 TA 值间接反应了 UE 距离基站的距离,通过平均 TA 值反应了用户分布远近。分布越远,说明用户大部分分布在小区边缘,相关的信道条件,KPI 理论上就会差一些。平均 TA 值:(0*N.RA.TA.UE.Index0+1*N.RA.TA.UE.Index1+…+12*N.RA.TA.UE.Index12) / (N.RA.TA.UE.Index0+ N.RA.TA.UE.Index0+…+N.RA.TA.UE.Index12)

  • 平均用户数:

用户数代表网络负荷,可以结合 PRB 利用率,干扰水平趋势一起分析。通常当用户逐渐增加时,一个网络的KPI 是会逐渐降低的。主要有几方面原因,一是由于用户增加,PRB 利用率抬升,邻区之间负荷增加,这个是主要原因;二是随着用户增加,网络中异常终端可能会增  加,通常少量异常终端就可以共享大量失败。

1.1..2操作和外部事件

网络操作和外部事件包含并不限于:站点数改造(持续新建,或者某些时间存在断站),网络调整(翻频,RF 优化,全网参数修改等),周边网元改造(LTE,核心网,传输等),重大节日活动,新款终端上市,主流终端版本升级,运营商资费策略变化等等。这些操作和事件会导致网络拓扑结构,用户分布,用户行为等发生变化,从而导致网络负载,干扰水平的变化,最终影响KPI。比如扩容改造,翻频等,可能让用户发生迁移,减小一个频点或小区的符合,从而导致 KPI 变好。反之,由于传输、供电等原因导致断站,覆盖受损,加上用户分流到其它小区导致负荷增加,KPI 就会变差。。

1.1..3TOP站点或典型站点详细分析

如果根据话统原因,关联指标,外部事件等排查无法定位根因,存在 TOP 站点时,需要采集一段时间 TOP 站点的信令跟踪,然后结合 CHR 一起分析。如果非 TOP 站点问题,也需要选择几个失败相对较多的典型站点进行采数做详细分析。如果话统原因分析时就存在不同的问题分类,则每一类问题原因都需要分别选几个典型站点进行详细采数分析。

2.2 常见掉话原因定位指导

从当前 NSA 现网问题来看,NR 的异常掉话原因主要为 3 大类:无线、传输、Noreply。分别对应 counter 指标为:N.NsaDc.SgNB.AbnormRel.Radio、N.NsaDc.SgNB.AbnormRel.Trans、N.NsaDc.SgNB.AbnormRel.NoReply。

2.2.1 NR 发起Radio 原因异常释放问题定位指导

当 gNodeB 向 eNodeB 发送 SgNB Release Required 消息时,若 SgNB Release Required 消息中CAUSE 为“RadioConnectionWithUELost”或“FailureintheRadioInterface”,则N.NsaDc.SgNB.AbnormRel.Radio 累加。

1.1.1.1话统表现

1、N.NsaDc.SgNB.AbnormRel.Radio.SUL:且 gNodeB 上用户的上行频点在 SUL 频点上,则N.NsaDc.SgNB.AbnormRel.Radio.SUL 累加。主要是针对 SUL 场景;2、当 gNodeB 向eNodeB 发送 SgNB Release Required 消息时,若SgNB Release Required 消息中CAUSE为“FailureintheRadioInterface”,且该释放是因为上行重同步失败(该指标为20A引入指标);3、当 gNodeB 向eNodeB 发送 SgNB Release Required 消息时,若SgNB Release Required 消息中CAUSE 为“Radio ConnectionWith UELost”,则 N.NsaDc.SgNB.AbnormRel.Radio.UeLost 增加;该指标在 NSA 场景比较场景为下行 RLC 达到最大重传;

1.1.1.2信令表现

gNodeB 向 eNodeB 发送 SgNB Release Required 消息,SgNB Release Required 消息中的cause 为“Radio Connection With UE Lost”以及“Failure in the Radio Interface”

2.2.2Noreply原因导致NR掉话

N.NsaDc.SgNB.AbnormRel.NoReply对应X2释放请求携带“TDCoverallExpiry”的情况。主要场景是 gNodeB 在 X2 口给 LTE 发了 SGNB Modification Required 消息后,一直没有收到 SgNBModification Confirm 消息,也没有收到 SgNB Modification Refuse 消息,直到 X2 等待响应定时器超时(当前版本 20 秒不可配)后发起释放。这种场景需要分析 LTE 侧日志,看 5G 没有收到 X2 响应消息,是因为 X2 传输故障,还是因为LTE 和 UE 空口交互超时,或者是 LTE 其它内部原因导致没有回复。

2.2.3TNL原因导致掉话

1.1.1.3话统表现

N.NsaDc.SgNB.AbnormRel.Trans,当前 NSA 场景下 TNL 原因导致掉话只有一级指标当gNodeB 向 eNodeB 发送 SgNB ReleaseRequired 消息时,若 SgNB Release Required 消息中 CAUSE 为“Transport Resource Unavailable”,则 N.NsaDc.SgNB.AbnormRel.Trans累加。

1.1.1.4信令表现

gNodeB 向 eNodeB 发送 SgNB Release Required 消息时,若 SgNB Release Required 消息中CAUSE 为“Transport Resource Unavailable”

2.3排查动作

2.3.1告警、故障日志排查

基站的告警和故障日志可以在 U2000 实时查询。需要排查掉话时间点前后是否存在如下可能导致掉话的告警。

2.3.2信令流程分析

在标口信令中要找到掉话记录,对于NSA 组网,可以在 4G 或 5G 的X2 信令里过滤消息:SGNB_REL_REQ和SGNB_REL_REQUIRED消息。4G 释放又可以细分为三种子场景:1)UE 上报异常导致4G 发起释放由于 NSA 组网下,UE 和基站之间的信令只会在 4G 一侧,所以当 UE 检测到异常时,也是通过4G 上报。4G 基站在收到UE 上报的 ScgFailure 消息后会发起释放。这类释放从终端侧log 可以看到UE 上报 ScgFailure;其它类型掉话,从终端侧看不到是4G 发起,还是 5G 发起释放。

UE 上报的 ScgFailure 消息里会携带异常原因值,常见的有 rlc-MaxNumRetx(上行 RLC 达到最大重传次数)和randomAccessProblem(收不到 RAR,或 SR 达到最大重传次数,或 TA 超时)。2)核心网发起释放

核心网发起释放有两种场景,一种是发送释放命令,把 4G/5G 都一起释放了

还有一种是初始添加 5G 后,或 5G 站间切换后,LTE 发起 ERAB 修改流程,核心网反馈承载修改失败,导致 4G 释放 5G。

3)4G 侧重建或掉话如果 LTE 侧出现 RRC 重建,或掉话,也会导致 5G 释放。这种情况需要先分析 4G 重建、掉话的原因。

2.3.3干扰排查

  • 话统

通过话统字段 N.UL.NI.Avg,N.UL.NI.Max,N.UL.NI.Min 可以查看上行干扰平均值,最大值,最小值的统计。如果空载网络N.UL.NI.Avg > -105,或者N.UL.NI.Min > -110,则可能存在上行干扰。

  • U2000 干扰检测

U2000(U2020)如下图所示位置可以进行上行干扰的秒级监控,可以看到整个带宽平均的和各个RB位置的干扰情况。

  • FFT频谱扫描

当通过前面的数据发现存在干扰迹象时,可通过Weblmt 登录基站做 FFT 上行频谱扫描进一步确认干扰信号的波形特征。如果小区是激活态,就选择“宽带在线频谱扫描”;如果小区是去激活态,就选择“宽带离线频谱扫描”。

扫描结果保存成 mmf 文件,可以使用 FMA 上集成的工具“FFTDataAnalyzer”回放查看。界面如下图所示,“Open”打开跟踪文件,点击“Import”即可看到上行频谱波形。

2.3.45G干扰问题导致的掉话

干扰是常见的一种导致掉话的原因,导致的掉话现象有多种,如下行 RLC 达到最大重传次数,上行 RLC 达到最大重传次数,SR 达到最大次数,TA 超时等等。干扰的类别有很多,例如切换不及时导致的邻区干扰,TDD 系统的环回干扰,时钟偏差导致的小区间干扰,还有外部干扰等。掉话分析主要是先确认是否由于干扰导致,然后才是确认干扰源和排除干扰。通过基站 FFT 频谱扫描发现,在小区工作频带内,存在一个带宽大约 7M 左右的明显外部强干扰。

2.3.55G配置问题导致的掉话

常见的配置问题主要有:漏配邻区导致无法切换掉话;RLC 参数配置不合理,导致状态报告不能及时上报,导致 RLC 重传达到最大次数掉话;SRS 自适应门限设置不合理,导致远点 SRS 带宽不能切换到窄带,基站测量 SRS 信号较弱,无法准确测量 TA 导致掉话;A2 门限配置过高,导致 UE 没有到小区边缘就被正常释放。

2.3.64G配置问题导致的掉话

4G 配置导致 5G 掉话的最常见的场景是 4G 站点和周边某些5G 站点没有配置 X2,并且没有打开 X2 自建立开关,导致 5G 移动拉网测试时不能切换导致掉话。从终端侧看到的现象就是持续上报NR 测量报告没有收到切换命令。

从基站侧信令看到的现象是 5G 侧已经发起了切换,但是 LTE 侧回复切换拒绝。

2.3.7切换失败导致的掉话

切换失败主要场景是 UE 向目标小区随机接入失败。移动拉网测试过程中,一种是 5G 小区间的切换;还有一种是NSA 组网下,LTE 发生切换,5G 服务小区虽然不改变,但是 UE 需要做一次随机接入, 这个过程也可能出现失败。

2.3.8传输故障导致的掉话

传输侧核查。

2.3.9小区故障导致的掉话

导致小区故障的场景很多,比如传输,供电,硬件故障等等各种原因。小区故障导致的掉话,可以通过查看告警进行确认。如下是一个典型的小区故障导致掉话的例子。

5G核心技术交流学习【扫码进群】【扫码回复】:‘ 5G群 ’

华为HCS5GRF工程师资格认证【扫码回复】:‘5G认证‘

咨询客服专员

参与 5G 热评:

    说点什么吧
    • 全部评论(0
      还没有评论,快来抢沙发吧!

您可能还会对下面的文章感兴趣: