您好,欢迎来到九壹网。
搜索
您的当前位置:首页爱立信APG43统计原理及常见故障处理

爱立信APG43统计原理及常见故障处理

来源:九壹网


关于爱立信APG网元统计无法正常生成的隐患分析

背景

增强网络的服务质量,提高客户感知,是我们一直努力的方向。而提高网络质量,首先必须要采集及分析网元的统计数据,准确的数据统计是网维和网优部门掌握交换机运行状况、网络质量评估和网络资源优化配置的前提。本案以爱立信APG网元统计系统组成及其工作原理为基础,分析当前关于爱立信统计常见故障,并给出解决方法。

问题(任务)描述

在日产维护工作中,时常会发生:

(1)网优无法取到MRR、RIR等统计文件;

(2)话务四期的统计数据不全或者无法取到统计数据;

(3)打印15分钟的话务,

STMFO -i -z SCREEN -b 201204111030 -s 201204111045 CELTCHF -p 15

提示 stmmp:error connecting to server

(4)打印MP信息,STMMP -L -l

提示stmmp:error connecting to server

下面将从Recording和STS系统组成及工作原理出发,分析这些故障原因,给出解决方法。

分析与对策

爱立信APG存在两种类型的统计,Recording类型和STS类型统计。

一、 Recording类型

Recording类型统计使用的是CP文件系统。在BSC或者MSC中配置统计,结果保存在APG的L:\\FMS\\data\\CPF\\EXCHVOLUME目录对应文件夹。在BSC中Recording类型统计文件一共有七类:

BA-List Recording (BAR)

Channel Event Recording (CER)

Measurement Result Recording (MRR)

Radio Interference Recording (RIR)

Cell Traffic Recording (CTR)

BTS configuration data collection (BCDC)

Mobile Traffic Recording (MTR)(在BSC中生成统计文件,但需在MSC中配置统计)

每一类型文件都对应着10到个记录文件,如MRRFIL00, MRRFIL08及MTRFIL63。下面以MRRFIL00-MRRFIL08为例,说明该类统计文件生成及传送原理。

步骤一:CP每小时会生成一个或者数个(依据定义的测量)MRRFILxx文件的子文件,并将结果保存在K:\\FMS\\data\\CPF\\EXCHVOLUME\\MRRFILxx文件夹中。

步骤二:根据定义好的MRRFILxx对应的传送队列(MRRTRQ),各自新生成的子文件都会被加上其对应主文件的前缀MRRFIL00-MRRFIL08(如MRRFIL00_0000000024),然后被送到K:\\FMS\\data\\CPFTQ\\MRRTRQ中,并在原目录(K:\\FMS\\data\\CPF\\EXCHVOLUME\\MRRFILxx)中删除。

(1)对于Recording类型统计为被动传输至OSS,则同时,该子文件被送到K:\\AES\\data\\cdh\\ftp\\OSSDESTx\\Ready中,并发一个通知(Notification)给OSS来取该子文件。

步骤三:OSS收到该通知(Notification)后,会FTP到APG中指定的虚拟目录CDH中取走该文件。

步骤四:OSS会接着将其移送到与Ready平行的Delete目录中(几分钟后,APG会自动将其从Delete目录中清除)。此时,若检查定义到该传送队列中文件的传送状态,发现其状态应为DELETE。

(2)对于主动传输至OSS,则直接将文件传送至OSS对应的目录。

步骤五:跟着倒计时开始(REMOVE TIMER,通过afpls可以查看),单位为分钟。计

到0后,传送队列会将其从K:\\FMS\\data\\CPFTQ\\MRRTRQ中删除,至此该文件从APG中彻底消失。

二、 STS类型

STS(Statistics and Traffic Measurement Subsystem),是爱立信GSM系统中引入的一个专门用于无线话务统计和测量的子系统,是一个运行在AXE IO系统(现网大多使用APG)上的纯软件实现的应用层程序。STS是以Object Type的方式从CP(或者APG)申请统计的结果(Counter值),并将结果存于AP中的数据库中(K:\\STS\\data\\DBTOP)。可以将不同类型的Object Type的统计组织成报告,并通过Measure Program定期地或人工即时地将统计报告生成不同格式的统计文件(ASN.1或Load File)以子目录的形式存放于S:\\STS\\data\\Deliverybuffdir或者S:\\STS\\data\\Deliverydir中以备传到OSS的后台处理程序分析。

STS包括三大功能模块:统计数据(计数器)采集模块、统计数据存储模块和统计报告文件与输出支持模块。

(1)统计数据(计数器)采集模块

CPAP1STSCP中的Counter数据34LAVS256IDS5SGS34MDBCP模块定义Counter规则(LASCS)121AP中的Counter数据AP中定义Counter规则 图1 数据采集功能流程图

Counter(计数器)是STS 数据采集工作的基础,定义于CP或者AP的各个功能块(block)中,负责采集与该功能块有关的统计数据,分为3 类, (1)事件计数器

(EventCounter)记录某个时间发生的次数,如呼叫数;(2)状态计数器(Status Counter)记录某一设备的数量,如定义的话音信道数;(3)累积计数器(Accumulated LevelCounter)记录测量时间内系统扫描到的某个事件数或状态数的和,如负荷累积、话务累积等。

Counter Rule是用来将从CP或者AP的各个Block中采集的计数器转换成Object Type的一个规则设置,若要修改CP中的Counter Rule,需要使用到CP功能模块LASCS。

LAVS,CP中的计数器受LAVS功能块控制,LAVS 的主要作用是支持变量的输出。

IDS(Intermediate DID Store),是为了增强STS的鲁棒性,减少STS处理时统计数据

的丢失,将采集的Counter数据以DID格式立马保存。其中,DID表示Counter原始数据的格式,是一种“数据接口描述”,由一个功能名称和位置编号(Position)组成, 如统计小区话音信道呼叫数的计数器TCALLS, 其对应的DID 为CELLTCHCNT2,系统根据DID可以在其测量数据库中寻找到和TCALLS 对应的变量。

MDB(测量数据库中)保存翻译后的统计数据。

SGS(Statistics Gatherer Service)使得STS 可以从当前网元所有的APG(如MSC中的AP1和AP2)中收集统计数据。

图1为统计数据(计数器)采集模块的流程图:

1、STS从CP或者AP中收集Counter规则;

2、STS周期性(BRP)的向CP或者AP的统计数据输出模块请求统计数据(Object Type)

3、CP(APG)中的LAVS(SGS)请求CP(APG)功能块的Counter数值;

4、CP(APG)功能块的Counter数值输出至CP(APG)中的LAVS(SGS);

5、Counter原始数据保存至IDS;

6、STS对原始数据进行处理(统计数据存储模块功能之一),翻译成Object Type,并保存至MDB中。

(2)统计数据存储模块

STS的统计数据存储在APG的MDB(K:\\STS\\DATA\\Dbtop)中,测量数据库由很多统计类别(ObjectType)组成,每个统计类别中又包含统计对象(Object)和一组计数器。统计类别包括一个该类型对象的集合, 每一个涵盖于一个统计类别范畴内的对象称为统计对象(Object),每一个统计对象都对应一组该统计类别特有的统计计数器。

当CP中的Counter数据经过LAVS模块,以DIDs格式传送至AP后,在AP中将会做如下处理:

(a)使用一定的算法将原始的DID格式的Counter原始数据转换成Object Type格式;

(b)Translation(翻译):给Object Type中的Object分配名称。STS的内部程序给每个统计对象(Objects)分配一个名称,该名称是该测量实体的标识,该过程被称为Translation。Translation依据Translation Table,保证CP和APG中的测量实体对象名称一致。

(3)统计报告文件与输出支持模块

AP1Remote destinationSTS423GOH56数据库7MDBSTSDeliveryDirectory8 步骤一:远端请求统计数据(可设置自动请求(STMRP\\STMMP)和手动请求(STMFO));

步骤二:STS相关进程从MDB中取出统计数据;

步骤三:STS相关进程处理统计数据(以指定格式输出,ANS.1格式或者Load File格式),然后保存至STS Delivery Directory中;

步骤四:在使用GOH传输统计文件至远端情况下,STS相关进行通知GOH,统计文件已经准备好,可以传送;

步骤五:GOH从STS Delivery Directory中取出统计数据(文件保存至OSSDEST1的Ready中);

步骤六:GOH通知远端来取统计文件;

步骤七:如果不使用GOH,远端可以直接FTP至相应目录进行统计文件提取;

步骤八:统计文件传送至远端服务器。

处理结果

问题一:网优无法取到MRR、RIR等统计文件

对于该类问题,需要检查是无法正常生成MRR等统计文件,还是生成的统计文件无法传到网优人员的OSS账号下面,一般遵循以下处理步骤:

1、确定传送方向工作正常。对于被动传送模式来说,通知(Notification)工作OK(一般,Recording类型统计通过被动传送方式传输到OSS)。

C:\\>cdhver OSSDEST1

DESTINATION STATUS NOTIFICATION

OSSDEST1 OK OK

2、确定统计文件能正常生成

MRRFIL00-MRRFIL08为例,查看是否有新文件生成

K:\\FMS\\data\\CPF\\EXCHVOLUME\\MRRFILxx,同时文件是否转移到

K:\\FMS\\data\\CPFTQ\\MRRTRQ中。对于没有正常生成情况,可能原因有来那个种,(a)CP中是否开启测量统计;(b)子文件是否能正常生成。

(a)确认在CP中,对应的Measure Program的状态要为”RECORDING”,CP在进行测量统计。

(b)如果测量统计在进行,但子文件不能正常生成,很可能子文件号与cpfls -l MRRFIL00所显示的ACTIVE号码不同。

C:\\>cpfls -l MRRFIL00

FILE TYPE CMP VOLUME

MRRFIL00 inf yes EXCHVOLUME

TRANSFER QUEUE

MRRTRQ

RLENGTH MAXSIZE MAXTIME REL ACTIVE SIZE USERS

512 no no yes 1422 0 0 [ 0R 0W]

这种情况下,应该强制删除,并重新创建该文件。

3、确认生成的统计文件可以通过传送队列传送走。

问题二:话务四期的统计数据不全或者无法取到统计数据

STS统计数据在OSS的后台处理程序分析后,会送到话务四期,当话务四期的统计数据不全或者无法取到统计数据,可能是由于话务四期和OSS之间的问题,需另处理。这里介绍排查网元侧故障,包括(1)确定传送方向工作正常(与Recording类型一样); (2)确定统计文件能正常生成(重点讨论);(3)确认生成的统计文件可以通过传送队列传送走(与Recording类型一样)。下面介绍统计文件不能正常生成的可能原因及处理方法:

原因一、检查是否有关于AP、CP统计传输方面的告警

C:\\>alist

Object of Reference

SCPS_QItemFiller

STATISTICS AND TRAFFIC MEASUREMENT COLLECTION TIMEOUT FAULT

A TIMEOUT OCCURRED DURING DATA COLLECTION FROM THE CP OR AP

Problem Data

Collection Timeout

该告警表示STS系统定义的,在指定时间内收集CP或者APG的Counter(计数器)值不成功,可能在计数器采集过程中,LAVS模块吊死导致。如果出现这个告警,一般应对CP作小启解决。

原因二、检查统计的定义,包括(1)查看话务四期需要的数据否被准确定义(stmotls);(2)需要的ObjectType的RECORDING状态是否为 “ON”((stmotls));(3)MP 是否为“running“状态(可通过指令 stmrp\\stmmp和进入OSS的SIMA工具查看)。

(1)对于没有正确定义的统计,即没有取需要的Counter(计数器)值,需核查并进行定义;(2)对于需要的Object Type的RECORDING不是为“ON“状态,需要通过指令激活统计(stmotd);(3)对于查看MP不为”running“状态(waiting或者其它状态),需要删除MP,并进行重新定义。

原因三、查看dsdls,应该有:

C:\\>dsdls

…..

NODE PORT

ap1a 1411

ap1a 1468

ap1a 1528

ap1a 1544

DOMAIN APPLICATION STS SGSDUMMY TCP/IP STS SGS TCP/IP STS StmdIpcServer TCP/IP STS OpcfServ CONN-TYPE PID IP ADDRESS TCP/IP 5948 192.168.169.1 192.168.170.1 1412

TCP/IP 5948 192.168.169.1 192.168.170.1 1469

TCP/IP 1116 192.168.169.1 192.168.170.1 1529

TCP/IP 3612 192.168.169.1

TCP/IP 192.168.170.1 1545

ap1a STS ConvServ TCP/IP 1504 192.168.169.1 1578

TCP/IP 192.168.170.1 1579

ap1a 1605

ap1a 1612

ap1a 1654

ap1a 1675

STS ProvServ TCP/IP STS OpCfIpcServer TCP/IP STS lfgConnector TCP/IP STS stmdbrtCmd TCP/IP TCP/IP TCP/IP TCP/IP TCP/IP 5932 192.168.169.1 192.168.170.1 1606

3612 192.168.169.1 192.168.170.1 1614

5932 192.168.169.1 192.168.170.1 1655

1504 192.168.169.1 192.168.170.1 1676

对于没有这些的网元,可能APG系统出现问题,需要TR支持。

原因四:去到K:\\STS\\data\\Dbtop\\2012xxxx中,查看*.idx文件大小是否正常;

原因五:整点时,去到K:\\STS\\OUTPUT\\Deliverybuffdir中,有

MP100x_201208060900_1212等文件夹产生。每个MP文件夹对应一个MP,每个MP文件夹中应有两个文件,一个是C20120806.0900-20120806.1000,这个是记录统计内容的文件。另一个是status1208060900文件,该文件是文本文件,有两行内容,可用type指令打印,记录的是统计输出的结果。

C20120806.0900-20120806.1000 request completed

Output file(s) request successful

有的时候,MP文件夹中只有一个status文件,其中只有一行“Output file(s) request successful”,这说明其实真正的统计文件并没有生成。这种情况很有欺骗性,因为对于传送队列而言,它认为一个新的统计已经生成,就会将其拷贝到K:盘,但是发通知到OSS后,OSS过来发现文件夹中并没有真正有意义的统计结果文件,所以,就不会将文件夹移到Delete目录中,造成一种假相,认为是OSS没有收到通知,或者通知没有被正确处理。

若发生这两种情况,则表明统计数据存储模块或者统计报告文件与输出支持模块有问题,可采取下面方法解决,

问题三:stmmp:error connecting to server

当执行STMFO -i -z SCREEN -b 201204111030 -s 201204111045 CELTCHF -p 15或者STMMP -L –l 等指令,提示stmmp:error connecting to server

查看15分钟统计,或者查看MP设置情况不成功,可能是APG原因,也可能是CP原因。首次尝试对APG的STS相关进程进行重启,若不能解决问题,可尝试对CP进行小启以解决!

cluster res stsprov /off /wait

cluster res stsconv /off /wait

cluster res stsopcf /off /wait

cluster res stsmain /off /wait

cluster res stsprov /on /wait

cluster res stsconv /on /wait

cluster res stsopcf /on /wait

cluster res stsmain /on /wait

总结与提炼(讨论与建议)

获取准确的统计数据是网维和网优部门保障网络性能的基本前提,当无法取到统计数据时,迅速定位原因并修复故障是我们努力的方向。本案例一方面,深入分析了爱立信APG网元统计系统组成(分为Recording类型和STS类型统计)、处理流程及其工作原理;另一方面,总结了爱立信APG网元统计系统应用过程中出现的一些实际问题,并给出解决方案,对网络维护和网络优化工作有一定的参考价值。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务