您好,欢迎来到九壹网。
搜索
您的当前位置:首页一种基于大数据技术的用户行为分析与服务推荐框架[发明专利]

一种基于大数据技术的用户行为分析与服务推荐框架[发明专利]

来源:九壹网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 1084604 A(43)申请公布日 2018.08.28

(21)申请号 201810212948.1(22)申请日 2018.03.15

(71)申请人 重庆邮电大学

地址 400065 重庆市南岸区崇文路2号(72)发明人 徐光侠 唐杰 刘宴兵 赵泽浩 

黄卿怡 (51)Int.Cl.

G06Q 10/04(2012.01)G06Q 50/10(2012.01)G06N 3/08(2006.01)

权利要求书1页 说明书4页 附图2页

(54)发明名称

一种基于大数据技术的用户行为分析与服务推荐框架(57)摘要

本发明请求保护一种基于大数据技术的用

涉及基于数据挖掘户行为分析与服务推荐机制,

的用户行为预测模型以及服务推荐两部分。基于大数据的实时性计算方法研究,为数据服务层提供准确且实时的分析结果。基于机器学习算法对用户行为进行建模分析与服务推荐,采用机器学习算法精确生成用户行为预测模型。在用户行为预测模型基础上,利用深度神经网络算法进行服务推荐,达到快速准确识别用户行为并进行服务推荐的目的。

CN 1084604 ACN 1084604 A

权 利 要 求 书

1/1页

1.一种基于大数据技术的用户行为分析与服务推荐机制,其特征在于:主要包括基于数据挖掘的用户行为预测模型以及服务推荐两部分。用户行为预测模型通过提取用户行为特征生成用户画像,使用一种基于居民行为预测图和循环神经网络的用户行为预测方法对用户行为进行预测。为达到快速准确识别用户行为并进行服务推荐的目的,使用深度学习下张量分解快速推荐算法:利用用户、服务、时间基于用户画像相似度分割区域进行分割处理,再利用张量分解快速推荐算法进行服务推荐。

2.根据权利要求1所述一种基于大数据技术的用户行为分析与服务推荐机制,其特征在于:用户行为特征提取如下:

S21:采用轮廓提取法提取运动目标。由于运动由一系列人体姿态序列组成,在姿态识别的过程中,很难提取出运动的变化特征,采用侧轮廓来进行人体运动的描述。

S22:混合高斯模型背景建模:将运动目标从视频图片中提取处理。S23:基于OpenCV的轮廓提取算法:在OpenCV函数库的基础上加以修改,进而采用cvFindContours进行轮廓特征提取。

S24:星型骨架方法:根据星形骨架方法获得的5个极大值点与质心的偏移量作为人体行为特征。

3.根据权利要求1所述一种基于大数据技术的用户行为分析与服务推荐机制,其特征在于:用户行为预测模型如下:

通过提取的用户行为特征,对用户进行行为预测。用户行为分析预测模型是基于决策树算法C5.0进行设计的,应用决策树来实现对用户的行为进行预测,进而得到用户行为预测图。

4.根据权利要求1所述一种基于大数据技术的用户行为分析与服务推荐机制,其特征在于:基于用户行为预测图和循环神经网络的用户行为预测方法如下:

基于决策树的用户行为预测向量,依据用户对服务的选择记录对每个用户的时序行为进行建模,从而刻画用户的短期行为特征。采用循环神经网络对用户的行为进行建模预测模型。

5.根据权利要求1所述一种基于大数据技术的用户行为分析与服务推荐机制,其特征在于:数据预处理如下:

S51:服务维度切割:经过基于语义的Web服务发现技术过程,可以过滤大量无关服务,将任务相关服务从全局视图中切割出来,并根据子任务分离成若干个服务子集。

S52:用户纬度切割:由于实际SOA系统环境中用户规模极为庞大,需对用户维度进行切割

S53:时间纬度规约:张量RM×N×C中,C代表最细粒度的时间点,这对于运行推荐算法而言复杂度较高,须进行规约。

6.根据权利要求1所述一种基于大数据技术的用户行为分析与服务推荐机制,其特征在于:张量分解标签推荐算法如下:

经数据预处理后,将获得若干用户-服务-时间小数据集,令Ri×j×k代表任意小数据集,基于Ri×j×k设计张量分解算法。定义:Xijk≈Yijk。

2

CN 1084604 A

说 明 书

1/4页

一种基于大数据技术的用户行为分析与服务推荐框架

技术领域

[0001]本发明涉及一种基于大数据技术的用户行为分析与服务推荐机制。通过智能视频监控系统获取用户行为特征,基于机器学习算法对用户行为进行建模分析与服务推荐,采用机器学习算法精确生成用户行为预测模型。在用户行为预测模型基础上,利用深度神经网络算法进行服务推荐,属于数据挖掘与物联网的交叉领域。背景技术

[0002]大数据与云计算平台有着千丝万缕的联系。数据是资产,是不可或缺的基础资源,云计算作为计算资源的底层,支撑着上层的大数据处理,实现实时交互式的查询效率和分析能力。IBM、甲骨文和HP等解决方案提供商、设备商,主要基于Hadoop架构为企业客户提供大数据应用产品和解决方案。其中,IBM提供的大数据产品包括基于Hadoop开源平台开发的云平台系统、流数据处理软件Streams、分析工具BigIn-sights、数据仓库Warehouse等大数据分析产品。[0003]智能社区现有的技术已经落伍,采用的依然是网站式的数据处理方式。而现有的国外名企IT核心计算处理层大多为Hadoop,MapReduce,Spark,在此之上,还应用有不同的计算范式,如批处理,流处理和图计算等。著名的亚马逊正是将灵活的MapReduce程序建立在Hadoop框架顶端,高效精确的分析并建立了用户行为模型,并且快速准确的对数十亿人群进行服务推送。[0004]我国“智慧社区”取得了积极进展,得益于大数据、云计算技术的快速发展,基于大数据的服务云平台也成了许多“智慧社区”的首要发展对象。然在当前技术下,用户行为模式刻画不精确,不及时,从而导致系统推荐的服务与用户实际需求的服务南辕北辙。发明内容

[0005]为了克服上述现有技术中存在的缺陷,本发明提供了一种基于大数据技术的用户行为分析与服务推荐框架,用于精确刻画用户的行为模式,并进行精准的服务推荐。在此基础上,本发明采用星形骨架方法、决策树C5.0等机器算法快速、精确地生成用户行为预测模型,在服务推荐时,基于深度神经网络学习算法为用户提供精确的个性化推荐。[0006]为实现本发明的上述目的所提出的框架,我们提供了具体的解决方案包括两个部分;

[0007]1、基于深度学习的张量分解快速的服务推荐方法。[0008]针对未来社区服务云平台分析引擎的准确、迅速的特点,提出一种基于数据挖掘的用户行为预测模型,该模型通过提取用户行为特征生成用户画像,使用一种基于居民行为预测图和循环神经网络的用户行为预测方法对用户行为进行预测。使用深度学习下张量分解快速推荐算法:利用用户、服务、时间基于用户画像相似度分割区域进行分割处理,再利用张量分解快速推荐算法进行服务推荐,达到快速准确识别用户行为并进行服务推荐的目的,为大数据分析引擎提供支持。

3

CN 1084604 A[0009]

说 明 书

2/4页

2、基于并行计算框架的实时计算方法。

[0010]实现了一个定制化的大规模神经网络训练并行计算平台,平台采用分布式存储优化策略、内存计算的设计思想,实现基于内存计算的高效神经网络迭代训练并行化计算框架,保证神经网络训练算法的快速执行。基于矩阵模型实现统一编程模型与接口,为系统应用层数据分析计算提供透明的加速平台和易用性接口。附图说明

[0011]图1是本发明的系统结构图;[0012]图2是决策树算法流程图[0013]图3是决策树执行过程流程图[0014]图4是用户行为时序预测模型图

具体实施方式

[0015]下面结合附图对本发明的具体实施作进一步的详细阐明。[0016]图1是本发明的系统结构图。涉及基于数据挖掘的用户行为预测模型以及服务推荐两部分。用户行为模式预测与服务推荐针对社区用户的行为建立预测模型,生成精准的服务推荐。使用星型骨架方法对用户的特征进行提取,并将特征存入居民用户行为训练数据库。基于居民行为预测图和循环神经网络的用户行为预测方法初步预测用户行为。为解决推荐服务准确率的问题,使用深度学习下张量分解快速推荐算法:利用用户、服务、时间基于用户画像相似度分割区域进行分割处理成3维数据,再利用当下流行的张量分解标签快速推荐算法进行标签的计算。最后引入深度学习技术,针对张量分解为非凸优化问题,无法保证生成三个隐特征矩阵、算法收敛过程非常依赖初值设定等问题,利用深度学习可训练出较准确的初始隐特征矩阵,进而通过张量分解算法获得更精准的预测。步骤如下:[0017]1、用户行为特征提取

[0018]通过智能视频监控系统获取用户行为特征。从视频中用户的运动提取用户行为,是用户行为提取的关键。运动是由一系列人体姿态序列组成的,在姿态识别的过程中,如果采用正面轮廓来描述人体运动,由于摄像头拍摄的特点,很难提取出运动的变化特征,因此,采用侧轮廓来进行人体运动的描述。同时描述人体运动的行为特征如果过于简单则描述不准确,很难精确识别人体行为,如果行为特征过于复杂,则计算量太大,影响系统运行效率。本项目采用星型骨架方法提取的运动特征是用人体头和四肢到质心的角度偏移量作为视频图片中运动目标的行为特征,在提取前,需要用轮廓提取法将运动目标提取出来。[0019]步骤一:混合高斯模型背景建模。根据视频监控,采集需要的视频资料,采用混合高斯模型背景建模方法,将运动目标从视频图片中提取处理。通过背景建模得到图像背景模型,再通过背景模型进行差分,得到的图像再进行二值化处理,得到一个小于阈值的像素点,作为该运动目标的像素点。[0020]步骤二:基于OpenCV的轮廓提取算法。本项目采用的轮廓提取算法是在OpenCV函数库的基础上加以修改而成,主要用到imgproc模块进行图像处理,video模块进行视频分析,calib3d模块进行3D建模以及相机定标,最后采用cvFindContours来进行轮廓特征提取。

4

CN 1084604 A[0021]

说 明 书

3/4页

步骤三:星形骨架方法。得到了运动目标姿态的完整轮廓之后,就可以采用星形骨

架方法得到运动物体的星形骨架。具体分为以下几步:①基于获得的姿态轮廓得到轮廓质心;②计算轮廓上的点到轮廓质心的欧式距离;③对距离进行IDFT、LPF、DFT处理,减少噪声,得到平滑后的输出序列;④寻找平滑输出序列的局部极大值,然后与轮廓质心构成运动目标的星形骨架。根据星形骨架方法获得的5个极大值点与质心的偏移量作为人体行为特征。

[0022]平台通过提取用户行为特征,为用户行为分析做准备,将提取的用户行为特征存入用户行为训练数据库,用户行为训练库作为用户行为特征匹配库,为用户行为预测提供基础。

[0023]2、用户行为预测模型

[0024]图2是决策树算法流程图。通过提取的用户行为特征,对用户进行行为预测。用户行为分析预测模型是基于决策树算法C5.0进行设计的。决策树算法是一种典型的机器学习分类算法,通常被应用于各种预测模型和分类器中,应用决策树来实现对居民用户的行为进行预测。

[0025]整个决策树执行过程主要包括以下两个步骤:[0026]步骤一:从居民用户行为训练数据库中抽取训练样本建立决策树模型,即进行机器学习,其实现通常包括构建决策树和决策树剪枝两个部分。[0027]步骤二:基于前文构建的决策树模型对抽取的训练样本进行分类处理,进而确定下一步各个分支的方向。

[0028]构建决策树主要通过属性选择度量来确定不同特征属性间的拓扑结构,从而完成决策树的构建。首先通过样本集合S创建节点N,然后对其进行判断,最后选取最佳的属性对S进行操作,最终得到完整的决策树,进一步生成用户行为预测向量表示。基于以上决策树原理,在用户行为分析过程中的决策树到构建得到一个用户行为预测图,使用图3表示的决策树来预测某一个用户的行为。[0029]3、基于用户行为预测图和循环神经网络的用户行为预测方法[0030]图4是用户行为时序预测模型图。在得到基于决策树的用户行为预测向量表示后,依据用户对服务的选择记录对每个用户的时序行为进行建模,从而刻画用户的短期行为特征。

[0031]采用循环神经网络对用户的行为进行建模预测。整个建模执行过程主要包括以下三个步骤:

[0032]步骤一:对于每个用户u,其对服务的使用记录按照时间进行排序后可以得到序列v1,v2,...vt-1,vt,...,对应的结果为y1,y2...,yt-1,yt...。[0033]步骤二:在当前时刻t,基于使用历史y1...,yt-1,对循环神经网络中的参数W4,W5和β进行学习,然后预测用户对所有服务的选择概率。[0034]步骤三:在t时刻,以用户u的历史信息v1,...,vt-1和y1,...,yt-1为训练数据对每个用户建立时序模型。在进行服务推荐时,对每个服务v∈V预测用户对该服务的选择率,并将选择率高的服务进行服务准确率计算。[0035]4、数据预处理

[0036]预处理旨在对用户-服务-时间三维张量全局视图实施切割,以分离出数据规模更

5

CN 1084604 A

说 明 书

4/4页

适宜的若干小数据集以便推荐算法的并行执行。令用户-服务-时间三维张量全局视图为GRM×N×C,其中M,N,C分别代表全局视图中的用户数、服务数、时间点数。显然,这是一个超大规模三维张量,其预处理过程如下。[0037]步骤一:服务维度切割。在服务计算领域,任意给定的用户任务可分为两类:原子服务需求型任务、组合服务需求型任务。前者只需基于单个候选服务集实施优选,后者只需对一系列子任务相关的候选服务集实施优选,两者均不需基于全局视图运行推荐算法。借助服务发现技术可从全局视图中抽取出仅与给定用户任务相关的服务子集。[0038]经过基于语义的Web服务发现技术过程,可以过滤大量无关服务,将任务相关服务从全局视图中切割出来,并根据子任务分离成若干个服务子集。每个服务子集分别对应一个数据规模大为减少的用户-服务-时间三维张量RM×N×C(其中,n代表张量中的服务数,且n≤N)。

[0039]步骤二:用户维度切割。考虑到服务维度切割后所得的用户-服务-时间张量RM×N×C仍是大规模的,尤其是实际SOA系统环境中用户规模极为庞大,故仍需对用户维度进行切割。用户上下文特征可有助于现有用户-服务-时间张量RM×N×C切割。[0040]步骤三:时间维度规约。张量RM×N×C中,C代表最细粒度的时间点,这对于运行推荐算法而言复杂度较高,须进行规约。规约关键在于时间片的划分,令c代表划分时间点后形成的时间片数,则时间规约后的张量RM×N×C就转换成Ri×j×k。经过数据预处理,最终得数据规模为RM×N×C的小数据集。[0041]5、张量分解标签推荐算法[0042]经数据预处理后,将获得若干用户-服务-时间小数据集,令Ri×j×k代表任意小数据集,可基于Ri×j×k设计的张量分解算法。定义如下:[0043]Xijk≈Yijk        (1)

[0044]其中Y代表不同的张量分解方法。

[0045]张量分解的原理是将高维数据空间Rm×n×c映射到由用户隐特征矩阵Uij、服务隐特征矩阵Vjk、时间隐特征矩阵Wik构成的低维特征空间中(维度1≤ijk)1≤ijk:考虑到三部图中三元组元素之间两两相关性,提出了如下张量分解模型:[0046]Yijk=UijVjk+VjkWik+UijWik         (2)[0047]用户节点i和服务节点j的关系如下:

[0048][0049]

其中,Uij是I×J矩阵,Vjk是J×K矩阵,Wik是I×K矩阵,比较式上面两式。(3)中模型显示了用户和服务之间的直接关系,其他直接关系同理。

6

CN 1084604 A

说 明 书 附 图

1/2页

图1

图2

7

CN 1084604 A

说 明 书 附 图

2/2页

图3

图4

8

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务