手机用户画像在大数据平台的实现方案

vincewi

贡献于2018-01-09

字数:0 关键词: 分布式/云计算/大数据 方案

266 手机用户画像在大数据平台的实现方案 张 慷 (中国电信上海公司政企客户部,上海 200041) 摘要:大数据平台通过对DPI上网日志的加工处理和分析,形成用户上网行为的特征刻画;同时结合经分系统现有用户基础 信息、套餐信息、终端信息、业务订购等信息,进行深度数据融合及交叉分析,形成手机用户画像,实现电信业务针对性营销。 关键词:Hadoop;DPI 上网日志;上网行为特征;用户画像;针对性营销 中图分类号:TP391.9 文献标识码:A 文章编号:1673-1131(2014)02-0266-02 1 系统概述 大数据平台通过对 DPI 上网日志的加工处理和分析,形 成用户上网行为的特征刻画;同时结合经分系统现有用户基 础信息、套餐信息、终端信息、业务订购等信息,进行深度数据 融合及交叉分析,形成手机用户画像。然后根据用户画像分 析结果,向用户有针对性地营销电信增值业务或合作方业务, 提高电信市场竞争力。 图 1 用户画像分析总体架构 2 解决方案 2.1 用户画像分析主要过程 用户画像分析主要过程如图 2 所示。 图 2 用户画像分析主要过程 网站分类标签可根据用户需求动态变化,支持多级标签, 包括三级标签和四级标签。网站分类标签示例如图 3 所示。 图 3 网站分类标签 用户行为标签示例如图 4 所示。 图 4 用户行为标签 用户的某个行为标签,需要包含访问次数和权重两个参 数,其中权重需要通过纵向均衡和横向均衡两次修正后,才能 得到具体的结果。例如:某个用户有三种访问行为,分别是新 闻(150 次),小说(30 次),音乐(20 次)。 (1)聚类功能纵向分为 10 个等级,每个访问次数先确定 等级,然后再根据等级范围,确定等级内的详细数字:新闻(150 次)纵向均衡后的数值是 5.79;小说(30 次)纵向均衡后的数值 是 3.42;音乐(20 次)纵向均衡后的数值是 4.58。 (2)横向均衡就是将不同标签的数值,按照进行百分比折 算即可。 (3)最终输出的权重数值。 表 1 标签权重 2.2 数据挖掘 数据挖掘可以根据用户的要求建立多个手机上网的分析平 面,通过数据聚类进行分析挖掘。例如: 第一平面为上网次数/ 流量; 第二平面为上网次数/时长; 第三平面为上网测试/时段。 图 5 多平面分析数据模型 数据聚类方法如下: 先将数据Vector 向量化/归一化,接着 设置聚类输出数目或中心点,最后选择聚类算法以及收敛参 数。数据聚类算法包括: -K-Means Clustering -Canopy Clustering 2014 年第 2 期 (总第 134 期) 2014 (Sum. No 134) 信 息 通 信 INFORMATION & COMMUNICATIONS 267 LED 显示屏亮度及色度调整技术应用 王鹏宇,宁 妍 (辽宁省葫芦岛市 92493 部队 3 分队,辽宁 葫芦岛 125000) 摘要:LED 显示屏作为一项新型的技术应用在娱乐市场当中,以其高亮度、宽色域以及节能环保等优点逐渐成为室外展 示市场的主角。但基于 LED 具有一定的离散性,导致显示屏在显示的过程中不能保证亮度和色度的一致性和均匀性, 需要对显示屏进行色度及亮度的调整。文章将介绍 LED 显示屏的色度亮度调整技术的应用。 关键词:LED;显示屏;亮度;色度;调整;逐点 中图分类号:TN9 文献标识码:A 文章编号:1673-1131(2014)02-0267-02 LED 显示屏是由很多个 LED 组成,由于离散性的问题导 致各个 LED 在组成后会出现色度和亮度不均的情况。如果 LED组成的批次不同,则离散性问题就会更大,色度和亮度的 均匀性、一致性也会更差,影响观赏的效果。对此,必须对LED 显示屏进行色度及亮度的调整,以保证色度和亮度的均匀性 和一致性。 1 LED 显示屏的均匀性和一致性 评定LED显示屏的画质质量好坏的标准是亮度和色度是 否具有均匀性和一致性。导致 LED 显示屏均匀性的问题的原 因有很多,而LED的离散性问题是最主要的问题之一;其次还 有导致 LED 显示屏一致性问题的时间衰减的问题等。离散性 问题是 LED 普遍存在的问题,一般会在生产过程中根据一定 的标准进行 LED的分档和筛选,这也是 LED 生产工艺当中的 最后一个流程,就是通过分光分色机将不合乎规格的 LED 进 行筛选和剔除,并将合乎规格的 LED 进行分档。 不同的厂家分档的标准是不一样的,有的是按电气指标 进行分档,有的是按光学指标进行分档。当然,分档的情况可 以通过设置进行调节,若想提高 LED 显示屏的整体画面质量 的均匀性和一致性的话,可以通过两个指标共同实现分档。这 样的分档方法虽然能够在一定程度上保证 LED显示屏的画面 质量,但却降低了 LED 显示屏的整体合格率,从而使 LED 显 示屏的价格升高。目前常用的主波长分档属于光学指标分档, 这种分档方式是十分不科学。这种分档方式只是单纯地根据 光强和主波长来对 LED 的性能进行判断,而单纯的光强和主 波长是无法完全的、准确地表示出光学的特性,所以这种判断 方法的误差性很高。 2 LED 显示屏亮度及色度调整的原理 LED 显示屏以像素为基本单位,而每一个像素又是由 -Mean Shift Clustering -Hierarchical Clustering -Dimensional Reduction -Expectation Maximization -Logistic Regression -Neural Network -Hidden Markov Models -Random Forests -Parallel Frequent Pattern Mining ⋯ ⋯ 用户上网行为分析结果示例如图 6 所示。 图 6 用户上网行为分析结果 2.3 客户画像示例 手机客户画像: (1)拥有的手机品牌和型号:HTC; (2)手机套餐标准:88RMB/月; (3)手机上网习惯: — — 上网时间:8:00-9:00/11:30-14:30/18:30-21:00/⋯ .. — — 喜欢浏览的网站:新浪娱乐、腾讯 ; — — 喜欢使用的软件:视频(电视剧/电影/娱乐新闻)/团购/ 微博/蘑菇街 ⋯ — — 是否购买产品,频次:是,2 次/周; — — 产品的类型:美食团购/时尚衣装。 3 结语 大数据平台按设定的行为标签、数据模型等规则对 DPI 上网日志的加工处理和数据挖掘,形成的用户行为特征数据, 包括用户互联网关注点分析、相同兴趣点、用户群信息等。同 时结合经分系统现有用户基础信息、套餐信息、终端信息、业 务订购等信息,进行深度数据融合及交叉分析,形成手机用户 画像。 电信根据大数据平台用户画像分析结果,可以向用户有 针对性地营销增值业务或合作方业务,提高市场竞争力。 参考文献: [1] 周正,陈枫.“大数据时代”来了— — 专访国防信息学院研 究所所长孟宝宏.解放军报,2013(1):17 [2] 顾芳,刘旭峰,左超.大数据背景下运营商移动互联网发展 策略研究[J].邮电设计技术,2012(8) [3] 陈如明.大数据时代的挑战、价值与应对策略 [J]..移动通 信,2012(17) [4] 胡弘毅.大数据分析有助电信企业“有的放矢”[J].赛迪网, 2013,6(20) 2014 年第 2 期 (总第 134 期) 2014 (Sum. No 134) 信 息 通 信 INFORMATION & COMMUNICATIONS

下载文档,方便阅读与编辑

文档的实际排版效果,会与网站的显示效果略有不同!!

需要 10 金币 [ 分享文档获得金币 ] 0 人已下载

下载文档

相关文档