当前位置首页 > 计算机 > 数据挖掘与模式识别
搜柄,搜必应! 快速导航 | 使用教程

某运营商数据挖掘项目汇报

文档格式:PPT| 38 页|大小 1.10MB|2024-11-28 发布|举报 | 版权申诉
第1页
第2页
第3页
下载文档到电脑,查找使用更方便 还剩页未读,继续阅读>>
1 / 38
此文档下载收益归作者所有 下载文档
  • 版权提示
  • 文本预览
  • 常见问题
  • 单击此处编辑母版文本样式,第二级,第三级,-,38,-,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,单击此处编辑母版标题样式,,,某运营商数据挖掘项目汇报,_,新增用户维系,2010,年,3,月,新增用户维系基本流程,1,、采用生存分析法,对有流失倾向的用户进行提前预警,并可根据用户流失概率的高低划定预警级别,流失高危用户群,在网异动用户群,正常用户群,,异动预警监控,1,、维系策略方案生成,渠道养卡监管措施,重入网与反复用户管控措施,正常低网龄用户维系措施,2,、维系方案实施,营销案实施流程,维系渠道,维系方式,维系策略及方案,1,、维系情况反馈,2,、目标达成情况,3,、维系效果评估:,渠道养卡识别及监管,重入网与反复重入网,正常低网龄用户维系,维系效果评估,1,、新增用户分群:,渠道养卡,重入网与反复重入网用户,正常低网龄用户细分,根据正常低网龄用户偏好进行细分,新增用户分群,建立新增用户维系闭环管理体系,准确分群,分级预警,制定针对性的维系策略和方案并实施,实现新增用户保有■,,渠道养卡识别与监控,□,,重入网与反复重入网管理,□,,正常低网龄用户维系,新增用户维系,,,,,,,,,,,,,柳州渠道养卡行为特征及监控思路建议,产品:,渠道养卡一般选择无月租或最低月租的产品,以降低养卡的成本,研究发现柳州,2,种类型产品均被渠道选择使用,ARPU,:,渠道养卡号码消费额一般较低,研究发现柳州养卡号码月均消费一般低于,15,元,主叫时长:,渠道养卡号码主叫时长非常低,研究发现柳州有,70%,以上无通话行为,有通话行为用户主叫时长主要集中在,3,分钟以内,用户状态:,研究发现柳州渠道养卡新增号码停机流失高峰出现在入网后的第,1-3,个月,消费情况:,同一个渠道发展的养卡号码中,出现多个号码消费行为一致的情况,如多个号码入网当月和次月消费完全一致,激活,IMEI,:,养卡号码在激活时,一般用同一个手机激活,因此养卡号码中大量号码的激活,IMEI,一致,柳州渠道养卡行为特征,制定疑似养卡渠道的判断规则:从渠道发展用户的产品、,ARPU,、用户状态进行判断,当用户数占比符合一定标准后,即判断为疑似养卡渠道;,制定疑似养卡号码的判断规则:从用户消费情况、激活,IMEI,等进行判断,符合一定标准的号码为疑似养卡号码;,分析疑似养卡渠道的养卡号码量,计算养卡号码占其当月新发展的比,并按各渠道此比例排序,,养卡行为监控思路建议,通过研究发现柳州渠道养卡行为特征及监控思路建议如下:,以上判断标准,都以同一渠道发展的用户作为判断基础数据;,判断步骤是首先判断疑似养卡渠道,在判断其为疑似养卡渠道后,统计其疑似养卡号码数量,对养卡号码的判断模型是对渠道养卡违规行为进行分析的基础,需要在执行中进一步分析、调研完善优化判断规则,提升判断准确率。

    疑似养卡渠道和养卡号码判断规则,疑,似,养,卡,渠,道,产品:,渠道新增用户中,,30%,以上的用户都为两广情零听计划或都市“零听”计划二,该渠道为疑似养卡渠道,主叫时长,:渠道新增用户中,,50%,以上或,100,人以上的用户入网当月和次月主叫时长在,3,分钟内,该渠道为疑似养卡渠道,用户状态:,渠道新增用户中,入网后在第,3,个月,,30%,以上的用户状态为停机流失,该渠道为疑似养卡渠道,,疑,似,养,卡,号,码,消费情况,:,a.,出现,5,个或以上号码号码入网当月和次月主叫时长都在,3,分钟内;,b.,或出现,5,个或以上号码号码入网当月和次月消费在,5,元以内;,c.,或出现,2,个以上号码入网当月或次月应收费完全一致,,这些号码为疑似养卡号码,激活情况:,a.,出现,5,个或以上号码号码激活,IMEI,一致,;,b.,或,2,个或以上号码登记身份证号一致,这些号码为疑似养卡号码,,ARPU,:,渠道新增用户中,,30%,以上或,100,人以上的用户入网当月和次月,ARPU,低于,5,元,该渠道为疑似养卡渠道,□,,渠道养卡识别与监控,■,重入网与反复重入网管理,□,,正常低网龄用户维系,新增用户维系,,,,,,,,,,,,,重入网与反复重入网(跳蚤)用户识别规则,N,N+1,N-6,N-4,N-5,N-2,N-3,N-1,新入网激活月,新入网激活后第,1,月,新入网激活月前半年的存量用户历史,IMEI,库或身份证库,N,月在网用户,区分新增和存量用户,判断重入网用户,判断新入网用户的有效,IMEI,或身份证号码,N,月新入网用户中的重入网和反复重入网用户名单,剔除无效,IMEI,或身份证号码,生成、维护历史有效,IMEI,库或身份证号库,重入网:,新用户,IMEI,或身份证号与历史,IMEI,或身份证号码能够匹配(,6,个月以内)。

    如,,9,月新入网用户,IMEI,或身份证号与,3,月到,8,月用户,IMEI,或身份证号码库匹配后,得到,9,月新入网用户中重入网用户反复重入网(跳蚤用户):,重入网用户在,6,个月以内重入网,2,次及,2,次以上的用户识别规则:,通过对新入网用户使用手机的,IMEI,号(或身份证号码)与存量用户的,IMEI,号历史库(或身份证号码历史库)进行分析识别出重入网和反复重入网用户为了提高分析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析分析示意如下:用户在,N,月入网并激活(有话单产生),则在,N+1,月(计算月)对,N,月入网并激活的所有用户进行重入网分析用户重入网主要原因分析,,,,,,产品,价格,促销,/,宣传,渠道,产品线过长,产品重叠较多,目标用户群存在较多交叉,不同品牌及资费存在内部竞争,,,产品价格调整比较频繁,而且在价格调整过程中没有考虑产品体系间的平衡问题,预存费用低,用户入网门槛不高,使其可以轻易弃卡,新入网促销活动优惠力度过大,品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足,部分社会渠道迫于指标压力或利益驱动,诱导用户换卡,社会渠道虚假激活,通过养卡恶意套取酬金,追求经济收益,受入网优惠的吸引,换取吉祥号码,欠费,,竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网,公司内部,竞争对手,用户,,服务,补卡成本高,手续复杂,补卡不如买新卡,欠费提醒不及时,欠费后被停机,选择重入网,从产品、促销、渠道、传播、服务等多方面入手加强重入网与反复重入网管理,降低重入网比率,,重入网与反复重入网管理措施,加强入网促销活动管理,减少促销活动对在网用户的干扰;,提高入网首次预存费用,增加在网时长;,用户忠诚度管理:网龄营销。

    产品,/,促销,传播,渠道,服务,加强(社会)渠道掌控,规范渠道行为,减少系统性离网行为采用户外广告、报纸等大众媒体及营业厅、,10086,短信、网站、,WAP,等自有媒体体开展网龄营销、优惠补卡及带号转品牌、套餐、停机保号等的传播加强欠费管理,减少无效欠费;,主卡付费,+,亲情网;,账户低余额时充值提示;,优惠或免费补卡;,推荐带号转品牌或带号转套餐□,,渠道养卡识别与监控,□,,重入网与反复重入网管理,■,正常低网龄用户维系,新增用户维系,,,,,,,,,,,,,正常低网龄,用,用户维系基,本,本策略,剔除了渠道,养,养卡用户和,反,反复重入网,用,用户后所获,得,得的正常低,网,网龄用户是,新,新增用户流,失,失控制的重,点,点运用数,据,据挖掘方法,,,,识别出不,同,同流失预警,级,级别的用户,,,,针对高危,用,用户和异动,用,用户分别采,取,取针对性的,营,营销捆绑手,段,段进行维系,,,,同时结合,网,网龄营销,,延,延长用户生,命,命周期正常低网龄,用,用户分群,用户,,重绑:,针对高危用,户,户在网黏性,已,已很弱的特,点,点,采取较,大,大力度的营,销,销捆绑策略,,,,以返还周,期,期短的财务,捆,捆绑和力度,较,较大的业务,捆,捆绑为主,,以,以服务捆绑,为,为辅。

    力保:,针对异动用,户,户尚处于流,失,失犹豫期、,还,还具有一定,黏,黏性的特点,,,,维系策略,将,将以强化用,户,户的业务黏,性,性为重点,,以,以业务捆绑,和,和较长返还,周,周期的财务,捆,捆绑为主,,以,以服务捆绑,为,为辅全用户常规,保,保有(不研,究,究)细分用户群,基本策略,流失高危,用户,在网异动,用户,相对稳定,用户,,,,,,,,,,,,,,,,,,,,,,多级预警,,多,多级维系,在模型挖掘,的,的基础上,,准,准确判别正,常,常低网龄用,户,户的流失倾,向,向,根据用,户,户流失概率,的,的高低分别,实,实施针对性,的,的维系策略,和,和措施,对,可,可能流失的,用,用户提前预,防,防,多级维,系,系,有效地,防,防止用户流,失,失流失异动用户,营销捆绑,日常维系及,异动监控,办理,未办理,模型匹配,低网龄用户,流失高危用户,是否流失,,流失,未流失,1,1,2,一级匹配和,维,维系; 二,级,级匹配和维,系,系1,2,正常低网龄,用,用户细分、,预,预警及维系,框,框架,精准营销模,型,型,新增用户细,分,分模型,用户价值,在网时长,渠道偏好,促销偏好,用户号码,消费特征,用户清单,话费余额,新增网用户,流,流失模型,商务高端用,户,户群,长途话务突,出,出群,本地话务突,出,出群,本地低端用,户,户群,数据业务发,烧,烧群,……,漫游突出用,户,户群,数据业务兴,趣,趣群,本地话务偏,好,好群,在网异动用,户,户,流失高危用,户,户,长途话务突,出,出群,本地话务突,出,出群,本地低端用,户,户群,……,漫游突出用,户,户群,数据业务突,出,出群,本地话务偏,好,好群,当月新增用,户,户,其他新增用,户,户,营销案,用户流失预,警,警和细分建,模,模过程,流失现状分,析,析,流失原因分,析,析,流失用户特,征,征分析,流失预警建,模,模目标沟通,确,确定,流失细分模,型,型目标沟通,确,确定,,根据建模要,求,求和现有数,据,据情况,构,思,思、沟通和,确,确定建模数,据,据提取需求,提取,09,年,1-10,月新增用户,在,在,1-10,月的自然属,性,性和消费行,为,为数据,提取,09,年,10,月新增用户,在,在,10,月的日消费,行,行为数据,数据质量审,核,核,数据探索,非正常用户,的,的剔除。

    根,据,据渠道养卡,和,和跳蚤用户,识,识别模型提,取,取异常用户,数据抽样确,确定建模用,户,户集合,建模衍生变,量,量计算根,据,据提取的基,础,础数据宽表,计,计算衍生变,量,量,建模变量筛,选,选,特征建模分,析,析,卡方分析,方差分析,双变量分析,Pearson,相关分析,wald,显著性检验,量重要性分,析,析,建模变量数,据,据转换,对数变换,标准化变换,确定建模用,户,户集,确定建模用,户,户数据集,采用,TwoStep,聚类算法,,建,建立用户细,分,分模型,月数据用户,细,细分模型(,高,高价值 用,户,户和在网,2,月及,2,月以上的新,增,增用户细分,日数据用户,细,细分模型(,在,在网,1,月新增用户,细,细分),业务解释聚,类,类结果,调,整,整模型参数,和,和建模变量,,,,直到得到,满,满意结果,确定建模用,户,户集,确定建模用,户,户数据集,采用逻辑回,归,归和决策树,算,算法建立流,失,失预警模型,在网,2,月新增用户,流,流失预警模,型,型,在网,2,月以上新增,用,用户流失预,警,警模型,在网,1,月新增用户,流,流失预警模,型,型,采用生存分,析,析算法建立,高,高价值用户,流,流失预警模,型,型,,模型的评估,提升图、收,益,益图,混淆矩阵。

    准,准确率和查,全,全率,模型的优化,建模训练集,比,比例,异常值处理,建模变量,建模方法,模型参数,显著性检验,方,方法,显著性检验,变,变量剔除阈,值,值,树的深度和,页,页节点记录,个,个数,……,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,数据提取,数据清洗,数据审核,数据集成,数据挖掘宽,表,表构建,缺失数据处,理,理,极值数据处,理,理,错误数据处,理,理,冗余数据处,理,理,数据统计错,误,误审核,数据源错误,审,审核,数据统计口,径,径审核,,,,,数据准备确,保,保建模数据,的,的完整性、,可,可用性和完,整,整性,提取建模所,需,需数据,数据准备,筛选建模变,量,量、根据模,型,型要求进行,数,数据变换,建模准备,,经分数据,,挖掘宽表,变量转换,变量筛选,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,健康度建,模指标库,,变量清洗,用户细分采,用,用凝聚层次,聚,聚类算法,,,,选择,初始化,更新,结束,计算包含每,对,对样本间距,离,离(如欧氏,距,距离)的相,似,似矩阵,把,每,每个样本作,为,为一个簇,使用相似矩,阵,阵查找最相,似,似的两个簇,将两个簇合,并,并为一个簇,,,,簇的个数,通,通过合并被,更,更新;同时,更,更新相似矩,阵,阵,将两个,簇,簇的两行(,两,两列)距离,用,用,1,行(,1,列)距离替,换,换反映合并,操,操作。

    当所有样本,都,都合并成一,个,个簇或满足,指,指定的簇的,数,数目时,整,个,个过程结束,层次聚类可,以,以分为两种,:,:凝聚的方,式,式和分割的,方,方式,凝聚,是,是一种至底,向,向上的方法,,,,将每一条,记,记录看作一,个,个类,然后,根,根据一些规,则,则将他们聚,合,合成越来越,大,大的类,直,到,到满足一些,预,预先设定的,条,条件1,2,3,4,执行,n-1,次步骤,2,和步骤,3,网龄2月及,以,以上新增用,户,户细分模型,采用,SPSS,及,CLEMENTINE,作为数据分,析,析与聚类建,模,模工具,算法为,Two Step,聚类算法,使用细分矩,阵,阵,按照语,音,音消费行为,和,和数据业务,消,消费行为两,次,次聚类的方,法,法分别聚类,,,,多维聚类,的,的方法较传,统,统单维聚类,方,方法,聚类,后,后的用户细,分,分特征更明,显,显,聚类数据集,为,为,2009,年,1-9,月新增用户,入,入网后第二,个,个月,且第,二,二月状态正,常,常的用户的,基,基础数据和,消,消费行为数,据,据,数据在聚类,前,前需进行标,准,准化变换和,极,极值处理,本地通话次,数,数,长途通话次,数,数,计费通话时,长,长,漫游通话次,数,数,ARPU,低端,中低端,长途突出,本地突出,漫游突出,商务,GPRS,流量,新业务费,新业务使用,种,种类数,彩信条数,短信条数,新业务费占,比,比,使用,少,占比高,兴趣,短信突出,上网突出,发烧友,细分群主要,消,消费行为特,征,征(网龄>=2个月)-1,序号,细分群名称,细分群特征,规模占比,1,商务高端用户群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,最高为,240,元,/,户以上,交往圈最大,本长漫语音话务均高,且每次通话时长较长,2.4%,2,漫游突出用户群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,85,元,/,户左右,经常去外地,漫游话务突出,本地及长途话务较少,且漫游通话频次最高,3.9%,3,长途话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,120,元,/,户左右,交往圈中有大量外地号码,长途话务突出,漫游很少,且长途通话频次最高,7.6%,4,本地话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,120,元,/,户左右,交往圈主要集中在本地,本地话务突出,长途漫游较少,且本地通话频次最高,4.7%,5,本地话务偏好群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,67,元,/,户左右,交往圈主要集中在本地,通话时长相对较低,但本地话务相对突出,长途漫游很少,14.8%,6,本地低端用户群,语音和数据业务消费行为均较低,用消费户行为相对均衡;,ARPU,较低为,30,元,/,户左右,很少去外地,漫游和长途时长比例最低,,,平均每次通话时长最短,33.5%,序号,细分群名称,细分群特征,规模占比,7,短信突出用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,40,元,/,户左右,数据业务消费占比高于,50%,,主要使用短信业务,且短信上行条数最高,8.0%,8,GPRS,突出用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,30,元,/,户左右,数据业务消费占比高于,50%,,,GPRS,流量高,其他数据业务使用较少,8.1%,9,数据业务兴趣群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,20,元,/,户左右,订购数据业务种类最多,但消费不高,数据业务费用占比高于,50%,13.3%,10,数据业务发烧群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,65,元,/,户左右,订购数据业务种类最多,且数据业务消费最高, 占比高达,67%,3.9%,细分群主要,消,消费行为特,征,征(网龄>=2个月)-2,网龄1月新,增,增用户细分,模,模型,采用,SPSS,及,CLEMENTINE,作为数据分,析,析与聚类建,模,模工具,算法为,Two Step,聚类算法,使用细分矩,阵,阵,按照语,音,音消费行为,和,和数据业务,消,消费行为两,次,次聚类的方,法,法分别聚类,,,,多维聚类,的,的方法较传,统,统单维聚类,方,方法,聚类,后,后的用户细,分,分特征更明,显,显,聚类数据集,为,为,2009,年,10,月,1~25,日入网,,11,月,1,日之前未流,失,失的用户从,入,入网当日至,月,月底的日均,消,消费行为数,据,据,数据在聚类,前,前需进行标,准,准化变换和,极,极值处理,低端,中低端,长途突出,本地突出,商务,占比占比,高,使用少,兴趣,上网突出,发烧友,日均本地通,话,话次数,日均长途通,话,话次数,日均漫游通,话,话次数,日均计费通,话,话时长,日均,GPRS,流量,日均彩信条,数,数,日均短信条,数,数,新业务使用,种,种类数,新业务费占,比,比,序号,细分群名称,细分群,特征,规模占比,1,漫游突出用户群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,100,元,/,户左右,经常去外地,漫游话务突出,本地及长途话务很少,且漫游通话频次最高,3.0%,2,长途话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,100,元,/,户左右,交往圈中有大量外地号码,长途话务突出,基本无漫游,且长途通话频次最高,4.5%,3,本地话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,75,元,/,户左右,交往圈主要集中在本地,本地话务突出,基本无漫游,长途很少,且本地通话频次最高,7.7%,4,本地话务偏好群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,55,元,/,户左右,交往圈主要集中在本地,通话时长相对较低,但本地话务相对突出,基本无漫游,长途很少,12.6%,5,本地低端用户群,语音和数据业务消费均较低,且二者消费相对均衡;入网当月,ARPU,为,25,元,/,户左右,主要在本地活动,本、长、漫通话时长均为最低,基本无数据业务使用量,36.7%,细分群主要,消,消费行为特,征,征(网龄1,个,个月)-1,序号,细分群名称,细分群,特征,规模占比,6,数据业务突出群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,30,元,/,户左右,订购数据业务种类最多,且数据业务消费占比高, 高达,79%,21.3%,7,GPRS,偏好用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,54,元,/,户左右,,GPRS,消费最高,远高于其他群,且数据业务消费占比高, 高达,77%,9.2%,8,,短信突出用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入当月,ARPU,为,80,元,/,户左右,数据业务消费占比为,65%,左右,日平均发送短信,10,条左右,主要使用短彩信业务,且短信和彩信上行条数均为最高,4.9%,细分群主要,消,消费行为特,征,征(网龄1,个,个月)-2,,新增用户中,的,的流失用户,超,超过四分之,三,三的用户生,命,命周期不超,过,过四个月,,不,不具有完整,的,的生命周期,特,特征,COX,生存分析模,型,型,隐含了,一,一条假设,,即,即在时间越,长,长,其离网,的,的可能性就,越,越大,这样,一,一来,是否,离,离网和在网,时,时间应该是,正,正相关的,,COX,模型在拟合,的,的时候,会,在,在这个约束,之,之下,所以,其,其对数据的,拟,拟合没有,LOGIT,效果好,因此对新增,用,用户离网预,警,警,采用,LOGIT,回归模型或,决,决策模型,,新增用户中,的,的流失用户,有,有,76%,在入网后的,四,四个月内流,失,失,,流失用户的,76%,是在入网后,的,的四个月内,流,流失,分别有,22%,和,23%,的流失用户,在,在入网后的,第,第一个月和,第,第二月内流,失,失,,数据来源:,09,年,1,月,-10,月新增用户,流失用户定,义,义:当月停,机,机,且连续,停,停机,60,天以上用户,,,到,2009,年,11,月仍未开机,用,用户,网龄举例:,3,月入网,,3,月流失的用,户,户,网龄为,0,个月,,,,流失用户的,在,在网时长分,布,布,决策树预测,模,模型:决策,树,树是以实例,为,为基础的归,纳,纳学习算法,,,,它着眼于,从,从一组无次,序,序、无规则,的,的实例中推,理,理出以决策,树,树表示的分,类,类规则。

    它,采,采用自顶向,下,下的递归方,式,式,在决策,树,树的内部节,点,点进行属性,的,的比较,并,根,根据不同属,性,性值判断从,该,该节点向下,的,的分支,在,决,决策树的叶,节,节点得到结,论,论逻辑回归预,测,测模型:也,称,称定性变量,回,回归,类似,于,于线性回归,,,,但是目标,字,字段使用字,符,符型字段而,不,不是数值型,字,字段Logistic,回归建立一,组,组方程,把,输,输入属性值,与,与输出字段,每,每一类的概,率,率联系起来,一旦生成,模,模型,便可,用,用于估计新,记,记录属于某,类,类的概率概,概率最大的,目,目标类被指,定,定为该记录,的,的预测输出,值,值,逻辑回归算,法,法具有训练,集,集和测试集,预,预测准确率,的,的差异是最,小,小的优点,能给出用户,属,属于某类型,概,概率,可精,确,确控制用户,群,群大小,,对有缺失值,的,的记录不能,给,给出预测概,率,率,模型自变量,之,之间可能存,在,在多重共线,性,性干扰,业务可解释,性,性较决策树,差,差,优点,缺点,,,逻辑回归算,法,法具有训练,集,集和测试集,预,预测准确率,的,的差异是最,小,小可以精确,控,控制筛选用,户,户群大小的,优,优点,同,时,时我们采用,缺,缺失值处理,、,、相关性分,析,析可以规避,算,算法的缺点,,,,优先选用,逻,逻辑回归算,法,法。

    比较模型预,测,测效果,选,择,择预测效果,较,较佳分类算,法,法,,模型,比较,结论,正常低网龄,用,用户流失采,用,用预警分类,算,算法,在网2月新,增,增用户流失,预,预警模型,采用,SPSS,和,CLEMENTINE,作为数据分,析,析和建模工,具,具,分别采用逻,辑,辑回归算法,和,和决策树算,法,法建模,比,较,较模型预测,效,效果,确定,使,使用逻辑回,归,归算法,,基本情况,语音通话情况,数据业务使用情况,品牌,ARPU,余额,套餐名称,…,本地通话次数,长途通话次数,漫游通话次数,…,数据业务费用,数据业务消费占比,数据业务使用种类数,…,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,建模时间窗,口,口,测试时间窗,口,口,入网月份,取数月份,流失月份,流失观察月,份,份,建模变量,建模结果,余额,通话次数,套餐名称,本地被叫次,数,数,欠费金额,本地主叫次,数,数,网内通话对,端,端数,网外通话对,端,端数,彩铃订购标,志,志,通话时长大,于,于,5,分钟标志,多次充值标,志,志,欠费标志,ARPU,大于,0,标志,长途通话次,数,数,漫游通话次,数,数,新业务费,通话标志,包打套餐标,志,志,手机报费用,本地主叫通,话,话标志,拨打,10086,次数,重入网标,志,志,所有的数,据,据经过对,数,数变换和,标,标准化变,换,换,消除,不,不同变量,和,和不同月,份,份对模型,的,的影响,逻辑回归,算,算法使用,的,的方法是,进,进入法,,模,模型调整,变,变量的依,据,据是回归,参,参数的,Wald,检验,模,型,型拟合优,度,度的评判,标,标准时是,-2,对数似然,值,值,值越,小,小,拟合,效,效果越好,模型的结,果,果为对数,流,流失风险,比,比的线性,拟,拟合表达,式,式,应用,模,模型时输,入,入为用户,当,当前在建,模,模变量上,的,的值,输,出,出为用户,的,的流失概,率,率,下图展示,了,了建模变,量,量的重要,性,性(调整,后,后的实际,建,建模变量,),),变量重要,性,性,用户集:,09年07月入网,、,、08月,仍,仍然正常,的,的用户,;,模型筛选,用,用户:,通过模型,筛,筛选出的,用,用户集中20%的,用,用户,,其中,,包含了用,户,户集中,52.2%,的,9,月流失用,户,户;,模型筛选,用,用户,9,月、,10,月和,11,月的流失,率,率(模型准,确,确率)分别为,16%,、,34%,和,48%,,比用户,集,集中用户,的,的流失率,(,(不使用,模,模型筛选,的,的准确率,),)提升度,分,分别为,2.4,、,2.5,和,3.2,倍。

    52.2%,*,提升度,=,模型筛选,用,用户流失,率,率,/,用户集中,用,用户流失,率,率,考察模型,筛,筛选用户,三,三个月流,失,失情况,,模,模型准确,率,率为,48%,在网2月,以,以上新增,用,用户流失,预,预警模型,分别采用,逻,逻辑回归,算,算法和决,策,策树算法,建,建模,比,较,较模型预,测,测效果,,确,确定使用,逻,逻辑回归,算,算法,,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,建模时间,窗,窗口,测试时间,窗,窗口,建模变量,基本情况,语音通话情况,数据业务使用情况,品牌,ARPU,余额,套餐名称,…,月数据,时间段变化趋势数据,月数据,时间段变化趋势数据,本地通话次数,长途通话次数,漫游通话次数,…,本地通话次数波动率,长途通话次数波动率,漫游通话次数波动率,…,数据业务费用,数据业务消费占比,数据业务使用种类数,…,数据业务费用波动率,…,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,建模结果,余额,本地被叫,通,通话次数,欠费金额,本地被叫,次,次数波动,率,率,通话标志,通话时长,大,大于,5,分钟标志,多次充值,标,标志,其他费用,本地主叫,次,次数波动,率,率,新业务费,通话次数,月租费,ARPU,彩铃订购,标,标志,长途通话,次,次数,漫游通话,次,次数,本地主叫,次,次数,所有的数,据,据经过对,数,数变换和,标,标准化变,换,换,消除,不,不同变量,和,和不同月,份,份对模型,的,的影响,回归分析,方,方法和参,数,数设置同,在,在在网,2,月新增用,户,户流失预,警,警模型,模型的结,果,果为对数,流,流失风险,比,比的线性,拟,拟合表达,式,式,用户余额,、,、本地被,叫,叫通话次,数,数、欠费,金,金额、本,地,地被叫次,数,数波动率,、,、通话标,志,志、通话,时,时长大于,5,分钟标志,变,变量重要,变量重要,性,性,模型预警20%的,正,正常用户,,,,包含61%的下,月,月流失用,户,户,用户集:,09年0,6,月,(包括,06,月)以前,入网、08月仍然,正,正常的用,户,户,;,模型筛选,用,用户:,通过模型,筛,筛选出的,用,用户集中20%的,用,用户,,其中,,包含了用,户,户集中,61.4%,的,9,月流失用,户,户;,模型筛选,用,用户,9,月、,10,月和,11,月的流失,率,率(模型准,确,确率)分别为,26.7%,、,36%,和,43%,,比用户,集,集中用户,的,的流失率,(,(不使用,模,模型筛选,的,的准确率,),)提升度,分,分别为,3.4,、,2.7,和,2.3,倍。

    61.4%,*,提升度,=,模型筛选,用,用户流失,率,率,/,用户集中,用,用户流失,率,率,在网1月,新,新增用户,流,流失预警,模,模型,在网,1,月新增用,户,户没有月,数,数据,只,有,有日数据,,,,由于系,统,统只保留,最,最近,3,月的日数,据,据,,9,月的日数,据,据不完整,,,,,11,月的新增,用,用户不能,判,判定用户,流,流失,只,能,能取,10,月新增用,户,户的日数,据,据为建模,数,数据集,用户的样,本,本量小,,考,考虑到决,策,策树算法,如,如使用交,叉,叉验证,,能,能一定程,度,度上弥补,样,样本量小,的,的不足,,采,采用决策,树,树算法作,为,为预警建,模,模算法,,建模时间,窗,窗口,建模变量,基本情况,语音通话情况,数据业务使用情况,品牌,ARPU,余额,套餐名称,…,日均数据,时间段日数据,/,变化趋势数据,日均数据,时间段变化趋势数据,本地通话次数,长途通话次数,漫游通话次数,…,本地通话次数波动率,长途通话次数波动率,漫游通话次数波动率,…,短信条数,彩信条数,GPRS,流量,…,短信条数波动率,…,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,入网时间,在,在,10,月,1~25,日的用户,从,从入网当,天,天直到,10,月底的日,数,数据,,建模结果,余额,品牌,手机报费,用,用,套餐名称,日均长途,通,通话次数,月租费,日均本地,被,被叫通话,次,次数,充值次数,日均漫游,通,通话次数,包打套餐,标,标志,本地通话,次,次数波动,率,率,手机邮箱,标,标志,新业务费,多次充值,标,标志,彩铃订购,标,标志,手机报订,购,购标志,本地主叫,次,次数波动,率,率,重入网标,志,志,外网通话,对,对端数波,动,动率,通话大于,5,分钟标志,通话标志,短信发送,条,条数波动,率,率,,,模型使用,了,了交叉验,证,证,模型的结,果,果为决策,树,树,应用,模,模型后的,输,输出为用,户,户流失的,置,置信度,用户余额,、,、品牌、,手,手机报费,用,用、套餐,名,名称、日,均,均长途通,话,话次数、,月,月租费、,日,日均本地,被,被叫通话,次,次数变量,重,重要,变量重要,性,性,模型预测,效,效果评估,由,于,于,没,没,有,有,11,月,的,的,数,数,据,据,可,可,用,用,于,于,测,测,试,试,12,月,流,流,失,失,情,情,况,况,,,,,使,使,用,用,建,建,模,模,数,数,据,据,集,集,评,评,估,估,模,模,型,型,拟,拟,合,合,效,效,果,果,从,收,收,益,益,图,图,来,来,看,看,,,,,模,模,型,型,筛,筛,选,选,了,了,20%,的,10,月,新,新,增,增,用,用,户,户,,,,,包,包,含,含,了,了,50%,的,11,月,流,流,失,失,用,用,户,户,筛,选,选,40%,的,的,的,10,月,新,新,增,增,用,用,户,户,,,,,包,包,含,含,了,了,74%,的,11,月,流,流,失,失,用,用,户,户,74%,50%,模,型,型,应,应,用,用,流,流,程,程,新,增,增,用,用,户,户,和,和,高,高,价,价,值,值,用,用,户,户,当,前,前,在,在,网,网,用,用,户,户,定,义,义,候,候,选,选,用,用,户,户,识,别,别,正,正,常,常,用,用,户,户,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,渠,道,道,养,养,卡,卡,用,用,户,户,识,识,别,别,模,模,型,型,跳,蚤,蚤,用,用,户,户,识,识,别,别,模,模,型,型,筛,选,选,流,流,失,失,预,预,警,警,用,用,户,户,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,用,户,户,细,细,分,分,模,模,型,型,根,据,据,不,不,同,同,用,用,户,户,特,特,征,征,,,,,采,采,用,用,适,适,宜,宜,的,的,挽,挽,留,留,策,策,略,略,了,解,解,用,用,户,户,特,特,征,征,在,网,网,1,月,新,新,增,增,用,用,户,户,流,流,失,失,预,预,警,警,模,模,型,型,在,网,网,2,月,新,新,增,增,用,用,户,户,流,流,失,失,预,预,警,警,模,模,型,型,在,网,网,2,月,以,以,上,上,新,新,增,增,用,用,户,户,流,流,失,失,预,预,警,警,模,模,型,型,高,价,价,值,值,用,用,户,户,流,流,失,失,预,预,警,警,模,模,型,型,,高价值用,户,户用户细,分,分模型,在网,1,月新增用,户,户细分模,型,型,在网,2,月以上新,增,增用户细,分,分模型,,维,系,系,方,案,案,正常低网,龄,龄用户维,系,系措施,正常低网,龄,龄用户维,系,系,在网异动,用,用户,流失高危,用,用户,财务捆绑,:,:预存话,费,费送话费,(,(高额度,),),,用户忠诚,度,度计划,网龄营销,(,(财务捆,绑,绑),服务捆绑,用户归位,,,,主动引,导,导用户归,位,位至适合,其,其自身消,费,费的品牌,和,和资费套,餐,餐;,优惠补卡,;,;,账户低余,额,额时充值,提,提醒;,主卡付费,+,亲情网,……,同一细分,群,群的流失,高,高危用户,和,和在网异,动,动用户采,用,用同一类,型,型的捆绑,政,政策,但,在,在力度上,会,会有所差,异,异。

    业务捆绑,:,:预存送,本,本地长途,通,通话分钟,数,数,业务捆绑,:,:预存送,本,本地通话,分,分钟数(,高,高额度),财务捆绑,:,预存话费,送,送话费(,中,中低额度,),),业务捆绑,:,:专项预,存,存,-,高价值数,据,据业务套,餐,餐优惠,业务捆绑,:,:专项预,存,存,-,短信套餐,捆,捆绑,业务捆绑,:,:专项预,存,存,-GPRS,套餐捆绑,业务捆绑,:,:预存送,漫,漫游主叫,通,通话分钟,数,数,业务捆绑,:,:专项预,存,存,-,数据业务,套,套餐优惠,业务捆绑,:,:预存送,本,本地通话,分,分钟数(,低,低额度),商务高端,用,用户群,长途话务,突,突出群,本地话务,突,突出群,本地低端,用,用户群,数据业务,发,发烧群,短信偏好,用,用户群,GPRS,偏好用户,群,群,漫游突出,用,用户群,数据业务,兴,兴趣群,本地话务,偏,偏好群,全用户,,,,谢,谢,谢 !,9,、静夜四无,邻,邻,荒居旧,业,业贫2022/12/182022/12/18,Sunday, December 18,2022,10,、雨中黄叶,树,树,灯下白,头,头人2022/12/182022/12/182022/12/18,12/18/20222:24:44 AM,11,、以我独沈,久,久,愧君相,见,见频。

    2022/12/182022/12/182022/12/18,Dec-2218-Dec-22,12,、故人江海,别,别,几度隔,山,山川2022/12/182022/12/182022/12/18,Sunday, December 18,2022,13,、乍,见,见翻,疑,疑梦,,,,相,悲,悲各,问,问年,2022/12/182022/12/182022/12/182022/12/18,12/18/2022,14,、他,乡,乡生,白,白发,,,,旧,国,国见,青,青山,18,十,十,二,二月20222022/12/182022/12/182022/12/18,15,、比,不,不了,得,得就,不,不比,,,,得,不,不到,的,的就,不,不要,十二,月,月222022/12/182022/12/182022/12/18,12/18/2022,16,、行,动,动出,成,成果,,,,工,作,作出,财,财富,2022/12/182022/12/18,18December2022,17,、做前,,能,能够环视,四,四周;做,时,时,你只,能,能或者最,好,好沿着以,脚,脚为起点,的,的射线向,前,前。

    2022/12/182022/12/182022/12/182022/12/18,9,、没有失,败,败,只有,暂,暂时停止,成,成功!2022/12/182022/12/18,Sunday,December18,2022,10,、很多事,情,情努力了,未,未必有结,果,果,但是,不,不努力却,什,什么改变,也,也没有2022/12/182022/12/182022/12/18,12/18/2022 2:24:44 AM,11,、成功就,是,是日复一,日,日那一点,点,点小小努,力,力的积累,2022/12/182022/12/182022/12/18,Dec-2218-Dec-22,12,、世间,成,成事,,不,不求其,绝,绝对圆,满,满,留,一,一份不,足,足,可,得,得无限,完,完美2022/12/182022/12/182022/12/18,Sunday, December 18,2022,13,、不知,香,香积寺,,,,数里,入,入云峰,2022/12/182022/12/182022/12/182022/12/18,12/18/2022,14,、意志,坚,坚强的,人,人能把,世,世界放,在,在手中,像,像泥块,一,一样任,意,意揉捏,。

    18,十,十二月20222022/12/182022/12/182022/12/18,15,、楚塞,三,三湘接,,,,荆门,九,九派通,十二月222022/12/182022/12/182022/12/18,12/18/2022,16,、少,年,年十,五,五二,十,十时,,,,步,行,行夺,得,得胡,马,马骑,2022/12/182022/12/18,18December2022,17,、空,山,山新,雨,雨后,,,,天,气,气晚,来,来秋,2022/12/182022/12/182022/12/182022/12/18,9,、杨,柳,柳散,和,和风,,,,青,山,山澹,吾,吾虑,2022/12/182022/12/18,Sunday,December18,2022,10,、阅,读,读一,切,切好,书,书如,同,同和,过,过去,最,最杰,出,出的,人,人谈,话,话2022/12/182022/12/182022/12/18,12/18/20222:24:44AM,11,、越,是,是没,有,有本,领,领的,就,就越,加,加自,命,命不,凡,凡2022/12/182022/12/182022/12/18,Dec-2218-Dec-22,12,、越是无,能,能的人,,越,越喜欢挑,剔,剔别人的,错,错儿。

    2022/12/182022/12/182022/12/18,Sunday,December18,2022,13,、知人者,智,智,自知,者,者明胜,人,人者有力,,,,自胜者,强,强2022/12/182022/12/182022/12/182022/12/18,12/18/2022,14,、意志坚,强,强的人能,把,把世界放,在,在手中像,泥,泥块一样,任,任意揉捏,18 十,二,二月 20222022/12/182022/12/182022/12/18,15,、,最,最,具,具,挑,挑,战,战,性,性,的,的,挑,挑,战,战,莫,莫,过,过,于,于,提,提,升,升,自,自,我,我,十,二,二,月,月222022/12/182022/12/182022/12/18,12/18/2022,16,、,业,业,余,余,生,生,活,活,要,要,有,有,意,意,义,义,,,,,不,不,要,要,越,越,轨,轨,2022/12/182022/12/18,18December2022,17,、,一,一,个,个,人,人,即,即,使,使,已,已,登,登,上,上,顶,顶,峰,峰,,,,,也,也,仍,仍,要,要,自,自,强,强,不,不,息,息,。

    2022/12/182022/12/182022/12/182022/12/18,,MOMODA POWERPOINT,Lorem ipsum dolor sit, eleifend nulla ac, fringilla purus. Nulla iaculis tempor felis amet, consectetur adipiscing elit. Fusce id urna blanditut cursus.,感,谢,谢,您,您,的,的,下,下,载,载,观,观,看,看,专家,告,告诉,。

    点击阅读更多内容
    最新文档
    XX中小学校食堂管理办法(修订版)及XX中小学校外供餐管理办法(修订版).docx
    2025年高考语文复习策略讲座.pptx
    2025年高考 历史三轮复习策略.pptx
    2025高三历史三轮复习策略.pptx
    2025年高考化学二轮复习备考策略.pptx
    总经理在中国电信分公司党委理论学习中心组专题学习2025年政府工作报告研讨会上的发言范文.docx
    科室长在全市挂职干部代表座谈会上的交流发言范文.docx
    中国石油分公司党委书记、总经理专题学习2025年政府工作报告心得体会范文.docx
    机关办公室专题学习2025年政府工作报告研讨会上的交流发言材料范文.docx
    书记在理论学习中心组关于官僚主义、形式主义专题研讨会上的发言材料范文.docx
    中国石油分公司党委副书记专题学习2025年政府工作报告心得体会范文.docx
    供电公司总经理专题学习2025年政府工作报告心得体会范文.docx
    在中国电信分公司党委理论学习中心组专题学习2025年政府工作报告研讨会上的发言范文.docx
    供电公司班子成员专题学习2025年政府工作报告心得体会范文.docx
    总经理在中国移动分公司党委理论学习中心组2025年政府工作报告专题研讨会上的交流发言.docx
    在中国移动分公司党委理论学习中心组2025年政府工作报告专题研讨会上的交流发言范文.docx
    区纪检监察党员干部学习2025年政府工作报告心得体会范文.docx
    供电公司党委书记专题学习2025年政府工作报告心得体会范文.docx
    在医院党委理论学习中心组专题学习2025年政府工作报告研讨会上的交流发言范文.docx
    在司法局理论学习中心组专题学习2025年政府工作报告研讨会上的交流发言范文.docx
    卖家[上传人]:213321321g
    资质:实名认证
    相关文档
    正为您匹配相似的精品文档