谢依妨
四川大学 610225
摘要:随着现代科学技术的进步与经济社会的发展,基于消费者对物质生活与精神文化生活并重的消费理念,高端手机及其应用也正面临着巨大的机遇与挑战,与此同时产生的垃圾短信信息正是当下相关手机信息维护工作人员最亟待解决的问题。本文针对当前社会中手机垃圾短信泛滥的这一实际情况,总结了传统治理方案没有达到预期效果的原因,并结合相关技术理论在手机通信运营商业务平台中研究并制定了一系列行之有效的措施与对策,以此希望能够对改善手机垃圾短信泛滥
一流信息监控拦截系统
挥卸ㄖ苹蚴谌ǖ那榭鱿拢赡吧怕胍远绦糯偷姆绞椒⑺偷接没只希⒃诙绦拍谌葜邪苏┢⑶樯⒈┝Φ任:ι缁峁舶踩怕疑缁峁仓伟驳亩绦拧�
本文主要以移动通信运营商下属的短信传送与数据维护平台为基础,通过建立数据挖掘技术的基本模式,自动对平台下所有相关数据进行自动过滤垃圾短信的业务为基本内容,将数据挖掘技术所获得的垃圾短信生成规律应用到对这部分信息的过滤工作中。
二、数据挖掘技术下对垃圾短信进行过滤处理的基本特征
对垃圾短信的过滤处理与传统意义上的垃圾邮件处理有所不同,基于数据挖掘技术来实现的垃圾短信过滤工作在继承传统过滤模式的基础上,作出了新的改动与调整。具体来说,主要涉及到以下几个方面。
(一)从理论上来说,短信得以传送的关键在于其内容所包含范围小,往往只能具体到文本与号码,无法实现对图片、视频等多媒体影音的传送,这也使得在数据挖掘模式下短息系统为过滤工作所提供的可利用资源很少。
(二)短信不仅对传送内容有要求,对其传送内容的总字数也有严格的控制,70中文字符的短信中使得数据挖掘技术下能够对相关垃圾短信进行内容与规则上掌握的信息很少。
(三)数据挖掘技术下对所有非手机业主自愿或授权的短信传送行为都会进行拦截与过滤,往往忽视了一种短信信息是否属于垃圾信息是依据手机业主对此是否有需求的这一原则,一味的过滤这些信息是不合理的。但是在数据挖掘技术下很难实现具体手机业主在正常短信与垃圾短信之间的自主选择。
(四)由于短信在传送过程中,传送手机号码是必须显示的重要内容且不以伪造,因此手机运营商应当将来电与短信黑名单的建设与开展工作同数据挖掘技术相结合,达到相关资源最大限度的整合。
三、垃圾短信过滤中数据挖掘技术的基本应用流程
相关工作人员在对垃圾短信的研究与分析过程中,首先需要对其运作流程具备一个全面、系统的研究,以求能够在垃圾短信实际过滤工作中将数据挖掘技术落实到实处,并据此提高这一技术的利用率与过滤成功率。具体来说,主要有以下几个方面的内容。
<!--[if !supportLists]-->(一)<!--[endif]-->垃圾短信具体特征的分析与研究。在对垃圾短信实时过滤工作前,首
先需要由专业技术人员采取不定量与定量相结合的模式对相关垃圾短信进行合理的分类与整理,通过所获取垃圾短信的不同特征对其建立不同形式的模型。对手机运营商而言,具体来说需要做到以下几个方面。
1.首先,需要在一定时期内将客户投诉与系统反映的垃圾信息进行样本处理与分析工作,并且对归类的垃圾短信进行内容分析与研究。
2.其次,需要依据垃圾短信在特征与归类方面的不同建立起不同的评价标准,根据统计学的基本原理对垃圾短信的各项基本指标进行测算与评估。
3.最后,需要由专业工作人员将这部分垃圾短信与正常的短信数据进行对比与分析,据此发现垃圾短信产生的系统漏洞。
(二)垃圾短信过滤中数据挖掘技术下建模指标的选取工作。在移动运营商短信平台上进行数据挖掘技术的目的在于在获取建模数据源的同时完成制表工作。具体来说是在将垃圾短信数据与正常短信数据混合的基础上,对数据库各种用户群下的垃圾数据进行归类制表,并通过数据挖掘技术整合排列出不同属性对短息数据输出的重要程度。
(三)数据挖掘技术下对垃圾短信的过滤流程。相关工作人员需要认识到对垃圾短信的过滤工作是一项不断优化与循环的过程。具体而言,可以分为以下几个方面。
1.首先,需要根据数据库建模树立决策树模型,利用不同分类下对垃圾短信过滤原则的掌握生成相应的垃圾短信过滤方案。
2.对这部分不同垃圾短信种类下的垃圾短信过滤,需要将SMSC数据库作为传送与过滤依据,并将垃圾短信过滤得出的数据及时反映到数据库当中。
3.通过对垃圾短信的数据挖掘与过滤,工作人员需要依据这一方式下得出的数据模型对实施的垃圾短信过滤方案进行可行性的研究与评估。
(四)垃圾短信在数据挖掘技术下过滤效果的评价与分析。通过一整套全面、系统的数据挖掘技术可以对垃圾短信实施有效的过滤,对相关结果仍然需要进一步的研究与分析。具体来说,主要分析角度有以下几个方面。
1.覆盖率。这一标准是指数据库在一定时期内所过滤出的垃圾短信占整体短信数据量的比列。
2.准确率。这一指标所反映的是一定时期内所有数据挖掘技术模式下过滤出的短信数据量中,真正意义上的垃圾短信所占的比重率。
3.服务质量提升率。对这一指标的考察与衡量,需要相关工作人员将在一定时期内没有采用数据挖掘技术进行短信过滤的前提下的投诉率与采用该种技术后短信平台中投诉量的数据进行比率分析,以此判定出数据挖掘技术在垃圾短信过滤中的功效性。
总而言之,各个手机运营商在短信传送服务中对相关垃圾信息全面综合的治理,不仅可以建立良好的短信平台运作环境,还能够起到提供高质量通讯服务,保障手机业主信息安全与隐私的作用。基于传统短信筛选与过滤技术为基础而产生的数据挖掘技术在继承传统模式优势的前提下,利用流程图以及模表分析,在很大程度使垃圾短信的有效过滤率得到了提升,是现代手机短信通讯与传送功能安全乃至整个经济社会稳定发展的有力保障。
参考文献:
[1] 胡峰.张杰.刘静.肖大伟.一种基于Rough集地海量数据属性约简方法. [J].重庆邮电大学学报(自然科学版).2009.(04).
[2] 陈平.乔秀全.刘臻.田小萍.数据挖掘网络中决策树并行算法设计及性能分析. [J].北京邮电大学学报.2009.(S1).
[3] 钱升华.武优西.柴欣.陈冀川.文本分类综述及手机垃圾短信过滤方法的研究. [J].河北工业大学学报.2007.(01).
[4] 黄文良.李石坚.刘菊新.徐从富.一个大规模垃圾短信实时过滤系统. [J].北京邮电大学学报.2008.(03).
[5] 金展.范晶.陈峰.徐从富.基于朴素贝叶斯和支持向量的自适应垃圾短信过滤系统. [J].计算机应用.2008.(03) www.mxhslw.com
本文转自:www.mxhslw.com