您的位置: 网界网 > 行业应用 > 正文

电子政务中的数据挖掘

2013年05月17日 11:21:38 | 作者:佚名 | 来源:中国电子政务网 | 查看本文手机版

摘要:数据挖掘电子政务网络数据分析数据库internet电子政务是从政府的角度出发,服务于社会、企业和个人的电子商务应用之一。

标签
电子政务
数据挖掘

数据挖掘电子政务网络数据分析数据库internet电子政务是从政府的角度出发,服务于社会、企业和个人的电子商务应用之一。作为一种基于网络,符合Internet标准,面向政府机关、企业以及社会公众的信息服务和信息处理系统,信息的获 取、利用和开发是必须解决的问题。目前的网络技术不具备信息自主开发能力。网络提供给用户的 只是信息素材或粗加工过的信息,不能立即应用于实际,而且为了得到这类原始信息或数据,通常 要经过一连串的网上操作,查询效率低,即信息的利用率低。特别是,对于不熟悉英文的大多数中 文用户而言,即使有良好的中文交互环境,仍然不可能充分利用Internet上本来可以利用的大量信息 资源,这种现状无法适应电子政务对高质量的网络信息服务的需求,网络信息中的数据挖掘(Data Mining)技术就是在这样一种环境下应运而生的。

一、电子政务需要数据挖掘 数据挖掘技术是人们对数据库技术不断研究和开发的结果,是继网络之后的又一个技术热点。自 1989年出现以来,经过十多年的发展,数据挖掘技术已趋于成熟,并已投入商业应用。世界上比较 有影响的典型数据挖掘系统有:SPSS公司的Clementine、IBM公司的Intelligent Miner、SGI公司的 SetMiner、SAS公司的Enterprise Miner、RuleQuest Research公司的See5, 还有CoverStory、EXPLORA、Knowledge Discovery Workbench、DBMiner、Quest等。知名的Gartner Group 的一次高级技术调查将数据挖掘和人工智能列为“未来3~5年内将对工业产生深远影响的五大 关键技术之首”。

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,抽取隐含在其 中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。从更广义的角度来讲,数据挖掘 就是在一些事实或观察数据的集合中寻找模式的决策支持过程。因此,挖掘的对象不仅是数据库, 还可以是任何组织在一起的数据集合。数据挖掘最初针对的是大型数据库,而电子政务中的数据挖 掘技术是基于网络的,即所谓的网络数据挖掘,它除了处理传统数据库中的数值型的结构化数据 外,处理更多的是文本、图形、图像、WWW信息资源等半结构、非结构的数据。

二、网络数据挖掘有固定流程 关于网络数据挖掘技术,目前众说纷纭。有人认为,网络数据挖掘就是利用数据挖掘技术,自动 地从网络文档以及服务中发现和抽取信息的过程。可以将网络数据挖掘分为四个步骤:

(1)确定业务对象 虽然网络数据挖掘的最后结构是不可预测的,但对要探索的问题应该有所预 见,不能盲目地为了数据挖掘而数据挖掘。清晰地定义出业务问题,认清数据挖掘的目的是网络数据 挖掘的重要一步。

(2)数据准备 网络数据挖掘的数据来自两个方面:一方面是客户的背景信息(+微信关注网络世界),主要来源于客户登 记表;而另外一部分数据主要来自浏览者的点击流(Click-stream),人们主要用这部分数据考察客户 的行为表现。由于客户的背景信息涉及个人隐私,因此客户不愿意把个人信息如实填写在登记表 上,这给数据分析和挖掘带来困难。在这种情况下,不得不从浏览者的表现数据中推测客户的背景 信息,进而再加以利用。数据准备首先检索所需的网络文档,发现资源;然后进行数据预处理,从发 现的网络资源中自动挑选和预处理得到专门的信息。

(3)网络数据挖掘 从单个的Web站点以及多个站点之间的网络资源中发现普遍的模式。

(4)结果分析 对挖掘出的结果,即普遍模式进行确认或者解释。

在整个网络数据挖掘的过程中,被研究的业务对象是挖掘过程的基础,它驱动整个网络数据挖 掘的全过程,同时,也是检验挖掘结果和引导分析人员完成挖掘的依据。数据挖掘的过程并非自动 的,许多工作需要人工完成。数据挖掘对数据有着严格的要求,先期的数据准备工作要占用60%的时 间,且对数据挖掘的成败至关重要。

[责任编辑:王莹 wang_ying@cnw.com.cn]