“从资料中取出隐含的过去未知的有价值的潜在信息”;
“一门从大量资料或者资料库中取有用信息的科学” 。尽管通常资料探勘应用于资料分析,但是像人工智能一样,它也是一个具有丰富含义的词汇,可用于不同的领域 。它与KDD(Knowledge discovery in databases)的关系是:KDD是从数据中辨别有效的、新颖的、潜在有用的、最终可理解的模式的过程;而数据挖掘是KDD通过特定的算法在可接受的计算效率限制内生成特定模式的一个步骤 。事实上,在现今的文献中,这两个术语经常不加区分的使用 。4. 本质数据挖掘本质上属于机器学习的内容 。例如:《数据挖掘:实用机器学习技术及Java实现》一书大部分是机器学习的内容,这本书最初只叫做“实用机器学习”,“数据挖掘”一词是后来为了营销才加入的 。通常情况下,使用更为正式的术语,(大规模)数据分析和分析学,或者指出实际的研究方法(例如人工智能和机器学习)会更准确一些 。5. 过程数据挖掘的实际工作是对大规模数据进行自动或半自动的分析,以取过去未知的有价值的潜在信息 。例如:数据的分组(通过聚类分析)、数据的异常记录(通过异常检测)和数据之间的关系(通过关联式规则挖掘) 。这通常涉及到数据库技术,例如空间索引(英语:spatial index) 。这些潜在信息可通过对输入数据处理之后的总结来呈现,之后可以用于进一步分析,比如机器学习和预测分析 。举个例子:进行数据挖掘操作时可能要把数据分成多组,然后可以使用决策支持系统以获得更加精确的预测结果 。不过数据收集、数据预处理、结果解释和撰写报告都不算数据挖掘的步骤,但它们确实属于“资料库知识发现”(KDD)过程,只不过是一些额外的环节 。数据库知识发现(KDD)过程通常定义为以下阶段:
- 选择
- 预处理
- 变换
- 数据挖掘
- 解释/评估
以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!
「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助:- 张一鸣的精彩生活经历:“今日头条”也是他的“孩子”
- 今日头条也出手了!严格审核付费圈子创作者资质
- 今日头条拿下券商牌照!松鼠证券将打造互联网券商新模板?
- 今日头条已经对纸质新闻媒体产生巨大影响
- 让人爆笑的综艺谐音梗,你都知道哪些?
- 谐音梗真是又尴尬又好笑的喜剧包袱,你知道哪些让人爆笑的综艺谐音梗?
- 今日头条抢先看!8月11日
- 今日头条开启“寻找真知派”活动 全网寻找下一个“局座”
- 今日国际金价多少一克
- 今日的国际重大新闻???11月8日国际重大新闻““““