导读:数据挖掘是通过分析数据,在大量数据中找出相应的规律的技术,英文为DataMining。数据挖掘主要步骤有提供数据、规律探索及规律表示。数据挖掘的主要任务有异常分析、关联分析、演变分析、分类分析、特异分析及聚类分析等。数据挖掘是一门综合性比较强的新学科,集成了大量学科的技术及工具,包括统计学、人工智能、模糊识别、数据库技术及神经网络技术等。
参考:中国挖掘机配套市场运营全景分析与未来发展定位预测报告。
数据挖掘是通过分析数据,在大量数据中找出相应的规律的技术,英文为DataMining。数据挖掘主要步骤有提供数据、规律探索及规律表示。数据挖掘的主要任务有异常分析、关联分析、演变分析、分类分析、特异分析及聚类分析等。数据挖掘是一门综合性比较强的新学科,集成了大量学科的技术及工具,包括统计学、人工智能、模糊识别、数据库技术及神经网络技术等。
随着计算机技术的不断发展,数据挖掘技术已被广泛应用于交通、银行、电商等领域中,解决了如客户群体计划、客户信用统计、诈骗分析、客户流失分析、消费群体分析等商业问题。
随着中国经济的不断发展,中国已经处于工业大国,我国能源消耗主要是工业,是中国节能政策的重点目标。
当前我国高耗能企业生产方式主要是粗放式生产,与发达国家相比,我国在能源利用设备及能源管理系统上还有很大的差距。数据挖掘技术在高耗能企业中还没有利用起来。将数据挖掘技术应用到节能领域是非常有效的。
1节能领域中数据挖掘相关技术
节能领域中数据挖掘技术主要有六方面:归纳法、聚类、OLAP技术、关联规则、预测和分类、数据仓库集成技术。
1.1面向属性归纳法
算法关键技术是攀升属性与相应的概念层次树,同时把原始数据泛化到用户感兴趣的概念层中,这样减少了数据集数量,最终算法复杂度降低。对于该算法的研究主要有三方面:扫描次数减少能够提高算法效率;引入记录阀值改进面向属性归纳法;改进概念层次。
1.2聚类
聚类是指将数据对象进行分组,在同一组中对象之间相似度非常高,不同组之间相似度小。聚类算法主要有:层次方法、划分方法、基于网格方法、基于密度方法及基于模型方法。对于聚类算法研究主要有四方面:对复杂聚类算法的研究;分析孤立点;概念聚类研究;对已经存在聚类算法进行分析与改进。
1.3OLAP技术
OLAOP技术全称为联机分析处理,该技术主要是通过学习隐含在数据中的背景知识,对数据进行分析,这样给用户提供不同的数据。目前国内对OLAP技术还没有深入研究,原因是中国数据仓库技术不够成熟,没有成熟的实现环境。
1.4关联规则
关联规则算法核心问题是生成所有频繁项目。该算法是数据挖掘中比较重要算法。目前中国对关联规则算法研究主要有三方面:根据不同形式关联规则进行研究;与其他理论进行结合对关联算法进行研究;对关联算法进行改进提高算法效率。
1.5预测和分类
预测和分类是两种对数据进行分析的方法。将数据筛选提取重要的数据进行预测。常用方法有贝叶斯分类方法、决策树归纳分类方法及后向传播分类方法。国内研究预测和分类逐渐增加。目前国内研究内容主要有两方面:与其它理论结合进行算法改进;将贝叶斯网络分类方法应用与预测和分类中。
1.6数据仓库集成技术
数据仓库是一个集成的、面向主题的、非易失的数据集合,并支持对管理部门的决策过程。数据仓库给数据挖掘技术提供了更多的活动空间。它与数据库是有区别的,在挖掘数据时提出了更高的要求。数据挖掘技术要能充分发挥其潜力,必须和数据仓库结合在一起。常用的数据仓库供应商有微软、甲骨文及IBM等。
2数据挖掘在节能领域中的应用
关联规则在数据挖掘技术中使用频率很高。目前国内外基于关联规则在节能领域中的研究已有一定成果。
李建强等利用数据挖据关联算法确定各工况下、各负荷下参数的最优值。刘吉臻等人用关联规则对锅炉经济性分析和最优氧量进行了计算。氧气量直接影响到锅炉的效率,氧气量确定能够帮助企业节能。在锅炉炉膛压力控制系统和锅炉送风系统中,氧气量都会影响到锅炉热损失及能耗改变,最终影响到企业经济,采用改进增量式模糊数据型关联算法,同时用一台300MW的机组进行验证,结果表明:改进关联规则算法与传统数据挖掘算法相比,算法效率提高了4~16倍。娄小芳针对铝工业生产过程的能耗问题,提出了一种新的模式识别算法。将该算法用于铝生产能耗问题,结果显示,该算法能够解决能耗,但该算法对参数设置是盲目的。文中通过计算数据之间的距离来设置参数,提出了新的算法,解决了参数设置的盲目性,但算法效率降低了。王宁玲将数据挖据理论及方法应用与燃煤发电机组中能耗分析及诊断中。煤炭发电机组能耗数据量大、数据维数很高、噪声污染多、强耦合性等特点,通过引入模糊粗糙集理论,采用启发式属性约简算法解决了煤炭机组关键能耗变量选择问题。沈文杰等针对大型高耗能企业,以SQL2008为数据挖掘平台,采用线性回归算法,从海量数据中挖掘节能潜力,结果显示该方法具有实用性。胡轶群等以化工厂为例,讲解了高耗能企业中数据仓库建立、钻取分析、能效评估及数据挖掘方法应用于企业节能。节能潜力分析,见图1。张璐探讨了数据挖掘技术在能源管理系统中的应用,分析了如何用数据挖掘技术进行能耗分析。
3结语
提高能源利用率关系到人类可持续发展。由于物联网技术的发展产生大量的数据,如何将巨大的能耗数据利用起来,挖掘出那些数据是可以用于节能。找出生产过程中能耗高的设备、淘汰低能效设备,使用高能效设备,使数据挖掘技术不断应用于节能领域中。
【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。