全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1064 12
2022-04-24
英文标题:
《The Application of Data Mining in the Production Processes》
---
作者:
Hamza Saad
---
最新提交年份:
2020
---
分类信息:

一级分类:Economics        经济学
二级分类:General Economics        一般经济学
分类描述:General methodological, applied, and empirical contributions to economics.
对经济学的一般方法、应用和经验贡献。
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
英文摘要:
  Traditional statistical and measurements are unable to solve all industrial data in the right way and appropriate time. Open markets mean the customers are increased, and production must increase to provide all customer requirements. Nowadays, large data generated daily from different production processes and traditional statistical or limited measurements are not enough to handle all daily data. Improve production and quality need to analyze data and extract the important information about the process how to improve. Data mining applied successfully in the industrial processes and some algorithms such as mining association rules, and decision tree recorded high professional results in different industrial and production fields. The study applied seven algorithms to analyze production data and extract the best result and algorithm in the industry field. KNN, Tree, SVM, Random Forests, ANN, Na\\\"ive Bayes, and AdaBoost applied to classify data based on three attributes without neglect any variables whether this variable is numerical or categorical. The best results of accuracy and area under the curve (ROC) obtained from Decision tree and its ensemble algorithms (Random Forest and AdaBoost). Thus, a decision tree is an appropriate algorithm to handle manufacturing and production data especially this algorithm can handle numerical and categorical data.
---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-4-24 15:25:21
工业工程2018;2(1): 26-33http://www.sciencepublishinggroup.com/j/iedoi:10.11648/j.ie.20180201.14数据挖掘在生产过程系统科学和工业工程中的应用,宾厄姆顿大学,纽约,USAHamza Saad。数据挖掘在生产过程中的应用。工业工程。2018年第2卷第1期,第26-33页。doi:10.11648/j.ie.20180201.14收到日期:2018年9月16日;接受日期:2018年9月28日;发布日期:2018年10月30日传统的统计和测量无法以正确的方式和适当的时间解决所有工业数据。开放的市场意味着客户增加,生产必须增加以满足客户的所有要求。如今,每天从不同的生产过程和传统的统计或有限的测量中产生的大量数据不足以处理所有的日常数据。提高产量和质量需要分析数据,并提取有关流程如何改进的重要信息。数据挖掘在工业过程中得到了成功的应用,关联规则、决策树等算法在不同的工业和生产领域都取得了很好的专业效果。本研究应用了七种算法来分析生产数据,并提取出工业领域的最佳结果和算法。KNN、Tree、SVM、Random Forests、ANN、Na"ive Bayes和AdaBoost应用于基于三个属性的数据分类,而不忽略任何变量,无论该变量是数值变量还是分类变量。从决策树及其集成算法(随机森林和AdaBoost)中获得的精度和曲线下面积(ROC)的最佳结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 15:25:27
因此,决策树是处理制造和生产数据的合适算法,尤其是该算法可以处理数字和分类数据。数据挖掘算法,分类,工业数据,精确度,ROC曲线1。在制造业和工业过程中,每天都会产生大量数据,然而传统的测量和分析不足以处理大量数据。问题来自复杂性、非线性和不一致性。随着现代组织中数据库的快速增长,数据挖掘成为一种越来越有价值的数据分析方法。数据库和统计分析的应用在工程中得到了很好的应用[2]。20世纪80年代末,人工智能首次应用于制造业[3-4]。记录公司所有流程的数据,如产品设计、材料控制、计划、调度、装配、回收、维护。这些数据被存储,因此作为新知识的来源提供了巨大的潜力。利用收集到的数据已成为一个问题,而数据挖掘是将这些数据转化为知识的典型和最佳解决方案。数据挖掘过程在制造业中的应用始于20世纪90年代[5-7],并逐渐受到生产界的关注。目前,数据挖掘应用于生产和制造工程的不同领域,以提取知识,应用于预测维护、设计、故障检测、质量控制、生产和决策支持系统。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 15:25:34
通过数据挖掘对数据进行分析,以识别控制制造过程的变量中隐藏的模式,或定义和提高产品质量。数据挖掘的一个重要优点是,分析所需的数据可以在所研究的制造过程的正常过程和操作中收集,因此通常不需要引入数据收集的专用过程。制造业的数据挖掘在过去几年中有所增加;目前适合对其应用进行批判性审查[10]。由于制造业的复杂性,数据挖掘提供了许多算法来处理复杂的数据。2018年印度工程学会;2(1):26-2733算法具有处理分类或数值数据的特殊能力。在本研究中,许多数据挖掘算法应用于基于三个属性的数据分类。在工业和制造过程中,关联规则和决策树用于从大数据中提取知识。然而,关联规则只能处理类别数据。决策树和基于集成学习的决策树记录了复杂的输出[1],无论依赖变量是数字变量还是分类变量。本研究中的数据挖掘算法用于分析[1]中最初从工业进展报告中获得的数据,并找出能够处理分类和性能最高的工业数据的最佳算法。2.方法论(数据挖掘算法概述)所有解释的数据挖掘算法都将用于分析生产过程中的实际问题。2.1.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 15:25:39
朴素贝叶斯(naivebayes)朴素贝叶斯(naivebayes)分类器是根据贝叶斯定理,在变量之间具有独立性假设而生成的。朴素的贝叶斯分类器易于构建,没有问题的迭代参数估计,这使得它适用于大型工业数据集。尽管它很简单,但该算法通常表现得出奇地好,并且得到了广泛的应用,因为它的性能往往优于perfectclassification方法。方程(1)中的贝叶斯定理提供了一种从P(c)、P(x)和P(x | c)计算后验概率P(c | x)的技术。它假设预测器(x)对agiven类(c)的影响独立于其他输入变量的值。这种假设被称为conditionalindependence类。P(c/x)=(/)*()()(1) P(c/x)是类(依赖)给定预测(变量)的后验概率。P(x/c)是一种可能性,它是给定类别的概率。P(c)是类的先验概率。P(x)是预测因子的先验概率[9]。2.2。决策树算法(C4.5)决策树以树的形式进行回归和分类模型。它将数据集分解为更小的子集,同时关联的决策树也逐渐发展[11]。最终的结果是一棵包含叶节点和决策节点的树。决策节点(例如,机器)有两个或多个分支(例如,旧的、阴的和新的)。叶节点(例如,平均值)代表决策。树的根节点位于树中与最佳预测器相对应的最顶层决策节点。决策树可以处理数字和分类数据。J.R.提出的ID3决策树生成算法的基础。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 15:25:46
Quinlan通过nobacktracking在可能的空间分支中进行自上而下的贪婪搜索。ID3应用信息增益和熵来构建决策树。2.3. K-最近邻算法(KNN)是一种简单的算法,它存储所有可用案例,并根据相似性度量(例如距离函数)对新案例进行分类。20世纪70年代初,K-最近邻作为一种非参数技术被用于模式识别和统计建模[9]。欧几里得的∑ (-)(2) 曼哈顿∑ |-|(3) 明可夫斯基∑ (|-|) /(4) 三个距离测量函数仅适用于连续数据。在分类实例变量中,必须使用等式(5)中的汉明距离,而不是距离函数。当数据集中的数值变量和分类变量混合时,数值变量的标准化介于0和1之间。汉明距离=|-| = =>  = 0 ≠ =>  = 1(5)选择K的最佳值最好先检查数据。一般来说,较大的K值更精确,因为它可以降低总体噪声,但没有保证。交叉验证是另一种通过使用独立数据集验证K值来回顾性确定好K值的方法。历史上,大多数数据集的最佳K值在3-10之间。这会产生比1NN更好的结果。2.4. 人工神经网络算法(ANN)人工神经网络(ANN)是一个基于生物神经网络的系统,就像大脑一样。ANNis由人工神经元网络(称为“节点”)组成。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群