基于软集合的不完备不一致
数据分析及决策方法研究
大数据时代下,虽然数据量巨大,但是大量有价值的信息却很少被挖掘出来加以利用。数据量的增加并不会给企业带来利益,只有对数据进行有效适当的分析,对潜藏在数据内部的规律和知识进行挖掘并加以利用,才能发挥数据的真正作用。
大数据具有规模性(Volume),多样性(Variety),高速性(Velocity)和低价值性(Value)的4V特征。其中,多样性和低价值性的特点会导致数据集更加容易出现质量问题。
不完备和不一致是两种常见的质量问题,而大数据规模巨大,结构复杂的特点,更加加剧了数据不完备和不一致的程度。基于以上原因,数据分析技术面临前所未有的挑战。
传统的分析技术对于数据质量较为敏感,在分析具有不完备和不一致数据的时候不能得到可靠结果;同时由于分析手段、分析能力限制,无法实时快速的分析数据量过大、类型复杂的数据。因此,迫切需要新的数据分析方法,可以对不完备不一致数据进行快速有效的分析,发现有价值的知识或信息。
软集合是一种新的处理不确定问题的数学工具,可以克服传统方法参数化工具不足的缺点。因此在分析不确定信息的两个重要表现形式——不完备和不 ...