zz太搞笑了!学术不端检测系统
2009-06-21 15:20
最近听同学说,博士论文要学术不端检测系统检测,超过30%就认为是学术不端行为,以后认定是否原创由系统说来算。以前听过,只是一直没用过,CNKI和武汉大学各出了一个,有幸通过一些方法搞到个帐号玩了一下,得到一些搞笑的结论。很奇怪GOOGLE和BAIDU为什么不开发一个以供娱乐。
中央文献出版社和《求是》杂志多位国家领导人(其中包括了XXXX大报告和论XXXX个呆表XXXX,XXX和牌发钱观)和特约评论员的报告和文章稿竟然出现了重复度超过60%,按照CNKI的说明,已经构成抄袭,但仔细看下文章你会发现,由于此类文章经常用的语句全部是套话,所以导致重复度过高,但讲得内容和主题确实不同。
检测了一下非线性泛函、微分集合和代数的相关40余核心以上论文,几乎没有一篇论文是低于30%。但仔细看一下分析结果会发现,令人哭笑不得的是自己引用自己的也包括在内,另外还有一些必须的介绍性的概念和背景知识。另外,突然发现该系统无法检测公式(呵呵!不知道会不会给一些抄袭的人些启发)和纯粹图片。山东大学一泰斗数学论文检测有58%以上叙述相同,但是仔细看因为作者修改了前人定理的一个条件,从数学意义上是相当重大的突破和创新了。
以后干脆发明一些系统,机器从语料库中提取组织能够自己撰写论文,而且可以做到学术不端检测系统无法检测就好了。
从检测结果来看,要想降低学术不端检测系统提出的重合率,方法可以如下:
1.大量的使用公式,公式不可判别;(看来做这个软件的人跟我开发反黄系统碰到一样的麻烦)
2.大量的使用图,而且采用图像微扭曲变换和滤波压缩操作;
3.尽量的使用一些非常规的说法,因为常用的句式都已经在系统的库里面了;
4.尽量的采用地方方言解释论文中的一些观点;
5.写论文之前,先搜索CNKI,看一下别人写了些什么,然后自己专写重复话或者屁话,导致该系统的检测匹配算法失效;
6.受免杀技术启发,建议自己也找个帐号,或者去CNKI注入一个,先自检一下,然后修改那些类似的地方,逐步消除特征。
以上内容非常实用,建议大家不妨一试。反正又是一个类似于绿坝的装B软件而已,不经过专业委员会一起认定,仅仅凭机器的结果就武断的定量出是否是学术不端,让领导更加不需要大脑就可以做决定了。让我们把装B装到底吧!!!!