zz太搞笑了！学术不端检测系统

5750

收藏 2009-06-22

zz太搞笑了！学术不端检测系统
2009-06-21 15:20
      最近听同学说，博士论文要学术不端检测系统检测，超过30%就认为是学术不端行为，以后认定是否原创由系统说来算。以前听过，只是一直没用过，CNKI和武汉大学各出了一个，有幸通过一些方法搞到个帐号玩了一下，得到一些搞笑的结论。很奇怪GOOGLE和BAIDU为什么不开发一个以供娱乐。

   中央文献出版社和《求是》杂志多位国家领导人（其中包括了XXXX大报告和论XXXX个呆表XXXX,XXX和牌发钱观）和特约评论员的报告和文章稿竟然出现了重复度超过60%,按照CNKI的说明，已经构成抄袭，但仔细看下文章你会发现，由于此类文章经常用的语句全部是套话，所以导致重复度过高，但讲得内容和主题确实不同。

   检测了一下非线性泛函、微分集合和代数的相关40余核心以上论文，几乎没有一篇论文是低于30%。但仔细看一下分析结果会发现，令人哭笑不得的是自己引用自己的也包括在内，另外还有一些必须的介绍性的概念和背景知识。另外，突然发现该系统无法检测公式（呵呵！不知道会不会给一些抄袭的人些启发）和纯粹图片。山东大学一泰斗数学论文检测有58%以上叙述相同，但是仔细看因为作者修改了前人定理的一个条件，从数学意义上是相当重大的突破和创新了。

以后干脆发明一些系统，机器从语料库中提取组织能够自己撰写论文，而且可以做到学术不端检测系统无法检测就好了。

从检测结果来看，要想降低学术不端检测系统提出的重合率，方法可以如下：

1.大量的使用公式，公式不可判别；（看来做这个软件的人跟我开发反黄系统碰到一样的麻烦）

2.大量的使用图，而且采用图像微扭曲变换和滤波压缩操作；

3.尽量的使用一些非常规的说法，因为常用的句式都已经在系统的库里面了；

4.尽量的采用地方方言解释论文中的一些观点；

5.写论文之前，先搜索CNKI，看一下别人写了些什么，然后自己专写重复话或者屁话，导致该系统的检测匹配算法失效；

6.受免杀技术启发，建议自己也找个帐号，或者去CNKI注入一个,先自检一下，然后修改那些类似的地方，逐步消除特征。

以上内容非常实用，建议大家不妨一试。反正又是一个类似于绿坝的装B软件而已，不经过专业委员会一起认定，仅仅凭机器的结果就武断的定量出是否是学术不端，让领导更加不需要大脑就可以做决定了。让我们把装B装到底吧!!!!