如何应对高校论文相似度检测

 估计是最近学术抄袭的现象过于严重了,现在一大部分高校整了一个论文反抄袭检测系统,用的是CNKI知网的论文库,只要你的毕业论文存在抄袭现象,它就会给你检测出来,严重影响了广大学生毕业论文的顺利通过,破坏了社会的和谐。

     要对付这个系统,首先要了解它的运行原理。通过分析我砸银子得出的检验报告,可以了解到这个检测系统,不是简单的把你的文章和他论文库进行对比,现在的学生也不傻,抄完文章,都是改句话,改个词,加几个字什么的,单用word查找似的对比方法,肯定查不出来。这个系统缺德带冒烟的地方就在于它是把你的文章按一定字数分段,然后把每段里面的汉字统计下来,跟论文库里的文章进行对比,只要相同的汉字达到一定的比率,就在你文章与库里文章连续重复较多的位置给你画出红线算抄袭了。根本不在乎你文字的顺序,就比如说你把你抄的一个段落整个打散了,每句话分别放在不同的段落里,也全都能给查出来。

     但这个系统也是有弱点的,首先它有一定的查找范围,也就是它的论文库有限。去年这个系统能检测到CNKI知网里的抄袭内容,对从书上和网上抄的内容根本检测不出来。不过今年变化了,根据最新的检测报告,这缺德系统现在连书上的文章也可以检测出来了,网上的东西也可以检测的到。但是从外国网站dnowload来的英文文章在翻译成汉语后,还是检测不出来。

     所以对付这个系统,如果你的学科在自然科学领域,那就简单了,直接去外国的网站找论文,然后自己或者找人翻译过来,把作者名字换成自己,抄上就OK了。但是社科类学科,尤其是我这个专业的就倒了血霉了,万恶的资本主义国家没有研究这个的,朝鲜估计可能研究这个,但是棒子文我看不懂。这就需要一定的技巧了,在抄文章时,最好从不同的文章里抄取(在检测系统里这叫多元抄取),然后记好自己每短话抄袭的文章,例如1段抄自A文章,2段抄自B文章,C段…….然后在论文整体抄袭完毕后,去学校(有的学校不给个人检,比如长春某高校)或者网上花钱检测一下(不要在乎钱,延期答辩带来的损失要远比这点钱多的多)。如果检测系统准确率不错的话,你大部分抄袭段落就会被检测出来,但是要注意不是全部,由于上段提到的那个论文库的问题,很可能你的某段从书上或者网上抄来的文章中的一段就没有被检测出来,那么恭喜你,赶紧把那本书或者网上的那篇文章找出来,尽情的抄吧。

     而对于已经被检测出来,画了红线的段落,如果受到论文写作需要的制约,无法用其他安全的抄袭文章段落来进行合理更换的话,我们只能是自己改。笨方法就是逐字逐句的改,大面积的更换原句的原有汉字,尽可能降低汉字的重复比。例如这句话:”近几年中央政府相继出台了一系列惠农政策,在减轻农民负担、刺激粮食生产等方面效果明显。”绝对不能简单的更换几个字,调整一下刺激粮食生产和减轻农民负担的顺序,那样改还不如不改,劳时费力还起不到一点的效果。必须得类似这样改成”近些年来,党中央国务院连续颁布了一系列扶农政策,对提高粮食产量、增加农民收入等方面卓有成效。”这么改安全是安全,不过有个缺点,就是太耗费心力了,你要是不多看几本书,还真改不出来,不过话说回来,书要是看的够多,论文谁他妈还抄啊。

国外的论文反抄袭软件早就应用了。国内的中文反抄袭软件,08年年底也开发出来了,目前国内有一些高校和研究机构在试用。之所以试用,而不是全面推广,是因为目前这个软件尚不稳定,而且数据库也需要补充。不过再过两年,高校和研究机构检查论文反抄袭,是大势所趋了。
  

     论文需要检测的tf,可以先检测一下,得出雷同比例,以及红色标志的雷同内容,然后根据下面的原则进行修改,就可以通过了。

     修改原则:

     1,反抄袭软件检测到13个相同的字,就认为是雷同,所以连续相同的,不要超过13个字;

     2,尽量用同义词替代,比如: 损坏=破坏;渠道=途径;原理=基本思路;不可见=隐藏;优点尤其突出=优势尽显无疑

     3,改变句子的主动被动语态,比如:数字水印为多媒体数据文件在认证、防伪、防篡改、保障数据安全和完整性等方面提供了有效的技术手段。=在多媒体制品的认证、防伪、防修改和传送安全以及完整性保障方面,可以采用数字水印的检测作为有力的检测手段。

     下面是一个例子,按照这个程度的修改,保证能通过:

     修改前:目前,数字水印技术(Digital Watermarking)已成为国际信息安全学术界研究的一个前沿方向,为多媒体的安全保存和传送开辟了一条全新的途径。数字水印通过在原始数据中嵌入版权信息,即水印来保证该数据信息的所有权,这种被嵌入的水印可以是一段文本、标识、序列号、图像等各种数字信号。而且这种水印通常是不可见的,它与原始数据紧密结合并且隐藏在其中,可以经历一些不破坏原数据使用价值或商用价值的操作而能保存下来。在需要时,能够通过一定的技术检测方法提取出水印,以此作为判断媒体的版权归属和跟踪起诉非法侵权的证据。数字水印为多媒体数据文件在认证、防伪、防篡改、保障数据安全和完整性等方面提供了有效的技术手段。

     修改后:当前,国际信息安全领域的一个热点研究,就是数字水印技术。这种技术可以在多媒体的保存和传送中提供一种更安全的渠道。数字水印技术的原理是用水印来保证数据的所有权,即在保存或传送的原始数据中嵌入特定的版权信息。这些被嵌入的信息,也就是水印,可以是各种形式,比如标识,文本,图像,序列号等各种数字信号。并且,这些数字信号在表面是不可见的,并且与原始的数据以各种形式密切结合,当然这种结合不会损坏原始数据,所以数据在使用过程中丝毫不受影响。在使用过程中如果有必要检测水印,则可以通过相关的手段提取出隐含其中的水印,用这种方法来判定原始数据的版权,可以作为法律上侵犯版权的证据。这项技术在某些领域应用前景特别广发,尤其是多媒体数据、制品、文件的认证、防伪、防止修改、保障传送安全和完整性时,优点尤其突出。

发表评论