首页 > 常见问题 > 详情

CNKI知网论文检测系统的局限

2017-12-09 21:42:43   来源:PaperEasy官网   浏览:  次
CNKI知网论文检测系统的局限
        CNKI知网论文检测系统中,期刊编辑使用较多的为社科期刊检测系统和科技期刊检测系统,其检测范围涵盖中国学术期刊网络出版总库、中国报纸全文数据库、中国优秀硕士论文网络出版总库、中国博士论文网络出版总库等,虽然涵盖面较大,但仍不可避免地存在数据的有限性,加之数据录入量大造成的时间拖延,其数据也存在滞后性。此外,由于CNKI知网论文检测系统仍处于不断完善的阶段,该系统对外文、文档格式与公式图表的处理存在误差,使用指纹比对方法对文章文字复制比的计算也容易出现偏误。
        一、 CNKI检测系统数据库的有限性与滞后性
CNKI检测系统能对其收录入库的期刊、报纸、会议等予以检索,但检测系统数据库以外的文献或来自博客、空间和其他网络终端的文献却未能予以完整收录。作为学术期刊编辑在使用该系统时也会遇到如下情况:检测文章在系统上并无抄袭或文字复制比很低,但经百度、google等搜索就会出现雷同文章,有时甚至是另一作者的原文。数据的有限性大大影响了CNKI检测系统的准确度。为了能够让自己的论文及时发表以完成科研考核目标或结题,很多作者都会出现_稿多投的情况,尽管很多编辑部在稿约中三令五申,但一稿多投的现象仍呈愈演愈烈之势。如果被抄袭的文献没有及时公开地发表却在“准出版公开”状态,刊登的论文没有及时被知网数据库收录,抄袭往往就不能被系统检测发现。由于CNKI的数据收录期刊众多,数据收录量极大,不可避免地会存在滞后性,很多文献都是在纸质出版物出版后的一个多月甚至两个月才能在数据库查询到。数据的滞后性严重影响了检测的准确度,甚至导致论文重复发表的结果。
        二、CNKI检测系统数据库的语言、文章格式与公式图表的限制
目前,CNKI检测系统数据库的所有数据来源主要为中文,虽然CNKI针对这一局限性推出了英文检测系统与中英文对照检测系统,但因其资源库仅仅包含springer图书、springer期刊earthscan期刊等题录数据库,在对翻译类文章的检测上显得力不从心。CNKI检测系统虽然支持caj、doc、pdf等多种格式的检测,但同一篇文章因格式不同而导致检测结果不同的情况并不鲜见:以编辑部来稿《从法科学生就业难探析法学教育的诟弊》为例,该文第一次以word形式的完整检测结果为21. 1%,但将该文格式改为txt后再次进行检测却得到了7. 4%的检测结果,这是由于机检对字符判断不一造成的。此类问题还包括上传pdf文件显示文章过短、改动论文排版导致结果相异等。此外,CNKI知网论文检测系统对文字敏感,对改换数据的公式、图表等的检测还处于完善期。在检测包含公式、图表的论文时常常无法正常显示,而只是其中数据的无序罗列。因此,即使是抄袭他人实证的图表有时都无法检测出,如若作者更换图表调研的名称或某些数据就更难以检出。如此种种限制更导致了CNKI检测系统数据的准确性难以保证。
        三、CNKI检测系统比对、判断失误
CNKI检测系统的比对、判断失误主要包括三方面的内容:对意义抄袭类文字难以判断、对文字复制的刻板误断和因收录不全导致的复制误判:
        1.对意义抄袭类文字难以判断
CNKI检测系统采用的是外形比对的方法来进行检测“即针对文字、字母与数字的各种排列组合进行外型比对,如果被比对的两段文字的句式、用词、排列顺序完全相同,则可以被轻易地检测出来。” 但如果是作者将搜集到的材料改换句式,进行解释性扩充,但保持内核不变的意义抄袭就比较隐蔽,很难被检测出来。
        2.对文字复制的刻板误判
CNKI检测系统外形比对的判断方法同样也会导致对文字复制的刻板误判。假如A作者引用了B作者的文章《xx》,但是B作者的文章因没有正确标注出引用文献或没有标注引用文献而被检测系统认定为抄袭,那么,即便A作者在引用B作者的文章时正确标注了所引的文章,检测系统依然会认定A作者为抄袭,这种情况对A作者来说就有失公平了。这样的情况还包括对某些名人著作、重要文件、经典案例的表述上。一般来说,这些文字不能被更改,从而导致机检的文字复制可能性高。
        3.因收录不全导致的复制误判
CNKI检测系统对原创文献的默认逻辑为:“首次在《中国学术文献网络出版总库》中出现的文章作者即认定为原创者,在其以后提交检测的论文中出现的相同的文字而没有标注出系统默认出处的,即被认定为抄袭。由于文章收录的不尽完善,这样的逻辑判断常常出现误差,假设A作者引用了一段文字(例如为《xx》书中的语句),而这段文字并未被列入比对的CNKI数据库,如果A作者为最早引用这段文字的人,并被收录入库,那么不管他是否标注这段文字为《xx》书的引用,系统都会默认A作者为原创者。若这段文字再次被B作者引用,即使他标明该段文字为《xx》书的引用,也会被系统认定为抄袭。这种情况下的文字复制比显然是系统的误判。

㊣ 转载请附上文章链接并注明:论文降重 » CNKI知网论文检测系统的局限

㊣ 本文永久链接:http://www.papereasy.com/article/91.html

相关热词搜索: 知网论文检测系统 CNKI 上一篇:CNKI知网论文检测系统的功用与数据解析 下一篇:知网论文检测系统的合理使用