馬亮:學位論文查重的“七宗罪”

文/馬亮 中國人民大學國家發展與戰略研究院研究員、公共管理學院教授

新冠肺炎疫情期間,全國高校普遍“停課不停學”,紛紛採取線上授課方式完成教學任務。與此同時,本碩博畢業生的學位論文開題、評審和答辯也多采取線上會議模式。一些學生無法按照預定計劃進行實地調研,不得不轉而採取二手資料分析和文獻研究等其他研究方法。加之來自導師的指導和督促也不夠,學生期望學位論文能夠矇混過關,這使得論文抄襲和剽竊的風險加大。

在這種情況下,如何把控學位論文質量就成了關鍵問題。為了確保學位論文經得起推敲,各大高校普遍採用論文查重軟件。論文查重不是新鮮事,但是,它在疫情期間的使用卻迅猛增長。

值得注意的是,論文查重並非萬靈藥,而且可能誘發新的學術不端和研究失範問題。可以說,論文查重有難以破解的“七宗罪”,不加重視會導致意想不到的負面影響。

一、論文查重是玩數字遊戲,使學術誠信成了一個可以操控乃至玩弄的量化指標。

論文查重的核心指標是重複率,即學位論文和數據庫的完全重複比例。但是,關於重複率應該設為多高,各大高校和各級學位卻沒有達成共識。一些學校將學位論文的重複率設為10%,但是也有學校規定不超過20%。多數高校對博士論文的重複率規定為不超過5%,但是一些學校將碩士論文的重複率標準定為10%,將本科畢業設計的重複率標準放寬到15%。

由此可見,論文查重將科研誠信和學術規範降格和矮化為可以討價還價和商量的量化指標,等於默許乃至縱容抄襲和剽竊。學術規範意味著非黑即白,而不是可以迴旋的餘地。只要存在抄襲,那怕是隻言片語,就可以判定為學術不端。

將學術規範操作化為重複率,無異於向學術不端妥協和讓步。假定重複率的標準被設為5%,那麼4.9%的重複率就是可以允許的。對於一篇三萬字的學位論文而言,這意味著可以允許不超過1500字的抄襲,而這顯然是一個可怕的數字。如果誠信是可以商量和討價還價的,那麼順利過關並畢業的學生會如何對待誠信?

二、論文查重是一個深不可測的陷阱,會誘使學生從抄襲走向剽竊。

論文查重軟件的核心技術邏輯是比對學位論文和數據庫,查看二者是否存在逐字逐句的重複。一旦學生認識到只要不逐字逐句地抄襲即可,那麼就會有人為了通過審查而去多次“刷”查重軟件,將逐字逐句的抄襲修改為隱性剽竊,直至論文通過查重標準。

論文查重軟件提供了標註涉嫌抄襲語句的服務,這為學生篡改語句和矇混過關提供了可乘之機。比如,一些人會顛倒語句,修改詞語和標點符號,以此矇混過關。

實際上,政策文件、直接引用、參考文獻等文字重複是允許的,但是為了降低重複率,還是有很多學生選擇機械操作,將一些文字轉換為不可編輯的圖片,進一步降低重複率。

相對來說,抄襲比剽竊更容易被判定,因為剽竊他人的觀點和思想往往需要行內人才能辨別,因此查重軟件等於拉高了學術不端的甄別難度係數,使學術失範問題更加難以被發現和揭露。

三、論文查重是一個心理安慰劑,政府、學校、導師和學生反覆使用都是為了買個放心、圖個省心、尋個安心。

目前高校普遍採購了論文查重服務系統,可以對學生提交的學位論文進行免費查重。學位論文審查沒有設立申訴機制,學生如果無法通過論文查重就有口難辯。這使學生對論文查重這場“期末考試”不放心,擔心如果不能通過論文查重會影響論文答辯和畢業就業。他們通常會自掏腰包先行自查自糾,直至達到論文查重標準。在學位論文質量師生同責的情況下,一些導師害怕學生論文出事而牽連自己,也會要求學生自行查重。

此外,學位論文涉及系所、學院、學校等多級部門,教育主管部門為了確保學位論文質量,還會對論文進行二次查重,進一步使學位論文反覆經歷數次查重。

由此可見,論文查重已然不是為了確保學術誠信,而是各個利益相關者為了自求心安而進行的心理安慰。

四、論文查重是一個巨大產業,但是教育主管部門涉嫌干擾市場公平競爭。

論文查重使學校和教育主管部門可以確保學位論文符合學術規範,也使學生可以花錢消災,這催生了一個龐大的新興產業。

在百度學術的論文查重欄目,可以查詢十餘家論文查重服務公司。既有萬方數據、PaperPass這樣的權威大牌,也有筆桿、大雅這樣的優選品牌,還有學術家這樣的惠享品牌。該欄目對各家公司查重服務的單價(元/千字)、預期耗時、數據庫量級、支持語種、檢測技術、報告特點等方面進行比較,供用戶貨比三家。截止目前,這個欄目獲得了超過一億次訪問量和點贊數,足見其受歡迎程度之高。

論文查重費少則幾十元,多則數百元,如果查詢多次那麼花費就會達到上千元。但是,由於教育主管部門使用中國知網來對學位論文進行抽查,各大高校因此也普遍採用同款軟件,這使得其他品牌的市場份額被擠壓。教育主管部門採用某種查重軟件,等於為其背書,也會促使各大高校、導師和學生紛紛採用同款軟件。這無異於政府幹預市場公平競爭,甚至涉嫌縱容企業壟斷和濫用市場支配地位。

五、論文查重會有漏網之魚,使很多學術不端矇混過關。

由於論文查重嚴重依賴其所比對的數據庫,所以數據庫收錄的論文量和著作量就直接決定了論文查重結果的可信度。

目前,論文查重軟件主要將學位論文同網絡搜索引擎、期刊論文數據庫、學位論文數據庫等進行比對,但是,在很多方面還存在較大限制。

首先,很多高校的學位論文還沒有上網,如果抄襲的話就很難被發現。

其次,圖書著作的數字化還很有限,也是學位論文抄襲的重災區,而查重軟件愛莫能助。

再次,論文查重軟件主要對中文數據庫進行比對,而很難調用英語和其他語種的數據庫,這使抄襲外文文獻的學術不端難以辨別。

最後,論文查重對中文論文應對自如,但是對英文論文還沒有完全覆蓋,這使規模越來越大的留學生的學位論文處於監管盲區,學術規範問題堪憂。

六、論文查重助長了臨時抱佛腳的僥倖心理,不利於培養學生的學術誠信。

學生抄襲或剽竊不是隻發生在學位論文環節,如果不加嚴格規範,在學生培養的全過程都會發生學術不端。

由於在培養過程缺乏必要的監管,一些人文社會科學專業的學生會抄襲他人的作品,或者把一篇作業改頭換面地反覆用於各種課程。如果在平時不加管束,那麼學生在畢業時已經養成了難以改變的抄襲習慣,論文查重軟件也無力迴天。

國外很多高校都為教師提供了課程作業反抄襲系統,學生提交的任何作業都會進行查重,如果發現存在抄襲或剽竊就會做出嚴肅處理,重則會勒令退學。

因此,在平時課程作業和論文中就應引入論文查重系統,使學生充分認識到學術誠信的重要性,避免一錯再錯和養成錯誤的觀念和習慣。當然,這需要推動高校之間課程論文和作業的共享互查,使抄襲和剽竊無所遁形。

七、論文查重是一場算法遊戲,在大數據時代將會愈演愈烈。

論文查重涉及許多人工智能問題,如分詞、斷句、比對等自然語言處理問題。為了使論文查重軟件更加聰明,目前一些企業在通過機器學習來訓練人工智能判定抄襲或剽竊。

但是,總體來說論文查重軟件在這方面的進展遲緩,且很難獲得公眾理解和社會認可,因此仍然是對學位論文的文字進行機械對比。導師和學生之所以預先自行論文查重,就在於論文查重本身的不確定性。由於和學位論文比對的數據庫在實時更新,每次查重結果都不一樣,這使導師和學生都不敢掉以輕心,害怕論文會不過關。

隨著企業之間的競爭日趨激烈,論文查重軟件也將迎來大數據和人工智能算法的一場革命。作為一把雙刃劍,這既有助於提高論文查重的精準性,也會使人們更加依賴查重軟件,並使上述問題被進一步放大。

論文查重存在“七宗罪”,但是它並非一無是處。論文查重仍然是一個值得一用的高效工具,我們也很難在短期內徹底棄之不用。至關重要的是,正確認識和理性使用查重軟件,避免出現上述問題並造成意想不到的負面影響。

論文查重是辨別學術不端的輔助工具,不應將重複率作為一個量化考核指標。我們要對抄襲和剽竊等學術不端“零容忍”,哪怕是0.1%的抄襲也不應容忍和放過。我們也應該將論文查重貫穿於學生培養的全過程,對學生作業和課程論文進行查重,使其真正發揮監督學生的作用。由此,學生才會在撰寫學位論文時就持有更高的敬畏之心,而不是將論文查重視為可以操弄的遊戲,師生們也可以使用任何一款論文查重軟件,無須亦步亦趨地效仿教育主管部門。此外,在中國大學日趨國際化的背景下,加強對留學生學位論文的規範也應提上日程。

(文章僅代表個人觀點。責編郵箱:[email protected]


分享到:


相關文章: