「科研」如何高效地閱讀文獻

作者 | 中國科學技術大學,zzy

簡書地址:https://www.jianshu.com/p/d036a11ef77d

文獻閱讀的意義和價值


對於研究生新生而言,剛開學,必不可少的就是接觸閱讀文獻這樣一件差事。通過閱讀文獻,一方面我們可以瞭解這個領域的專家/學者最近在研究什麼,可以從中收穫新的insight和知識,另一方面,我們也可以藉助這個機會,學習學術論文撰寫的方法和討論,瞭解寫作技術,此外,我們還可以以此來評估今後自己的工作是處於什麼level,適合什麼層次的會議/期刊。

「科研」如何高效地閱讀文獻


會議和期刊的區別

首先了解下會議和期刊的主要區別。

會議

一般而言,會議文章審稿週期短,錄用速度快,比較直接,部分頂會增加了rebuttal的過程,即有一次審稿人反饋信息,作者對審稿人的問題進行一一辯駁解釋,以消除審稿人的疑慮(concerns)。對於會議,除了審稿週期短外,如計算機的會議,要求內容很新,可能會是有新的問題, 也要求有新的方法,尤其是對於做應用(application)的同學而言。


期刊

而期刊,往往審稿週期很長,會反覆修改,對內容要求是全文內容全面,推導、實驗完整,有較完備的分析和討論,即“全”。而對新穎的要求會略低於頂級會議。

文獻閱讀

下面就談談如何閱讀一篇文獻。一般一篇文章分為Abstract、Introduction、Related work、 Methods、Experiments和Conclusion這六個主要部分。

Abstract

當然第一部分是Abstract,這部分是一個工作總覽,一般會包含研究的問題what、研究意義價值significance、主要方法 recent works、挑戰 still remain challenging due to XX(沒解決的問題)、我們提出的框架(we propose xxx to address xxx)、涉及的主要方法(e.g. xxx and then xx, extract the interacted relationship...)、實驗結果與結論(Experimental results illustrate xx 提升了多少 outperforms other baselines)
通過讀它我們可以快速瞭解全文的研究內容和主要方法,從而決定這篇文章和自己研究方向的相關程度,確定是否需要花很多時間進行精讀,或者依據此也可以確定興趣程度,來確定如何閱讀全文。

Introduction

接著是閱讀introduction,我們一般從以下幾個方面來對intro進行評估,汲取希望獲得的知識(內容):
1.significance(意義)為什麼研究
2.motivation (技術)
challenges
3.相關工作 related work 表明自己的與他們其實不同的 problem,method
4.Methods & Main Contribution (Methods 是針對challenges提出的,contributions一般需要從兩個方面理解,一個為研究的問題problem,另一個是technique contribution即模型技術上的貢獻)
對照主要貢獻,當我們自己有了idea的時候,就可以對照這些文章來評估自己的想法處於什麼層次level,是否適合這些會議/期刊,哪些是適合我的,我還可以針對哪些方面做哪些提升。

Related work

接下來是閱讀related work。
這部分工作的閱讀我們需要從中瞭解到相關工作的寫作方法,別人是如何闡述相關工作的,這些工作和我們工作的關聯是什麼,不同點在哪裡,針對本文的contribution,來提別人的工作,並針對性的給出分析,指出研究的不同點和方法的不同點。

Methods

對於Methods方法部分,我們需要著重把握文章提出的模型是什麼
對於一般的機器學習模型,可以拆分為模型和數據兩個大塊。
數據:輸入是什麼(features) 輸出是什麼 y, prediction
模型:模型框架即結構是什麼(structure)
模型的損失函數如何設計(定義)loss function 是否有正則化
這個模型和別人以往工作的模型創新點在哪裡,是基於什麼motivation的,即基於某個observation(什麼樣的規律或者觀測或者發現,在這個發現的基礎上,我們對過往的模型提出了改進)

Experiments

對於這一部分,我們一般需要關注作者是如何設計這個實驗的,如何控制變量,這些實驗設計出來的目的是什麼,即為了驗證什麼。


如模型本身準確率很高?
某一單個模塊很有效?尤其是自己提出的方法 設計的模塊 更應當驗證其有效性
是否有做消融實驗?

實驗結果的分析

是怎麼去表達數據的不同(變化)的,如何表達好的,如何規避“不太好”的實驗結果。

一般需要縱向比(即和不同的模型比,我們的模型總體上都比其他同類或不同類的模型效果都要好一些)
一般還需要橫向比(即和自己比,做消融實驗,消去自己模型的不同模塊 評估準確率,為了得到不同模塊都是對結果優化起正面作用的)

Conclusion

這一部分往往會闡述(回顧)本文的研究問題和主要方法,進一步的提出未來工作展望。可能部分文章(尤其是期刊)會增加“討論”這一部分,讓讀者明白其模型其設計的motivation及其設計的小弊端、小缺陷(這樣做的好處是承認問題 避免審稿人再挑刺)。
這部分可以學習到結論部分是如何重複闡述問題(和abstract類似而又表達語句不同的)怎麼指未來的研究方向。以及什麼樣的小弊端是可以在論文最後提,而有些弊端是不用提的,避免麻煩。

實時記錄好的句子和想法

以上就是初學者閱讀論文的主要思路和方法,並且在閱讀過程中,遇到好的表達方式可以進行記錄,並標記這種表達一般用在什麼地方,方便今後寫作時調取進行模仿寫作。

略讀

在閱讀完一定量的論文具有了一定積累後,可以試著粗略閱讀,比如我們只是想看看方法和技巧,那麼我們可以快速閱讀摘要,模型的框架(Framework)從而可以看到模型的主要貢獻在哪裡,通過掃描實驗可以大致看到實驗的設計和主要結果。

The End


分享到:


相關文章: