Survey是做好論文的第一步

Survey是做好論文的第一步,也是關鍵的一步。Survey的目的大家都知道,就是要對研究的議題有個深入且廣泛的了解,這樣才知道目前在這領域裡研究的進展已經到什麼地步,state of the art是什麼,有那些的子題及技術已經被探討,從而也可以知道那些還可以開發,那些技術可以被的研究議題拿來應用。Survey 做的不好,最致命的打擊就是在對的研究議題一頭埋入,花了許多心血,好不容易熬出一些成果之後,突然才發現別人早已經發表同樣或類似的成果。

怎樣才能把survey做的深入且廣泛呢?要知道在這領域裡主要的國際會議是什麼,然後把這些會議近幾年來(至少三年)所發表過的論文的title及abstract瀏覽一次,找出跟研究議題比較相關的論文(注意:是「議題」,不是「領域」)。

這樣初步找出來的論文大概從十來篇到二、三十篇,甚至也可能更多。接著,得把這些論文的Introduction看一遍,對它們做個初步的瀏覽,然後把這些論文依它們與的研究議題的相關性做個大致的排序。接下來就是依序把這些論文仔細的研讀,每篇論文的重點是什麼,關鍵的技術又是什麼,都得弄得很清楚。在這個階段,每篇研讀的論文大概都是夠水準的論文(因為他們是發表在主要的國際會議)。在研讀這些論文的時候,看它們探討那些相關的文獻,這些文獻大致都得知道,並且就其中與研究議題最相關的論文,也得找出來仔細的研讀,並且重覆這樣子的工作一直追溯下去。不用擔心這樣做會無止無境,因為當從最近的一篇論文開始往前追朔,大概不超過三、四代,就會發現不必再追朔,因為再往前追朔,會發現它們要麼與的研究議題愈來愈遠,要麼就是研究領域的基本知識。如果是研究領域應具備的基本知識,而還不了解,那應該回頭再修一些課把基礎打好,不該這麼早就進入想研究的議題上。

根據這個經驗法則,會發現在survey的階段只要把握一個原則:把與研究議題相關的最近幾篇論文拿出來,看看這些論文所引用的文獻有沒有不知道的,如果沒有,那麼比這些論文早的文獻大概都沒遺漏了。如果有,就把它們找出來仔細的研讀。隨著研讀的論文愈多,的功力就愈增加。當發現拿到一篇新論文時只要看完它的Introduction之後,就知道這篇論文的重點及猜出它用的主要技術之後,的功力已經提昇到可以進入研究議題的階段了。在這個階段,如果論文的研讀夠深入及廣泛,往往也可以發現新的研究議題。

的survey還不能在這裡停止,因為的觸角可能尚未含蓋所有關於研究議題的文獻。目前只有survey與研究議題相關的主要國際會議(以及會議論文所引用到的相關文獻),這些會議通常不超三到五個。目前的國際會議相當多,而且有些會議的研討議題又廣,因此有可能兩個會議的主軸不一樣,但卻含蓋類似的子題。舉例來說,假設要研究的是peer-to-peer系統上的資訊搜尋,大概會找專門探討peer-to-peer系統的國際會議。這個目前大概有二、三個。可是知道那裡還有呢?至少還有二、三十個可能:專門討論分散式系統裡的國際會議(這至少有五到十個,其中first tier的約三、四個,其餘為second tier),討論平行運算的國際會議(這至少也有五個),討論網路與通訊系統的國際會議(這至少十個以上),討論資料庫與資訊檢索的國際會議(這至少也有五個),相信了吧!而且還有好多新的workshop從未聽過的。

一、怎麼知道有那些可能相關的國際會議;
二、怎麼有辦法消化完這些會議的論文?

第一個問題得從第一階段的論文研讀著手。在研讀這些論文的時候,得注意它們發表在那裡,從而知道有那些可能相關的國際會議。
第二個問題:如何消化與的研究議題可能相關的國際會議內的論文?把與研究議題相關的最近幾篇論文找出來,看它們是在那一年發表的。如果研究的是熱門議題,找到的應該是去年或今年的論文;如果的議題冷門,那最近一篇論文有可能是好幾年前的事。不過不管是冷是熱,都只需把相關的國際會議最近一、二年的會議議程拿來看看,有沒有與的研究議題相關的論文發表,有的話把論文找出來仔細研讀一下這篇論文有什麼突破,另外,也注意一下這篇論文引用的參考文獻有沒有尚未讀過的,沒有的話表示前階段的survey做的很仔細,有的話就得把這些遺漏的論文找出來研讀,並且用前面提到的方法再去追朔這篇論文三、四代以內的參考文獻,以及論文出處,找出是否還有其他的相關國際會議,並且一樣得把這些會議近一、二年的議程拿來看看是否有相關的論文發表。這些過程一定會收斂的,而當發現沒有新的論文被找出來之後,的survey工作大概已經做的差不多了,可以準備收工全心投入研究議題上。通常而言,在第二階段找到的論文不會太多,大多數的論文在survey的第一階段都會看到。收工之前,為防萬一,再到Google、Siteseer及幾個主要的digital library,如IEEE,ACM,Springer等去search一下,確定沒有漏網之魚。如果survey的深入,應當知道要下那些關鍵字去查詢。這個步驟也可以確保如果研究的是冷門議題,在看到的最近一篇的論文,到近一、二年的國際會議這期間,有沒有其他的論文沒有注意到的(因為最後一階段的survey工作只注意相關會議最近一、二年的議程,而看到最近的論文可能是好幾年前的東西)。

在這裡我好像都沒提到期刊論文。一般而言,期刊論文通常比較完整,但刊登的結果往往是二、三年前的東西。就資訊科技而言,二、三年內的研究進展可能很大,因此比較新的結果通常先發表在國際會議上,發表之後,經過幾回合的修正才會投稿到期刊。所以survey的論文比較新的東西很少會在期刊上發現。但反之,比較久的成果,有可能已整理發表於期刊上。如果是如此,那在研讀這個成果時,最好是找已發表於期刊上的論文研讀,這樣會得到比較完整清楚的資訊。
整個survey的階段會看完幾篇論文?這當然看的研究議題而定。但三十篇以上是跑不掉的。如果加上只瀏覽Introduction 的部分,那可能在五、六十篇以上。

Leave a Comment.