2006年的國際數學大會把菲爾茲獎頒給了證明龐加萊猜想的俄羅斯數學家格里戈里·佩雷爾曼。但是,佩雷爾曼的論文僅僅發表在開放預印本庫arXiv.org,這在中國的科研評價看來,根本就不能算“學術論文”,更別談獲獎了!
中國“核心期刊”從過去的檢索手段,如今演變成為科研評價的絕對指標,同時,交叉重疊、莫衷一是的量化標準更加劇了科研評價的不公平、不公正。這種現狀反映著背后僵化的量化思維,亟待改變。請“核心期刊”走下神壇,倡議發展更加豐富多元、求真務實的科研評價機制,正是本文作者對這現狀的回應。
文/張曉林
《中文核心期刊要目總覽2014》(簡稱《總覽》)發布后,我們針對它在計算期刊學科影響力時的不科學不合理做法,已經做了若干評論(詳見文末參考文獻)。通過這些分析,我們開始意識到,問題的根源可能就在于“核心期刊”概念本身,在于我國學術界、期刊界,乃至科技管理領域的“核心期刊”情結。因此,有必要對“核心期刊”正本清源,避免造成對“核心期刊”及“核心期刊目錄”的誤解甚至迷信。
中國特色的“核心期刊”現象
1. “核心期刊”的“絕對”與“脆弱”
在我國,“核心期刊”是一個重要的現象、指標和名譽。許多機構都明確和公開地選用某個核心期刊目錄(或者自己選定一組期刊組成“核心期刊”),規定在應聘、晉升、考核、申請項目、獎勵時只接受發表在“核心期刊”中的論文。
這似乎在說,一篇論文發表在核心期刊上就是好論文,一種核心期刊上的所有論文都達到了一定的學術水平;反之,一篇論文無論其真實學術水平如何、實際效果有多大,只要沒有發表在核心期刊上就不能算數。筆者多年在管理崗位和各種評聘中的經驗也證明,沒有發表在核心期刊的論文往往沒有資格進入評審,而對于那些“核心期刊”論文,實際評聘過程中也沒有多少人仔細閱讀和評價。
但是,有所求就會有所應。許多著名機構對編選“核心期刊目錄”進行了長期研究,投入規模大,積累時間長;許多期刊把進入核心期刊目錄作為努力的目標、在進入某個目錄后就在期刊封面顯著注明自己的核心期刊地位;許多作者費心費力、采取各種方式要把論文“發表”在“核心期刊”上。
但國際學術機構卻并不看重所謂的“核心期刊”,而是最看重學術科研本身。2006年國際數學家大會將當年的菲爾茲獎授予了證明龐加萊猜想的俄羅斯數學家格里戈里·佩雷爾曼,美國克雷數學研究所也在2010年將100萬美元的千禧年數學大獎給予了佩雷爾曼,而佩雷爾曼證明龐加萊猜想的論文從來就沒有發表在任何期刊上,更不用說什么核心期刊了,而是發布在開放預印本庫arXiv.org上。
如果按照我國許多機構的規定,佩雷爾曼的論文根本就不能算“學術論文”呢!難道在我國學術生活和職業發展中如此舉足輕重的“核心期刊”概念,在真正的科學大獎面前就如此不堪一擊了嗎?
2. 優秀論文不問出身
我們仔細想想,幾乎所有的科技發達國家里,很少有嚴肅的科研教育機構會事先規定一個核心期刊目錄,要求人們在應聘、晉升、考核、獎勵時呈交的論文必須來自這個核心期刊目錄中的期刊。人們會根據論文本身而不是它們的“出身”來判斷論文的學術水平。英國英格蘭高等教育資助理事會(HEFCE)等組織的英國大學學術卓越性評價(Research Excellence Framework)并不要求提交評價的論文的“出身”,澳大利亞學術評價(Excellence in Research for Australia)在2012年及以后的評審中取消了原來依靠一個期刊排序表的做法而依靠評審專家的專業判斷。
那么,我們是對評審專家的學術水平、學術公正或者學術誠信不自信,因此才會依賴一個核心期刊名單?或者是實在沒有時間或不愿意花時間去評價論文本身、才讓一個“核心期刊”目錄作為“過濾器”來減輕負擔?要回答這個問題,有必要對“核心期刊”及其遴選機制進行追根溯源。
“核心期刊”概念可能是筆糊涂賬?
1. 核心期刊的前身:作為檢索手段的遴選代理
我們也許應該看看“核心期刊”的歷史內涵。
從某種意義上講,“核心期刊”是紙本時代的一種檢索手段。在紙本時代,人們面對發表在眾多期刊上的眾多論文,自然希望先選擇少數“可能刊登了較多較高水平論文的期刊”作為一個遴選代理,幫助自己縮小需要閱讀的范圍來“找到值得讀的論文”。這也許就產生了評價期刊質量、遴選“核心期刊”的需求。另一方面,“核心期刊”也是圖書館在紙本時代的一種選刊手段,圖書館因為采購經費限制,只能選訂一部分期刊,因此也需要遴選出那些平均論文水平比較高的期刊作為“值得訂閱的期刊”。
為遴選這樣的核心期刊,有的機構依靠自己的學者進行遴選,也有的機構依靠某個客觀機制來選擇,例如湯森路透公司的期刊影響因子。期刊影響因子通過期刊在一個時間段內發表論文的被引次數來反映“期刊學術質量”,這種指標本身有一定的合理性。一種期刊通過自己的學術標準、同行評議專家水平、學術誠信控制能力、編輯能力等,努力保障自己所發表論文的學術水平,而論文的學術水平可以在一定程度上通過論文的被引用頻次來體現。
因此一般來說,期刊的學術質量水平與所發表論文的平均學術水平正相關,因此也與其平均被引頻次正相關。這樣,利用以前發表論文的平均被引頻次就可以在一定程度上反映該刊的學術質量水平。所以,人們用如此計算得來的期刊影響因子在一定程度上反映該刊的學術水平。
2. 期刊的高質量不保證論文的高質量
但是,即使我們承認引用統計能在一定程度上反映學術期刊的學術影響力,而影響因子本質上是且只是期刊質量的評價指標。期刊的高影響因子從來就不能簡單等同于發表在這個期刊上的某篇具體論文的高質量,高影響因子期刊上也有許多論文無人引用或者所發表論文也會因為學術不端或失誤等被撤銷。例如,Nature不得不撤銷弄虛作假的小保方晴子的論文;有研究指出,多種著名期刊都有多篇論文(其中不乏高引用率論文)因為科學不端行為而被撤銷。
因此,不能因為一篇論文發表在某個高影響因子的期刊上就認為這篇論文一定是高水平的。那種通過發文期刊的影響因子來代表具體論文水平的做法本身是不科學的,那些宣傳“論文影響因子”、計算某個研究人員的“發文平均影響因子”、或者統計某個研究團隊或研究機構的“論文平均影響因子”或“論文累計影響因子”的做法更是已在荒唐的邊緣。
3. 互聯網檢索淡化了學術期刊的“核心”價值
值得關注的是,有研究發現,來自高影響因子期刊的高被引論文比例在不斷下降,來自非高影響因子期刊的高被引論文比例在不斷上升。其實,這反映了學術期刊網絡化檢索利用的現實。在Google、Bing、百度、CNKI以及大規模集成檢索系統已經成為人們檢索文獻的主要工具時,以期刊為主的文獻檢索已經讓位于以論文為主的文獻檢索,期刊本身作為一種遴選機制的作用迅速下降,而圖書館采用的Big Deal采購機制(購買大規模期刊數據庫而非單獨期刊)也明顯淡化了“核心期刊”的作用。
“核心期刊目錄”及其遴選可能出了什么錯?
1. 不合時宜的期刊遴選 莫衷一是的量化標準
在期刊遴選作用實際上不斷弱化的同時,我國的“核心期刊”評選依然方興未艾,而且我國的“核心期刊”名單何其多也!不僅多個研究機構編制了多個核心期刊目錄,國務院學位委員會等也提出了自己的核心期刊目錄,許多教育科研單位又有自己的目錄。
這些目錄一方面都是在一定程度上依據論文引用數據作為基本客觀數據,另一方面又“各有創新”引入許多間接指標,再加上出于種種原因各自設計出不同的分類體系,因此造成一種期刊在不同評價體系中出現在不同類別、出現在不同排名位置,甚至在有的體系中排名很高的期刊在另一個體系中名落孫山。而且,近些年又有許多新的“評價指標”被不斷地“研究”出來,使得幾乎每一個稍稍正經點的期刊似乎都能找到一個有利指標來彰顯自己的“高水平”。這樣,“核心期刊”遴選成為研究熱點,相關“市場”也持續火爆。
2. 互相庇護的引用聯盟 發展艱難的專門期刊
這種局面往往導致學術期刊為獲得某個體系的青睞而采取種種“有利于提高期刊影響力”的非學術做法。例如,《總覽》懲罰那些發表跨學科論文的期刊,就會助長期刊只關注和發表“本學科”的內容,因為在有限發文量內發表跨學科論文將導致自己的“本學科論文的引用量”的減少,這實際上導致“畫地為牢”和必然的“坐井觀天”。這還容易驅使部分期刊建立“引用聯盟”,相互“友情”引用來提高自己被引量,畢竟“引用聯盟”只有在“本學科”中才能有效建立。另外,這往往造成對特色化專門化期刊發展的阻礙。
為什么在我國專門化期刊難以發展呢?除了管理體制的原因(例如許多屬地辦刊)外,要獲得較多“學科內引用”,就要發表這個學科領域內不同人員都讀得懂的論文,或者在本學科所有主題領域都發表論文來覆蓋各種引用可能,因此涉及宏觀主題、宏大敘事和“熱點主題”的論文以及綜述等可能就受歡迎,因此許多期刊發表了上至宏觀哲學般內容、下至非常高深細微的技術內容,不管自己的評審專家或編輯是否能看懂。
有的評價體系不得不承認自己的遴選方法對一部分期刊不公平,卻宣稱自己本身就沒打算進行全面評價,因此是否客觀和公平似乎就沒關系。但是,當這些體系采用的核心評價方法與科學研究主要趨勢不一致、與學術期刊本身推進學科發展的宗旨不相符、與真正的符合發展趨勢的學術質量無關時,它就已經失去了整體上的可信度。何況實際上,沒有一個體系會說自己只是“部分期刊的核心期刊目錄”,人們也會在實踐中把它作為一個普適的體系來應用。
3. 評選曖昧 呼吁透明
還有,許多“核心期刊目錄”的評選過程并不透明,數據來源及其計算不清楚,往往還人為加入了許多主觀“調整”,而“調整”的依據以及“調整”操作者信息也不公開。我們沒有證據說明其中存在“任性”,但我們也沒有數據可以對其進行重復驗證。我們呼吁所有的“核心期刊目錄”體系公開自己的所有數據及其計算方法,公布自己主觀評選時的定性指標及其判斷依據,公布自己“調整”遴選結果的依據。如果這些評選及其調整是科學、嚴謹、規范的,其結果就應該在同樣的數據、標準和流程條件下可重復驗證。將數據、過程和責任人員予以公開,這已經成了科研領域和出版領域的基本要求,也是公信力的基礎。
其實,國際科技界《研究評價的舊金山宣言》、《關于研究評價原則的萊頓宣言》和中國科學院學部主席團《追求卓越科學》宣言中都要求科學地應用評價指標和評價體系。如果仍然堅持對“核心期刊”的迷信和對“核心期刊目錄”的迷信,本身就說明在學術評價和期刊評價上的膚淺和不負責任。
都是“指標驅動”惹的禍?
1. 科研評價依賴顯性量化 癡迷指標引發學術不端
也許應該指出,“核心期刊”神圣化以及“影響因子”神圣化本身還不是問題的全部。問題還在于我們對科學的評價過度地依賴某種顯性的、最好是量化的指標。這種對指標的依賴似乎已經在很大程度上綁架了我們的意識,造成“指標驅動的評價”,甚至“指標驅動的研究”。
筆者曾在Nature舉辦的一個討論會上反復聽到我國研究人員問“我怎樣才能在Nature上發表論文”,盡管Nature編輯回答說“你需要做一個高水平的研究”,但提問者明顯感到“不解決問題”。我們看到,問題和答案的出發點有明顯的差異,很可能導致人們行為的差異。
對于提問者來說,發文-->在核心期刊發文-->在影響因子盡可能高的期刊發文,已經成了科研是否成功、工作能否“交賬”和“職業生涯”能否發展的主要(甚至全部)依據,成了各類機構的宣傳重點、成就象征和評價條件。這就在潛意識上、甚至在實際評價和管理中造成只要發了文章就“功成名就”,至于是否真正解決了問題、是否解決了對科學或對發展真正重要的問題,那已經無關緊要了。那么,為了快發文、多發文、發那些高影響因子期刊“喜歡發”的論文,可能就直接導致追風式科研、短平快科研、碎片化科研等,也容易誘導科學不端行為。
對指標的癡迷也對辦刊理念和辦刊方法帶來負面影響。例如,前面已經提到的對跨學科內容的回避、對特色化辦刊的回避、對“熱點”主題的盲目追逐、對冷門問題的冷漠,等等。而且,對指標的癡迷還會驅使期刊“想方設法”把引用量“做上去”,這在一些圈子里已經成了交流的熱點、密室交換的利器,甚至專業化“殺手锏”。有些期刊在這方面頗有“創新”意識,例如少發文章、發表綜述文章、獎勵作者引用自己刊物、建立“引用聯盟”等等。
2. 熱門引用不等于杰出思想 引用指標一樣要走下神壇
其實,許多看似神圣的指標本身應該走下神壇。前面我們對“核心期刊”去神圣化,現在來分析“引用”這個指標本身。“引用”作為影響力指標,是假定“引用”代表了使用、使用代表了影響、影響促進了科學發展。在大量文章的大量引用情況下,從平均來說“引用”確實能夠從一個方面體現“關注”和“影響”,但是,引用本身有很多原因,熱門引用論文不一定代表了杰出科學思想,引用量并非一定與論文的學術水平嚴格正相關。
Nature在2014年發文指出,許多提出了后來獲得諾貝爾獎的發現或創造的論文并不在高被引論文名單上,“史上引用量最高”的論文往往是與方法、數據等有關。盡管我們承認這些論文的效用,但它們往往不能代表所在學科的學術創造方向和一流學術水平。
而且必須看到,引用指標嚴重偏向基礎研究論文,因為人們寫一篇論文時必須引用其讀過的另一篇論文才產生“引用”,因此“引用“作為指標有利于把學術論文作為主要產出的基礎研究領域。但是,技術應用、科學普及、政策研究等方面的學術和研究,它們的讀者受到“影響”后往往不是再寫一篇研究論文,而是開發技術和工具、改變或完善政策、組織生產或管理、開展教育等。因此對這些領域,即使很大的“影響”也往往不是通過其他新的論文來體現,也可能帶不來很多的引用量,因此在那些以引用量為基礎的評價體系中就缺乏“價值”。
另外,區域性主題、細節化問題,甚至高深的突破性的創新,往往比那些“全球性”問題或“宏觀性”問題的“受眾”少,因此,無論其研究水平和創新程度有多高,自然也不會有多少引用。試想,如果霍金沒有寫《時間簡史》,有多少人知道他呢?
我們不反對采用指標,包括采用量化指標。許多指標,如果正確地計算和正確地應用,有其客觀的有限的作用。但是,把任何指標用到它本身力所不逮的程度就變成了荒唐,真理超過一步就是謬誤。
最后需要說明,我們批判某些指標體系的錯誤,并不指望甚至不希望又出現一個超級精細和“全面”的指標體系。任何指標都無非是從某一個角度觀察復雜世界的投影,而異常復雜糾纏的指標體系往往可能存在更多的問題。我們的目的是排除對指標的迷信,不被指標(更不用說其中錯誤百出者)所裹脅。
(作者為《現代圖書情報技術》主編)