關于學術評價中的同行評議問題已有一些討論,這里有必要繼續討論怎么樣把同行評議做得更好的問題。
我們說,科學的學術評價是社會需要,是學術發展的需要。隨著社會科學、技術進步與經濟、文化的發展,有大量的科學研究成果不斷涌現。由于人們時間、精力、財力的限制,不得已有選擇的利用這些現有的、或者有一定價值的成果。有選擇就有評價,社會和學術界大量選人、選物等各類選擇的需求,推動了科學評價的產生和發展。由于科學評價的復雜性,評價結果往往難以令人滿意,因此,經常會遭到這樣那樣的非議。但是,不管人們是不是喜歡,這個科學評價其實是無處不在的,并且已經成為當今社會關注的熱點問題。
科學評價實際上是一件特別復雜的事情,它的復雜性表現在評價對象、評價主體、評價目的、評價方法等諸多方面。
評價對象是復雜多樣的,在科學研究領域,評價的對象是知識產品,知識產品可分為精神產品和物質產品,精神產品包括論文、論著、課題、新工藝等等,物質產品包括新工具、新產品等等。關于評價主體即誰來評價,也是五花八門,有管理機構的評價、資助機構的評價、服務機構的評價,有政府評價,也有民間評價等等。評價目的也各不相同,政府機構可能有獎懲之類的評價,管理部門可能有職稱評定之類的評價,資助機構有基金評審之類的評價,有些民間機構有選刊、選文之類的評價等等。這些評價都是很難的事情,因此為達目的,評價方法也是有多種多樣,歸納起來可以分成三類:定性評價、定量評價和定性與定量相結合的評價。我跟大家討論的是定性評價當中同行評議的地位和作用。
同行評議實際上是定性評價中的一種代表性的方法,這是歷史最悠久的、最傳統的方法,也是最重要的科學評價方法。這種方法其實是一種主觀的評價方法,大家都知道有缺點,但是至今還沒有找到可以替代它的更好的辦法。目前在學科評價、職稱評審、項目資助、論文發表、機構評估等科研活動中,同行評議是被國內外使用最廣泛、最基本的一個方法。
同行評議的主體是同行,評價的標準是一種事先制定好的有效評議的范式,有一個同行,然后再有一個標準,就可以進行評價活動。同行評議有很多優點,它是決策民主化的一種手段,可以避免決策上的主觀臆斷,如果有一個同行的組織進行評議,可以避免少數決策者的主觀臆斷。同行評議采取大致相同的范式來評價同一個事物,使得評價結果有效度,不會出現風馬牛不相及的重大失誤,這也就是為什么同行評議會為大家共識,一直都在使用的一個重要原因。
但是同行評議也不是完美無缺的。我覺得在以下方面同行評議還是存在問題的,有欠缺的。
首先,同行評議可能欠客觀,因為它是一個主觀的判斷,這個主觀判斷容易受到專家的學術視野、學術喜好、知識結構等的影響,所以評出來的結果可能有時候會欠客觀。
第二,同行評議可能欠公正,因為由于競爭關系、人情關系這些因素的影響,難以保證所有專家都是公正的。尤其在我們中國現在人情很泛濫的社會環境,更可能會出現欠公正的結果。
第三,也可能欠合理,因為評價標準和程序是機械的,大家都要執行。比如有的期刊在審稿時規定必須有十篇參考文獻,沒有十篇就不要了,可能他就沒有十篇,但是是一篇好文章,你就不采用它了? 這樣就會產生一些不合理的現象。還有一些專家帶有歧視的眼光,看不上你的成果,還有熱點追逐等現象,這些都會影響合理評價。
再就是同行評議的可控性比較差,難以控制越規行為,比如說它欠公正、欠合理,怎么樣來控制,也是比較困難的。此外,同行評議的成本高,要花費大量的經費,還要花費專家們大量的時間和精力,但即使這樣,不一定能做得好。
有些欠缺是同行評議固有的,比如專家的知識局限性是固有的,有的是社會風氣和社會環境造成的,這些問題無法或不易克服,因此同行評議的結果往往會不盡如人意??梢?,作為定性評價方法代表的同行評議,我們看到它并不是完美無缺的,是存在局限性的。
那么怎么辦? 如何解決這些問題? 就需要改進,如何改進? 于是定量評價方法被引入,并逐步發展起來,起到了較好的作用。
什么是定量評價? 定量評價實際上是將研究成果的一些特征進行數量化,并且根據數值的大小來評價對象的水平高低和質量優劣。SCI 創始人加菲爾德通過引文分析,對評價的基本因素的準確性、穩健性、功能性等進行了分析后認為,就自然科學與社會科學而言,文獻計量學方法明顯優于同行評議。大家都知道,定量評價在客觀性、具體性、準確性、可操作性等方面比定性評價更具有優勢,但是學術成果的內容有些是不能量化,或者是很難量化的,在人文社會科學方面更是如此,加上各種因素產生的無效引用,也會使得定量評價的有效性大打折扣。所以定量評價也會出現嚴重偏差,我們在做評價的過程當中發現,有些定量評價最后得出的結果一看就有問題,有偏差??梢姸吭u價也不是完美無缺的方法,上面已經分析過定性評價的陷缺。所以,現在越來越多的提倡定量評價和定性評價相結合的評價方法。
怎么樣來完善定量評價和定性評價相結合的評價方法呢? 我覺得可以從以下幾個方面來下工夫。
首先要進一步完善大家都在用的、特別經典傳統的同行評議機制,可以從這幾個方面來考慮:一是要完善專家遴選機制,比如對專家系統的知識結構、學術水平、研究道德修養、評議水平等等都要進行評議,使之組成優秀的評價專家隊伍。
二是要制定細致的評價程序,并且嚴格執行,在同一個標準里面進行評價。三是要完善監督機制,就是這個評價的機構以及評價出來的結果要有人來監督。使評價主體更加鮮明,而不是自己找一找就行了。所以只有有了好的評價主體才能有好的評價結果,這也是同行評議機制的進一步完善。
第二是在大數據時代,可以引入網絡同行評議的方法,開放獲取同行評議和公眾評議,好處是能夠縮短評議的周期,能夠突破地域和專業的限制,實現評議過程和結果的網上查詢,提高公開和公正程度,網絡評議也是對于同行評議的一種完善。但是,網絡的公眾評議也有一定問題,比如,其有效性、可靠性是要下大工夫來解決的。大家都知道網絡資源有很多問題,能不能保存,是不是可靠,有沒有效果都有很多的問題。所以網絡評議現在剛剛開始,大家都在做,今后有待大家共同想辦法解決它存在的問題,提高它的效率。
三是要提倡定量和定性相結合的評價方法,同行評議和定量評價這兩種方法并不是互相對立的,而是相互聯系、互為基礎的?,F在的定量評價本身就含有同行評價的成分,引文是通過同行評議,經過深入研究認為有效才引用。文摘、轉載這方面的數據,那是經過了刊物轉載,經過專家們認真的評議優選出來的。所以我覺得這些東西本身就是同行評議的結果,是互為基礎的。同行評議的過程中其實也用到了量化的方法,設置好幾個指標,由專家來打分,最后得出結果就是一種量化。因此,定性評價和定量評價是互相聯系、互為基礎的。所以,我認為,同行評議和定量評議是可以優勢互補的,同行評議要充分發揮專家的特長和優勢,科學計量可以給專家評議的主觀判斷提供客觀的數據,所以是相輔相成的。
通過以上分析可以得出這樣的結論:對于類型多樣、因素復雜的學術評價,未來的評價應該是科學計量和專家智力的組合,沒有最好的方法,只有最合適的方法,沒有普遍的標準,只有特定的標準。任何評價機制都不會是完美無缺的,無論你選擇哪種方式都會存在這樣或者那樣的缺陷,評價機構應該根據評價目的和客觀條件選擇最合適的評價方法才能夠取得比較理想的評價結果。我們國家不少評價項目采用不同的評價方法,都能夠達到比較好的研究目標,得到學界認可的具有參考價值的評價結果,所以各種有效的評價方法才能得到認可。
原發期刊、文摘期刊等的審稿、選稿一般都采用同行評價的方式,因為這樣的審稿沒有定量數據可統計,即定量評價統計不到,所以,審稿、選稿作為一種評價,嚴格地說,就是一種同行評議。而對期刊的評價一般都采用定量和定性相結合的評價方法,比如:中國人民大學人文社會科學學術成果評價中心和中國人民大學書報資料中心研制的《‘復印報刊資料’重要轉載來源期刊》(2014 年),采用的方法是,定量和定性相結合的方法來評價,定量的結果請專家來評判,然后提出 10% 不建議優選的名單,最終推出了2014 年中國人民大學書報資料中心的 747 種來源期刊。北京大學圖書館研制的《中文核心期刊要目總覽》(2011 年版),采用定量結果請專家評審,提出不入選名單和增補入選名單,最終評出 750 種人文社會科學核心期刊。中國社會科學院中國社會科學評價中心研制的《中國人文社會科學期刊評價報告》(2014 年),對“中國人文社會科學引文數據庫”733種來源期刊,用定性和定量相結合的方法,以專家的意見為主進行了學科的分類排序。其實,這次全國中文核心期刊也是采用定量和定性相結合的方法來評定,定量評價的結果請專家評審,提出增選名單,最終評出了 750 種人文社科的核心期刊。這些項目都有各自的評價目標,采用的評價方法都不太一樣,最后都得到了比較好的效果,在社會上都得到了有效的應用,都是可以倡導的。評價機構根據自己的評價需求和客觀條件,選擇適合自己的評價方法,一般都是采取以定性和定量相結合,有的是以定量為主,有的是以定性為主,是根據具體情況來確定的,這樣的方法是最合適的方法。