山豐於1992年7月本科畢業(yè),9月成為本系研究生,山豐的導(dǎo)師是任緒江教授,任老師個(gè)子不高,當(dāng)時(shí)五十多歲。任老師當(dāng)時(shí)主持語(yǔ)言信息技術(shù)研究所簡(jiǎn)稱語(yǔ)言信息所的工作,所里最主要的工作是編寫計(jì)算機(jī)能夠使用的語(yǔ)言知識(shí)庫(kù),任老師給山豐他們上《計(jì)算語(yǔ)言學(xué)》課程,組織所里每周的討論班。第一次去計(jì)算語(yǔ)言所,山豐還記憶猶新,在古sE古香的南閣的二樓,山豐本科的機(jī)房在北閣,南北閣緊挨一起,完全相同的建筑,那麼漂亮的建筑用來(lái)做計(jì)算機(jī)機(jī)房,真的浪費(fèi)了,好好收拾收拾,還建筑原貌,設(shè)置一些也有古意的中式家俱,作為文學(xué)或歷史的研究中心,應(yīng)該是很適合的。南閣進(jìn)去,雜物頗多,一樓用作什麼,山豐直到畢業(yè)也不知道,當(dāng)然也沒(méi)有想去知道。沿著不大的木樓梯上去,才發(fā)現(xiàn)二樓面積其實(shí)不大,大約三間正規(guī)的小屋,大概都在10平方米左右,任老師接待了山豐,帶著山豐參觀,分別給山豐介紹遇到的人,最先遇到的是佟福玲,一位大約40歲的nV工作人員,然後另一間屋遇見(jiàn)段慧明、郭濤和嚴(yán)析慧老師,段老師大約30多歲,郭濤大約不到20歲,小姑娘的樣子。嚴(yán)老師山豐後來(lái)知道是任老師的夫人,她無(wú)論什麼時(shí)候,都陪在任老師的旁邊,感情深厚。最後去的那間屋,山豐遇到了吳湛,他本科來(lái)自清華,現(xiàn)在是三年級(jí)的研究生,任老師告訴山豐,研究生的工作室就在這間屋,還有一位二年級(jí)研究生,柳凜,北大本校畢業(yè),等會(huì)可能會(huì)來(lái)。
記得那間屋靠窗擺了兩臺(tái)電腦,是個(gè)人計(jì)算機(jī),即俗稱的微機(jī),山豐早聽(tīng)同學(xué)眉飛sE舞地說(shuō)過(guò),還未用過(guò)。本科上機(jī)實(shí)習(xí)用的是一臺(tái)帶有二十多個(gè)終端的中型機(jī),機(jī)房就在旁邊的北閣,如果二十多個(gè)人同時(shí)編譯和運(yùn)行程式,那臺(tái)機(jī)器非常慢,不夸張的說(shuō),當(dāng)年做編譯原理的大作業(yè)的時(shí)候,程式提交給機(jī)器編譯,山豐他們?nèi)ナ程贸灶D飯?jiān)倩貋?lái),編譯結(jié)果都不一定能出來(lái),調(diào)試程式的效率極低,據(jù)說(shuō)微機(jī)可以眨眼間完成。終端與微機(jī)還有一個(gè)很大的區(qū)別是,終端是黑白和字元行模式,微機(jī)則有圖形和各種顏sE。簡(jiǎn)而言之,一個(gè)是老古董,一個(gè)是現(xiàn)代化。山豐還記得一臺(tái)是386,一臺(tái)是286,後來(lái)山豐用得b較多的是那臺(tái)286,40M的y盤,256K的內(nèi)存,DOSC作系統(tǒng),dBase數(shù)據(jù)庫(kù),TurboC編譯器。遇到兩位師兄,是山豐很大的幸運(yùn)。柳凜對(duì)微機(jī)很JiNg通,山豐這方面的知識(shí)很多都是他告訴山豐的,b如如何制作啟動(dòng)盤,如何殺病毒,如何優(yōu)化系統(tǒng)等等。吳湛則告訴山豐很多C語(yǔ)言的知識(shí),本科時(shí)候,山豐他們一直用的是PASCAL語(yǔ)言,上了研究生才知道,真正實(shí)用的程式設(shè)計(jì)語(yǔ)言是C,特別是學(xué)術(shù)研究中。
從研究生室出來(lái),正要離開(kāi),任老師指著對(duì)面大約只有一個(gè)平方米左右的隔間說(shuō),「這是我的辦公室,有什麼問(wèn)題,到這里來(lái)找我?!股截S才發(fā)現(xiàn)這間小屋,放了一個(gè)書(shū)桌和凳子,就滿了的小屋,其實(shí)是儲(chǔ)放雜物的空間,美國(guó)人設(shè)計(jì)的房屋都會(huì)將建筑T中不太方便利用的邊角做成儲(chǔ)物間。那時(shí),全國(guó)人民艱苦慣了,山豐看了心里沒(méi)有什麼觸動(dòng),現(xiàn)在回想,任老師最初的條件是很艱苦的。參觀結(jié)束,任老師最後說(shuō)了一句話,「希望你盡快進(jìn)入角sE?!惯@句話山豐至今難忘,也困惑到現(xiàn)在,山豐回去一直琢磨,「什麼角sE?怎樣才算進(jìn)入?」整個(gè)研究生階段,山豐都時(shí)不時(shí)拿出這句話來(lái),細(xì)細(xì)琢磨,山豐想任老師的意思是不是,「盡快成為一名合格的研究生,像吳湛師兄那樣能夠獨(dú)當(dāng)一面,提出方案,編寫程式,得到理想的結(jié)果?!褂袝r(shí),山豐覺(jué)得自己很難進(jìn)入那樣的角sE。但任老師是山豐所見(jiàn)最和藹可親、理解包容學(xué)生的老師,他的意思也許不是那麼高的要求?;蛟S,山豐見(jiàn)到任老師總是笑容親切地和每個(gè)人交流、商量、討論、安排,有種很溫馨穩(wěn)定的集T氛圍,也許任老師希望山豐盡快融於這個(gè)集T中,甚至把這里當(dāng)作新家??缮截S那時(shí)多麼矛盾啊,一方面想,如果畢業(yè)后能夠像他們一樣長(zhǎng)久地在北大工作,該是多麼幸運(yùn);另一方面又想,自己的能力和堅(jiān)持力是不是夠強(qiáng),外面的世界那麼大那麼JiNg彩,山豐還從未T驗(yàn)過(guò),難道就一直閉鎖在這個(gè)狹小的南閣二樓?
後來(lái)去的多了,還常在佟老師的房間遇到兩位中文系的研究生,張惠雯和王蕓菲,典型的中文系才nV的形象,她們也b山豐先進(jìn)所。所里的「老人」都很熱情,感覺(jué)已經(jīng)在得心應(yīng)手地開(kāi)展工作了,已經(jīng)「進(jìn)入角sE」,她們很熱心地幫助山豐,有時(shí)聊聊所里的故事。不久來(lái)了一位英語(yǔ)系的朝鮮族nV同學(xué),山豐和她也時(shí)不時(shí)聊聊天。山豐所在房間的書(shū)架上大都是計(jì)算語(yǔ)言學(xué)領(lǐng)域的資料,山豐最A(yù)i翻讀的是任老師參加論文答辯帶回的畢業(yè)論文,那時(shí)計(jì)算語(yǔ)言學(xué)在國(guó)內(nèi)剛剛起步,設(shè)置這個(gè)研究方向的大學(xué)不多,與北大交往最密切的是「隔壁」的清華,主要是h昌寧老師的小組,山豐記得書(shū)架上有6、7本清華最近幾年的畢業(yè)論文,導(dǎo)師幾乎都是h昌寧,但感謝辭中都會(huì)提到陳群秀老師。有兩位學(xué)生的論文山豐覺(jué)得特別好,一位姓欒,另一位姓孫,後來(lái)山豐想起,他就是現(xiàn)在國(guó)內(nèi)有名的、清華自然語(yǔ)言處理領(lǐng)頭人孫茂松。山豐那時(shí)將他們兩位的論文作為榜樣。
第一學(xué)年,花了很多JiNg力學(xué)習(xí)專業(yè)知識(shí),山豐記得當(dāng)時(shí)又選修了張立昂老師的課程《最優(yōu)化》,再一次喜歡上了張老師的課,其他課幾乎都記不得了,然後平時(shí)參加討論班,項(xiàng)目討論,沒(méi)有真正參與到項(xiàng)目中,也沒(méi)有真正對(duì)所里有什麼貢獻(xiàn)。山豐後來(lái)想來(lái),當(dāng)時(shí)一個(gè)很大的遺憾是沒(méi)有讀什麼文獻(xiàn),當(dāng)時(shí)沒(méi)有互聯(lián)網(wǎng),要外國(guó)文獻(xiàn)非常困難,圖書(shū)館查到的往往晚好幾個(gè)月,而且也很少,所以那時(shí)候主要還是看一點(diǎn)中文資料,或者自己想方法。記得當(dāng)時(shí)國(guó)內(nèi)自然語(yǔ)言處理領(lǐng)域b較轟動(dòng)的一個(gè)成果是中科院計(jì)算所陳肇雄實(shí)現(xiàn)的「智慧型機(jī)器翻譯系統(tǒng)」,這個(gè)系統(tǒng)被做進(jìn)香港權(quán)智公司的快譯通中,成為其中的一項(xiàng)亮眼功能,權(quán)智公司付給了當(dāng)時(shí)國(guó)內(nèi)覺(jué)得驚人的高價(jià),使得國(guó)內(nèi)一直認(rèn)為計(jì)算語(yǔ)言學(xué)只能在研究室里玩玩的人們震驚地發(fā)現(xiàn)計(jì)算語(yǔ)言學(xué)也可以在真實(shí)的市場(chǎng)中發(fā)揮作用。任老師找來(lái)好多陳肇雄課題組寫的資料,讓山豐先看看,然後在討論班上講給大家聽(tīng)。山豐花了好幾個(gè)星期,認(rèn)真讀了這些資料,是懂非懂,講完后,大家一起討論,還是是懂非懂,第一次感覺(jué)到了科研的困難。
這個(gè)期間,上過(guò)一門有關(guān)Petri網(wǎng)的課程,這幾乎是山豐在北大感受最不好的一門課,最主要的原因是老師課堂閑聊的時(shí)間太長(zhǎng)了,山豐不反對(duì)教師在講授中穿cHa一些閑話,一方面能夠緩解課程內(nèi)容的枯燥,活潑課堂氣氛,另一方面,如果閑話其實(shí)不「閑」,而是教師個(gè)人對(duì)課程內(nèi)容的題外見(jiàn)解,甚至一些人生感悟,能夠從其他方面啟迪學(xué)生思維,這樣的「閑話」是很有益處的。即使如此,山豐個(gè)人認(rèn)為「閑話」時(shí)間不能超過(guò)教學(xué)時(shí)間的五分之一憑感覺(jué)給的數(shù)字??墒钱?dāng)時(shí)的老師一半以上的時(shí)間都在講閑話,山豐印象主要講自己家孩子在中學(xué)的一些情況,不僅是中學(xué)里的學(xué)習(xí)情況,吃喝拉撒都有,而且占多數(shù),山豐覺(jué)得對(duì)他們學(xué)生基本沒(méi)有幫助。而且,每次臨近下課,還剩五六分鐘了,老師才回到課程內(nèi)容,下課鈴聲響后,總要拖上好一陣子,然後對(duì)山豐他們說(shuō):「抱歉,內(nèi)容太多了。」這門課讓山豐對(duì)Petri網(wǎng)理論也沒(méi)有好的印象,覺(jué)得一開(kāi)始說(shuō)了很多大話,幾乎可以解決一起問(wèn)題,實(shí)際上只是把已有的、存在很大缺陷的辦法換個(gè)方式說(shuō)出來(lái),并沒(méi)有創(chuàng)新,非??斩?。Petri網(wǎng)是當(dāng)時(shí)b較前沿的一個(gè)研究方向,授課老師也屬於國(guó)內(nèi)研究Petri網(wǎng)的權(quán)威之一,這次上課讓山豐感覺(jué)到科研的困惑,山豐覺(jué)得那位老師孜孜追求的,可能是無(wú)意義的,甚至是偽科學(xué)。
第二學(xué)年,山豐對(duì)自己的研究工作有了很大的困惑,覺(jué)得他們?cè)谶M(jìn)行一項(xiàng)不可能實(shí)現(xiàn)的工作,讓計(jì)算機(jī)能夠順利的處理自然語(yǔ)言是不可能的,有一陣子很少去實(shí)驗(yàn)室,呆在宿舍,或者去圖書(shū)館,記得很清楚,當(dāng)時(shí)完整地看了兩部電視劇《過(guò)把癮》和《編輯部的故事》,這都是王朔的作品,情節(jié)平常,完全靠語(yǔ)言取勝,對(duì)話俏皮和出奇,對(duì)接順滑,仿佛大型情景相聲,透著北京式的洞察世事的智慧,帶著玩世不恭和滿不在乎。更多的時(shí)間是把柏楊的《資治通鑒》72冊(cè)幾乎通看了一遍?!顿Y治通鑒》山豐接觸多次了,原版文言文讀起來(lái)有些困難,其中的大量古代地名、術(shù)語(yǔ)、官職等等不明就里,白話翻譯版大都gg巴巴,既缺少原版文言文的文字美,又沒(méi)有將現(xiàn)代人需要的背景知識(shí)補(bǔ)充進(jìn)去,而柏楊的大不相同,文中有大量順暢cHa入的解讀,b如當(dāng)時(shí)的地名現(xiàn)在所處何地,當(dāng)時(shí)的官職大概與現(xiàn)在何官相當(dāng),還有人物之間的暗藏關(guān)系等等,更妙的是柏楊的歷史功底和文字功夫遠(yuǎn)勝一般譯者,歷史脈絡(luò)梳理更加清晰,文字曉暢嚴(yán)謹(jǐn),不失趣味,不拘泥原文字眼,重在意義和文采的翻譯,沒(méi)有大陸學(xué)者在長(zhǎng)期官壓下形成的僵化、呆板、味同嚼蠟。柏楊的史觀也很合山豐,他注入了自己的想法,甚至感情,山豐也常常有共鳴。
那段時(shí)間是山豐在北大最迷茫的時(shí)期,山豐懷疑自己該不該上研究生,或者該不該選擇這個(gè)方向,山豐其實(shí)一直很喜歡文字,但是喜歡和教計(jì)算機(jī)理解是完全不同的,山豐覺(jué)得這個(gè)領(lǐng)域的研究是沒(méi)有希望的。但山豐又深切地懷疑自己在企業(yè)的實(shí)際工作能力,山豐不太能夠安心坐下來(lái)腳踏實(shí)地地寫一些簡(jiǎn)單但繁瑣枯燥的代碼,山豐的內(nèi)心還是希望完成有挑戰(zhàn)的、帶有開(kāi)創(chuàng)X質(zhì)的任務(wù)。那時(shí)的山豐處?kù)读说湫偷摹父卟怀?、低不就」的兩難困境中。
山豐就這樣一直困惑著進(jìn)入了研究生三年級(jí),這時(shí)候所里和中科院合作開(kāi)展了一個(gè)機(jī)器翻譯項(xiàng)目,主導(dǎo)者是中科院計(jì)算所的杜鑫。杜鑫當(dāng)時(shí)碩士畢業(yè)不久,也在不斷嘗試,希望打開(kāi)自己的研究局面。杜鑫能力很強(qiáng),特別是程式設(shè)計(jì)的能力,幾乎編寫了系統(tǒng)需要的所有代碼,北大主要提供各種詞典和規(guī)則,特別是把長(zhǎng)期研究的《現(xiàn)代漢語(yǔ)信息詞典》實(shí)用化,山豐主要參與了規(guī)則這部分工作。他們?cè)趨钦康慕M織下,很快給出了一套規(guī)則。具T方法是,先找來(lái)一批句子,然後分頭完成每個(gè)句子的句法分析,并標(biāo)注出來(lái),然後用程式從中提取出句法規(guī)則。這個(gè)方法與山豐最初的想法完全不同,山豐本來(lái)以為會(huì)組織大家整理《現(xiàn)代漢語(yǔ)語(yǔ)法》這類書(shū)籍,然後想辦法把那些規(guī)則寫成計(jì)算機(jī)可以接受的嚴(yán)格的形式,但是難度很大,山豐一直在想,看看吳湛或其他人有沒(méi)有什麼好的辦法,沒(méi)有想到吳湛用了這麼巧妙的方法解決了這個(gè)問(wèn)題。他們把第一版規(guī)則提供給杜鑫,很快杜鑫反饋了意見(jiàn),規(guī)則很粗糙,需要補(bǔ)充和JiNg細(xì)地調(diào)整。這個(gè)任務(wù)後來(lái)主要由鐘紅鈞和山豐來(lái)做,鐘紅鈞b山豐低一級(jí),是中文系的研究生,但是他是跨學(xué)科培養(yǎng)的研究生,他也學(xué)了很多計(jì)算機(jī)方面的知識(shí),顯然他是最適合這個(gè)工作的人選,山豐後來(lái)主要是輔助他。那時(shí),他們天天一起去中科院計(jì)算所的實(shí)驗(yàn)室,和杜鑫隨時(shí)交流,不斷改進(jìn)系統(tǒng),他們對(duì)山豐幫助很大,結(jié)下了深厚的友誼。
這項(xiàng)工作做著做著,山豐又開(kāi)始有些喜歡計(jì)算語(yǔ)言學(xué)的研究了,其實(shí)不應(yīng)該想得太遠(yuǎn)太大,不要總?cè)ハ肽切┙K極的問(wèn)題,從這種小的事情做起,盡可能地多解決一些問(wèn)題,才是山豐當(dāng)時(shí)應(yīng)該有的研究態(tài)度和方法??墒沁@個(gè)時(shí)候,已經(jīng)錯(cuò)過(guò)報(bào)考博士的報(bào)名了,另外,山豐也確實(shí)想到社會(huì)上去看看。山豐那時(shí)定下了計(jì)劃,先好好完成碩士論文,然後出去工作,再根據(jù)碩士論文和工作情況來(lái)決定是不是重回學(xué)校讀博士。三年級(jí)的第二學(xué)期開(kāi)始不久,山豐就告別杜鑫的團(tuán)隊(duì),回到北大完成自己的碩士論文,記得特別清楚,最後那天,杜鑫還專門請(qǐng)山豐吃了一頓飯,鐘紅鈞也在一起,飯桌上杜鑫不僅給了一些研究的真知灼見(jiàn),還給了山豐一個(gè)至今采用的選餐館秘訣,「當(dāng)一條街上餐館很多時(shí),如果不了解情況,就選新開(kāi)張的店,新店不僅僅環(huán)境好,而且為了把名聲打出去,往往做菜很認(rèn)真?!股截S很感謝他們一直給予的鼓勵(lì)和幫助。
山豐的碩士論文題目是《漢語(yǔ)句法規(guī)則的獲得和分析算法》,山豐由於參加了漢語(yǔ)句法規(guī)則的編寫,且山豐一直認(rèn)為句法分析是自然語(yǔ)言處理中目前切實(shí)可做的最關(guān)鍵任務(wù),山豐因此選擇了這個(gè)題目,這個(gè)工作與山豐以前完成的編譯原理大作業(yè)有類似的地方,但是復(fù)雜很多,山豐一度懷疑自己能不能將程式調(diào)試成功,後來(lái)山豐不去想那麼多,只想盡量接近成功一些,臨近論文最終提交的日期,山豐竟然修正了其中的所有bug,程序?qū)崿F(xiàn)了自己預(yù)定的所有目標(biāo),算是順利完成了。這是山豐第一次完成的大型程式,給了山豐很大的信心,它讓山豐相信只要不放棄,再難的程式都是可以完成的,雖然時(shí)間來(lái)得晚了一些。如果山豐早有這樣的信心,山豐就會(huì)努力申請(qǐng)?jiān)谒镏苯庸プx博士學(xué)位。
【本章閱讀完畢,更多請(qǐng)搜索讀吧文學(xué);http://m.qly9.com 閱讀更多精彩小說(shuō)】