幫助讀者掃除古代文獻閱讀障礙,推動古籍閱讀普及化,激活學者的研究成果
浙江大學中國古代文學專業的博士生郝亞潔認領了新任務:對《徐文長文集》《吟香室詩草》等古籍的OCR校對結果進行二次審核。
“根據平台不同時期的需求,我的工作內容側重點都有不同。”郝亞潔介紹,比如,在平台建設初期,同學們主要負責數據上傳整理,“數據一般以一部文集為單位,需要製作目錄文件把文集的文字內容按照篇目和影像一一對應。”後期,郝亞潔則負責OCR識別和機器標點校對後的人工審核等工作。
全程參與“智慧古籍平台”建設,讓郝亞潔受益匪淺……在她眼中,徐永明是治學嚴謹的導師,自己從平台維護中收穫良多。“比如,之前學過的Python計算機編程語言,就苦於沒機會實踐;現在的校對環節中,用Python代碼檢查不僅幫了我大忙,更體會到了什麼叫‘活學活用’。”
平台運行至今獲得各方好評,但徐永明坦言,“智慧古籍平台”建設任重道遠,想要把浩如煙海的中華古籍資源利用起來,還有很長的路要走。“我們的初衷很簡單,就是想為讀者掃除古代文獻閱讀障礙,推動古籍閱讀普及化,激活學者的研究成果,突破學術壁壘,將前沿的學術研究成果轉化為社會大眾共享的文化資源,同時改變‘數據在中國,數據庫在國外’的現象。”
面向未來,徐永明團隊定下了新目標:利用“智慧古籍平台”進一步推進古籍數據資源的整合和開放共享,用智慧化手段為中國古代典籍資源爭取“主動權”,讓古籍資源從“活下來”真正轉變為“活起來”! |