】 【打 印】 
【 第1頁 第2頁 第3頁 】 
數字化助古籍走出“深閨高閣”
http://www.CRNTT.tw   2023-01-30 10:49:22
 

  人工智能的快速發展,為數字古籍的整理分類帶來革命性變化。2022年10月,由字節跳動與北京大學數字人文研究中心合作研發的數字古籍平台“識典古籍”便是一個生動案例。

  進入“識典古籍”的網站,記者看到《周易》《左傳》《禮記》等陳列於首頁上。隨機點開一本,左側為章節目錄,右側為正文,排版形式既順應現代人的閱讀習慣,又還原了古籍紙張的閱讀美感。

  “與一些數字化平台不同,‘識典古籍’是完全免費的,而且增加了簡繁體轉換、底本影像對照、全文檢索等一系列便捷功能。”抖音集團企業社會責任部產品總經理唐塏鑫介紹,該平台主要應用了文字識別、自動標點和命名實體識別這3種技術,不僅能將影印本上的文字提取整理,還能通過序列標注識別文本中的人名、地名等信息,準確率達到96%至97%。

  “平台已整理上線了685部經典古籍,共計7900多萬字,主要來自《四部叢刊》。”唐塏鑫說,“識典古籍”已上線手機移動版,未來平台中的書目將持續更新。

  業內人士預測,隨著AI技術的運用,古籍文獻中所蘊藏的古代歷史文化知識將不斷被抽取,構造成各種各樣的知識庫,並將以知識圖譜的形式支持互聯網前端應用。

  跨界合作成趨勢

  事實上,在“識典古籍”上線之前,文保機構、科研院校與互聯網公司的跨界合作已越來越普遍。比如,騰訊聯合敦煌研究院開發了AI病害識別技術,幫助“問診”敦煌千年壁畫。

  由於在產品研發、設計方面存在優勢,互聯網公司等社會力量的加入會進一步保障古籍數字化平台的服務質量。“我們有優秀的產品經理、設計師、軟件工程師,能夠不斷優化數字古籍平台的產品功能。”唐塏鑫說。

  “識典古籍”的誕生離不開專家學者支持。北京大學數字人文研究中心主任王軍表示,北大在這次合作中負責人工審核與校對,彌補人工智能有識別錯誤率的短板,並利用自有學術平台,連接更多專業研究者和學生群體。 


 【 第1頁 第2頁 第3頁 】 


          
】 【打 印】 【評 論

 相關新聞: