漢語文白自動對照及檢索平台:「雅歌匯」

錢志安, 鄒嘉彥, 鄺藹兒, 周嘉寶

Research output: Contribution to conferencePaper

Abstract

中華文化源遠流長,累積了不少典籍,是了解和欣賞中華文化的重要途徑之一。不過,很多古代典籍都是用文言文編寫,所以,我們要認真了解這些典籍的精髓,就必須擁有古漢語知識。漢語有三千多年的歷史,古今漢語有不少顯著差異。因此,要完全看懂文言文並不容易,除了使用合適的工具書之外,我們還可以借助白話文來理解文言文,換句話說,「文白對照」是學習文言文的一種重要手法。 香港的中國語文課程包括古漢語課文,但是,我們發現不同的教科書所收錄的文言文課文數量和題材不盡相同。我們可以想像到,老師教授文言文時,會受教科書所限制。老師如果想增補材料,他們需要花費額外的時間和精神去選材和備課,但是在沒有相應的教學資源的配合,效果可能事倍功半。 現今的資訊科技十分發達,我們應該充分使用有關技術,開發教學輔助工具和平台來協助老師和學生,使古漢語的教與學有所得著,從而提高學生對古漢語的認識和加深他們對中國文化的興趣。有關工具和平台並提供額外的渠道讓更多人士接觸中華文化,使古文欣賞和學習普及化。 本文作者的研究中心在自然語言處理領域中,一直致力發展雙語文本對齊及跨語言訊息提取等技術。2010 年,我們開發了一個漢語文白對照及檢索平台─「雅歌匯」(ACKER- Aligned Chinese Knowledge Exchange Repository https://acker.chilin.hk/)。「雅歌匯」有以下的功能和特點: 1. 文白詞句自動對應:用戶上載文言文和相應的白話文後,系統會依據內置詞典和知識庫,把文本逐句分拆,並進行文白字詞對應。系統未能對應的文白詞語,經用戶編輯後,有關資訊將會回送到系統,並更新詞庫。 2. 文白雙向搜索功能:用戶可以文言文或白話文搜索「雅歌匯」的語料,並查閱原文。對於一詞多義現象,系統會以字詞的出現頻率(由高至低或由低至高)排列。這些資訊在教科書都欠奉。 3. 資源互動和共享:「雅歌匯」是一個開放式平台,資料和詞庫會不斷累積和更新,自2010年初,系統已累積了一定數量的文白資料,包括《論語》、《孟子》、《史記》部分章節和《顏氏家訓》等。隨著用戶人數及文白語料數量不斷增加,系統的詞庫和詞句自動對應系統的準確度也會提升。 4. 操作簡便:「雅歌匯」在互聯網上運作,用戶毋須另行安裝軟件,可隨時隨地登入系統。 「雅歌匯」於 2010 年初進行測試,受邀用戶包括語文教師、研究員、文字工作者和出版商等。登記用戶約兩千多位,點擊率超過三萬次,系統並獲得好評。 我們計劃把「雅歌匯」引進香港的中國語文課程中,作為文言文教學輔助工具,並繼續改良和加入新功能,如普通話和粵語朗讀功能、文本按內容、朝代和性質分類、為同一篇文言文作品收集多於一個白話譯文,讓用戶分析和比較不同白話文譯本的優劣之處。 Copyright © 2011 Overseas Compatriot Affairs Commission, R.O.C.(Taiwan).
Original languageChinese
Publication statusPublished - 2011

Citation

錢志安、鄒嘉彥、鄺藹兒和周嘉寶 (2011年6月):漢語文白自動對照及檢索平台:「雅歌匯」,論文發表於「第七屆全球華文網絡教育研討會」,台灣。

Keywords

  • 雅歌匯
  • 文白對照
  • 古漢語