標題: | 詞嵌入應用於佛學研究 — 兼論詞嵌入模型評估 |
作者: | 王昱鈞 |
關鍵字: | 詞嵌入;漢文大藏經;佛學研究;語義關係;語義類比 |
公開日期: | 十月-2023 |
期刊: | 數位典藏與數位人文 |
卷: | 12 |
頁數: | 43-82 |
摘要: | 詞嵌入是利用語料庫自動產生語義向量的方法,本論文的目標為探索詞嵌入
在Comprehensive Buddhist Electronic Text Archive (CBETA)漢文佛典中的可能
應用面向。為取得適用於佛學研究的詞嵌入最佳模型,本文利用莊春江辭典、丁
福保辭典和Digital Dictionary of Buddhism 辭典建立實驗資料集,並設計偵測同義
詞及干擾詞等兩種評估實驗來取得模型優化的基線。結果發現Word2Vec CBOW
(continuous bag-of-words)、Dimension 400、Window 10、Epoch 10 為最佳超參
數組合,驗證正確率為0.87,測試正確率為0.86。據此,我們將CBETA 語料分類
訓練出不同詞嵌入模型,再跑出依據年代、譯者及部類的不同範圍語料對比詞表,
並進行實際應用分析。本論文的主要貢獻有三:一、建置適用於漢文佛典研究之
詞嵌入同義詞資料集;二、找出適於漢文佛典文本之詞嵌入超參數;三、探討與
分析詞嵌入於漢文佛典研究之實例,包括可用於判斷譯詞的語義核心演變、能用
於界定不明確的語義、能透過語義類比找出相關概念、能找出各部類的核心概念、
能藉以拓展研究廣度和深度,以及可用於驗證傳統研究結果等面向。 |
URI: | https://ir.dila.edu.tw//handle/123456789/1286 |
顯示於: | 佛教學系
|
顯示文件完整紀錄