https://ir.dila.edu.tw//handle/123456789/1286
Title: | 詞嵌入應用於佛學研究 — 兼論詞嵌入模型評估 | Authors: | 王昱鈞 | Keywords: | 詞嵌入;漢文大藏經;佛學研究;語義關係;語義類比 | Issue Date: | Oct-2023 | Journal: | 數位典藏與數位人文 | Journal Volume: | 12 | Journal Pages: | 43-82 | Abstract: | 詞嵌入是利用語料庫自動產生語義向量的方法,本論文的目標為探索詞嵌入 在Comprehensive Buddhist Electronic Text Archive (CBETA)漢文佛典中的可能 應用面向。為取得適用於佛學研究的詞嵌入最佳模型,本文利用莊春江辭典、丁 福保辭典和Digital Dictionary of Buddhism 辭典建立實驗資料集,並設計偵測同義 詞及干擾詞等兩種評估實驗來取得模型優化的基線。結果發現Word2Vec CBOW (continuous bag-of-words)、Dimension 400、Window 10、Epoch 10 為最佳超參 數組合,驗證正確率為0.87,測試正確率為0.86。據此,我們將CBETA 語料分類 訓練出不同詞嵌入模型,再跑出依據年代、譯者及部類的不同範圍語料對比詞表, 並進行實際應用分析。本論文的主要貢獻有三:一、建置適用於漢文佛典研究之 詞嵌入同義詞資料集;二、找出適於漢文佛典文本之詞嵌入超參數;三、探討與 分析詞嵌入於漢文佛典研究之實例,包括可用於判斷譯詞的語義核心演變、能用 於界定不明確的語義、能透過語義類比找出相關概念、能找出各部類的核心概念、 能藉以拓展研究廣度和深度,以及可用於驗證傳統研究結果等面向。 | URI: | https://ir.dila.edu.tw//handle/123456789/1286 |
Appears in Collections: | 佛教學系 |
File | Description | Size | Format | |
---|---|---|---|---|
詞嵌入應用於佛學研究—兼論詞嵌入模型評估.pdf | 3.19 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.