https://ir.dila.edu.tw//handle/123456789/1286
DC 欄位 | 值 | 語言 |
---|---|---|
dc.contributor.author | 王昱鈞 | en_US |
dc.date.accessioned | 2024-04-19T07:23:33Z | - |
dc.date.available | 2024-04-19T07:23:33Z | - |
dc.date.issued | 2023-10 | - |
dc.identifier.uri | https://ir.dila.edu.tw//handle/123456789/1286 | - |
dc.description.abstract | 詞嵌入是利用語料庫自動產生語義向量的方法,本論文的目標為探索詞嵌入 在Comprehensive Buddhist Electronic Text Archive (CBETA)漢文佛典中的可能 應用面向。為取得適用於佛學研究的詞嵌入最佳模型,本文利用莊春江辭典、丁 福保辭典和Digital Dictionary of Buddhism 辭典建立實驗資料集,並設計偵測同義 詞及干擾詞等兩種評估實驗來取得模型優化的基線。結果發現Word2Vec CBOW (continuous bag-of-words)、Dimension 400、Window 10、Epoch 10 為最佳超參 數組合,驗證正確率為0.87,測試正確率為0.86。據此,我們將CBETA 語料分類 訓練出不同詞嵌入模型,再跑出依據年代、譯者及部類的不同範圍語料對比詞表, 並進行實際應用分析。本論文的主要貢獻有三:一、建置適用於漢文佛典研究之 詞嵌入同義詞資料集;二、找出適於漢文佛典文本之詞嵌入超參數;三、探討與 分析詞嵌入於漢文佛典研究之實例,包括可用於判斷譯詞的語義核心演變、能用 於界定不明確的語義、能透過語義類比找出相關概念、能找出各部類的核心概念、 能藉以拓展研究廣度和深度,以及可用於驗證傳統研究結果等面向。 | en_US |
dc.language.iso | zh | en_US |
dc.relation.ispartof | 數位典藏與數位人文 | en_US |
dc.subject | 詞嵌入 | en_US |
dc.subject | 漢文大藏經 | en_US |
dc.subject | 佛學研究 | en_US |
dc.subject | 語義關係 | en_US |
dc.subject | 語義類比 | en_US |
dc.title | 詞嵌入應用於佛學研究 — 兼論詞嵌入模型評估 | en_US |
dc.type | journal article | en_US |
dc.relation.journalvolume | 12 | en_US |
dc.relation.pages | 43-82 | en_US |
item.fulltext | with fulltext | - |
item.grantfulltext | open | - |
item.languageiso639-1 | other | - |
顯示於: | 佛教學系 |
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
詞嵌入應用於佛學研究—兼論詞嵌入模型評估.pdf | 3.19 MB | Adobe PDF | 檢視/開啟 |
在 IR 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。