詞嵌入應用於佛學研究 — 兼論詞嵌入模型評估

王昱鈞

DC Field	Value	Language
dc.contributor.author	王昱鈞	en_US
dc.date.accessioned	2024-04-19T07:23:33Z	-
dc.date.available	2024-04-19T07:23:33Z	-
dc.date.issued	2023-10	-
dc.identifier.uri	https://ir.dila.edu.tw//handle/123456789/1286	-
dc.description.abstract	詞嵌入是利用語料庫自動產生語義向量的方法，本論文的目標為探索詞嵌入在Comprehensive Buddhist Electronic Text Archive （CBETA）漢文佛典中的可能應用面向。為取得適用於佛學研究的詞嵌入最佳模型，本文利用莊春江辭典、丁福保辭典和Digital Dictionary of Buddhism 辭典建立實驗資料集，並設計偵測同義詞及干擾詞等兩種評估實驗來取得模型優化的基線。結果發現Word2Vec CBOW （continuous bag-of-words）、Dimension 400、Window 10、Epoch 10 為最佳超參數組合，驗證正確率為0.87，測試正確率為0.86。據此，我們將CBETA 語料分類訓練出不同詞嵌入模型，再跑出依據年代、譯者及部類的不同範圍語料對比詞表，並進行實際應用分析。本論文的主要貢獻有三：一、建置適用於漢文佛典研究之詞嵌入同義詞資料集；二、找出適於漢文佛典文本之詞嵌入超參數；三、探討與分析詞嵌入於漢文佛典研究之實例，包括可用於判斷譯詞的語義核心演變、能用於界定不明確的語義、能透過語義類比找出相關概念、能找出各部類的核心概念、能藉以拓展研究廣度和深度，以及可用於驗證傳統研究結果等面向。	en_US
dc.language.iso	zh	en_US
dc.relation.ispartof	數位典藏與數位人文	en_US
dc.subject	詞嵌入	en_US
dc.subject	漢文大藏經	en_US
dc.subject	佛學研究	en_US
dc.subject	語義關係	en_US
dc.subject	語義類比	en_US
dc.title	詞嵌入應用於佛學研究 — 兼論詞嵌入模型評估	en_US
dc.type	journal article	en_US
dc.relation.journalvolume	12	en_US
dc.relation.pages	43-82	en_US
item.grantfulltext	open	-
item.fulltext	with fulltext	-
item.languageiso639-1	other	-
Appears in Collections:	佛教學系