Skip navigation
  • 中文
  • English

DSpace CRIS

  • DSpace logo
  • 首頁
  • 研究成果檢索
  • 研究人員
  • 單位
  • 計畫
  • 分類瀏覽
    • 研究成果檢索
    • 研究人員
    • 單位
    • 計畫
  • 機構典藏
  • 登入
  • 中文
  • English
  1. DSpace-CRIS at My University
  2. 學術單位
  3. 佛教學系
  4. 佛教學系
請用此 Handle URI 來引用此文件: https://ir.dila.edu.tw//handle/123456789/1286
標題: 詞嵌入應用於佛學研究 — 兼論詞嵌入模型評估
作者: 王昱鈞 
關鍵字: 詞嵌入;漢文大藏經;佛學研究;語義關係;語義類比
公開日期: 十月-2023
期刊: 數位典藏與數位人文 
卷: 12
頁數: 43-82
摘要: 詞嵌入是利用語料庫自動產生語義向量的方法,本論文的目標為探索詞嵌入 在Comprehensive Buddhist Electronic Text Archive (CBETA)漢文佛典中的可能 應用面向。為取得適用於佛學研究的詞嵌入最佳模型,本文利用莊春江辭典、丁 福保辭典和Digital Dictionary of Buddhism 辭典建立實驗資料集,並設計偵測同義 詞及干擾詞等兩種評估實驗來取得模型優化的基線。結果發現Word2Vec CBOW (continuous bag-of-words)、Dimension 400、Window 10、Epoch 10 為最佳超參 數組合,驗證正確率為0.87,測試正確率為0.86。據此,我們將CBETA 語料分類 訓練出不同詞嵌入模型,再跑出依據年代、譯者及部類的不同範圍語料對比詞表, 並進行實際應用分析。本論文的主要貢獻有三:一、建置適用於漢文佛典研究之 詞嵌入同義詞資料集;二、找出適於漢文佛典文本之詞嵌入超參數;三、探討與 分析詞嵌入於漢文佛典研究之實例,包括可用於判斷譯詞的語義核心演變、能用 於界定不明確的語義、能透過語義類比找出相關概念、能找出各部類的核心概念、 能藉以拓展研究廣度和深度,以及可用於驗證傳統研究結果等面向。
URI: https://ir.dila.edu.tw//handle/123456789/1286
顯示於:佛教學系

文件中的檔案:
檔案 描述 大小格式
詞嵌入應用於佛學研究—兼論詞嵌入模型評估.pdf3.19 MBAdobe PDF檢視/開啟
顯示文件完整紀錄

Google ScholarTM

檢查

TAIR相關文章


在 IR 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

瀏覽
  • 機構典藏
  • 研究成果檢索
  • 研究人員
  • 單位
  • 計畫
法鼓文理學院 Dharma Drum Institute of Liberal Arts
DSpace-CRIS Software Copyright © 2002-  Duraspace   4science - Extension maintained and optimized by NTU Library Logo 4SCIENCE 回饋