查詢結果分析
來源資料
頁籤選單縮合
| 題 名 | 大型語言模型在訓練階段與使用檢索增強生成的著作權風險挑戰及案例研究=Copyright Risks, Challenges, and Case Studies of Large Language Models during Training and the Use of Retrieval-Augmented Generation (RAG) |
|---|---|
| 作 者 | 廖先志; 陳鍾誠; | 書刊名 | 智慧財產權月刊 |
| 卷 期 | 317 2025.05[民114.05] |
| 頁 次 | 頁56-71 |
| 分類號 | 588.36 |
| 關鍵詞 | 人工智慧; 大型語言模型; 訓練模型; 檢索增強生成; 著作權; AI; Large language model; LLM; Model training; Retrieval augmented generation; RAG; Copyright; |
| 語 文 | 中文(Chinese) |
| 中文摘要 | 本文探討大型語言模型在訓練階段與使用檢索增強生成技術時所面臨的著作 權風險,本文首先分析預訓練、微調和檢索增強生成技術的原理,並根據我國著 作權法規範之合理使用原則,評估三者於利用目的及性質、著作性質、利用質量 及比例,以及利用結果對著作潛在市場影響等面向的侵權風險。本文認為,預訓 練的風險最低,微調風險其次,而檢索增強生成的風險最高。接著,本文以 ISO 31000 風險管理框架為基礎,設計一個以跨國移交受刑人法為主題的智慧問答系 統。為降低著作權侵權風險,系統僅使用法律條文、施行細則、法院判決和取得 合法授權的文獻作為資料來源。系統採用微調後的 ChatGPT 3.5 Turbo 模型,並結 合檢索增強生成技術,以 Google Colab 平臺運行。本文最後總結大型語言模型之 訓練及其在法律領域應用所面臨的著作權挑戰,並提出未來研究方向。 |
本系統中英文摘要資訊取自各篇刊載內容。