查詢結果分析
相關文獻
- 電子文獻主題之自動辨識
- WWW資訊檢索的新趨勢--欄位檢索
- Social Dimensions of the Digital Revolution
- 網路文件自動分類
- Searching for Information on the Internet Using Medical World Search
- Information Extraction: Beyond Document Retrieval
- An Assessment of Character-based Chinese News Filtering Using Latent Semantic Indexing
- 架構在WWW與Z39.50上的近似自然語言OPAC檢索系統
- 試談電子文獻資料庫在歷史研究上的應用
- 中文全文資訊檢索研究架構與重要議題探討
頁籤選單縮合
題名 | 電子文獻主題之自動辨識=Automatic Identification for Topics of Electronic Documents |
---|---|
作者 | 陳光華; Cheng, Kuang-hua; |
期刊 | 中國圖書館學會會報 |
出版日期 | 19971200 |
卷期 | 59 1997.12[民86.12] |
頁次 | 頁43-58 |
分類號 | 028.7 |
語文 | chi |
關鍵詞 | 資訊檢索; 電子文獻; 主題辨識; Information retrieval; Electronic document; Topic identification; |
中文摘要 | 網際網路上的電子文件數量極為龐大, 如何快速有效的進行電子文件主題標引的 工作逐漸成為一項重要的研究課題。目前有關的研究著重於名詞的行為,期望藉由文獻中名 詞的頻率或是其他統計值,求得文獻的主題分類。雖然文獻的主題是由名詞組成,但是本文 認為決定那些名詞成為主題的因素卻不只是名詞。因為文獻的組織是具有結構性的,是事件 驅動( Event-Driven )的,而事件則是由名詞與動詞共同完成的,名詞與動詞在決定文獻 的過程中具有重要地位。本論文考慮文獻的一般行為,提出四項因素:(1) 詞彙的重要性, (2) 詞彙的重複性, (3) 詞彙的共現性, (4) 詞彙的距離,建構一個數學模型並進行讀者 與模型的比較實驗。實驗結果顯示該模型的自動主題辨識與人工主題辨識具有相當的效能。 |
英文摘要 | The volume of electronic decuments in the Internet grows very quickly. How to effectively assign topics to documents becomes an important issue. In the present time, the researches based on this line focus on the behavior of nounts in documents. Although topics are composed of nounts, the constituents that determine which nouns are topics are not only nouns. We think that texts are well-organized and are event-driven. Therefore, nouns and verbs together contribute the process of topic identification. This paper considers four factors: (1) word importance, (2) word frequency, (3) word co-occurrence, and (4) word distance and constructs a mathematical model. The preliminary experiments show that the performance of the proposed model is equivalent to that of human being. |
本系統之摘要資訊系依該期刊論文摘要之資訊為主。