查詢結果分析
相關文獻
- 《人民日報》語料庫命名實體分類的研究
- 中國情報自動檢索的歷史和現狀
- 重建現代化的巴比塔--機器翻譯的歷史和現狀
- 有關日語句末動詞「卜思ウ」的探討--透過日語辯論的語料庫
- 合歡山臺灣冷杉土壤之發育與分類
- 語料庫為本的現代漢語結構助詞統計分析
- 人工智慧應用於ICD-10疾病分類
- The Feasibility of Automated Topic Analysis: An Empirical Evaluation of Deep Learning Techniques Applied to Skew-distributed Chinese Text Classification
- 華語教學語法:探討量詞與分類詞的分級與教學排序
- 「口」と共起するコロケーションの考察--品詞を中心に
頁籤選單縮合
題 名 | 《人民日報》語料庫命名實體分類的研究=The Chinese Named Entity Categorization Based on the People's Daily Corpus |
---|---|
作 者 | 夏迎炬; 于浩; 西野文人; | 書刊名 | International Journal of Computational Linguistics & Chinese Language Processing |
卷 期 | 10:4 民94.12 |
頁 次 | 頁533-542 |
分類號 | 312.13 |
關鍵詞 | 命名實體; 分類; 語料庫; 自然語言處理; Named entity; Classification; Corpus; Natural language processing; |
語 文 | 中文(Chinese) |
中文摘要 | 在信息檢索、信息抽取等應用中,命名實体的處理十分重要。本文在目前的命 名實体分類体系的基礎上,從信息檢索和抽取的角度對命名實体的細分類進行 了深入的研究。提出了命名實体的多級分類并給出了每一級的詳細分類。為了 檢驗該分類体系的實際效果,我們在人民日報語料上進行了初步的標注。并使 用常用的基于統計模型的命名實体識別算法在人民日報語料上做了一系列的 對比實驗。實驗結果表明:面向機器處理的細分類能有效地提高識別系統的性 能并最終有助于信息檢索和抽取。 |
英文摘要 | Named entity recognition is a very important part of information retrieval and information extraction. Classification is also very important. This paper investigates the sub-classification of named entities from the point of view of information retrieval and information extraction. This paper also presents multi-classification and gives detailed information about each sub-class. We have manually annotated people’s daily corpus (1998) and conducted a serial of experiments using the statistical model of named entity recognition. Theexperimental results show that the sub-classes presented by this paper can enhance the recognition system’s performance and aid information retrieval and information extraction. |
本系統中英文摘要資訊取自各篇刊載內容。