查詢結果分析
相關文獻
- A Corpus-Based Language Model For Topic Identification
- The Efficient Method for Expanding Non-text Symbols Using Corpus-based Language Model in Chinese
- Humboldt's "Spirit of the Nation" and Approaches to Its Study in Contemporary Linguistics
- 從布勒語言模型看方言田野調查
- 電子文獻主題之自動辨識
- The Analysis of Smoothing Method and Alternative Methods for Language Models
- Asymmetry in Mandarin Consonant Articulations: Evidence from Slips of the Tongue
- 非特定語者、中字彙中文語音辨識技術初探
- 使用概念資訊於中文大詞彙連續語音辨識之研究
- CAT, TM und MTPE. Die Rolle Computerunterstützter Übersetzung in der Übersetzer-Ausbildung
頁籤選單縮合
題 名 | A Corpus-Based Language Model For Topic Identification=主題辨識用的一種語料庫為本語言模型 |
---|---|
作 者 | 陳信希; 陳光華; 李御璽; | 書刊名 | 國立臺灣大學工程學刊 |
卷 期 | 62 1994.10[民83.10] |
頁 次 | 頁97-106 |
分類號 | 312.23 |
關鍵詞 | 語庫; 語言模型; 主題辨識; 詞關連模型; Corpus; Language model; Topic identification; Word association; |
語 文 | 英文(English) |
中文摘要 | 本文提出一種語料庫為本的語言模型供言談分析,我們分析LOB語料庫 中名詞一名詞配對、名詞一動詞配對的關連性。此關連性的強度由三項要素決定: 字的重要性、配對出現次數、以及距離,這些資料分別由段落和句子層次訓練出。 在主題連貫的假設下,那些與動詞和其他名詞其有較強關連性的名詞,構成優先 的主題集合。這種連語語義可辨識段落的主題,討論主題移動現象,並摘要出全 文主題。 |
英文摘要 | This paper proposes a corpus-based language model for discourse analysis. Weanalyze the association of noun-noun and noun-verb pairs in LOB corpus. The wordassociation norms are based on the three factors: (1) word importance, (2) pairoccurrence, and (3) distance. They are trained on the paragraphic and sententiallevels for noun-noun and noun-verb pairs respectively. Under the topic coherencepostulation, the nouns that have the stronger connectivities with the other nounsand verbs in the discourse form the preferred topic set. The collocational semanticsis used to identify the topics from paragraphs, to discuss the topic shift phenomena,and to abstract the text topics. |
本系統中英文摘要資訊取自各篇刊載內容。