查詢結果分析
相關文獻
- 比較淨最小平方法中選取最佳因子數準則的研究--以近紅外線光譜資料為例
- 交叉驗證法在淨最小平方法中選取最佳因子數目之模擬研究
- 共線性資料下不同準則對PLS中決定最佳因子數的模擬研究
- 近紅外線光譜分析上以淨最小平方法決定白米粉末直鏈澱粉含量的模型
- 評估以不同統計方法建立白米粉末直鏈澱粉含量的近紅外線光譜模型
- 近紅外線光譜儀在分析纖維成份之應用
- 果汁糖度檢測模式之研究
- 集合住宅屬性與設施管理之決策關係研究
- A Review on in Vitro Studies of Hemodynamic Characteristics in Terminal and Lateral Aneurysm Models
- 近紅外線光譜技術分析番茄之品質
頁籤選單縮合
| 題 名 | 交叉驗證法在淨最小平方法中選取最佳因子數目之模擬研究=The Development, Cultivation and Chemical Constituents in Psudobulbs of Bletilla formosana (Hayata) Schltr. |
|---|---|
| 作 者 | 廖宜倫; 郭寶錚; | 書刊名 | 臺中區農業改良場研究彙報 |
| 卷 期 | 103 2009.06[民98.06] |
| 頁 次 | 頁41-51 |
| 分類號 | 434.113 |
| 關鍵詞 | 近紅外線光譜; 淨最小平方法; 共線性資料; 交叉驗證法; 模擬研究; NIR; Partial least squares method; Multi-collinearity data; Cross validation; Simulation study; |
| 語 文 | 中文(Chinese) |
| 中文摘要 | 利用淨最小平方法來解決資料中共線性問題是有用的,而淨最小平方法是由主成分分析改進而來,除了將解釋變數X 矩陣轉換成直交得點矩陣t 外,並在得點矩陣中加入反應變數y 的訊息。淨最小平方法中, X 矩陣可分解成得點與負荷量矩陣t 及p′ , y 矩陣可分解成得點與負荷量矩陣u及q′,其間並經由權重向量w 牽引著X 與y 之間的訊息,因此,淨最小平方法的表現要比主成分回歸法為佳的原因。本研究利用兩個模擬研究以交叉驗證法來選擇淨最小平方回歸上最佳因子數,第一個模擬資料的產生是利用實際的NIR資料特性為基礎來模擬產生,也就是新產生的資料中含有原始的實際資料的特性,我們只控制了模式中最佳因子數目、樣本個數、解釋變數個數與樣本變方大小,並檢查這些因素對選取最佳因子數目的影響;第二個模擬則是依照共線性程度的大小來模擬產生資料,在這個模擬中我們控制了資料的共線性大小,當共線性程度太過嚴重時,可以利用交叉驗證法來選擇保留有用訊息的因子數目,捨棄會造成共線性問題的因子。綜言之,使用淨最小平方法可以有效控制資料共線性問題,交叉驗證法對模式中最佳因子數目的估計能獲得不錯的效果,而交叉驗證法在各種情形下對模式中最佳因子數目的估計最為準確。 |
| 英文摘要 | It’s useful to solve the multi-collinear problem of data by partial least squares regression. The partial least squares regression is modified from principal component regression. PLS transforms the explanatory-variable matrix X into several orthogonal t scores, and it adds y information into scores t simultaneously. On PLS regression, the X matrix is decomposed into t scores and p loadings; u scores and q loading for y matrix. It introduces the relationship of X and y by using the w weights. This is the reason that PLS always performs better than PCR. This study uses cross validation to choose the number of fitting factors by two simulation studies. We simulate the first data by using real NIR data character and the simulation data have the same character with real NIR data. We only control the number of fitting factors, sample size, explained variables and sample variance of the model. Finally, we check the effects for the number of fitting factors. The second simulation data is generated by the degree of collinear. On this simulation data, we control the degree of collinear. When the degree of collinear is too serious, we can use CV to keep some useful factors, and to reject some factors, which cause the collinear. Generally speaking, controlling multi-collinearity data is effectible by using PLS. we can get good result of choosing the number of fitting factors by using MSECV. And at many conditions using the MSECV will get the accurate estimation. |
本系統中英文摘要資訊取自各篇刊載內容。