亚洲成aⅴ人在线观看_亚洲欧美日韩综合一区在线观看_国产无码电影一区二区三区_国语精品91自产拍在线观看二区

VIP標(biāo)識(shí) 上網(wǎng)做生意,首選VIP會(huì)員| 設(shè)為首頁(yè)| 加入桌面| | 手機(jī)版| RSS訂閱
食品伙伴網(wǎng)服務(wù)號(hào)
 

聚類分析

放大字體  縮小字體 發(fā)布日期:2006-09-19

聚類通過(guò)把目標(biāo)數(shù)據(jù)放入少數(shù)相對(duì)同源的組或“類”(cluster)里。分析表達(dá)數(shù)據(jù),(1)通過(guò)一系列的檢測(cè)將待測(cè)的一組基因的變異標(biāo)準(zhǔn)化,然后成對(duì)比較線性協(xié)方差。(2)通過(guò)把用最緊密關(guān)聯(lián)的譜來(lái)放基因進(jìn)行樣本聚類,例如用簡(jiǎn)單的層級(jí)聚類(hierarchical clustering)方法。這種聚類亦可擴(kuò)展到每個(gè)實(shí)驗(yàn)樣本,利用一組基因總的線性相關(guān)進(jìn)行聚類。(3)多維等級(jí)分析(multidimensional scaling analysis,MDS)是一種在二維Euclidean “距離”中顯示實(shí)驗(yàn)樣本相關(guān)的大約程度。(4)K-means方法聚類,通過(guò)重復(fù)再分配類成員來(lái)使“類”內(nèi)分散度最小化的方法。

聚類方法有兩個(gè)顯著的局限:首先,要聚類結(jié)果要明確就需分離度很好(well-separated)的數(shù)據(jù)。幾乎所有現(xiàn)存的算法都是從互相區(qū)別的不重疊的類數(shù)據(jù)中產(chǎn)生同樣的聚類。但是,如果類是擴(kuò)散且互相滲透,那么每種算法的的結(jié)果將有點(diǎn)不同。結(jié)果,每種算法界定的邊界不清,每種聚類算法得到各自的最適結(jié)果,每個(gè)數(shù)據(jù)部分將產(chǎn)生單一的信息。為解釋因不同算法使同樣數(shù)據(jù)產(chǎn)生不同結(jié)果,必須注意判斷不同的方式。對(duì)遺傳學(xué)家來(lái)說(shuō),正確解釋來(lái)自任一算法的聚類內(nèi)容的實(shí)際結(jié)果是困難的(特別是邊界)。最終,將需要經(jīng)驗(yàn)可信度通過(guò)序列比較來(lái)指導(dǎo)聚類解釋。

第二個(gè)局限由線性相關(guān)產(chǎn)生。上述的所有聚類方法分析的僅是簡(jiǎn)單的一對(duì)一的關(guān)系。因?yàn)橹皇浅蓪?duì)的線性比較,大大減少發(fā)現(xiàn)表達(dá)類型關(guān)系的計(jì)算量,但忽視了生物系統(tǒng)多因素和非線性的特點(diǎn)。

 

 

 
推薦圖文
推薦食品專題
點(diǎn)擊排行
 
 
Processed in 0.253 second(s), 564 queries, Memory 2.01 M