激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频

分類(lèi)數據的統計分析技巧

時(shí)間:2024-11-01 10:02:51 曉璇 統計師 我要投稿
  • 相關(guān)推薦

分類(lèi)數據的統計分析技巧

  你知道分類(lèi)數據的統計分析技巧有哪些嗎?你知道什么是分類(lèi)數據的統計分析嗎?下面是yjbys小編為大家帶來(lái)的關(guān)于分類(lèi)數據的統計分析技巧的知識,歡迎閱讀。

  分類(lèi)數據的統計分析技巧:

  1. 樣本數據與總體比較

  1)二分類(lèi)資料:

  (1)小樣本數據:用二項分布進(jìn)行確切概率法檢驗;

  (2)大樣本數據:用U檢驗;

  2)多分類(lèi)數據:用Pearson檢驗(又稱(chēng)擬合優(yōu)度檢驗)。

  2. 四格表(2×2表)數據

  1)完全隨機設計的四格表數據的分析

  (1)當樣本量n>40,并且4個(gè)格子理論數均大于5時(shí),則用Pearson 檢驗;

  (2)當樣本量n>40,并且4個(gè)格子理論數均大于1且至少存在一個(gè)格子的理論數<5時(shí),則用校正檢驗或用Fisher’s精確概率法檢驗;

  (3)當樣本量n40或存在任一格子理論數<1,則用精確概率法檢驗;

  2)配對設計的四格表數據的分析

  (1)b+c≥40,則用McNemar配對檢驗;

  (2)b+c<40,則用二項分布確切概率法檢驗;

  3. 2×C表或R×2表數據的統計分析

  1)列變量為效應指標,并且為有序多分類(lèi)變量,行變量為分組變量,則可以采用行平均得分差(Row Mean Scores Differ)的CMH 或成組的Wilcoxon秩和檢驗;

  2)列變量為效應指標并且為二分類(lèi),行變量為有序多分類(lèi)變量,則可采用普通的Pearson 檢驗比較各組之間有無(wú)差別,如果總的來(lái)說(shuō)有差別,還可進(jìn)一步作兩兩比較,以說(shuō)明是否任意兩組之間的差別都有統計學(xué)意義。

  3)行變量和列變量均為無(wú)序分類(lèi)變量:

  (1)當樣本量n>40,并且理論數小于5的格子數少于行列表中格子總數的25%,則用Pearson 檢驗;

  (2)當樣本量n40,或理論數小于5的格子數多于行列表中格子總數的25%,則用Fisher’s確切概率法檢驗;

  4. R×C表數據的統計分析

  1)完全隨機設計的R×C表數據的統計分析

  (1)列變量為效應指標,并且為有序多分類(lèi)變量,行變量為分組變量,則CMH 或Kruskal Wallis的秩和檢驗;

  (2)列變量為效應指標,并且為無(wú)序多分類(lèi)變量,行變量為有序多分類(lèi)變量,則采用普通的Pearson 檢驗比較各組之間有無(wú)差別,如果總的來(lái)說(shuō)有差別,還可進(jìn)一步作兩兩比較,以說(shuō)明是否任意兩組之間的差別都有統計學(xué)意義;

  (3)列變量和行變量均為有序多分類(lèi)變量,可以作Spearman相關(guān)分析或者非零相關(guān)(none zero correlation)的CMH ;

  (4)列變量和行變量均為無(wú)序多分類(lèi)變量:

  i. 當樣本量n>40并且理論數小于5的格子數少于行列表中格子總數的25%,則用Pearson 檢驗進(jìn)行分析;

  ii. 當樣本量n40或理論數小于5的格子數多于行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗;

  2)配對設計的C×C表數據:

  (1)配對比較:用McNemar配對檢驗;

  (2)一致性檢驗(Agreement):用Kappa檢驗;

  Poisson分布數據

  1. 單樣本數據與總體比較:

  1)當觀(guān)察值較小時(shí):可以用確切概率法進(jìn)行檢驗。

  2) 當觀(guān)察值較大時(shí):可以用正態(tài)近似的U檢驗。

  2. 兩個(gè)樣本數據的比較:可以用正態(tài)近似的U檢驗。

  兩個(gè)變量之間的關(guān)聯(lián)性分析

  1. 兩個(gè)變量均為連續型變量

  1)當兩變量為小樣本并且兩個(gè)變量服從雙正態(tài)分布時(shí),可以用Pearson相關(guān)系數來(lái)衡量?jì)蓚(gè)變量之間的關(guān)聯(lián)性;

  2)當兩變量為大樣本或兩個(gè)變量不服從雙正態(tài)分布,則用Spearman相關(guān)系數來(lái)衡量?jì)蓚(gè)變量之間的關(guān)聯(lián)性;

  2. 如果兩個(gè)變量均為有序分類(lèi)變量,可以用Spearman相關(guān)系數來(lái)衡量?jì)蓚(gè)變量之間的關(guān)聯(lián)性;

  3. 如果一個(gè)變量為有序分類(lèi)變量,另一個(gè)變量為連續型變量,可以用Spearman相關(guān)系數來(lái)衡量?jì)蓚(gè)變量之間的關(guān)聯(lián)性。

  如何進(jìn)行數據分析統計:

  描述統計是通過(guò)圖表或數學(xué)方法,對數據資料進(jìn)行整理、分析,并對數據的分布狀態(tài)、數字特征和隨機變量之間關(guān)系進(jìn)行估計和描述的方法。

  描述統計分為集中趨勢分析、離中趨勢分析、相關(guān)分析三大部分。

  集中趨勢分析

  集中趨勢分析主要靠平均數、中數、眾數等統計指標來(lái)表示數據的集中趨勢。

  離中趨勢分析

  離中趨勢分析主要靠全距、四分差、平均差、方差(協(xié)方差:用來(lái)度量?jì)蓚(gè)隨機變量關(guān)系的統計量)、標準差等統計指標來(lái)研究數據的離中趨勢。例如,我們想知道兩個(gè)教學(xué)班的語(yǔ)文成績(jì)中,哪個(gè)班級內的成績(jì)分布更分散,就可以用兩個(gè)班級的四分差或百分點(diǎn)來(lái)比較。

  相關(guān)分析

  相關(guān)分析探討數據之間是否具有統計學(xué)上的關(guān)聯(lián)性。

  假設檢驗是用來(lái)判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統計推斷方法。

  假設檢驗可分為正態(tài)分布檢驗、正態(tài)總體均值分布檢驗、非參數檢驗三類(lèi)。

  正態(tài)分布檢驗

  正態(tài)分布檢驗包括三類(lèi):JB檢驗、KS檢驗、Lilliefors檢驗,用于檢驗樣本是否來(lái)自于一個(gè)正態(tài)分布總體。

  正態(tài)總體均值分布檢驗

  正態(tài)總體均值分布檢驗考察系統誤差對測試結果的影響,從統計意義上來(lái)說(shuō),各樣本均值之差應在隨機誤差允許的范圍之內。反之,如果不同樣本的均值之差超過(guò)了允許的范圍,這就說(shuō)明除了隨機誤差之外,各均值之間還存在系統誤差,使得各均值之間出現了顯著(zhù)性差異。

  分為兩種情況:

  T檢驗:主要用于樣本含量較小,總體標準差未知的正態(tài)分布資料。它用T分布理論來(lái)推斷差異發(fā)生的概率,從而判定兩個(gè)平均數的差異是否顯著(zhù)。

  U檢驗:一般用于大樣本的平均值差異性檢驗,基于樣本來(lái)自正態(tài)總體的假設。它是用標準正態(tài)分布的理論來(lái)推斷差異發(fā)生的概率,從而比較兩個(gè)平均數的差異是否顯著(zhù)。國外英文統計學(xué)大多采用Z檢驗。

  非參數檢驗

  非參數檢驗不考慮總體分布是否已知,僅應用樣本觀(guān)察值中一些非常直觀(guān)的信息。適用情況包括:待分析數據不滿(mǎn)足參數檢驗所要求的假定,因而無(wú)法應用參數檢驗;僅由一些等級構成的數據;所提的問(wèn)題中并不包含參數;需要迅速得出結果時(shí)。它的主要方法包括:卡方檢驗、秩和檢驗、二項檢驗、游程檢驗、K-量檢驗、符號檢驗等。

  相關(guān)分析是研究現象之間相互關(guān)系的主要方式之一,它可以將現象之間的關(guān)系大小與方向測定出來(lái)。相關(guān)關(guān)系的類(lèi)型按照不同維度可分為:

  按相關(guān)程度劃分:完全相關(guān)、不相關(guān)、不完全相關(guān)。

  按依存關(guān)系的表現形式劃分:線(xiàn)性相關(guān)、非線(xiàn)性相關(guān)。

  按相關(guān)方向劃分:正相關(guān)、負相關(guān)。

  按研究量劃分:?jiǎn)蜗嚓P(guān)、復相關(guān)。

  相關(guān)關(guān)系的測定方法包括:散點(diǎn)圖、相關(guān)系數等。

  回歸分析是確定兩種或兩種以上變量間相互依賴(lài)的定量關(guān)系的一種統計分析方法。它按照變量的多少和變量之間的關(guān)系類(lèi)型,可分為多種回歸:

  一元線(xiàn)性回歸分析

  分析一個(gè)因變量與一個(gè)自變量之間的線(xiàn)性關(guān)系,常用統計指標包括: 平均數、增減量、平均增減量。

  多元線(xiàn)性回歸分析

  分析多個(gè)自變量與一個(gè)因變量之間的線(xiàn)性關(guān)系,在實(shí)際統計分析中,一般利用軟件對多元回歸模型進(jìn)行估計。

  非線(xiàn)性回歸分析

  自變量與因變量之間因果關(guān)系的函數表達式是非線(xiàn)性的,非線(xiàn)性回歸模型有很多包括對數曲線(xiàn)方程、反函數曲線(xiàn)方程、二次曲線(xiàn)方程、三次曲線(xiàn)方程、復合曲線(xiàn)方程、冪函數曲線(xiàn)方程 、S形曲線(xiàn)方程等均為非線(xiàn)性回歸方程。

  其它回歸分析模型還有很多,之前有寫(xiě)過(guò)一篇回歸分析的內容,想了解的小伙伴可以去看,這里就不贅述啦!

  方差分析又稱(chēng)“變異數分析”或“F檢驗”,用于兩個(gè)及兩個(gè)以上樣本均數差別的顯著(zhù)性檢驗。使用條件包括:各樣本須是相互獨立的隨機樣本;各樣本來(lái)自正態(tài)分布總體;各總體方差相等。

  根據所分析的試驗因素個(gè)數多少,可分為:

  單因素方差分析

  用來(lái)研究一個(gè)控制變量的不同水平是否對觀(guān)測變量產(chǎn)生了顯著(zhù)影響。這里,由于僅研究單個(gè)因素。

  雙因素方差分析

  用來(lái)分析兩個(gè)因素的不同水平對結果是否有顯著(zhù)影響,以及兩因素之間是否存在交互效應。

  聚類(lèi)分析是一種探索性的分析,在分類(lèi)的過(guò)程中,人們不必事先給出一個(gè)分類(lèi)的標準,聚類(lèi)分析能夠從樣本數據出發(fā),將數據分類(lèi)到不同的類(lèi)或者簇。同一個(gè)簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。

  聚類(lèi)分析的計算方法主要有:

  分裂法

  首先創(chuàng )建k個(gè)劃分,k為要創(chuàng )建的劃分個(gè)數。然后利用一個(gè)循環(huán)定位技術(shù)通過(guò)將對象從一個(gè)劃分移到另一個(gè)劃分來(lái)幫助改善劃分質(zhì)量。典型的劃分方法包括:k-means、k-medoids、CLARA、CLARANS、FCM等。

  層次法

  創(chuàng )建一個(gè)層次以分解給定的數據集,可以分為自上而下(分解)和自下而上(合并)兩種操作方式。方法包括:BIRCH、CURE、ROCK、CHEMALOEN等。

  基于密度的方法

  根據密度完成對象的聚類(lèi)。方法包括:DBSCAN、OPTICS等。

  基于網(wǎng)格的方法

  先將對象空間劃分為有限個(gè)單元以構成網(wǎng)格結構,然后利用網(wǎng)格結構完成聚類(lèi)。方法包括:STING、CLIQUE等。

  基于模型的方法

  假設每個(gè)聚類(lèi)的模型并發(fā)現適合相應模型的數據。方法包括:COBWEB、CLASSIT等。

  時(shí)間序列是同一現象在不同時(shí)間上的觀(guān)察數據按時(shí)間先后順序排列起來(lái)所得到的數列,也稱(chēng)為動(dòng)態(tài)數列。時(shí)間序列的兩個(gè)基本要素:現象所屬的時(shí)間和反映現象在不同時(shí)間上的指標數值。

  時(shí)間序列按排列指標的表現形式不同,可分為:

  絕對數時(shí)間序列

  指一系列同類(lèi)的總量指標數據按時(shí)間先后順序排列而形成的序列,反映現象在各個(gè)時(shí)期上達到的絕對水平。又分為:時(shí)點(diǎn)序列和時(shí)期序列。

  相對數時(shí)間序列

  指相對指標數值按時(shí)間先后順序排列而形成的時(shí)間序列,主要反映的是客觀(guān)現象數量對比關(guān)系的發(fā)展過(guò)程。

  平均數時(shí)間序列

  指一系列同類(lèi)的平均指標數值依時(shí)間順序排列形成的數列,主要反映的是客觀(guān)現象一般水平的發(fā)展變化過(guò)程。又可分為:靜態(tài)平均數時(shí)間序列和動(dòng)態(tài)平均數時(shí)間序列。

  時(shí)間序列的分析模型,按影響因素可劃分為:

  長(cháng)期趨勢的測定和分析方法:時(shí)距擴大法、移動(dòng)平均法、最小二乘法。

  季節變動(dòng)的測定和分析方法:同期平均法、移動(dòng)平均趨勢剔除法。

  循環(huán)變動(dòng)的測定和分析方法:直接法和剩余法。

  當然了,統計學(xué)遠遠不止這7種數據分析方法,還有很多其他方法值得我們深挖學(xué)習,如通徑分析、因子分析、主成分分析等。如果以后要做數據分析,一定要學(xué)習更多統計學(xué)的基礎知識。

【分類(lèi)數據的統計分析技巧】相關(guān)文章:

演講技巧分類(lèi)03-18

excel表格數據的分類(lèi)匯總教程03-29

攝影的分類(lèi)和技巧03-17

瑜伽呼吸分類(lèi)技巧03-07

嗓音分類(lèi)與歌唱技巧03-17

管理模具設計數據的技巧02-28

微軟認證考試技巧:數據庫03-21

Oracle 數據庫查詢(xún)小技巧03-21

2016最數據庫設計技巧03-29

美甲筆的分類(lèi)及使用技巧03-12

激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频