日韩av大片在线观看欧美成人不卡|午夜先锋看片|中国女人18毛片水多|免费xx高潮喷水|国产大片美女av|丰满老熟妇好大bbbbbbbbbbb|人妻上司四区|japanese人妻少妇乱中文|少妇做爰喷水高潮受不了|美女人妻被颜射的视频,亚洲国产精品久久艾草一,俄罗斯6一一11萝裸体自慰,午夜三级理论在线观看无码

湘潭宇科分析儀器有限公司

做實驗需要掌握哪些統(tǒng)計學知識?

時間:2025-1-4閱讀:775
分享:

統(tǒng)計學是數據分析的基石,。學了統(tǒng)計學,,你會發(fā)現很多時候的分析并不靠譜。比如很多人都喜歡用平均數去分析一個事物的結果,,但是這往往是粗糙的,,準確的。如果學了統(tǒng)計學,,那么我們就能以更多更科學的角度看待數據,。 


大部分的數據分析,都會用到統(tǒng)計方面的以下知識,,可以重點學習:

  • 基本的統(tǒng)計量:均值,、中位數、眾數,、方差,、標準差、百分位數

  • 概率分布:幾何分布,、二項分布,、泊松分布、正態(tài)分布等

  • 總體和樣本:了解基本概念,,抽樣的概念

  • 置信區(qū)間與假設檢驗:如何進行驗證分析

  • 相關性與回歸分析:一般數據分析的基本模型

通過基本的統(tǒng)計量,,你可以進行更多元化的可視化,以實現更加精細化的數據分析,。這個時候也需要你去了解更多的Excel函數來實現基本的計算,,或者python、R里面一些對應的可視化方法,。

有了總體和樣本的概念,,你就知道在面對大規(guī)模數據的時候,,怎樣去進行抽樣分析。

你也可以應用假設檢驗的方法,,對一些感性的假設做出更加精確地檢驗,。

利用回歸分析的方法,你可以對未來的一些數據,、缺失的數據做基本的預測,。

了解統(tǒng)計學的原理之后,你不一定能夠通過工具實現,,那么你需要去對應的找網上找相關的實現方法,,也可以看書。先推薦一本非常簡單的:吳喜之-《統(tǒng)計學·從數據到結論》,。 

另外,,如何精力允許,請掌握一些主流算法的原理,,比如線性回歸,、邏輯回歸、決策樹,、神經網絡,、關聯分析、聚類,、協(xié)同過濾,、隨機森林。再深入一點,,還可以掌握文本分析,、深度學習、圖像識別等相關的算法,。關于這些算法,,不僅需要了解其原理,你最好可以流暢地闡述出來,,還需要你知曉其在各行業(yè)的一些應用場景,。如果現階段不是工作剛需,可不作為重點,。

本文算是一個知識點匯總,,不做細致展開,讓大家了解統(tǒng)計學有哪幾大塊,,每一類分別用于什么樣的分析場景,。后面幾篇會以實際案例的方式,細致講講描述性統(tǒng)計,、概率分布等,。


知識點匯總:

1.集中趨勢

2.變異性

3.歸一化

4.正態(tài)分布

5.抽樣分布

6.估計

7.假設檢驗

8.T檢驗


一,、集中趨勢

圖片


1.眾數

出現頻率最高的數;

2.中位數

把樣本值排序,,分布在最中間的值,;

樣本總數為奇數時,中位數為第(n+1)/2個值,;

樣本總數為偶數時,中位數是第n/2個,,第(n/2)+1個值的平均數,;

3.平均數

所有數的總和除以樣本數量;

現在大家接觸最多的概念應該是平均數,,但有時候,,平均數會因為某些極值的出現收到很大影響。舉個小例子,,你們班有20人,,大家收入差不多,19人都是5000左右,,但是有1個同學創(chuàng)業(yè)成功了,,年入1個億,這時候統(tǒng)計你們班同學收入的“平均數"就是500萬了,,這也很好的解釋了,,每年各地的平均收入數據出爐,小伙伴們直呼給祖國拖后腿了,,那是因為大家收入被平均了,,此時,“中位數"更能合理的反映真實的情況,;



二,、變異性

圖片


1.四分位數

上面說到了“中位數",把樣本分成了2部分,,再找個這2部分各自的“中位數",,也就把樣本分為了4個部分,其中1/4處的值記為Q1,,2/4處的值記為Q2,,3/4處的值記為Q3

2.四分位距 IQR=Q3-Q1

圖片

3.異常值

小于Q1-1.5(IQR)或者大于Q3+1.5(IQR);

對于異常值,我們在數據處理的環(huán)節(jié)就要剔除,;

4.方差

圖片

5.平方偏差

方差的算術平方根

6.貝塞爾矯正:修正樣本方差

實際在計算方差時,,分母要用n-1,而不是樣本數量n,。原因在于,,比如在高斯分布中,,我們抽取一部分的樣本,用樣本的方差表示滿足高斯分布的大樣本數據集的方差,。由于樣本主要是落在x=u中心值附近,,那么樣本如果用如下公式算方差,那么預測方差一定小于大數據集的方差(因為高斯分布的邊沿抽取的數據也很少),。為了能彌補這方面的缺陷,,那么我們把公式的n改為n-1,以此來提高方差的數值,,這種方法叫貝塞爾矯正系數,。



三、歸一化

圖片


1.標準分數

一個給定分數 距離 平均數 多少個標準差,?

標準分數是一種可以看出某分數在分布中相對位置的方法,。

標準分數能夠真實的反映一個分數距離平均數的相對標準距離。

圖片


四,、正態(tài)分布

圖片



1.定義:隨機變量X服從一個數學期望為μ,,方差為σ?2;的正態(tài)分布,記為N(μ,σ?2;)

隨機取一個樣本,,有68.3%的概率位于距離均值μ有1個標準差σ內,;

有95.4%的概率位于距離均值μ有2個標準差σ內;

有99.7%的概率位于距離均值μ有3個標準差σ內,;

圖片


五,、抽樣分布

圖片


1.中心極限定理

設從均值為μ,方差為σ?2;的任意一個總體中抽取樣本量為n的樣本,,當n充分大時,,樣本均值的抽樣分布近似服從均值為μ、方差為σ?2;/n的正態(tài)分布

2.抽樣分布

設總體共有N個元素,,從中隨機抽取一個容量為n的樣本,,在重置抽樣時,共有N·n種抽法,,即可以組成N·n不同的樣本,,在不重復抽樣時,共有N·n個可能的樣本,。每一個樣本都可以計算出一個均值,,這些所有可能的抽樣均值形成的分布就是樣本均值的分布。但現實中不可能將所有的樣本都抽取出來,,因此,,樣本均值的概率分布實際上是一種理論分布。數理統(tǒng)計學的相關定理已經證明:在重置抽樣時,樣本均值的方差為總體方差的1/n,。

舉個例子:

48盆MM豆,,計算出每盆有幾個藍色的MM豆,48個數據構成了總體樣本,。然后隨機選擇五盆,,計算五盆中含有藍色MM豆的平均數,然后反復進行了50次,。這就是n為5的樣本均值抽樣,。

圖片


六、估計

圖片


1. 誤差界限

圖片

2. 置信度

We are some % sure the true population parameter falls within a specific range

我們有百分之多少確信總體中的值落在一個特定范圍內,;

一般情況下,,取95%的置信度就可以;

3. 置信區(qū)間

圖片


七,、假設檢驗

圖片

1.問題:什么是顯著性水平,?

顯著性水平是估計總體參數落在某一區(qū)間內,,可能犯錯誤的概率,,也就是Type I Error

A Type II Error is when you fail to reject the null when it is actually false.

圖片

圖片

2. 如何選擇備選檢驗和零假設?

一個研究者想證明自己的研究結論是正確的,,備擇假設的方向就要與想要證明其正確性的方向一致,;

同時將研究者想收集證據證明其不正確的假設作為原假設H0


八、T檢驗

圖片


1. 主要用于樣本含量較?。ɡ鏽<30),,總體標準差σ未知的正態(tài)分布。

流程如下:

圖片

是用t分布理論來推論差異發(fā)生的概率,,從而比較兩個平均數的差異是否顯著,;

一般檢驗水準α取0.05即可;

計算檢驗統(tǒng)計量的方法根據樣本形式不同;

2. 獨立樣本T檢驗:

現在要分析男生和女生的身高是否相同兩者的主要區(qū)別在于數據的來源和要分析的問題,。

圖片

問題:為什么T檢驗查表時候要n-1?

樣本均值替代總體均值損失了一個自由度

3. 配對樣本t檢驗

分析人的早晨和晚上的身高是否不同,,于是找來一撥人測他們早上和晚上的身高,這里每個人就有兩個值,,這里出現了配對

圖片

樣本誤差(Standard Error)

圖片


圖片

4. Pooled variance 合并方差

當樣本平均數不一樣,,但實際上認為他們的方差是一樣的時候,需要合并方差

不要被公式嚇到,,他的本質是兩個樣本方差加權平均

圖片


圖片

5. Cohen’s d

效應量(effect size):提示組間真正的差異占統(tǒng)計學差異的比例,,值越大,組間差異越可靠,。

圖片

圖片


會員登錄

×

請輸入賬號

請輸入密碼

=請輸驗證碼

收藏該商鋪

X
該信息已收藏,!
標簽:
保存成功

(空格分隔,最多3個,單個標簽最多10個字符)

常用:

提示

X
您的留言已提交成功!我們將在第一時間回復您~

以上信息由企業(yè)自行提供,,信息內容的真實性、準確性和合法性由相關企業(yè)負責,,化工儀器網對此不承擔任何保證責任,。

溫馨提示:為規(guī)避購買風險,建議您在購買產品前務必確認供應商資質及產品質量,。

撥打電話
在線留言