今天我們繼續(xù)介紹QC七大手法的第五種——散布圖。
散布圖是探討一組成對數(shù)據(jù)之間是否具有相關(guān)性的圖示,其基本的形式如下:
散布圖主要是用來尋找兩種變量間的關(guān)系,因此,散布圖也叫相關(guān)圖。
在現(xiàn)實的工作、生活中,我們經(jīng)常會需要分析兩種變量是否有關(guān)系,而這種關(guān)系往往因為偏差、測量誤差等因素呈現(xiàn)出非線性的關(guān)系,不能由數(shù)學(xué)公式直接計算,這時候通過散布圖,就可以相對方便地觀察出這兩個變量之間的關(guān)系。
散布圖的相關(guān)性分為強(qiáng)正相關(guān)、弱正相關(guān)、強(qiáng)負(fù)相關(guān)、弱負(fù)相關(guān)、非線性相關(guān)、不相關(guān)等六種形態(tài),如下圖所示:
1、強(qiáng)正相關(guān)
強(qiáng)正相關(guān),就是一個變量隨另一個變量的增加而增加,并且所有的數(shù)據(jù)點都分布在較為狹小的區(qū)域內(nèi),兩個變量表現(xiàn)出較強(qiáng)的因果關(guān)系,比如發(fā)動機(jī)的輸出功率和轉(zhuǎn)速。
2、弱正相關(guān)
弱正相關(guān),就是一個變量隨另一個變量的增加而增加,但數(shù)據(jù)點分布在較寬的范圍內(nèi),兩個變量的因果關(guān)系表現(xiàn)較弱,比如人的體重和身高。
3、強(qiáng)負(fù)相關(guān)
強(qiáng)負(fù)相關(guān),就是一個變量隨另一個變量的增加而減少,并且所有的數(shù)據(jù)點都分布在較為狹小的區(qū)域內(nèi),兩個變量表現(xiàn)出較強(qiáng)的因果關(guān)系,比如油的粘度和溫度。
4、弱負(fù)相關(guān)
就是一個變量隨另一個變量的增加而減少,但數(shù)據(jù)點分布在較寬的范圍內(nèi),兩個變量的因果關(guān)系表現(xiàn)較弱,比如人走路的步速和溫度。
5、非線性相關(guān)
非線性相關(guān),就是兩個變量的數(shù)據(jù)點分布在較狹小的范圍內(nèi),但不在一條直線上。
6、不相關(guān)
不相關(guān),就是兩個變量的數(shù)據(jù)點分布在很寬的范圍內(nèi),兩者沒有表現(xiàn)出因果關(guān)系。
通過散布圖對兩個變量的關(guān)系進(jìn)行分析、判斷,可以尋找控制、改善的方法。
散布圖的畫法如下:
1、收集兩個變量的數(shù)據(jù);
2、找出數(shù)據(jù)中的最大值與最小值;
3、將數(shù)據(jù)繪制成坐標(biāo)圖;
4、畫出簡易的回歸線。
在這里,首先需要注意,收集的數(shù)據(jù)量要足夠多,否則可能因為數(shù)據(jù)量不足,造成隨機(jī)的數(shù)據(jù)偏差較大,從而導(dǎo)致對相關(guān)性的錯誤判斷。
傳統(tǒng)的統(tǒng)計學(xué)中,對于數(shù)據(jù)量的要求是不少于20個,而在散布圖的繪制要求是不少于30個。隨著數(shù)據(jù)量的增加,變量之間的關(guān)系會更加清晰而易于判斷。目前的大數(shù)據(jù)分析,運用的也是散布圖來尋找變量間的關(guān)系。
其次,散布圖繪制后,分析散布圖應(yīng)謹(jǐn)慎,因為散布圖是用來理解一個變量與另一個變量之間可能存在的關(guān)系,這種關(guān)系需要進(jìn)一步的分析,最好做進(jìn)一步的調(diào)查。
再次,對散布圖進(jìn)行分析時,要注意:
1、散布圖反映的只是一種趨勢,對于定性的結(jié)果還需要具體的分析。
2、分析時,應(yīng)注意對數(shù)據(jù)的正確分層,否則可能會發(fā)生誤判。
3、在使用散布圖調(diào)查兩個因素之間的關(guān)系時,應(yīng)盡可能固定對這兩個因素有影響的其他因素(控制變量法),才能保證通過散布圖分析的結(jié)果比較的準(zhǔn)確。