更新時(shí)間:2022-01-04 來源:黑馬程序員 瀏覽量:
SPSS是公認(rèn)的最優(yōu)秀的統(tǒng)計(jì)分析軟件之一, 它是一款在市場研究、醫(yī)學(xué)統(tǒng)計(jì)、政府和企業(yè)的數(shù)據(jù)中應(yīng)用最為廣泛的統(tǒng)計(jì)分析工具。
SPSS是由美國斯坦福大學(xué)三位研究生于1968年一起開發(fā)的一個(gè)統(tǒng)計(jì)軟件包,SPSS是該軟件英文名稱的首字母縮寫,最初軟件全稱為“社會科學(xué)統(tǒng)計(jì)軟件包”( Solutions Statistical Package for the Social Sciences)。
2000年,隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的增加,SPSS公司正式將英文全稱更改為“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”(Statistical Product and Service Solutions),而英文縮寫沒有改變。
2009年,SPSS公司宣布重新包裝旗下的SPSS產(chǎn)品線,定位為預(yù)測統(tǒng)計(jì)分析軟件(Predictive Analytics Software,PASW),但用戶對這個(gè)名字難以接受。
2010年,隨著SPSS公司被IBM公司并購,軟件也相應(yīng)地更名為IBM SPSS Statistics。
現(xiàn)在,SPSS旗下主要有4個(gè)產(chǎn)品。
●IBM SPSS Statistics(原SPSS):統(tǒng)計(jì)分析產(chǎn)品。
●IBM SPSS Modeler(原Clementine):數(shù)據(jù)挖掘產(chǎn)品。
●IBM SPSS Data Collection(原Dimensions):數(shù)據(jù)采集產(chǎn)品。
●IBM SPSS Decision Management (原Predictive Enterprise Services):企業(yè)應(yīng)用服務(wù)。
人們常說的SPSS,指的是IBM SPSS Statistics, 后續(xù)介紹的內(nèi)容同樣采用簡稱SPSS。
SPSS與Excel都屬于數(shù)據(jù)分析軟件,可以對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。但不同的是Excel更活合簡單場景的輕度匯總,如報(bào)表數(shù)據(jù),而SPSS功能較多,適合更加專業(yè)的使用場景,如數(shù)據(jù)建模前的數(shù)據(jù)預(yù)處理等?;诖?,可以總結(jié)出以下幾個(gè)優(yōu)勢。
SPSS具有第四代語言(它在表示控制結(jié)構(gòu)和數(shù)據(jù)結(jié)構(gòu)的抽象基礎(chǔ)上,不再需要規(guī)定算法細(xì)節(jié))的特點(diǎn),只要了解統(tǒng)計(jì)分析的原理,無須通曉統(tǒng)計(jì)方法的各種算法,即可得到需要的統(tǒng)計(jì)分析結(jié)果。對于常見的統(tǒng)計(jì)方法,SPSS的命令語句、子命令及選擇項(xiàng)的選擇絕大部分由“對話框”的操作完成。因此,用戶無須花大量時(shí)間記憶大量的命令、過程、選擇項(xiàng)。
SPSS與Excel最大的區(qū)別體現(xiàn)在數(shù)據(jù)統(tǒng)計(jì)功能方面,Excel只內(nèi)置了幾個(gè)簡單的統(tǒng)計(jì)功能,而SPSS非常全面地涵蓋了數(shù)據(jù)分析主要操作流程,提供了數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展示等數(shù)據(jù)分析操作。其中,SPSS涵蓋了各種統(tǒng)計(jì)方法與模型,從簡單的描述統(tǒng)計(jì)分析方法到復(fù)雜的多因素統(tǒng)計(jì)分析方法,例如數(shù)據(jù)的描述性分析、相關(guān)分析、方差分析、回歸分析、Logistic回歸、聚類分析、判別分析、因子分析、對應(yīng)分析等。
SPSS能夠?qū)思皩?dǎo)出多種格式的數(shù)據(jù)文件或結(jié)果。例如,SPSS可導(dǎo)人文本、Excel、Access、SAS、Stata等數(shù)據(jù)文件,SPSS還能夠把其表格、圖形結(jié)果直接導(dǎo)出為Word、Excel、PowerPointTXT文本、PDF、HTML等格式文件。
SPSS可以調(diào)用R語言的各種統(tǒng)計(jì)包括Python的功能模塊,實(shí)現(xiàn)最新統(tǒng)計(jì)方法的調(diào)用,增加SPSS的擴(kuò)展性。
SPSS是一款綜合性的產(chǎn)品,它為各分析階段提供了豐富的模塊功能。SPSS Statistics Base是基礎(chǔ)的軟件平臺,具備強(qiáng)大的數(shù)據(jù)管理能力、輸人輸出界面管理能力,以及常見的統(tǒng)計(jì)分析功能。其他每個(gè)獨(dú)立擴(kuò)充功能模塊均在SPSSStatisticsBase的基礎(chǔ)上,為其增加某方面的分析功能。用戶可以根據(jù)自己的分析需要及計(jì)算機(jī)配置靈活選擇組合使用。
根據(jù)SPSS模塊功能的不同,可以將SPSS常用模塊大致劃分為四個(gè)分析階段:數(shù)據(jù)處理、描述性分析、推斷性分析和探索性分析,各分析階段對應(yīng)的具體模塊如表所示:
分析階段 |
模塊 |
功能 |
數(shù)據(jù)處理 |
Data Preparation | 提供數(shù)據(jù)校驗(yàn)、清理等數(shù)據(jù)處理工具 |
Missing Values | 提供缺失數(shù)據(jù)的處理與分析 | |
Complex Samples | 提供多階段復(fù)雜抽樣技術(shù) | |
描述性分析 |
Statistics Samples | 提供最常用的數(shù)據(jù)處理、統(tǒng)計(jì)分析 |
Custom Tables | 提供創(chuàng)建交互式分析報(bào)表功能 | |
推斷性分析 |
Advanced Statistics | 提供強(qiáng)大且復(fù)雜的單變量和多變量分析技術(shù) |
Regression | 提供線性、非線性回歸分析技術(shù) | |
Forecasting | 提供ARIMA指數(shù)平滑等時(shí)間序列模型 | |
探索性分析 |
Categories | 提供針對分類數(shù)據(jù)的分析工具 |
Conjoint | 提供聯(lián)合分析市場研究工具 | |
Direct Marketing | 提供直銷活動(dòng)效果分析工具 | |
Decision Trees | 提供分類決策樹模型分析方法 | |
Neural Networks | 提供神經(jīng)網(wǎng)絡(luò)模型分析方法 |
猜你喜歡:
數(shù)據(jù)分析的流程是什么?如何做數(shù)據(jù)分析?
如何做數(shù)據(jù)分析?數(shù)據(jù)分析有什么作用?