統計學的術語和簡介

  統計學是通過搜尋、整理、分析、描述資料等手段,以達到推斷所測物件的本質,甚至預測物件未來的一門綜合性科學。以下是由小編整理關於什麼是統計學的內容,希望大家喜歡!

  統計學的起源

  統計學的英文statistics最早源於現代拉丁文statisticum collegium***國會***、義大利文statista***國民或政治家***以及德文Statistik,最早是由Gottfried Achenwall於1749年使用,代表對國家的資料進行分析的學問,也就是“研究國家的科學”。十九世紀,統計學在廣泛的資料以及資料中探究其意義,並且由John Sinclair引進到英語世界。

  統計學是一門很古老的科學,一般認為其學理研究始於古希臘的亞里斯多德時代,迄今已有兩千三百多年的歷史。它起源於研究社會經濟問題,在兩千多年的發展過程中,統計學至少經歷了“城邦政情”、“政治算數”和“統計分析科學”三個發展階段。所謂“數理統計”並非獨立於統計學的新學科,確切地說,它是統計學在第三個發展階段所形成的所有收集和分析資料的新方法的一個綜合性名詞。概率論是數理統計方法的理論基礎,但是它不屬於統計學的範疇,而是屬於數學的範疇。

  統計學的主要術語

  統計學***statistics***:收集、處理、分析、解釋資料並從資料中得出結論的科學。

  描述統計***descriptive statistics***:研究資料收集、處理和描述的統計學方法。

  推斷統計***inferential statistics***:研究如何利用樣本資料來推斷總體特徵的統計學方法。

  變數***variable***:每次觀察會得到不同結果的某種特徵。

  分類變數***categorical variable***:觀測結果表現為某種類別的變數。

  順序變數***rank variable***:又稱有序分類變數,觀測結果表現為某種有序類別的變數。

  數值型變數***metric variable***:又稱定量變數,觀測結果表現為數字的變數。

  均值***mean***:均值也就是平均數,有時特指算術平均數,這是相對其他方式計算的均值,求法是先將所有數字加起來,然後除以數字的個數,這是測量集中趨勢,或者說平均數的一種方法。

  中位數***median***:也就是選取中間的數,要找中位數,首先需要從小到大排序,排序後,再看中間的數字是什麼。

  眾數***mode***:眾數也就是資料集中出現頻率最多的數字。

  統計學的檢驗應用

  統計學的中心問題就是如何根據樣本去探求有關總體的真實情況。因此,如何從一個總體中抽取一些元素組成樣本,什麼樣的樣本最能代表總體,這直接影響著統計的準確性。如果抽取元素的方法是使總體中的元素成分不改,所觀測到的數值是互相獨立的隨機變數,並有著和總體一樣的分佈,這樣的樣本是一個簡單的隨機樣本,它是總體的最好代表,而取得簡單隨機樣本的過程叫做簡單隨機取樣。

  簡單隨機取樣就是重複進行同一隨機試驗,也就是指每次試驗都在同一組條件下進行,因而每次試驗得到什麼結果,其可能程度都是固定不變的。對於有限總體,簡單隨機抽樣意味著每次抽出一個元素後,放還再抽,若不放還,總體的成分將有所改變,那麼再抽時,出現各種結果的可能程度就相對地改變了。至於無限總體則沒有區分“放回”或“不放回”的必要。

  除以上述原則外,另一方面,獲得樣本的具體方法能否保證觀察值是獨立的,這是問題的關鍵,因此,一樣本的隨機與否還取決於獲得樣本的具體方法。

  在具體進行取樣時,必須根據研究目的的不同,選擇不同的取樣方法。

  ①單純隨機取樣法先把每個個體編號,然後用抽籤的方式從總體中抽取樣本。這種方法適用於個體間差異較小、所需抽選的個體數較少或個體的分佈比較集中的研究物件。

  ②分割槽隨機取樣法將總體隨機地分成若干部分,然後再從每一部分隨機抽選若干個體組成樣本。這種抽樣法可以更有組織地進行,而且中選的個體在總體的分佈比單純隨機取樣更均勻。

  ③系統取樣法先有系統地將總體分成若干組,然後隨機地從第一組決定一個起點,如每組15個元素,決定從第一組的第13個元素選起,那麼以後選定的單位即28,43,58,73等等。

  ④分層取樣法根據對總體特性的瞭解,把總體分成若干層次或型別組,然後從各個層次中按一定比例隨機抽選。這種方法的代表性好,但若層次劃分得不正確,也不能獲得有高度代表性的樣本。

統計學的術語