高斯分佈

Yufen Chun 2022-03-14 1 min read {Quotes} [Lectures]

考試成績分佈

文憑試採用水平參照(standards-referenced)評級。成績大致分 5 級的水平(由 1 級至最高的 5 級),考生的成績取決於他是否達到某個等級的要求,個人表現與事先界定標準及準則比較,去決定結果。

會考和高考是採用「常模參照曲線」來評定學生等級,俗稱「拉 curve」。 全名是「相對評分」(relative grading),或「在曲線上評分」(grading on the curve)。這是學生與班級其他學生進行的比較。分數為個人表現與其他學生表現相比較決定的結果。一個高的等第,表示學生分數高於班上多數同學。

例如,一個有 50 道選擇題的試題,只答對 40 題也可能是班上分數最高者。「評分曲線」一般會採用百分比(percent),例如考試「前 20%」的學生給予「A」,「次 30%」的學生給予「B」,「之後 30%」的學生給予「C」,「再之後 10%」的學生給予「D」,「最後 10%」的學生給予「E」。

參考:五南出版,吳明降著《學習評量精要 75 講》。

要求大學生成績呈「正態分佈」

網傳中南大學教務部門,要求學生成績呈「正態分佈」,一教師憤而發帖,稱成績是試卷的結果,不是教務辦定的指標。一時引起網上熱議。後來中南大學回應「分數無誤,溝通有誤」,並稱他們樂於見到多數學生考高分。發帖教師所教班 70% 學生在 90 分以上,差不多沒有低分。發帖教師是中南大學、軟件學院、特聘副教授、澳大利亞蒙納什大學副研究員。據中南大學官網引用的 1 月 15 日的新聞,「···老師表示,由於家裡親人剛剛去世,加之年終各項工作繁雜,情緒低落,在與教務辦工作人員溝通過程中,存在誤解,誤以為要自己修改分數。事後出於個人情緒原因,在私人 QQ 說說和微信朋友圈發了一些帶情緒的言論,屬於個人的情緒發洩。」

網傳浙江大學、中國科學院大學、吉林大學、北京師範大學、中國農業大學等多數高校教務處關於成績評定的規定中,都明確了「成績應呈正態分佈」的相關規定。

參考:學生期末成績須正態分佈?高校教師探討更科學的評分方式

成績高斯分佈

「正態分佈」、「常態分佈」英文是 normal distribution。其實是「高斯分佈」(Gaussian distribution)。將一「連續變項」之「觀察值」的「發生機率」以圖呈現其分佈情形,具有以下特性:

  1. 以平均數為中線,構成左右對稱之單峰、鐘型曲線分布。
  2. 觀察值之範圍為負無限大至正無限大之間。
  3. 變項之平均數、中位數和眾數為同一數值。
  4. 標準偏差 (standard deviation):
    • 68.3% 的數值,落在平均數 ± 1個標準差間;
    • 95.4% 的數值,落在平均數 ± 2個標準差間;
    • 99.7% 的數值,落在平均數 ± 3個標準差間。
  5. 標準差(Standard Deviation) ,也稱均方差(mean square error),定義是各資料偏離平均數的距離的平均數,它是離均差平方和平均後的方根,用 σ 表示。標準差是方差的算術平方根。標準差能反映一個資料集的離散程度。平均數相同的,標準差未必相同。標準差愈大,表示數值與平均值(Mean)的差距愈大,反之亦然。

「高斯分佈」是一種概率分佈的特殊表現形式。

如果成績是「高斯分佈」,那麼,在統計某次考試成績分佈規律的時候,以總成績 100 分計,90 以上的高分和 60 以下的低分,人數都比較少,大多數在七八十分左右徘徊,這就是「中間大,兩頭小」的「正態分佈」。

「高斯分佈」只適合各種「獨立因素」累加的情況,如果這些因素不是彼此獨立的,會互相加強影響,那麼就不是「高斯分佈」。所以說「正態」、「常態」便造成誤解。

一些學者認為用正名「高斯分佈」比較適當。

如果各種因素對結果的影響不是相加,而是相乘,那麼最終結果不是「高斯分佈」,而是「對數正態分佈」(log normal distribution),即 x 的對數值 log(x) 滿足正態分佈。

參考:John Cook Why isn’t everything normally distributed?

「高斯分佈」不是常態

財富分佈曲線就不是「高斯分佈」,一個人是否能夠掙大錢,由多種因素決定。這些因素都不是獨立的,會彼此加強。如果出生在上層家庭,那麼你就有更大的機會接受良好的教育、找到高薪的工作、遇見好機會,反之亦然。「高斯分佈」只適合各種因素累加的情況,如果這些因素不是彼此獨立的,會互相加強影響,那麼就不是「高斯分佈」了。

參考:正態分佈為什麼常見?

教育是「高斯分佈」嗎?

教育是反隨機,是有目的的,是讓學生學會他所教的東西。理想的教育會讓所有學生完全掌握所學內容,這樣他們都將獲得滿分。即是說,不讓學生成績呈「高斯分佈」是理想教育的一個目標。

雖然無法控制學生智力和努力程度的隨機性,但是教師可以通過教學手段的改進,尤其通過因材施教來普遍提高學生成績。

學生問,回答是:

「你的問題不清楚,想好了問題再問。」
「你要自己學找答案。」
「····」(留散無窮。)

或:

「你從這方向找答案。」
「這本書,這篇論文有討論。」
「····」(恍然大悟。)
「····」(一理通、百理明、開拓新天地。)

影響學生成績的因素是隨機變量嗎?這些因素是彼此獨立的嗎?

參考:檢驗教學:試題內容要科學合理