風之結構?幡之結構?仁者心之結構
《心理統計學》第一課引 Herbert Simon 《人工科學》這句話【1】——
I shall not try to settle which is chicken and which is egg: whether we are able to understand the world because it is hierarchic or whether it appears hierarchic because those aspects of it which are not elude our understanding and observation.
——若將 hierarchic 理解爲更寬泛的「具有良好的結構與分層,每個層級獨立不重複的幷行對象數不超出短時記憶 7±2 的容量」【2】,即本文標題。
· 語言和想像的世界貌似廣大,意識却可能成爲本質上無法擠過的窄門
也許 Simon 的這段話更適合在《認知心理學》課堂引用。主流的《認知心理學》課程很大篇幅將認知過程類比爲計算機(只有很少的篇幅將認知過程類比爲神經網絡)。吊詭的是,計算機正是這段話中「our understanding and observation」的産物,認知過程再類比爲計算機,就有循環論證的意味。與之相反,哺乳動物腦神經網絡的運算機制,基本上是「our understanding and observation」海平面之下的龐大冰山。人腦瞬時的意識內容受限于短時記憶容納獨立對象的狹窄帶寬。語言和想像的世界貌似廣大,面對哺乳動物腦神經網絡規模的認知對象,意識却可能成爲本質上無法擠過的窄門。人類最終也許可以設計、訓練這種規模的神經網絡,却不可能象構造馮-諾依曼體系計算機那樣去理解和構造這種規模的系統。將來也許可以借助馮-諾依曼體系的計算機設計、訓練人腦規模的神經網絡,但這個「訓練」只是馬戲團馴獸師意義上的訓練。文獻中有這樣一個老梗:要製造人腦水平的智能系統,最簡單的方法是從一個受精卵開始花幾個月把它生出來(再花若干年時間訓練它)。
· 多元統計模型的良好結構特性源于主觀心理認知而非客觀數理規律
多元統計中的主成份分析有助于操作化地理解這個窄門。服務于人肉智能的主成份分析模型,最終成份的數量通常是個位數。有誰見過幾十個成份去近似幾百上千個變量的實證案例?儘管這在數學上成立,但是最終的模型不能擠進意識的當下窄門。類似地,結構方程模型如果要獲得同行的廣泛接受,也必須有這個意義上的「良好結構特性」。這不是數理統計的要求,而是心理認知的要求。
· 人爲單維度數量概念的前提
儘管心靈和語言的短時記憶窄門帶寬大于三,但只要有可能,生活語言仍然傾向于把三維度或者高于三維度的數量概念簡化爲單維度的概念。如果彼此高相關,這樣做有道理。比如智商這樣的單維度概念,背後是數量邏輯、語言能力、空間幾何這樣三個不同質的數量概念(主流的CHC認知能力模型把空間幾何再分拆爲視覺處理和聽覺處理)。對于通常群體,這幾個數量彼此的相關係數相當高,支持進一步用單維度的概念去近似概括。另一個更常見的例子是教育測量中的學業成績。學生的學業成績本質上是多維度的概念,不過,在校生群體任意兩個學科成績的相關係數通常很高。比如PISA項目上海市的數據,十五周歲上海市在校生的語言素養和數學素養得分計算相關係數,如果精確到小數點後一位,歷届數據得到的結果都是0.9。
這裏可能有必要解釋統計課的一個知識點:相關係數不只是兩個變量的特性,還定義于被測的總體。假如追踪這群十五周歲在校生,會發現幾年後應届考入復旦大學的小群體中,同樣兩個變量的相關係數接近于零、甚至可能負相關。類似的道理,北美名校入圍申請者托福成績的聽力、寫作、閱讀各模塊的成績相關也不會太高,幷不支持計算總分。ETS的教育測量專家一度打算真的這麽做,抵制托福總分的報告,然而市場幷不認同,最終托福考試在推薦使用分項目多維度成績報告的同時,仍然保留了總分報告。
· 人爲單維度數量概念的誤區:自信與幸福
數量概念的單維度簡化可能是頑固的認知誤區,再舉兩個有意思的反直覺實例。第一個例子是教育學中的自信心。生活語言裏的自信經常被當作單維度的概念,然而,對語文課業高自信的學生,對數學課業是否也高自信?Herbert Marsh 在「自我概念 / Self-concept」領域的系列研究,證實不同學科自我概念的內部參照效應。具體舉例:兩個學生的語文課業都是中等偏上同一水準,其中學生 A 數學課業極爲優异、學生 B 數學課業只是中等。根據內部參照效應,學生對兩門課業的心理感受會在個體內部彼此參照,學生 A 覺得自己偏科,對語文課業很不自信;學生 B 也覺得自己偏科,對語文課業相當自信。由此可見,不同課業的自信心之間是低相關甚至負相關關係,不能作單維度的簡化。
第二個例子是心理學中的幸福感。Seligman在2004年發展的幸福感模型包括PEM三個成份:P = Pleasant Life / 愉悅的生活、E = Engaged Life / 投入的生活、M = Meaningful Life / 富有意義的生活。在TED的演講中,Seligman 特別舉例 P 值極低、E 值極高、M 值中等偏高的代表性個體,說明這三個變量幷不象公衆直覺的那麽正相關,不能混爲一談。
· 注記【1】:
回想1998年春季學期第一次讀到 Herbert Simon 這段話。當時我的學術訓練極其貧乏,正在起勁地寫民間科學範的本科畢業論文,其中有這麽一節腦洞——
…對複雜性進行小整數分解的思想來源已久,幷爲諸正統哲學奉爲圭臬——如「對立統一的矛盾」二分法、「三位一體」的三分法。注意到大于1的自然數n只有2和3滿足 n*(n-1)/2 <= n,其中,n爲個體數,n*(n-1)/2即個體兩兩間的關係的數量。無論是歸因于客觀事物的矛盾本質或是其它的神秘因素,都脫不開唯一能見證認知對象的主體所具有的認知功能結構。如果人腦是由64個微處理器的組合成的幷行中央處理器,可以想像六十四卦演繹也許會取代「玄而又玄,衆妙之門」的「二者同出而异名」或「三位一體」
· 注記【2】:
7±2 的短時記憶容量由 Miller 首先提出,後續研究認爲上限還可以向下修正到4 (Cowan, 2001)。
· 擴展閱讀:
Marsh, H. W. (1990). Influences of internal and external frames of reference on the formation of math and English self-concepts. (論文摘要)
Miller, G. A. (1956). The Magical Number Seven, Plus or Minus Two: Some Limits on our Capacity for Processing Information (Miller 的 7±2 論文HTML版)
Miller, G. A. (2003). The cognitive revolution: a historical perspective (Miller 評述1956年認知革命)
Seligman, M. (2004). The new era of positive psychology. (Seligman 的多維度幸福人生 PERMA 模型的2004 PEM 版,TED視頻,可選中文字幕)
Simon, H. A. (1996). The Sciences of the Artificial, 3rd Ed. (z.cn在售原著、中譯本豆瓣頁)
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!
- 来自作者