列印此頁 列印此頁

管理新知~資源配置管理

從諾貝爾經濟獎漫談資源配置管理研究(二):互動面

賴聰乾

 

  賽局理論,又稱互動決策理論,乃探討個體間如何策略性互動及其互動行為。由於社會是由個體(個人、組織)所組成,賽局理論已逐漸被認為是社會科學的物理學,並逐漸進入及深化社會科學的各領域。諾貝爾經濟獎,於1994年首度頒給賽局理論,並於2005年再度頒給這個領域。

 

1994年得獎

  John F. Nash, John C. Harsanyi 和 Jr. Reinhard Selten三人因對(非合作賽局)均衡性的貢獻,於1994年獲獎。其中,Nash因對Nash Equilibrium的貢獻,Harsanyi因對資訊不完整情況下均衡性的貢獻,Selten因對Perfect Equilibrium的貢獻。美國作業研究與管理科學學會最早肯定Nash的貢獻,於1979年即頒給他John von Newmann理論獎。

  Nash憑藉卡內基美隆大學R.L. Duffin教授一封介紹信,進入普林斯敦大學攻讀數學博士,該封介紹信只有一句話︰「這個人是個天才。」他的博士論文指導教授A.W. Tucker回憶說︰「我偶爾會認為Duffin的推薦,言過其實,但當我更加了解Nash之後,我漸漸覺得Duffin是對的。」

  Nash的博士論文有27頁,包含三部分,第一部分(論文前6頁)是關於n人非合作賽局模型的定義、觀念介紹,及(至少存在一個解的)存在性証明。第二部分(論文後6頁)是研究動機與解釋(他所證明存在的)均衡解(點),Nash提供兩種解釋︰第一種解釋,假設參賽者具有完美的訊息與理性,認為均衡點是完美理性反應的預期行為,第二種解釋,捨棄完美訊息與理性的假設,而從群體統計行為的觀點來解釋。第三部分(其餘15頁)被他當時博士班同學H.W. Kuhn以諂媚的口吻譏笑是Nash灌水上去的。實質說來,Nash的博士論文只有12頁,而他之所以獲頒諾貝爾經濟獎,是因為論文前6頁。

  Nash對其均衡點所提供的兩種解釋,第一種解釋較為世人所熟知,第二種解釋適合生物體(物種、器官、基因體)間的互動,因生物體不像人有思考能力去選擇最適反應方式,生物體的反應方式由基因來調控、在適者生存的回應訓練下,進行演化,第二種解釋也適合社會規範(例如,排隊、靠右(左)走、拆分差異、女士優先、某些地方在餐廳用餐給小費、教授研究室由資深者先選…)的行為演化分析。

  人類在探索新知識,常採用的一項策略是:站在巨人肩膀上,向前探索。Nash的存在性証明,並不是從頭証起,而是利用已知的固定點定理,不論使用Brouwer或Kakutani固定點定理來証,都能達到目的,Brouwer固定點定理是拓樸學(Topology)的一個定理,而Kakutani是Brouwer固定點定理的一個延伸。Nash均衡點還有一個重要意義,自然與社會科學的交流互動,無論從方法、理論本身來看,一向是從自然流向社會科學,Nash均衡點是一個例外,它是從社會流向自然科學,Nash均衡點的發展,原本是用來解決經濟與其他社會科學的問題,後來才被應用於生物體的演化分析。

  Harsanyi獲獎,主要是因發表在Management Science(1967-68)的那三篇一系列文章-”Games with Incomplete Information Played by Bayesian Players. I, II, III”。Nash的n人非合作賽局模型,假設模型結構的訊息完整,但實際情況,訊息往往不完整(Incomplete),參賽人各自所擁有的私有訊息,既無義務、往往也無意願去揭露,例如,冷戰時期,美蘇的武器競賽,任一方都不太清楚對方的內部情況(例如,武器研發進展、數量、威力、準度…),又例如,企業之間的競爭,一企業往往不清楚其他企業內部的作業參數值(例如,新產品的研發進展、作業配方、良率、產品作業前置期…)。為克服訊息不完整這個困擾,Harsanyi假設參賽者是貝氏型決策者,並將原來的不完整訊息問題,巧妙地轉化成不完美(Imperfect)訊息問題,之後,再運用貝氏理論來處理,由於不完美訊息問題,並不難處理,這個困擾就這樣被Harsanyi給克服了。

  由於Nash均衡點不保證唯一,如果有多個時,該選那一個呢?這個問題,對採用第一種解釋”均衡點是完美理性反應的預期行為”,格外重要。對這個問題的解決,Selten跨出重要的一步,他提出完美均衡點的觀念,將均衡點分成完美與非完美兩群,完美均衡點是那些有可能被理性參賽者所選用的、非完美均衡點是那些不被選用的,不過,Selten仍然沒有解決大家所渴望的唯一性,因為完美均衡點也可能有多個;唯一性這個問題,至今仍困擾著人類!

  合作性議價問題(合議價問題),向來被大家所津津樂道,這是Nash留給世人的另一珍貴遺產。Nash假設合議雙方的訊息透明,包括雙方的個別效用函數、個別自助報酬,個別自助報酬代表無需靠合作、各自便能獨立達成的報酬,這是雙方合議不成(破局)時的各自報酬,它實際上反應各自的議價籌碼。為方便操作,Nash採用在效用空間上操作,Nash的合議價問題是:給定雙方在效用空間上的可行議價區S及自助報酬點(u, v),是否唯一存在一個合議(報酬)解(u*,v*)。Nash列出一組公設,來描述理性的合議行為,並證明唯一存在一個合議解(u*, v*)滿足該組公設。該組有四個公設:

(1)明顯理性公設:合議解必須大於等於自助報酬點,亦即(u*, v*) ≧(u, v),合議解必須屬於可行議價區S,合議解必須是柏拉圖最適解;

(2)不相關解的獨立性:對可行議價區S的任一子集合T而言,如果S上面的合議解(u*, v*)屬於T,則(u*, v*)必須是T上面的合議解;

(3)效用空間線性轉換的獨立性:如果轉換後的空間為 ,則轉換後的合議解為 ;

(4)對稱性:可行議價區S必須是對稱(如果(u, v)屬於S,則(v, u)屬於S),且各自報酬如相等,則雙方在合議解的值亦相同(如果u=v,則u*=v*)。

  關於Nash的合議價問題,有三點補充:(1)對稱性公設,適用於雙方力量約在伯仲間,若過於懸殊則不適用;(2)有威脅時,該如何處理呢?Nash並沒有提出令人滿意的解答,處理威脅情況,至少有兩個棘手的地方,一是威脅牽涉說與做到的落差,另一是增加求解的困難度;(3)Ariel Rubinstein(1982)將Nash的一回合問題推廣至n回合問題。

 

2005年得獎

  Robert J. Aumann 和Thomas C. Schelling因對(多人競爭賽局下)合作與衝突性的貢獻,於2005年獲獎。其中,Aumann因對Folk Theorem進行正式分析的貢獻,Schelling因對賽局理論應用在嚇阻、武器競賽上的貢獻。Aumann於1995年,以專書”Repeated Games with Incomplete Information”(co-authored by M.J. Maschler and R.E. Sterns, MIT press, 1995),獲頒美國作業研究與管理科學學會的Lanchester著作獎、並於2005年獲頒John von Neumann理論獎。

  Aumann是對民間智慧Folk Theorem,進行正式分析的先驅,Folk Theorem的主張為:(多個)個體間重複性的互動,會產生許多具有自我約束力的行為型態(均衡點),其中之一是,個體會犧牲短期利益,來維持長久合作關係。個體犧牲短期利益來維持長久合作關係,這種行為型態,其實是小朋友在幼稚園階段,便開始學習的東西:學習分享與輪流承擔。透過非合作賽局模型,Aumann(或與合著人)在一系列文章:(1)視長期目標型式而定,建立那些結果會、那些不會成為均衡點;(2)對均衡點做進一步的釐清,是否是Nash均衡點或更強、是否是完美均衡點;(3)對模型的結構參數,例如,參賽人數、對方動作的可觀測性、互動頻率、訊息完整性的層次、參賽人的計算能力等等,進行系統性分析。

  破產賽局問題,是Aumann(與合著人M.J. Maschler)最廣為人知的作品︰有n個權益請求者,各持有權益價值 (i=1,2,…,n),而可分配價值 不足時,如何公平分配呢?Aumann與 Maschler提出一分配規則,並證明該分配解是n人合作賽局的核仁。該分配規則,將猶太經典(Talmud)記載的一則對兩人爭分衣服實例所提出的分配法,推廣至n人情況,在爭分衣服實例中,一人(甲)持有1/2、另一人(乙)持有全部,該如何公平分配呢?猶太傳教士Shlomo Titzhaki提出的分配法如下:對乙而言,1/2是屬於非爭分部分,這部分應全歸乙,剩下的1/2是屬於兩人爭分部分,這部分平分,所以甲分得1/4而乙分得3/4。Aumann與Maschler的分配法如下︰若可分配值小於權益總值的一半,依等所得原則分配,但每人可分得的上限為 ;若可分配值等於權益總值的一半,則每人各分得 ;若可分配值大於權益總值的一半,每人先分得 ,剩餘再依等損失原則分配。

  核(Core)與核仁(Nucleolus)是n人合作賽局的兩個重要解觀念,結盟的誘因有兩種︰經濟與公平。在核中的任一解,n人聯盟沒有瓦解成任一次聯盟的經濟誘因,而核仁是核中的一個公平解,核仁所根據的分配思維,是讓一個群體中最不幸成員的幸福極大化,若有多重選擇時,再次使不幸成員的幸福極大化,依此類推,直到找出一個解。這裡所指的成員是n人聯盟中的任一個次聯盟,不包括n人聯盟本身及空集合,共有 個成員。

  Schelling獲獎,主要是因他的一本專書”The Strategy of Conflict”(哈佛大學出版,1960),這本書對於衝突(conflict)、承諾(commitment)、協調(coordination)的觀念剖析與洞察力(insights),貢獻顯著,尤其是在嚇阻(deterrence)與武器競賽的應用上。這本書沒有使用高深的賽局理論,而是以討論的方式進行,至多使用兩人非合作賽局的(2×2)報酬矩陣來分析,例如膽怯(Chicken)範例,由於該書的數學障礙低,讀者群廣泛,影響深遠。膽怯範例是說:兩位參賽者,在一條雙線路寬、中間沒有分隔線的道路,各自沿著路中間、高速迎面而來,這時雙方各有兩個選項:讓(閃到路邊)或不讓(沿路中間繼續高速前進);膽怯範例又稱鷹鴿(Hawk-Dove)範例,當兩個團體面對衝突時,各自都有兩個選項:鷹派或鴿派做法。該書至少有三點貢獻:(1)在侵略與嚇阻情境,借助膽怯賽局範例,Schelling說明,面對可能侵略時,承諾反擊的能力若可信,將有嚇阻效果,尤其該反擊兌現的機率很高時,效果更好;(2)面對複雜且棘手的(兩造合議)議題時,Schelling討論如何,經由一次邁進一步的方式(實質與時間上)有效地化解該爭議;(3)當協調使得上力時,Schelling的聚焦點(focal point)思維,是一種便利工具,在某些情境下,有時能解決多均衡點的問題。

  由於Aumann是應用數學家,而Schelling是政治學者,兩人不論在背景、研究作品的性質上差異都很大,人們好奇地問Schelling︰你們兩個人同時獲獎,中間的關連在那裡呢?Schelling回答:提名委員將我們倆個人連結在一起,因為Aumann是賽局理論的生產者,而我是使用者。

 

賴聰乾小檔案

  現任臺大工商管理系暨商學所教授。1960年次,18歲前住在嘉義,之後6年,在(早期)人煙稀少的清大校園,過著有些與世隔絕的生活,服完預官後,猶豫該去約翰霍普金斯大學數學科學系、UCLA電機系、或史丹福大學工業工程系(現併入管理科學與工程系)攻讀博士,後來選了史丹福,轉眼結束5年如夢幻般的校園生活,旋即在本校工商管理系暨商學所任教迄今,期間(1998至1999)在麻省理工學院作業研究中心客座一年。目前的研究重點是,使用穩定度方法來處理不確定下最適資源配置,另一方面,隨著年齡增長,對管理與決策思維的研究漸感興趣。

 

小百科:賽局理論

  • (一)由來︰

賽局理論(Game Theory)的正式展開,始於”Theory of Games and Economic Behavior”這本書(by John von Neumann and Oskar Morgenstern, 1944),初期以普林斯敦大學為研究重鎮、交流中心及人才孕育搖籃,並逐漸擴散開來。主要有(1)合作(Cooperative)與(2)非合作(Non-cooperative)賽局理論兩大分支,1980年代為其成長爆發期,1994年首度獲頒諾貝爾經濟獎、2005年再度獲獎,其應用理論(機制設計理論)更於2007年獲獎。其他分支還有:(3)演化(Evolutionary)賽局理論:源自Maynard Smith & Price(1973)刊登在Nature期刊的一篇文章”The logic of animal”。(4)行為賽局理論:探討真實參賽者如何玩賽局,有實驗賽局(在實驗室進行)與實證賽局(在實際情境進行)。(5)演算與人工賽局理論:探討活參賽者(或有計算能力的機器)的賽局複雜度議題(例如計算、訊息、行為複雜度)。(6)互動知識論(Interactive Epistemology):探討互動知識,包含對知識的知識,例如甲知道X、乙知道甲知道X、甲知道乙知道甲知道X、…。(7)組合賽局:探討賽局獨特的數學議題。(8)非貝氏(Non-Bayesian)決策理論︰在放鬆或取代傳統理論的貝氏假設下,探討不確定性下的決策。(9)賽局神經研究︰探討人在玩賽局時的生理活動。此外,還有應用上述賽局工具,處理經濟、政治、管理方面的賽局。

 

  • (二)n人非合作賽局模型、觀念、範例︰

(1)模型︰各參賽者 各有 個(策略)選項,令 表參賽者 的選項,參賽者 的報酬為 ,令 (其中 為非負且和為1)表參賽者 的策略,亦即,參賽者 的策略代表其在 個選項間的機率配置(和為1的配置比重),如何決定各參賽者的策略呢?

(2)觀念︰Nash均衡解(點)(Nash Equilibrium)與完美均衡解(Perfect Equilibrium)是非合作賽局的兩個基本解觀念。Nash均衡解的定義(Nash 1950)︰任一參賽者在知道其他各參賽者的策略後,也不更改其策略。完美均衡解的定義(Selten 1975),對一般讀者而言不易消化,簡言之︰在Nash均衡解中,那些不會被明顯比下去而有可能被採用者。

(3)範例1︰(阿公卜煮鹹阿媽卜煮汫(煮鹹煮淡)賽局)Ann 與Bob是一對情侶,工作(課業)之餘,希望能在一起又能have fun,傷腦筋的是,Ann(參賽者1)很喜歡聽音樂會而Bob(參賽者2)卻興趣缺缺、Bob很喜歡看球賽而Ann卻興趣缺缺,怎麼辦呢?Ann與Bob各有兩個選項︰聽音樂會(選項1)、看球賽(選項2)。Ann與Bob的各自(效用)報酬,可用一個2×2矩陣AB分別來表示如下︰

    

如果兩人一起聽音樂會,Ann與Bob的效用分別是4, 1;一起看球賽,效用分別是1, 4;其他不在一起的組合,效用皆為0。有三個Nash均衡解︰ ,即兩人總是去聽音樂會,Ann的期望報酬是4而Bob是1; ,即兩人總是去看球賽,Ann的期望報酬是1而Bob是4; ,即Ann配置4/5聽音樂會、1/5看球賽,而Bob配置1/5聽音樂會、4/5看球賽,Ann與Bob的期望報酬皆為4/5(=4/5×1/5×4+1/5×4/5×1)。其中,第三個解,雖不具效率性(因是非合作賽局,這種情況存在),但不是明顯被比下去,所以三個仍都是完美均衡解(當然Ann與Bob之間有約束力的話,第三解會被排除)。完美均衡解並沒有明確告訴Ann與Bob該採用三個中的那一個,試想︰Ann可能會試圖讓Bob總是去聽音樂會,而Bob也可能會試圖讓Ann總是去看球賽,或雙方採用不具效率性的折衷解,這仍待當事人進一步去傷腦筋。”唯一解”這個問題,至今仍困擾著人類!

(4)範例2︰考慮下列兩人賽局(各有兩個選項)

  

   有兩個Nash均衡解︰兩人皆採用選項1、兩人皆採用選項2。前者明顯被後者比下去,所以前者不是完美均衡解。

(5)範例3︰(膽怯(Chicken)賽局;又稱鷹鴿賽局)兩位參賽者,在一條雙線路寬、中間沒有分隔線的道路,各自沿著路中間、高速迎面而來,這時雙方各有兩個選項︰(選項1)讓(閃到路邊)、(選項2)不讓(沿路中間繼續高速前進),各自報酬矩陣如下︰

  

矩陣AB為對稱,其中,相讓的報酬為0(互不吃虧)、互不讓為-109(兩敗慘傷)、己讓對方不讓為-10(不滿對方霸道)、己不讓對方讓為1(占便宜或不讓霸道得逞)。有三個Nash均衡解︰己讓對方不讓、己不讓對方讓、各配置99/100於讓1/100於不讓。在侵略與嚇阻情境,面對可能侵略時,為何承諾反擊的能力若可信,將有嚇阻效果,尤其該反擊兌現的機率很高時,效果更好呢?因其中之一個均衡點是己不讓對方讓,所以只要讓對方越相信我方會採用”不讓”,對方就會越採用”讓”。

(6)範例4︰(囚犯困局)兩個罪嫌被檢察官隔離問訊,兩罪嫌各有兩選項︰認罪(選項1)與不認罪(選項2),令各自報酬(被求處年)矩陣如下︰

   

只有一個Nash均衡解︰雙方都認罪(各被求處5年)。雖然雙方都不認罪(各被求處1年)是對兩罪嫌最好的結果,但由於怕被陷害(一方認一方不認,不認的一方被加重求處,而認的一方免被求處),故該解無法形成均衡解,兩罪嫌只好在檢察官的誘因機制設計下認罪。

(三)n人合作賽局模型、觀念、範例︰

(1)模型︰給定任一聯盟(結盟) 的價值 ,其中 ,如何將全聯盟的價值 公平分配給每位參賽者呢?令 表參賽者i的分配值,其中, 。

(2)觀念︰核(Core)、核仁(Nucleolus)、Shapley value是合作賽局的三個基本解觀念。核的定義(Gillies 1959)︰對任一次聯盟 (不含全聯盟及空集合),其分配總值必須大於等於其聯盟價值,亦即, 。核是一個解集合的觀念,它不一定存在,如果存在,核中的任一解,皆有經濟誘因形成全聯盟(因為任一次聯盟的分配總值大於等於其價值,任何次聯盟都不會形成)。核中有多個解時,該如何挑選呢?核仁便是核中的一個公平解,核仁的定義(Schmeidler 1969)︰核仁所根據的分配思維,是讓最不幸成員的幸福極大化,若有多重選擇時,再使次不幸成員的幸福極大化,依此類推,直到找出一個解,這裡所指的成員是任一個次聯盟(不包含全聯盟及空集合),共有 個成員。Shapley value 的定義(Shapley 1953)︰參賽者的貢獻以邊際貢獻來衡量,n個參賽者共有n!排序,一個參賽者的分配值為其在n!排序的平均邊際貢獻,在一排序中,令S(可為空集合)表排在參賽者i前面的所有參賽者,則參賽者i在該排序的邊際貢獻為 。

(3)範例5︰三公司擬成立聯合作業中心,其中,各公司(1, 2, 3)如單獨成立,其成本分別為11, 8, 7,公司1, 2聯合成立的成本為14,公司1, 3的聯合成本為15,公司2, 3的聯合成本為13,公司1, 2, 3的聯合成本為20,三公司如何公平分攤成本呢?首先,將該問題表成3人合作賽局模型︰ , (因獨資沒節省成本), (公司1, 2如聯合成立,成本可節省5,因5=11+8-14),     。核為下列六個不等式及一個等式所圍成的區域︰

各6成員(次聯盟)的幸福值為其分配總值扣掉其聯盟價值,由於成員{3}與{1,2}的幸福值和1為最小,最不幸發生於此,平分,各得0.5之幸福值,故成員{3}之分配值為0.5(=0+0.5)而成員{1,2}的分配總值為5.5(=5+0.5),接下來,將5.5分配給{1}與{2},由於成員{1,3}與{2,3}的幸福值和1.5(=6.5-5, 因 )為最小,最不幸發生於此,平分,各得0.75之幸福值,故成員{1}與{2}之分配值分別為3.25, 2.25。因此,核仁為 ,亦即,成本各分攤7.75 (=11-3.25), 5.75, 6.5。參賽者1,2,3在6個排序123, 132, 231, 213, 312, 321的邊際貢獻分別為 (0, 5, 1), (0, 3, 3), (4, 0, 2), (5, 0, 1), (3, 3, 0), (4, 2, 0),故參賽者1,2,3的平均邊際共獻(Shapley value)分別為8/3, 13/6, 7/6,如下表所示︰

123 0 5 1
132 0 3 3
231 4 0 2
213 5 0 1
312 3 3 0
321 4 2 0
平均 8/3 13/6 7/6

亦即,根據Shapley的分配思維,成本各分攤25/3, 35/6, 35/6。

發表迴響

你可以使用 HTML標簽

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>