7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf ·...

38
7장: 게임이론 게임이론? 동시게임 우위전략 내쉬균형 순차적 게임 제로섬게임과 최대최소정리

Transcript of 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf ·...

Page 1: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

7장: 게임이론

게임이론?

동시게임

우위전략

내쉬균형

순차적 게임

제로섬게임과 최대최소정리

Page 2: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

입지선택 게임

어떤 신도시에 A와 B지역, 두개의 상권이 있다. 경쟁업체인 M과 L은, 각각,둘 중 한 곳에 햄버거 체인점을 열려고 한다.

A와 B지역 인구는 각각 10만과 5만이다. 현재 M과 L 햄버거의 선호도는 7대3이다.

두 업체는 각각 어느 지역으로 진출하는 것이 최선일까?

Page 3: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

입지선택 게임 (계속)

M과 L을 게임참가자(player)라고 한다.

M과 L은 각각 {A, B}라는 대안집합을 가지고 있다.

M과 L의 의사결정은 상호 영향을 준다 : M과 L의 선택 조합이 두기업의 성과(payoff)를 결정한다.

오른쪽과 같은 성과표를 사용하면 입지선택게임의 성과구조를 표현할 수 있다.

이러한 상호성을 고려하여 선택한 최선의 대안을 전략(strategy)이라고 하고 그 조합을 균형이라고 한다.

3

7M

L

A

A B

B

Page 4: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

게임이론의 역사

게임이론은 1944년 폰 노이만과 모겐스턴의 The theory of games and economic behavior으로 본격적으로 시작되었다. 제로섬 (zero-sum)게임, 협력 (cooperative)게임.

1950년대 초의 내쉬균형(Nash Equilibrium) - Nash, Shapley, Harsanyi, ... .

사회과학, 생물학, ..., 교통공학, 계산과학

어떤 시스템이, 단일 관리자에 의하여 통제되는 것이 아니라, 각자 목적을 가진 다수에 의하여 운영되거나 사용되는 상황이라면, 이를 가장 잘 모형화하는 수단은 게임이론이 될 것이다.

“인터넷은 균형이다. 우리가 할 일은 그 게임이 무엇인지 밝히는 것 뿐이다.”- 스캇 쉔커(Scott Shenker)

Page 5: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

2인 게임, 3인 게임, ... .

동시게임 - 참가자들이 사전에 정한 전략을 변경하지 않고 실행하여 게임 성과를 거둔다고 가정. 순차적게임 - 참가자들이 번갈아 가며 수를 쓴다고 가정. 일련의 수가 전략을 결정.

완비게임 - 참가자들이 게임의 구조, 즉, 참가자, 가능한 수, 성과 등을 모두 알고 있는 게임 (예: 포커게임). 그렇지 못한 게임을 불완비게임이라고 한다.

완전정보게임 - 각 수를 쓸때, 그 전까지의 게임의 전개 과정(다른참가자들이 쓴 수)을 모두 알수 있는 게임 (예: 바둑). 불완전정보게임- ... (예: 포커게임).

제로섬게임 - 참가자들의 성과가 완전히 대립되는 게임. 2원소행렬게임 (bimatrix game) - 제로섬이 아닌 2인게임

게임모형의 분류

Page 6: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

동시게임게임의 참가자들이 게임 시작에 정한 전략을 게임의 끝까지 변경하지 않고 실행하여 성과를 거두는 게임.

게임의 전개과정을 고려하지 않는 단순화된 모형으로 생각할 수 있다. - 게임 참가자들이 전략을 동시에 실행한다고 생각할 수 있다.

2인 동시게임은 앞의 입지선택게임과 같이 2원소행렬(bimatrix)로 그 성과구조를 표현할 수 있기 때문에 2원소행렬 게임이라고 부른다.

Page 7: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

우위전략

게임참가자 I의 어떤 전략 s가, 다른 게임참가자들이 어떠한 전략을 선택하는 경우에도, I에게 가장 큰 성과를 주면, s를 I의 우위전략(dominant strategy)이라고 한다.

우위전략을 가진 참가자는 그 전략을 선택하는 것이 최적이며, 다른 참가자들은 이러한 가정에서 각자의 최적전략을 선택할 수 밖에 없다.

따라서 2인 게임에서 우위전략이 두 참가자 중 한 사람에게 존재하면 게임의 균형은 쉽게 구할 수 있다.

Page 8: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

우위전략 (계속)삼성과 LG는 `블루레이 디스크 대 HD-DVD 디스크'로 대표되는 차세대 미디어 표준 경쟁에 참가하려고 한다. 시장조사 결과 국내 블루레이와 HD-DVD의 수요 규모는 각각 연간150만 장, 50만 장으로 추산되고 있다.

두 회사가 서로 다른 미디어에 투자할 경우 해당 수요를 독점할 수 있다. 그러나 같은 미디어에 투자할 경우, 수요를 반반씩 나눌것으로 예상한다.

두 회사는 각각 어떤 미디어에 투자할 것인가?

75 50

75 150

150 25

50 25

S

L

B

B H

H

Page 9: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

우위전략 (계속)

기술 선점을 위하여 삼성은 블루레이 관련 기술을, LG는 HD-DVD 관련 특허를 사전에 구입하였다.

이 특허 때문에 삼성이 HD-DVD 분야에 진출할 경우 LG에 수익의 40%의 로열티를 지불해야 하고, LG가 블루레이 분야에 진출할 경우에는 삼성에게 수익의 40%를 지불해야 한다.

이 경우 양사의 전략은 ?

45 50

105 150

110 35

90 15

S

L

B

B H

H

Page 10: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

우위전략 (계속)죄수의 딜레마 - 범죄의 용의자인 A와 B가 검거되었다. 검사는 모두 공범으로 판단하고 있다. 범행이 밝혀지는 경우, 형량은 최소 5년이지만, 용의자의 자백이 관건이 된다.

두 사람 모두 침묵을 지키면, 증거확보가 어려워 2년을 넘는 형을 받을 가능성은 없다.

검사는 A와 B를 다른 방에 놓고 이야기 한다. “둘다 자백을 한다면, 협조 한것을 참작 최소형량 5년을 구형할 것이다. 하나만 자백을 할 경우, 그의 형량은 유죄협상(plea bargain)에 의거 1년으로 낮추겠지만, 자백을 거부한 사람은 10년을 구형한다.

두 용의자는 어떠한 선택을 하게 될까?

-5 -10

-5 -1

-1 -2

-10 -2

A

B

자백

자백

묵비

묵비

Page 11: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

우위전략 (계속)Vickrey auction - 주파수 대역 같은 공공 인프라를 경매할 때, 공익에 부합하는 낙찰자를 선정하는 것은 중요하다. 이러한 목적에 맞도록 경매 규칙을 설정할 수 있다. 이를 게임설계 문제라고 한다.

참여자들이 입찰가를 한번 제시하고, 낙찰자를 결정하는 경매를 생각하여 보자. 경매물은 입찰자 i에게 v_i의 가치가 있으며, p_i를 지불하면 v_i-p_i의 이익을 얻는다 하자.

가장 큰 입찰가를 낸 참가가에게, 그 금액을 받고 경매물을 파는 최고입찰가 방식은 우위전략이 존재하지 않는다. 상대의 입찰가에 따라 나의 입찰가가 달라지기 때문이다.

이에 비해 빅커리 경매는 가장 큰 입찰가에 낙찰을 주지만, 두 번째로 높은 입찰가와 동일한 가격을 받는다.

각 입찰자 i는 경매물에 대한 자신의 가치 v_i를 입찰가로 쓰는 것이 우위전략임을 보이라. (따라서, 경매물을 가장 가치있게 활용하는 입찰자에게 낙찰된다.)

Page 12: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

내쉬균형2인 게임에서 두 참가자, I과 II가 택하는 전략 조합 순서쌍, (s,t)가 다음을 만족하면 내쉬균형(Nash equilibrium)이라고 한다.

I이 s를 선택한다면, t가 II에게는 최선의 전략이다.

II가 t를 선택한다면, s가 I에게는 최선의 전략이다.

다시 말하면 내쉬균형이란 어떤 참가자도 자기 혼자 전략을 바꿀 동기가 없는 전략 조합을 말한다. 이러한 의미에서 내쉬균형은, 일단 달성되면, 안정적으로 유지되는 전략 조합이라고 할 수 있다.

내쉬균형이 우위전략의 개념을 포함한다는 것을 보여라. 즉, 우위전략의 조합은 내쉬 균형임을 증명하라.

Page 13: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

내쉬균형 (계속)

성의 대결(battle of sexes) - 영희와 철수는 캠퍼스 커플이다. 주중에는 학업에 매진하고 금요일 저녁에 데이트를 한다. 그런데 영희는 야구광, 철수는 재즈팬이다.

어느 금요일, 철수는 재즈 베이스 주자 레이브라운의 콘서트 표 두 장을, 영희는 한국시리즈 결승전 표 두 장을 들고 강남역에서 만났다. 이날 둘의 운명은?

1 -2

0 -2

-1 0

-1 1

철수

영희

야구

야구

재즈

재즈

Page 14: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

내쉬균형 (계속)

비둘기-매 게임(hawk-dove game) - 어떤 종은 두 가지 생존전략이 있다. 첫째 `매'(hawk)가 되는 것이다. 상대를 만나면 전력을 다해 싸우며, 한 쪽이 심각한 상처를 입으면 끝난다. (이 때 -100의 성과가 있다고 하자.)

둘째, `비둘기'(dove)가 되는 것이다. 매를 만나면 즉시 피하여 진다. 같은 비둘기를 만나면 싸우게 되는데, 극단적인 폭력을 피하는 방식이기 때문에 이기든 지든 양쪽 모두 -10의 성과가 발생한다.

비둘기 혹은 매끼리 싸울 때 승률은 1/2이라고 하자. 싸움 자체에서 발생하는 성과와는 별도로, 싸움에 이기면 50, 지면 0의 성과를 얻는다.

비둘기-매 게임은 다음과 같은 성과표로 나타낼 수 있다.

15 50

15 0

50 -25

0 -25

I

II

비둘기

비둘기

Page 15: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

라우팅게임교통 네트워크의 각 출발-목적지 쌍 (s, t)의 복수개의 s-t 경로가 존재한다고 하자. (경로 대신 ‘연결’(connection)이라는 용어를 사용하기도 한다.)

각 경로마다 통행 비용이 존재하고, 통행자들은 각자 비용이 최소가 되는 경로를 선택한다고 하자. 이를 ‘selfish routing,’ 즉 개별적 라우팅이라고 한다. 통행자들의 개별적 라우팅이 전체 네트워크의 통행 흐름을 결정한다.

역으로, 통행량은 또한 경로의 비용을 결정하는 요인 중에 하나이다. 비용 요인 중에는 통행시간, 환승의 편의성, 요금 등도 존재한다.

통행량이 특별한 점은, 이를통해 통행자들의 경로선택이 상호 영향을 준다는 것이다. 즉, 경로선택 문제는 통행자들간의 게임이 된다 - 라우팅 게임(routing game)이라고 한다.

따라서, 각 경로의 통행량은 라우팅 게임의 균형이 된다.

Page 16: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

연속흐름 라우팅게임라우팅게임의 참가자 수가 크면, 각 통행자를 개별 참가자로 반영하는 모형은 크기가 너무 커서 효율적 분석이 불가능하다. 예를 들어, 서울광역지역 15개 노선 지하철 통행 횟수는 1일 700만건을 넘는다.

이러한 경우, 통행자들을 집합적으로 반영하는 연속흐름 모형을 사용할 수 있다. 기본 구성은 다품종흐름네트워크를 사용한다.

출발-도착지 쌍, 통행자들을 개별적으로 구별하지 않고,크기 를 가진 연속흐름으로 모형화한다. i = 1, ..., m.

각 i 에 대해 를 연결하는 경로의 집합을 로 표시하고, 이에 속한 각 경로 를 선택한 승객 흐름의 크기를 로 표기한다.

전체 승객의 통행 경로 선택은, 따라서, 다음과 같이 표현할 수 있다.

네트워크 각 호 의 비용은 총 흐름 의 함수 로 가정한다.

경로 P의 비용은

PiP 2 Pi fP

si � ti

si � ti

ri

f = {fP |P 2 Pi, i = 1, . . . ,m}

e 2 E fe =P

P3e fPce(fe)

cP =P

e2P ce.

Page 17: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

연속흐름모형의 예

연속흐름 라우팅게임 (계속)

Page 18: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

피구의 예 - 그림의 s에서 t까지 r = 1이라는 통행 수요가 있다. 두개의 s-t 경로가 있으며, 위 경로의 단위 흐름 당 비용은 흐름량 f에 관계없이 c(f) =1, 아래 경로는 c(f)=f이다. 예를 들어, 위 경로는 멀어 비용이 높지만 용량이 커서 통행량의 영향을 받지 않고, 아래 경로는 짧지만 용량이 제한적이어서 통행량에 비례하여 단위 비용이 증가한다.

연속흐름 라우팅게임 (계속)

Page 19: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

피구의 예 (계속)- 시스템 전체 비용을 최소화하는 시스템 최적해를 먼저 구해보자. 아래 경로의 통행량을 x라고 하면, 두 경로에서 발생하는 총비용은 (1-x) + x^2 따라서, 최적해는 x* = 1/2가 되고 비용은 3/4이 된다.

연속흐름 라우팅게임 (계속)

지하절 네트워크라면 시스템 최적해를 달성할 수 있을까?

Page 20: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

워드롭균형- f를 수요를 모두 만족하는 가능흐름이라고 하자. f가 다음 조건을 만족하면 워드롭 균형이라고 한다. 모든 i = 1, ..., m에 대해, 임의 두 s_i-t_i 경로 에 대해 다음 조건이 성립한다 :

사용하고 있는 경로의 비용은 모두 대안 경로보다 비용이 크지 않기 때문에 어떤 통행자도 독자적으로 경로를 바꿀 동기가 없는 흐름. 내쉬균형의 연속흐름 버전이라고 할 수 있다.

연속흐름 라우팅게임 (계속)

fP > 0 ) cP (f) cP 0(f).

P, P 0 2 Pi

Page 21: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

피구의 예(계속)- Public transport와 같이 개별라우팅이 이루어지는 경우는 라우팅게임의 균형을 구해야 한다.

연속흐름 라우팅게임은 각 통행자를 극소흐름으로 생각한다. 아래 그림에서 f<1이면 아래의 경로의 비용이 더 작다. 따라서 모든 통행수요를 아래의 경로를 사용한다.

연속흐름 라우팅게임 (계속)

따라서 균형에서 모든 수요는 아래의 경로를 사용한다. 그 때 발생비용의 합은 1이다.

방임의 댓가(Price of anarchy)= 균형비용/시스템최적비용

Page 22: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

브레이스의 역설(Braess’s paradox)-왼쪽 네트워크의 균형을 구해보자. 두경로 P, Q의 단위 비용이 같기 때문에, 각각 1/2의 흐름이 균형이 된다. 총 발생 비용은 3/2이 된다.

마디 u에서 v까지 단위비용 0인 더 효율적인 도로를 건설한다. 새경로 R은 항상 P, Q보다 단위비용이 작기 때문에, 새로운 균형에서는 R에 1의 수요가 몰린다. 이때 경로 R의 단위 비용은 2가 되어, 총 비용 2가 발생한다.

연속흐름 라우팅게임 (계속)

개별라우팅을 하는 네트워크에서는 더 효율적인 도로건설이 더 많은 비용을 발생시킬 수 있다.

Page 23: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순수전략과 혼합전략

단일대안으로 구성된 전략을 순수전략(pure strategy)라고 한다. 앞에서 고려한 전략들은 모두 순수전략이었다.

순수전략 중에는 내쉬균형이 존재하지 않을 수 있다.

순수전략을 확률적으로 섞어서 구사하는 전략을 사용하면 내쉬균형을 항상 찾을 수 있다. 이러한 전력을 혼합전략(mixed strategy)라고 한다.

Page 24: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

승부차기-단순함을 위하여 차는 쪽과 막는 쪽의 전략은, 각각 왼쪽과 오른쪽 두가지이며 차고 막는 방향이 다르면 득점이 되고, 같으면 그렇지 않다고 가정하자.

게임의 성과는 오른쪽과 같다.

순수전략을 사용하는 내쉬균형이 존재하지 않는다.

1 -1

-1 1

-1 1

1 -1

키퍼R L

순수전략과 혼합전략 (계속)

R

L키커

Page 25: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

승부차기(계속)-키커가좌 우 두개의 전략을 x 그리고 1-x 비율로 무작위로 섞는 전략을 생각해보자.

이때 키퍼가 좌우로 대응할 경우, 그의 기대값은 가각 2x-1, -2x+1이 된다.

키커의 최선의 전략은 좌우를 반반씩 섞는 것이다. 이때 키퍼는 좌우 모두 최선이 된다.

따라서 양편 모두 좌우를 반반씩 섞는 것이 내쉬균형이 된다.

1 -1-1 1

-1 11 -1

키퍼L R

순수전략과 혼합전략 (계속)

L

R키커

Page 26: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

진화적 안정전략-앞의 비둘기-매 게임을 약간 수정해보자.

어떤 한 개의 종 (species)이 유전적으로 두 가지 생존 경쟁 전략 중 하나를 가지고 태어난다고 하자.

이 경우, 장기적으로 이 종에서 비둘기와 매의 형질의 비율은 얼마나 될지다음과 같은 과정으로 계산하여 보자.

(1) 모든 구성원이 매인 경우, 싸움에서 얻는 기대값은 얼마인가? 이 때 돌연변이 비둘기가 하나 태어났다고 하자. 이 비둘기의 유전자는 멸하게 될 것인가?

(2) 모든 구성원이 비둘기인 경우에 대해 같은 질문에 대해 답하라.

(3) 장기적으로 이 종에서 매와 비둘기 형질 비율은 얼마가 될까? 왜 그런지설명하라. (힌트: 비둘기-매 게임에 대칭적인 혼합전략 내쉬균형이 있는지 찾아보라.)

(4)* (3)의 비율이 한번 달성되면, 다른 비율로 균형이 바뀌지 않는 것을 보여라. 구체적으로 말해, 이 비율을 p*라고 하면, p*에는 p*로 대응하는 것이 최적이며, 어떤 다른 비율 p에도 p*로 대응하는 것이, 같은 p로 대응하는 것보다 성과가 더 크다는 것을 보여라.

순수전략과 혼합전략 (계속)

Page 27: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임순차적게임은 전개과정을 고려하는 게임의 모형이다. 게임참가자들은 상대의 수를 보고 나의 수를 결정한다. 미리 정해진 횟수의수를 다 쓰거나, 특정 성과가 나오면 게임은 종료된다.

쉽게 생각할 수 있는, 순차적게임의 예로는 바둑, 장기, 체스, 틱택토등이 있다. 그러나, 앞의 동시게임과 마찬가지로 순차적 게임은 다양한 맥락에서 발생한다.

순차적게임은 그 특성 때문에 그 균형이 매우 자연스럽게정의되는 것을 볼 것이다. 좀더 구체적으로 말하면, 각수를 위한 대안집합이 유한한 경우, 역귀납법을 사용하여 그 균형을 구할 수 있다.

Page 28: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)

틱택토(tic-tac-toe)- 2인게임. 참가자들은 각각 과 중 하나를 미리 선택하여, 그림과 같이 3x3 칸 중 빈칸 하나씩 선택하여 번갈아 쓰는 게임이다.

같은 기호로 가로, 세로, 혹은 대각선으로 한 줄을 먼저 만들면 이긴다.

틱택토는 게임나무로 완전하게 묘사할 수 있다.

� ⇥

Page 29: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)

Page 30: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)게임나무 - 각수를 위해 선택 가능한 대안의 수가 유한한 경우, 순차적 게임은 나무로 표현할 수 있다. 각 참가자가 수를 써야 하는 순간을 마디로 표현하고, 선택 가능한 대안에 호를 하나 씩 대응시킨다. 그리고 게임이 끝나는 순간의 성과, 즉 승패를 해당 마디에 적는다.

편의를 위해, 다음과 같이 게임이 전개된 시점부터 시작하는 게임을 생각하여 보자. (원래 게임의 부분게임(subgame)이라고 한다. )

Page 31: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)순차적게임의 전략- 틱택토 게임처럼 그 전개과정을 완전하게 알 수 있는 완전정보 순차적게임에서는, 각 참가자가 수를 쓰는 모든 시점에서, 그 때까지 게임의 전개과정을 반영할 수 있다.

따라서 각 참가자의 전략은 해당 참가자가 수를 쓰는 가능한 시점들의 대안들을 모두 명시해 주어야 완성된다.

예를들어 앞의 게임에서 참가자 A의 가능한 전략은 세개이다 :

B의 전략은 다음과 같다 :

(a, d, e, f, g), (b, d, e, f, g), (c, d, e, f, g).

(u,w, y), (u,w, z), (u, x, y), (u, x, z),(v, w, y), (v, w, z), (v, x, y), (v, x, z).

Page 32: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)

역귀납법(backward induction)- 순차적 게임의 게임 나무를 사용하면 게임의 결과 마디들로부터 게임의 시작 마디까지 수를 역으로 추론하면 각 참가자의 최선의 전략을 찾아 게임의 균형을 찾을 수 있다. 이를 역귀납법이라고 한다.

역귀납법은 게임나무의 게임 종료 마디들로 부터 시작 마디로 거슬러 올라간다. 즉, 한 마디의 분석을 위해서는 그 이후의 수를 나타내는 마디들을 먼저 분석해야 한다.

한 마디의 분석은 그 시점에서 해당 참가자가 각 대안을 선택했을 때 발생하는 성과를 바탕으로 최선의 대안이 무엇인지를 정하는 것을 말한다.

역귀납법으로 구한 균형을 부분게임완전균형 (subgame perfect equilibrium)이라고 한다.

앞의 예에 역귀납법을 적용하여 보자.

Page 33: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)역귀납법 (계속) - 게임 종료 직전 A가 수를 쓰는 시점인 세번째 단계 마디들을 보자. 쓸 수 있는 대안이 유일하기 때문에 최적이다. 해당하는 게임성과를 마디에 표시하였다.

이제, B가 수를 쓰는 시점인 두번째 단계 마디 분석이 가능하다. 가장 왼쪽 마디를 예로 보자. 유향호로 표현한 가능한 두 대안 중 첫째를 선택하면 A가, 앞에서 분석한대로, 자신의 승리가 되도록 수를 쓴다. 두번째는 무승부로 이어진다. 따라서, B는 두번째 수를 쓰는 것이 최선이다.

선택하지 않는 왼쪽 호를 두 줄로 자르고, 선택하는 호를 굵게 표시하였다. 그리고 해당 게임성과를 호 옆에 표시한다.

Page 34: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)역귀납법 (계속) - A가 게임을 시작하는 가장 윗 단계 마디의 분석이 가능하다. 선택할 수 있는 세개의 대안 중, 첫번째를 선택하면 무승부가 되고, 이는 패배로 이어지는 나머지 두개의 대안보다 낫기 때문에, 첫번째 호를 굵은 선으로 표시하여 나머지는 두줄로 잘라내었다.

오른쪽 그림은 부분게임완전 균형을 보여준다. 해당하는 전략조합은 다음과 같다 :

균형에서 게임의 성과는 무승부가 된다. (게임값이라고 부르기도 한다.)

이 균형이 내쉬균형임을 보여라.

⇣(a, d, e, f, g), (v, w, y)

⌘.

Page 35: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)진입게임 - 기업 I은 현재 한 산업 분야에 진입할 것을 고려하고 있다. 이 분야에는 현재 기업 II가 독점적인 지위를 누리고 있다.

기업 I이 진출을 하는 경우, 기업 II는 두가지의 선택이 있다. 첫째, 이를 받아들이고 시장을 나누는 것이다. 둘째, 치열한 가격경쟁을 하여 기업 I과 싸우는 것이다.

이 상황을 순차적게임으로 모형화하면 다음과 같다.

Page 36: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)진입게임 - 역귀납법을 적용하여 균형을 구하면 기업 I은 진출하고, 기업 II는 이를 용인하고 시장을 나누는 것이다.

진입게임을 동시게임으로 모형화해 보자.

두개의 내쉬균형이 존재한다. {(진입, 용인), (포기, 가격전쟁)}

이 균형들이 모두 현실적인지 논하라.

1 0

1 -1

2 2

0 0

I

II

진입

포기

용인 가격전쟁

Page 37: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)

강령(platform)의 선택 - 양당 제도가 정착된 소인국. 자유당과 사회당이 선거를 대비하고 있다.

선거에서 중요한 일 중 하나는 정당이 정치적 강령을 밝혀 비슷한 이념 성향을 가진 유권자들의 표를 끄는 것이다.

편의상유권자들의 이념적 스펙트럼은 ‘극좌’에서 ‘극우’까지 고르게 분포되어 있다고 가정하자. 극좌에 0, 극우에 1을 대응시키면, 유권자들의 이념 분포는 이들을 끝점으로 하는 구간으로 나타낼 수 있다.

각 유권자는 자신의 성향과 가장 가까운 강령을 가진 정당에 투표한다고 하자. 양 정당은 강령을 구간 어느 점에놓겠는가?

제3의 정당이 창당된다면 3개 정당의 강령은 궁극적으로 어떻게 위치하겠는가?

0 1

Page 38: 7장: 게임이론 - Seoul National Universitypolytope.snu.ac.kr/courses/ms2013/Chap7-Game.pdf · 2013-12-10 · 입지선택 게임 어떤 신도시에 a와 b지역, 두개의 상권

순차적게임 (계속)지네(centipede)게임 - 게임참가자 갑과 을은, 게임나무의 가장 위의 마디부터 아래로, 게임을 계속할 것인지 멈출 것인지를 결정한다. 순서쌍은, 게임을 멈추거나 게임이 끝나는 순간 갑과 을이 얻는 성과를 나타낸다.

역귀납법으로 게임의 균형을 구하라.

이 균형이 우리의 ‘일반적인’ 기대와 일치한다고 할 수 있을까? 현실에서 이런 게임을 한다면 위의 균형대로 나타날까 토론하여 보라.