본문 내용으로 건더뛰기

KDI 경제정보센터

ENG
  • 경제배움
  • Economic

    Information

    and Education

    Center

경제로 세상 읽기
왜 그들은 자백을 했을까?
KDI 2023년 12호 8p

“애덤 스미스는 말했지. 집단에 속한 모든 사람이 자신의 이익을 위해 행동할 때 최선의 결과를 얻을 수 있다고. 하지만 그 설명은 불완전해. 왜냐하면 최선의 결과는 집단에 속한 모든 사람이 자신뿐 아니라 집단의 이익을 위해 행동할 때 얻을 수 있기 때문이지. 애덤 스미스는 틀렸어.”

- 영화 <뷰티풀 마인드> 중 존 내쉬의 대사1)

교육과정
· 중학교 「사회」 경제생활과 선택, 시장과 자원 배분
· 고등학교 「통합사회」 인간과 공동체
· 고등학교 「경제」 경제생활과 경제 문제, 시장과 경제 활동

<뷰티풀 마인드>는 미국의 천재 수학자 존 내쉬(John Nash)의 일대기를 다룬 영화입니다. 내쉬는 학위 논문에서 제시한 ‘내쉬 균형(Nash Equilibrium)’으로 1994년 노벨 경제학상을 받았습니다.2) 영화에는 내쉬가 ‘내쉬 균형’에 대한 아이디어를 생각해 내는 장면이 등장합니다. 그동안 경제학에서는 합리적인 개인, 즉 각 경제 주체가 자신의 이익을 위해 ‘이기적’으로 행동할 때 사회에도 이익을 가져다준다는 애덤 스미스(Adam Smith)의 주장이 폭넓게 받아들여지고 있었습니다. 하지만 내쉬는 애덤 스미스의 이론이 불완전하다고 말합니다. 사람들이 자신의 이익을 위해 최선의 선택을 했지만 사회적으로 최적의 결과를 가져오지 못하는 상황을 발견했기 때문입니다. 각 개인이 최선을 다해 합리적으로 선택했는데 오히려 모두가 불리해진 상황, 내쉬는 이러한 역설적 상황을 분석한 공로를 인정받아 노벨 경제학상을 받았습니다.

1) 대사의 원문은 다음과 같음. “Adam Smith says ‘Best result comes from everyone in the group doing what’s best for himself.’ Incomplete. Because the best result will come from everyone in the group doing what’s best for himself and the group. Adam Smith is wrong.”
2) 내쉬는 미국 경제학자 존 하사니(John Harsanyi), 독일 경제학자 라인하르트 젤텐(Reinhard Selten)과 공동으로 1994년 노벨 경제학상을 수상함.

♦ 게임의 3요소

내쉬의 연구와 업적은 특히 경제학의 한 분야인 ‘게임 이론(Game Theory)’의 발전에 큰 영향을 주었습니다. 경제학에서 게임이라니, 얼핏 생각할 때 관련성이 낮아 보이는 두 단어를 연결 짓기가 쉽지 않을지도 모릅니다. 먼저 많은 사람들이 좋아하는 게임을 떠올려 봅시다. 게임에는 플레이어(Player), 즉 참가자가 있습니다. 각 플레이어는 다른 플레이어를 제치고 게임에서 승리하기 위해 전략을 세웁니다. 상대방의 행동에 따라 게임의 상황이 바뀔 수 있기 때문에 다른 플레이어들이 어떤 전략을 세울지 예측하며 자신의 행동을 결정합니다. 플레이어의 전략과 행동에 따라 게임의 승패가 결정되고, 각 플레이어는 게임의 결과에 따른 보상을 받습니다.

이와 비슷하게 경제학의 게임 이론에도 참가자(Player)와 전략(Strategy), 보수(Payoff)가 있습니다. 참가자는 경제 주체로, 게임에서 어떻게 행동할 것인지 전략을 결정해야 합니다. 참가자들이 선택하는 전략에 따라 각 참가자가 얻게 되는 보상, 즉 보수가 달라집니다. 각 참가자는 자신의 의사 결정이 자신뿐 아니라 상대에게 영향을 미치고, 상대의 의사 결정도 자신에게 영향을 준다는 것을 알고 있습니다. 이처럼 각 참가자의 의사 결정이 서로에게 영향을 주고받는 상황, 그리고 모든 참가자가 그 사실에 대해 인지하고 있는 상황을 게임 상황(Game Situation)이라고 부릅니다. 참가자들은 자신과 상대방의 의사 결정, 그에 따른 게임의 결과를 예측하는 전략적 사고를 해야 합니다. 즉, 게임 이론은 게임 상황에 놓인 경제 주체들의 전략적 행동을 분석합니다.

말장난 같지만 게임 상황을 적절하게 표현하고 있는 문장입니다. 상대의 행동을 예측하고 있는 나의 상황을 상대방이 알고 있고(ㄱ), 나는 상대가 나의 그러한 상황을 고려한 후 의사 결정을 내릴 것이라는 점까지 예측해(ㄴ)전략을 세워야 합니다.

이러한 게임 상황을 우리는 일상에서 자주 만납니다. 예를 들어 축구, 야구 등 각종 스포츠 경기, 가위바위보, 체스, 카드 게임 등은 물론이고 언제 놀이공원에 가야 사람들이 적을지 고민하는 것도 게임 상황입니다. 연휴에 놀이공원에 가려는 사람들은 가능한 한 덜 붐비는 날을 선택하려 할 것이고, 다들 언제가 덜 붐빌지 예측을 하며 ‘눈치 게임’을 하고 있다는 것을 서로 알고 있습니다. 뿐만 아니라 같은 골목에 있는 카페들끼리 손님을 더 많이 모으기 위해 경쟁하는 것, 일부 국가가 수출을 늘리기 위해 외환 시장에 개입해 자국의 통화 가치를 낮추려고 하는 것도 게임 상황입니다. 게임 상황에서 합리적인 경제 주체는 어떤 전략을 선택하고, 어떤 결과를 얻게 될까요?

♦ 당신의 선택은?

‘죄수의 딜레마(Prisoner’s Dilemma) 게임’3)은 게임 이론에서 가장 많이 다루는 사례입니다. 죄수의 딜레마 게임에서 설정하는 상황은 다음과 같습니다

이 게임에서 참가자는 A와 B입니다. 참가자가 세울 수 있는 전략은 범행 사실을 인정하며 ‘자백’하거나 끝까지 ‘부인’하는 것입니다. 참가자가 선택하는 전략에 따라, 두 사람은 풀려나거나 1년형, 3년형, 또는 10년형의 벌을 받는 보수(결과)를 얻게 됩니다. 게임 이론에서는 게임의 상황과 결과를 한눈에 볼 수 있도록 표로 정리하는데, 이를 보수 행렬(Payoff Matrix)이라고 부릅니다. 죄수의 딜레마 게임을 정리하면 표 1과 같이 나타낼 수 있습니다.

표 1 죄수의 딜레마 게임 보수 행렬

표 1에 있는 괄호 안의 숫자들4)은 두 사람이 교도소에 수감되는 기간을 보여 주는데, 첫 번째 숫자는 A의 수감 기간, 두 번째 숫자는 B의 수감 기간을 의미합니다. 예를 들어, (-1, -1)은 A와 B 모두 범행을 부인할 경우 두 사람이 각각 1년형의 벌을 받는다는 것을 뜻합니다. (-10, 0)의 경우 A는 범행을 부인하고 B는 자백했을 때 두 사람이 얻게 될 결과를 나타내는데, A는 10년형을 받는 반면 B는 풀려난다는 의미입니다.

죄수의 딜레마 게임이 성립하기 위해서는 두 가지 조건이 필요합니다. 첫째, 두 참가자는 동시에 전략을 선택해야 합니다. A와 B는 각자 다른 방에서 취조를 받고 있어서 서로 어떤 전략을 선택할지 상의할 수 없고, 상대방이 어떤 선택을 할지 모르는 상태에서 자신의 전략을 선택해야 합니다. 둘째, A와 B는 게임의 규칙을 잘 이해하고 있으며 두 참가자는 서로가 자신에게 유리하게 행동하는 합리적인 경제 주체라는 사실을 알고 있습니다. 또한 각 참가자가 선택할 전략에 따라 어떤 보수를 얻게 될지 알고 있습니다. 이러한 모든 상황은 공통 지식(Common Knowledge)으로, A와 B 모두 완전하게 인지하고 있습니다. 이제 이 게임이 왜 ‘죄수의 딜레마’라고 불리는지, 두 참가자는 어떤 전략을 선택할지 살펴보겠습니다.

3) 법원의 판결이 나오기 이전에 검사가 용의자 두 명을 심문하는 상황이므로 죄수가 아닌 ‘용의자의 딜레마’라고 지칭하기도 하나, ‘죄수의 딜레마’로 더 잘 알려져 있음.
4) 교도소 수감은 자신의 시간과 자유를 빼앗기는 부정적인 상황이므로 ‘-’로 나타냄.

♦ 그들이 자백한 이유

먼저 참가자 A의 입장에서 생각해 봅시다. B가 만약 죄를 ‘부인’하는 전략을 선택한다면, A의 입장에서는 ‘자백’하는 것이 이득입니다. 자백하면 바로 풀려나지만, 죄를 부인하면 1년형의 벌을 받게 되기 때문입니다. B가 ‘자백’하는 전략을 선택할 경우에도 A는 역시 ‘자백’하는 것이 이익입니다. 부인하면 10년형을 받지만, B와 함께 자백하면 3년형을 받기 때문입니다. 즉, B가 어떤 전략을 선택하든지 A의 입장에서는 ‘자백’하는 것이 항상 더 나은 선택이 됩니다. 이를 표 2에 나타내면 다음과 같습니다. A의 입장에서 B의 전략에 대응하는 최적의 선택을 *로 나타내고 있습니다. B가 ‘부인’할 경우 A는 ‘자백’을, B가 ‘자백’할 경우에도 A는 ‘자백’을 선택하는 것이 유리합니다

표 2 죄수의 딜레마 게임: A의 최적 대응

이러한 상황은 B의 입장에서도 마찬가지입니다. A가 어떤 전략을 선택하든 B도 ‘자백’을 선택하는 것이 유리한 상황입니다. 이를 표 3에 나타내면 다음과 같습니다. B의 입장에서 A의 전략에 대응하는 최적의 선택을 *로 나타내고 있습니다.

표 3 죄수의 딜레마 게임: B의 최적 대응

표 2표 3의 내용을 합쳐 한 번에 나타내면 표 4와 같습니다. 두 참가자 모두 상대방이 죄를 부인하든지, 자백하든지와 상관없이 ‘자백’을 선택하는 것이 유리합니다. 이처럼 상대의 선택과 무관하게 자신에게 항상 이익을 가져다주는 전략을 우월 전략(Dominant Strategy)이라고 합니다. 이 게임에서는 두 참가자 모두 ‘자백’하는 것이 우월 전략이며, 그 결과 A와 B 모두 3년형을 받게 됩니다. 더불어 두 참가자는 ‘자백’ 외에 다른 전략을 선택할 유인도 없습니다. 우월 전략이 아닌 ‘부인’을 선택할 경우 교도소에서 살아야 하는 기간이 늘어나기 때문입니다. 즉, A와 B의 최적 대응을 표 4에 나타냈을 때, *과 *이 모두 표시된 (자백, 자백)이 우월 전략으로 이루어진 짝인 우월 전략 균형5)이 됩니다.

표 4 죄수의 딜레마 게임: 우월 전략 균형

합리적인 참가자 A와 B는 죄수의 딜레마 게임의 결과로 둘 다 3년형을 받게 되었습니다. 하지만 이는 둘에게 최선의 결과가 아닙니다. 만약 두 참가자 모두 혐의를 부인했다면 더 짧은 1년형만 받을 수 있기 때문입니다. 합리적인 경제 주체가 자신의 입장에서 최선의 전략을 선택했지만, 오히려 합리적으로 행동했기 때문에 최적의 결과를 얻지 못했습니다.

만약 A와 B가 독방으로 갈라지기 전에 이 모든 상황을 눈치채고 재빠르게 혐의를 ‘부인’하자고 약속했다면 어땠을까요? 그렇다고 하더라도 A와 B가 합리적인 경제 주체라면 그 약속은 지켜지기 어렵습니다. 상대방이 혐의를 부인하는 약속을 지킨다면, 나는 약속을 어기고 ‘자백’해서 바로 풀려나는 것이 더 유리하기 때문입니다. 그리고 두 사람 모두 상대방이 약속을 지키지 않을 유인이 있다는 것도 알고 있습니다. 따라서 두 참가자는 1년형만 받을 수 있는 상황임에도 불구하고 3년형을 받게 되는 것입니다. 합리적인 두 참가자가 자신에게 이익이 되도록 최선을 다해 선택한 전략이 역설적이게도 최적의 결과를 가져오지 못했기 때문에 이를 ‘죄수의 딜레마 게임’이라고 부릅니다.

5) 게임 이론에서 균형을 나타낼 때 각 참가자의 ‘최적 전략의 묶음’으로 표기해야 함. 보수의 묶음 (-3, -3)은 (자백, 자백) 균형이 달성된 결과 두 참가자가 얻는 보수일 뿐 균형을 의미하지 않음. 따라서 죄수의 딜레마 게임에서 균형은 (자백, 자백)으로 표기해야 함.

♦ 내쉬 균형의 발견

죄수의 딜레마 게임의 결과는 인간의 합리성을 전제해 온 전통적인 경제학의 연구 방향에 중대한 영향을 미쳤습니다. 존 내쉬의 연구가 발표되기 전, 게임 이론에서는 참가자들이 가장 큰 공동의 이익을 얻을 수 있는 전략을 선택하기로 협의하고 계약을 맺는 ‘협조 게임(Cooperative Game)’이 주된 연구 대상이었습니다. 경제 주체는 합리적이므로 협조를 통해 모두에게 이익이 되는 전략을 선택하는 것이 자연스러운 결과라고 생각해 왔던 것입니다. 반면 내쉬는 죄수의 딜레마 게임처럼 다른 참가자와 어떤 전략을 선택할지 협상하지 않거나, 협상하더라도 약속을 어겼을 때 제재를 가할 수 없는 비협조 게임(Non-Cooperative Game)6)에서 경제 주체의 행동과 결과를 연구했습니다.

내쉬는 비협조 게임에서 합리적인 참가자들이 각자 최적의 전략을 선택한 결과 ‘균형’이 존재한다는 것을 증명했습니다. 여기서의 균형이란, 다른 상황이 변하지 않는 한 현재 상태가 변함없이 유지되는 것을 의미합니다. 즉, 비협조 게임에서 상대방의 전략이 주어졌을 때 각 참가자는 그에 대응해서 자신이 가장 큰 이익을 얻을 수 있는 최적의 전략을 선택하게 됩니다. 그렇기 때문에 그 전략에서 벗어나 다른 전략을 선택하게 되면 자신이 얻을 수 있는 이익은 줄어들 수밖에 없습니다. 따라서 참가자 모두 자신이 선택한 최선의 전략을 바꾸지 않고 유지하는 상태에 이르게 되는데, 이를 ‘내쉬 균형(Nash Equilibrium)’이라고 합니다.

그러나 이렇게 달성된 균형은 각자의 입장에서는 최선일지 몰라도, 사회 전체적으로 볼 때 최선의 결과라는 보장이 없습니다. ‘죄수의 딜레마 게임’에서 A와 B는 각자의 입장에서 최선이었던 ‘자백’ 전략을 선택했고, 그 결과 3년형을 받게 됩니다. 그런데 사실 모두에게 최선인 것은 둘 다 죄를 ‘부인’해 1년형만 받는 것이었습니다. 하지만 상대방은 선택을 바꾸지 않는데 자신만 전략을 바꾸게 되면 더 큰 손해를 입게 되므로, 더 나은 상황이 있다는 것을 알면서도 최선으로 나아가지 못하고 현재 상태가 유지되는 것입니다.

6) 참가자가 얼마나 협조적인가에 따라 협조 게임과 비협조 게임을 구분하는 것이 아님. 협조 게임에서는 참가자 간 어떤 전략을 선택할지 협상해 공동의 이익을 달성할 수 있는 계약을 맺게 되고, 이를 위반할 경우 제재를 가할 수 있음. 반면, 비협조 게임에서는 사전에 다른 참가자와 어떤 전략을 선택할지 협상을 할 수 없거나 하지 않으며, 설령 약속을 했더라도 이를 위반했을 때 처벌할 수 없음.

♦ 일상에서 만나는 죄수의 딜레마 게임

우리 일상에서도 죄수의 딜레마 게임 상황을 쉽게 찾아볼 수 있습니다. 여러분이 친구들과 맛집에 갔다고 상상해 봅시다. 무엇을 먹을지 고민하고 있는데, 한 친구가 각자 먹고 싶은 걸 고르고 계산은 똑같이 n분의 1로 나눠서 하자고 제안합니다. 원래는 평소 먹던 적당한 가격대의 음식을 주문하려고 했는데, 친구의 얘기를 듣고 나니 ‘어떤 걸 주문하든 똑같이 나눠서 낼 거니까 평소에 먹던 거 말고 비싼 메뉴 시켜야겠다’ 이런 생각이 듭니다. 다른 친구도 ‘나만 싼 거 고르면 손해니까 오늘은 특별한 걸 먹어 볼까?’라고 생각합니다. 모두가 이런 생각을 하면서 주문하다 보니, 결국 평소보다 많은 돈을 쓰게 되었습니다. 이를 ‘뻔뻔한 저녁 식사의 딜레마(Unscrupulous Diner’s Dilemma)7)’라고 부르는데 죄수의 딜레마 게임과 동일한 상황입니다. 혼자 밥을 먹었다면 자신이 쓸 수 있는 예산 안에서 가능한 한 취향에 맞는 음식을 골랐을 것입니다. 그런데 무엇을 주문하든 모두 동일한 비용을 내게 되므로 개인의 입장에서는 굳이 저렴한 메뉴를 고를 이유가 없습니다. 결과적으로 모두가 비싼 메뉴를 주문해 더 많은 돈을 지출하게 된 것입니다.

죄수의 딜레마 게임 상황은 세계사에서도 찾아볼 수 있습니다. 제2차 세계 대전이 끝난 냉전 시기에 미국과 소련은 군비를 경쟁적으로 늘렸습니다. 미국 입장에서 소련이 군비를 늘린다면 미국도 군비를 늘려야 합니다. 소련과 동일한 군사력을 갖춰야 혹시 전쟁이 다시 일어나더라도 바로 대응할 수 있고, 국제적 영향력도 유지할 수 있기 때문입니다. 소련이 군비를 줄이더라도 미국 입장에서는 군비를 늘리는 것이 최선입니다. 그래야 막강한 군사력을 바탕으로 소련보다 유리한 위치에서 정치적 영향력을 행사할 수 있습니다. 이러한 상황은 소련에도 동일하게 적용됩니다. 따라서 소련과 미국 모두에게 군비를 늘리는 것이 우월 전략이 됩니다. 그러나 두 나라가 군비를 늘려 더 많은 무기를 보유할수록 전쟁의 위협은 커지고, 다른 곳에 생산적으로 사용될 수 있었던 많은 자금이 군사력을 높이는 데 집중적으로 사용되었습니다. 즉, 미국과 소련의 입장에서는 군비를 늘리는 것이 최적의 선택이었지만, 두 나라를 포함한 전 세계는 평화를 더욱 위협받는 비합리적인 상황에 처해 버린 것입니다.

7) 나탈리 글랜스(Natalie Glance)와 베르나르도 허버만(Bernardo Huberman)이 미국의 Scientific American이라는 잡지에서 언급한 예시로 ‘저녁 식사의 딜레마’라고도 불림.

♦ 당신의 선택, 그게 최선입니까?

게임 이론은 경제학뿐 아니라 경영학이나 심리학, 정치학 등 다양한 분야에서 활용되고 있습니다. 사람들의 선택과 행동이 상호 영향을 미치는 게임 상황은 일상에서 다양하게 발생하고 있기 때문입니다. 특히 죄수의 딜레마 게임은 각자에게 최선이라고 생각했던 것이 오히려 모두를 불리하게 만드는 비합리적인 상황을 제시함으로써 여러 시사점을 던지고 있습니다. 죄수의 딜레마 게임이 만약 한정된 공유 자원을 사용하는 상황에 적용된다면 그 결과는 어떻게 될까요? 개인의 입장에서는 자신의 이익을 위해 최대한 많은 자원을 사용하는 것이 합리적일지 몰라도, 결국 자원이 고갈되어 누구도 사용할 수 없는 최악의 상황이 펼쳐질 수 있습니다. 게임 상황에서 나타나는 참여자 간 상호 의존성에 대해 생각해 보며, 함께 살아가는 사회에서 어떤 전략을 선택하는 것이 나를 위한 그리고 모두를 위한 최선인지 고민해 보면 좋겠습니다.

기획재정부와 한국개발연구원(KDI)이 함께 만드는 <경제로 세상 읽기>는 매달 1편씩 기획재정부 경제교육포털 경제배움e(econedu.go.kr)에 업로드되고 있습니다.

* 내용 문의 또는 주제 제안: youngkim@kdi.re.kr

01
게임의 3요소가 아닌 것은?
  • 균형
  • 보수
  • 전략
  • 참가자
02
내쉬 균형에 대한 설명으로 옳지 않은 것은?
  • 비협조 게임에서 나타날 수 있는 균형이다.
  • 내쉬 균형은 사회 전체적으로도 항상 최선의 결과를 가져다준다.
  • 내쉬 균형에서 벗어나면 참가자가 얻을 수 있는 보수는 줄어든다.
  • 상대방의 전략이 주어졌을 때 그에 최적으로 대응하는 전략의 짝이다.
[3-5] 다음을 읽고 물음에 답하시오.
한 마을에 A와 B가 살고 있다. 이 마을에는 가로등이 없어 A와 B는 불편함을 겪고 있다. 답답했던 두 사람은 마을 회의에서 가로등 설치에 대해 투표하기로 했다. 가로등 설치비는 개당 300만 원이고, ‘설치’에 투표한 사람만 비용을 부담하게 된다. 일단 가로등이 설치되면 비용을 내지 않은 사람도 그로 인한 이익을 누릴 수 있다.
만약 A와 B가 모두 ‘설치’에 투표한다면 가로등은 2개가 설치되고, 그로부터 A와 B가 얻는 이익을 화폐 단위로 환산하면 각각 500만 원이다. 만약 A만 ‘설치’에 투표한다면 가로등은 1개만 설치되므로, 2개인 경우에 비해 불빛이 줄어들어 그로부터 얻는 이익은 각각 250만 원으로 줄어든다. 이때 A는 50만 원의 손해(=250만 원-300만 원)를 입게 되고, 비용을 부담하지 않은 B는 250만 원의 이익만 얻게 된다. 만약 모두 ‘미설치’에 투표할 경우 가로등은 설치되지 않는다. 이를 표로 나타내면 다음과 같다.
보수 행렬
03
위와 같은 게임의 명칭을 고르면?
  • 내쉬 게임
  • 치킨 게임
  • 검사의 딜레마 게임
  • 죄수의 딜레마 게임
04
에 대해 옳은 해석을 한 사람은?
  • 마음: A가 ‘설치’에 투표한다면 B도 ‘설치’에 투표하는 것이 이득이야.
  • 바다: A와 B가 합리적으로 행동한다면 모두 ‘설치’에 투표하게 될 거야.
  • 사랑: B가 ‘미설치’에 투표하고 A가 ‘설치’에 투표하면 A는 0을 얻게 돼.
  • 아름: B가 무슨 선택을 하든지 A는 ‘미설치’에 투표하는 게 항상 이득이야.
05
이 게임에서 내쉬 균형은?
  • (설치, 설치)
  • (설치, 미설치)
  • (미설치, 설치)
  • (미설치, 미설치)
정답은 pdf파일을 참고해 주세요.