게임 이론의 내쉬 평형 전략 | 미시 경제학

내쉬 균형의 정의는 지배적 전략 균형의 ∀ si”가 부족하다. 내쉬 균형 전략은 가능한 모든 전략이 아니라 다른 내쉬 전략에 대한 최상의 반응 일 필요가 있습니다. 그러나 우리는 최선의 대응책을 다루고 있으며 실제로 움직입니다. 따라서 플레이어들은 서로의 움직임을 예측하고 있습니다.

정치 전투 :

정치 전쟁에서, 우리는 그 대가를 극대화하는 두 정당이 있다고 가정했습니다. 이러한 보수는 선거에서 과반수를 얻는 데 유용합니다. 인도에서는 정당이 과반수를 차지하지 않습니다. 따라서 연합 정부 만이 정부를 구성하는 유일한 방법입니다. 연합 정치는 일당 지배적 정치 / 전략과 다릅니다. 연립 정부에서는 각기 다른 당사자들이 서로 다른 선언문을 가지고 있으며 타협하지 않습니다. 그러나 국가 차원의 정책 형성은 지역 당의 선언에 영향을 줄 수있다. 그러므로 지방 당은 자국의 정책에 반대 할 수있다.

인도에서 우리는 Trinamool 의회가 항상 다른 문제에 대해 의회에 반대한다는 것을 발견했습니다. Trinamool 의회는 West Bengal의 지역 정당입니다. 우리는 휘발유 가격의 예를 들었습니다. Trinamool 의회는 휘발유 가격 인상을 지속적으로 반대하고 있습니다. 인도에서는 보조금이 휘발유에 제공됩니다. 이제 의회 정부는 휘발유 보조금을 줄이기위한 정책을 수립하고 있습니다. 이는 중앙에서 재정 적자를 줄이기 때문입니다. 대부분의 정부 석유 회사들은 휘발유 가격을 결정하고 있습니다.

이러한 가격은 국제 휘발유 가격에 따라 다릅니다. 국제 시장에서 휘발유 가격이 상승하면 휘발유 가격을 인상 할 수밖에 없습니다. 그렇게하지 않으면 보조금이 증가하고 정부의 재정 적자에 영향을 미칩니다. 따라서 정부는 휘발유 가격 고정에 관여합니다. 이 과정에서 정부는 다른 정당들에 대해 논의하고 의견을 제시하지 않습니다. 그것은 때때로 연합 정치에서 불안정성을 만듭니다.

Trinamool Congress와 같은 정당이 그러한 결정에 반대한다는 것은 명백합니다. 두 당사자가 휘발유 가격 상승에 동의하지 않으면 두 당사자 간의 충돌이 발생합니다. 내쉬 균형은 때때로 게임의 반복에 의해 정당화된다. 의회가 동맹국들과 논의하지 않고 그들이 게임 기간을 일정 기간 후에 반복한다고 가정하면 불안정성 문제는 정부에서 발생할 것입니다. 이 게임에서 그들은 결국 내쉬 균형 중 하나에 정착합니다. 그러나 그것은 두 가지 환경 설정에 달려 있습니다.

정치 전투에서 내쉬 균형은 각각 파레토 효율입니다. 다른 전략 조합은 다른 당사자의 지불을 줄이지 않고 한 당사자의 지불을 증가시키지 않습니다. 의회당은 휘발유 가격을 결정하는데 처음으로 움직입니다. 의회가 휘발유 가격을 높이면, 그 약속은 Trinamool 의회가 휘발유 가격을 높이는 길로 가도록 유도 할 것입니다. 리터당 증가하는 휘발유 가격을 고려했습니다.

휘발유 보조금은 (20, 10) 의회보다는 Trinamool 의회에 더 많은 혜택을 줄 것입니다. 그러나 의회가 시장 가격을 받아 들인다면, 그 이익은 의회보다 적다 (10, 20). 그러나 이러한 노력은 정부의 업무와 재정 안정을 원활하게하는 데 도움이 될 것입니다. Trinamool 의회가 시장 가격을지지하고 의회가 휘발유 가격 인상을 원한다면 그 혜택은 (-50, -50) 양 당사자에게 동일합니다.

정치 게임에서 먼저 이동하는 당사자는 첫 번째 이동자 이점이 있습니다. 그것은 헌신과 동일합니다. 정치의 전투는 많은 경제적 인 적용을받습니다. 이러한 선택은 산업에서 널리 사용됩니다. 두 회사가 선호도가 다르고 소비자가 제품을 구매하도록 장려하는 공통 표준을 원한다고 가정하십시오. 두 번째 회사는 계약에 사용 된 언어를 선택하여 두 회사가 판매 계약을 공식화하고자합니다. 그러나 그들은 다른 용어를 선호합니다.

연립 정부에서 정당은 함께 일하지만 선호도는 다릅니다. 정당 선언문에 기초하여 경쟁이 서로 일어난다. 선거에서 다수를 차지하는 정당은 가장 강력한 정당으로 나타나고 정부를 구성합니다. 최대 원수의 정당이 여러 정부 차원에서 결정을 내리는 것은 단순한 게임이다.

정규형 및 결과 매트릭스 :

순서대로 여러 번의 움직임이있는 게임은 단일 움직임 게임보다 프리젠 테이션에서 더 많은주의가 필요합니다. 전략은 순수한 조정 조치와 동일하며 결과는 2x2 형식입니다. 그것은 보상과 행동, 결과에 대한 전략 조합과 관련이 있습니다. 이 두 가지 매핑을 일반 형식과 결과 매트릭스라고하며 더 복잡한 게임에서는 서로 다릅니다.

일반적인 형식은 가능한 각 전략 조합에서 어떤 결과가 나오는지 보여줍니다. 결과 매트릭스는 각 가능한 조치 조합의 결과를 보여줍니다. 아래의 정의는 플레이어 수를 나타내는 데 사용됩니다. k가 결과 벡터의 변수 수이고 p가 전략 조합 수이고 q가 작업 조합 수라고 가정합니다.

다음과 같이 표시됩니다.

일반적인 게임 형태는 다음과 같습니다.

1. 가능한 모든 전략 조합은 S 1 ……… Sn입니다.

2. π i (I = 1, … .n)에서 S i 를 지불 n에 매핑하는 지불 함수

결과 매트릭스는 두 가지 결과로 구성됩니다.

1. 가능한 모든 행동 조합은 a1 ……입니다. 과

2. 결과 함수 a1을 결과 k에 매핑하는 결과 함수, 여기서 z i, = (1, ……… n)

순수한 공동 조정 :

우리는 다른 종류의 게임에 대해 다른 예를 들었습니다. 이 게임의 플레이어는 Deepa와 Smita입니다. 그들은 서로 경쟁하는 플레이어이며 그들의 행동에서 더 높은 보수를 원합니다. 둘 다 개별 전략 중 큰 보상을 선호하지만 개별 전략은 서로 다릅니다.

순수한 조정 게임에서 한 가지 주요 전략이 적용되는 리더를 따르십시오. 이 게임에서 Smita가 먼저 움직입니다. 그녀는 Deepa가 무엇을 선택하든 특정 디스크 크기에 자신을 맡기고 있습니다. 새로운 게임에는 순수한 조정과 동일한 결과 매트릭스가 있습니다. 다른 게임의 일반적인 형태입니다. Deepa의 전략은 더 이상 단일 행동이 아니기 때문입니다. Deepa의 전략 세트에는 네 가지 요소가 있습니다.

이러한 전략은 다음과 같이 설명됩니다.

우리는 다음과 같이 약어

리더를 따라 약간의 복잡성을 추가하면 어떻게 일반 형태가 너무 불분명해질 수 있는지 설명합니다. 그러나 매우 유용합니다.

위의 표에서 우리는 균형 전략 결과를 제시했습니다.

다음과 같습니다.

X {대 (대, 대)} 둘 다 크게 선택

Y {대 (소, 소)} 모두 크게 선택

Z {작은 (작고 작음)} 모두 작게 선택

위의 상자에서 X, Y 및 Z는 내쉬 평형 전략입니다. 평형 X에서 Deepa는 Smita가하는 일에 관계없이 크게 반응합니다. Smita는 큰 것을 선택하게되어 매우 기쁩니다. Smita가 작은 것을 먼저 선택하면 Deepa는 큰 것을 선택하는 것이 어리 석습니다. 그러나 그 사건은 순수한 협동 조합 균형에서 일어나지 않을 것입니다. 평형 Y에서 Deepa는 Smita가 선택한 것을 선택합니다. 그래서 Smita는 큰 돈을 지불하기로 결정했습니다.

이 시점에서, 보수 2는 1 대신에 더 낫습니다. 평형 Z에서 Smita는 의도적으로 작은 것을 선택합니다. 그녀는 Deepa가 자신이하는 모든 일에 대해 작은 반응을 보일 것임을 알고 있기 때문입니다. Smita는 균형에서 작은 것을 선택하기 때문에 Deepa는 작은 것으로 기꺼이 응답합니다. 이 시점에서 평형 x와 z는 완전히 합리적이지 않습니다.

광범위한 형태와 게임 트리 :

우리는 문제를 해결하기 위해 광범위한 양식과 의사 결정 트리를 사용합니다. 게임 트리는 광범위한 형태와 동일합니다. 각 노드마다 결과가 있습니다. 평형을 벗어난 결과가 대가로 정의되고 광범위한 형태가 의사 결정 트리와 평형이라고 가정하자. 우리는 왜 평형 X와 Z가 내쉬 평형인데도 만족스럽지 못한 지에 관심이 있습니다.

의사 결정 트리를 통해이를 이해해야합니다.

다음과 같습니다.

위의 그림 4.7에서 게임은 실제로 B1 또는 B2의 노드에 도달합니다. Deepa는 B2에서 지배적 인 행동을 취할 것입니다. 보수가 더 많기 때문입니다. 그녀는 B1에서 약간의 보수를 받았을 것입니다. X 및 Z 평형에 관한 한, 내쉬 평형은 Y에서 관찰된다. 광범위한 형태의 순수한 조정이 그림에 제시되어있다. 점선이 광범위한 형태임을 보여줍니다. 리더 1 전략을 따르는 것입니다.

이 게임에서 각 플레이어는 두 행동 사이에서 단일 결정을 내립니다. 플레이어의 움직임은 동시에 이루어집니다. Smita가 Deepa 로의 이동에 대해 말하지 않고 먼저 이동한다고 가정하십시오. Deepa는 그녀의 움직임을 이해하고 게임은 어떤 노드에 도달합니다. 그림에서 이러한 정보 세트는 점선으로 표시되어 있습니다. 그러나 Deepa는이 게임에서 도달 한 정확한 노드를 모릅니다.

혼합 전략 : 복지 게임 :

게임 이론에서 내쉬 평형이 가장 바람직한 결과입니다. 내쉬 평형은 결과 예측을 제공하는 데 유용합니다. 지배적 인 전략이 필요하지 않습니다. 일부 게임에는 내쉬 평형이 없습니다. 전략 공간을 확장하는 것이 현실적이고 유용합니다. 여기에는 내쉬 평형이 거의 항상 존재하는 임의의 전략이 포함됩니다. 이러한 무작위 전략을 혼합 전략이라고합니다.

순수한 전략은 각 플레이어 가능한 정보 세트를 하나의 액션에 매핑합니다.

혼합 전략은 각 가능한 가능한 정보 세트를 확률 분포 조치에 맵핑합니다.

확장 된 게임 이론 버전은 혼합 전략을 허용합니다. 이를 게임의 혼합 확장이라고합니다. 순수한 전략은 다른 플레이어에게 어떤 행동을 선택해야하는지 알려주는 규칙입니다. 혼합 전략은 행동으로 선택하기 위해 던질 주사위를 알려주는 규칙을 구성합니다. 플레이어가 혼합 전략을 추구하면 주어진 상황에서 여러 가지 행동을 선택할 수 있습니다. 그에게 도움이 될 수있는 예측 불가능 성입니다.

이러한 혼합 전략은 현실 세계에서 자주 발생합니다. 미식 축구 경기에서 공세 팀은 합격 여부를 결정해야합니다. 통과는 일반적으로 더 많은 야드를 얻지 만 가장 중요한 것은 팀이 예상하지 않은 행동을 선택하는 것입니다. 팀은 시간의 일부를 실행하고 시간의 일부를 통과하기로 결정합니다. 관찰자에게는 무작위로 보이지만 게임 이론가에게는 합리적입니다.

복지 게임 :

인도와 같은 개발 도상국에서 정부는 빈민을위한 많은 복지 프로그램을 제재합니다. 우리는이를 복지 국가 기준 또는 정치 경제라고 부를 수 있지만 복지 프로그램은 가난한 사람들을 위해 발표됩니다. 많은 사람들이 그러한 프로그램에 참여하기 때문에 일부 복지 프로그램은 인기를 얻습니다. 대부분의 경우, 사람들과 지역 대표들은 그러한 복지 프로그램을 요구합니다. 인도의 복지 프로그램은 실제로 다양한 종류의 농촌 기반 시설을 조성하고 생태 환경을 유지하는 데 도움이됩니다.

그러나 일부 사회 복지 프로그램은 농촌 사람들의 참여가 적고 정책 개입 시간으로 인해 실패합니다. 이 복지 게임에서 우리는 정부와 빈곤의 모범을 보였습니다. 복지 게임 모델에서 정부는 빈곤층을 돕고 자한다. 이러한 빈곤층은 농촌 지역의 가난한 사람이며 항상 가장 가까운 위치에서 구직 활동을합니다. 정부 지원에 의존 할 수없는 경우에만 빈곤층이 일자리를 찾는 지 여부는 딜레마이다.

이 상황을 대표하는 보수를 시도하면 빈곤층은 일자리를 찾지 못할 수도있다. 이 게임에서 정부 나 빈곤층은 지배적 인 전략을 가지고 있지 않습니다. 둘 다 서로 이익을 위해 의존합니다. 약간의 생각으로, 우리는 순수한 전략에 내쉬 균형이 존재하지 않음을 알 수 있습니다.

다음 예를 통해 설명합니다.

위의 예에서 각 전략 조합을 차례로 검사하여 내쉬 평형을 확인해야합니다.

전략 조합 (Aid, work try) (Aid, be idle) (No Aid, Be Idle) (No Aid, Work to try)은 Nash 평형이 아닙니다.

정부는 확률 Pa로 원조를하고 빈곤층은 확률 Pw로 일하려고한다.

정부의 예상 보수는 다음과 같습니다.

순수한 전략 만 허용된다면 Pa는 0 또는 1과 같습니다. 그러나 게임의 혼합 확장에서 Pa의 정부의 행동은 0에서 1까지의 연속체에 있습니다. 극단적 인 가치 인 순수한 전략은 선택 변수와 관련하여 지불 기능을 차별화합니다. 첫 주문 조건을 얻는 것입니다.

위의 예는 혼합 전략 평형에서 농촌 빈곤층은 빈민층 전략을 얻기 위해 20 %의 시간을 일할 수있는 옵션을 선택 함을 보여줍니다. 정부에 대한 전략과 보상의 수는 다음과 같이 설명됩니다. 첫째, 최적의 혼합 전략은 정부에 존재한다. 둘째, 빈곤 노동이 20 %를 초과한다고 가정하면 정부가 항상 원조를 선택한다. 그러나 대안으로, 빈곤층이 20 % 미만의 근로를 시도하면 정부는 절대로 원조를 선택하지 않는다.

정부가 빈곤에 대한 원조를 선택하는 것은 분명한 전략이다. 셋째, 정부의 경우 혼합 전략은 빈곤층이 정확히 20 %의 확률로 작업하려고 시도해야한다는 것이다. 인도와 같은 개발 도상국에서는 종종 사람들이 일을 시작해야하므로 정부 복지 프로그램에 기꺼이 시간을 할애 할 것으로 예상됩니다. 그렇지 않으면 공공 자원이 낭비 될 것입니다. 이제는 원조 프로그램의 시작 여부를 결정하는 것이 정부입니다. 정부가 원조를 선택할 확률을 얻으려면 빈곤에 대한 대가를 계산해야합니다.

이러한 기능은 다음과 같이 정의됩니다.

우리가 첫 주문 조건을 취하는 경우 :

Destitute가 0.2의 확률로 일하려고 시도하고 정부가 Aid를 선택하는 데 무관심하다고 가정하자. 확률은 100, 0 또는 그 사이에 있습니다. 내쉬 균형의 혼합 전략에서 정부는 확률이 0.5 인 원조를 선택하고, 빈곤층은 확률이 0.2 인 일을 시도합니다. 평형 결과는 결과 매트릭스의 4 가지 항목 중 하나 일 수 있습니다. 발생 확률이 가장 높은 항목은 각각 확률이 0.4 = 0.5 (1⎯ 0.2) 인 (원조, 유휴 상태) 및 (원조, 유휴 상태)입니다.

위의 확률로부터 우리는 정부가 빈민을위한 원조 프로그램을 선택할 것인지 명확하지 않다. 언젠가는 일이 필요하지만 빈곤 한 사람은 일할 준비가되지 않았으며 유휴 상태를 유지하는 것을 선호합니다. 따라서 대부분의 경우 원조에 대한 평가가 있습니다. 원조는 빈민을 돕고 있으며 그렇지 않으면 중단됩니다.

원조 프로그램의 효율성이 더 중요한 경우도 있지만 도시 및 농촌 지역에서의 이주 가능성, 대체 직업 가능성, 새로운 기술 학습 등 여러 가지 요인에 따라 달라집니다. 정부는 이러한 원조 프로그램을 다른 수준과 시간으로 평가합니다. 독립적 인 연구 기관에서 평가합니다. 원조는 다양한 보고서를 신중하게 평가 한 후에 승인됩니다.

공동 전략 :

협동 게임은 참여와 협력을 장려합니다. 공동 관련 평형 전략은 내쉬 평형보다는 해결책입니다. 이러한 전략은 1974 년 수학자 Robert Aumann에 의해 처음 논의되었습니다. 그는 각 플레이어가 자신의 관찰에 따라 행동을 선택한다고 지적했습니다. 이러한 관찰은 동일한 공개 신호의 가치입니다. 전략은 플레이어가 할 수있는 모든 가능한 관찰에 대한 행동이됩니다. 단일 플레이어가 표준 전략에서 벗어나고 싶지 않다고 가정하면 분배를 상호 관련 전략이라고합니다.

코인을 던질 때 두 명의 플레이어가 공동 관련 평형을 갖습니다. 전략은 Smita와 Deepa에게 간단합니다. Smita는 머리가 오면 숙박을 선택할 수 있습니다. Deepa에게는 꼬리가 오면 체재를 선택할 수 있습니다. 던지기를 잃은 플레이어는 등을 선택합니다. 각 플레이어의 전략은 다른 플레이어에게 가장 좋은 반응입니다. 각 숙박 선택 확률은 0.5입니다.

각각에 대한 예상 보수는 1.00입니다. 이 게임에는 간단한 확률 함수가 있습니다. 모델이 상관 평형을 참조 할 때 일반적으로 무작위 배정은 명시 적으로 모델링되지 않습니다. 외적 불확실성은 선호 엔 다우먼트 또는 생산에 영향을 미치지 않는 변수에 대한 불확실성을 의미합니다.

상호 관련 전략 결과를 모델링하려면 특성상 이동을 지정해야합니다. 그것은 각 플레이어에게 균등 한 확률을 부여합니다. 이것은 두 선수가 정확히 동시에 업계에 들어갈 확률이 0이기 때문에 종종 현실적입니다. 그러나 누가 운이 좋은 스타터인지 누가 미리 알 수 없습니다. 기업은 사전에 이점이 없지만 결과는 효율적입니다. 혼합 전략은 상관 관계 전략에 사용할 수 없습니다. 일반적인 혼합 전략에서 혼합 확률은 통계적으로 독립적입니다. 공동 전략에서는 그렇지 않습니다.

싸구려 대화는 게임이 시작되기 전에 비용이 들지 않는 커뮤니케이션을 말합니다. 순수한 조정으로, 저렴한 대화를 통해 플레이어는 원하는 결과를 즉시 얻을 수 있습니다. 의사 소통이 없다면, 유일한 대칭 평형은 혼합 전략입니다. 두 선수 모두 일관성없는 발표를하면 낭비적인 혼합 전략 결과가 될 것이며, 그들이 발레를 갈 것인지 아니면 상을받을 것인지를 발표 할 의사가 있다고 생각한다고 가정하자. 합의에 도달 할 가능성이 높습니다.

따라서 의사 소통은 두 선수가 충돌하더라도 비 효율성을 줄이는 데 도움이됩니다. 그러나 다시 이러한 전략은 순전히 두 선수 간의 의사 소통에 달려 있습니다. 목표는 플레이어가 아닌 팀으로 승리하는 것입니다. 효과적인 협동 게임 패턴을 발견하는 것은 개인적 의사 소통을하는 애매하고 중요한 문제입니다. 대부분의 경우 의사 소통은 문제의 해결책으로 사용되는 마지막 전략입니다.

 

귀하의 코멘트를 남겨