Obsah:
- Teorie rozhodnutí
- 1. Jaké jsou preference před vyhlídkami?
- 2. Užitečná opatření preference
- 3. Realizace skutečných rozhodnutí
- 7. Závěrečné poznámky
- Bibliografie
- Akademické nástroje
- Další internetové zdroje

Video: Teorie Rozhodnutí

2023 Autor: Noah Black | [email protected]. Naposledy změněno: 2023-08-25 04:38
Vstupní navigace
- Obsah příspěvku
- Bibliografie
- Akademické nástroje
- Náhled PDF přátel
- Informace o autorovi a citaci
- Zpět na začátek
Teorie rozhodnutí
První publikováno 16. prosince 2015
Teorie rozhodování se zabývá důvody, které jsou základem pro volbu agenta, ať už se jedná o všední volbu mezi nástupem do autobusu nebo taxíkem, nebo o širší výběr o tom, zda pokračovat v náročné politické kariéře. (Všimněte si, že „agent“zde znamená entitu, obvykle individuální osobu, která je schopna uvažovat a jednat.) Standardní myšlení je, že to, co agent dělá při jakékoli příležitosti, je zcela určeno její vírou a touhami / hodnotami, ale to není kontroverzní, jak bude uvedeno níže. V každém případě je teorie rozhodnutí tolik teorií víry, tužeb a dalších relevantních postojů, jako je teorií volby; záleží na tom, jak tyto různé postoje (nazývají je „preferenční postoje“) spolu.
Těžištěm této položky je normativní teorie rozhodování. To znamená, že hlavní otázkou zájmu je, jaká kritéria by měla preferenční přístup agenta splňovat za jakýchkoli obecných okolností. To odpovídá minimální racionalitě, která odkládá podstatnější otázky týkající se vhodných hodnot a preferencí a přiměřených přesvědčení, vzhledem k dané situaci. Klíčovou otázkou v tomto ohledu je řešení nejistoty. Ortodoxní normativní teorie rozhodování, očekávaná teorie užitečnosti (EU), v podstatě říká, že v nejistých situacích by měl člověk preferovat variantu s největší očekávanou žádostí nebo hodnotou. Tato jednoduchá maxima bude středem naší diskuse.
Struktura této položky je následující: Část 1 pojednává o základním pojmu „preference před vyhlídkami“, který leží v jádru teorie rozhodování. Oddíl 2 popisuje vývoj teorie normativního rozhodování z hlediska stále silnějších a flexibilnějších opatření preferencí. Část 3 pojednává o dvou nejznámějších verzích teorie EU. Oddíl 4 se zabývá širším významem teorie EU pro praktickou činnost, odvozování a oceňování. Oddíl 5 se týká významných výzev pro teorii EU, zatímco oddíl 6 se zabývá postupnými rozhodnutími a tím, jak toto bohatší nastavení ovlivňuje debaty o racionálních preferencích.
- 1. Jaké jsou preference před vyhlídkami?
-
2. Užitečná opatření preference
- 2.1 Řádné obslužné programy
- 2.2 Nástroj pro kardinalizaci
- 2.3 Věta o reprezentaci von Neumanna a Morgenstern (vNM)
-
3. Realizace skutečných rozhodnutí
- 3.1 Savageova teorie
- 3.2 Jeffreyova teorie
-
4. Širší význam teorie očekávané užitečnosti (EU)
- 4.1 Meze teorie EU
- 4.2 O racionální víře
- 4.3 Na racionální přání
-
5. Výzvy k teorii EU
- 5.1 Příčinné anomálie
- 5.2 O oddělitelnosti: Rizikové a lítostné postoje
- 5.3 K úplnosti: Vague víry a touhy
-
6. Postupná rozhodnutí
- 6.1 Byl Ulysses racionální?
- 6.2 Axiomy EU byly znovu revidovány
- 7. Závěrečné poznámky
- Bibliografie
- Akademické nástroje
- Další internetové zdroje
- Související záznamy
1. Jaké jsou preference před vyhlídkami?
Dva hlavní pojmy v teorii rozhodování jsou preference a vyhlídky (nebo rovnocenně, možnosti). Zhruba řečeno, říkáme, že agent „upřednostňuje“„možnost“(A) před (B) jen v případě, že pro dotyčného agenta je ten první vhodnější nebo vhodnější než ten druhý. Tato hrubá definice objasňuje, že preference je srovnávací postoj; je to jedna z možností srovnání, pokud jde o to, jak jsou žádoucí / hodní výběru. Kromě toho existuje prostor pro argumenty o tom, jaké preference před možnostmi skutečně odpovídají, nebo jinými slovy, co je o agentovi (možná o sobě), který se nás týká, když hovoříme o jeho preferencích před opcemi. Tato část se zabývá některými základními otázkami interpretace, které stanovily fázi pro zavedení (v další části) rozhodovacích tabulek a očekávaného pravidla užitečnosti, že pro mnohé je známý předmět teorie rozhodování. Další interpretační otázky týkající se preferencí a vyhlídek budou řešeny později, jak se objeví.
Pokračujme však nejprve zavedením základních kandidátských vlastností (racionální) preference před možnostmi a teprve poté se obrátíme na otázky interpretace. Jak je uvedeno výše, preference se týkají srovnání možností; je to vztah mezi možnostmi. Pro doménu možností hovoříme o řazení preferencí agenta, jedná se o uspořádání možností, které je generováno preferencí agenta mezi libovolnými dvěma možnostmi v této doméně.
V následujícím textu představuje (preceq) slabý preferenční vztah, tj. Vztah "… není upřednostňován …". Takže (A / preceq B) představuje, že agent, který nás zajímá, považuje možnost (B) za alespoň tak výhodnou jako varianta (A). Ze slabého preferenčního vztahu můžeme definovat přísný preferenční vztah (prec) následovně: (A / prec B / Leftrightarrow A / preceq B & / neg (B / preceq A)), kde (neg X) znamená "není to tak, že (X)". Lhostejný vztah (sim) je definován jako: (A / sim B / Leftrightarrow A / preceq B & / B / preceq A). To znamená, že agent, který nás zajímá, považuje (A) a (B) za stejně výhodného.
Říkáme, že (preceq) slabě objednává množinu (S) možností, kdykoli splňuje následující dvě podmínky:
Axiom 1 (úplnost)
Pro všechny (A, B / in S): buď / (A / preceq B) nebo (B / preceq A).
Axiom 2 (Transitivity)
Pro libovolný (A, B, C / in S): pokud (A / preceq B) a (B / preceq C), pak (A / preceq C).
Výše uvedené lze považovat za předběžnou charakteristiku racionální preference před variantami. I tato omezená charakterizace je však sporná a ukazuje na rozdílné interpretace „preferencí před vyhlídkami / možnostmi“.
Začněte axiomem Úplnost, který říká, že agent může porovnat všechny páry možností v (S), pokud jde o vztah slabé preference. To, zda je úplnost přijatelným omezením racionality, závisí jednak na tom, jaké možnosti jsou zvažovány, a na tom, jak interpretujeme preference před těmito možnostmi. Pokud sada možností zahrnuje všechny druhy stavů, pak úplnost není okamžitě naléhavá. Například je sporné, zda by agent měl být schopen porovnat možnost, že dva další lidé na světě jsou gramotní s možností, že dva další lidé dosáhnou věku šedesáti. Pokud jsou na druhou stranu všechny možnosti v sadě vzájemně velmi podobné, řekněme, že všechny možnosti jsou investiční portfolia, pak je úplnost přesvědčivější. Ale i když neomezujeme druhy zvažovaných možností, otázka, zda by měla být úplnost uspokojena, závisí na významu preference. Například, pokud preference pouze reprezentují chování při výběru nebo dispozice výběru, jak to činí podle „odhalené teorie preferencí“populární mezi ekonomy (viz Sen 1973), pak je úplnost automaticky uspokojena za předpokladu, že výběr musí být nevyhnutelně proveden. Naproti tomu, pokud jsou preference chápány spíše jako mentální postoje, tj. Uvažované úsudky o tom, zda je volba lepší nebo vhodnější než jiná, pak jsou pochybnosti o úplnosti zmiňované výše relevantní (pro další diskusi viz Mandler 2001).otázka, zda by měla být uspokojena úplnost, závisí na významu preference. Například, pokud preference pouze reprezentují výběrové chování nebo výběrové dispozice, jak to dělají podle „odhalené teorie preferencí“populární mezi ekonomy (viz Sen 1973), pak je úplnost automaticky uspokojena za předpokladu, že výběr musí být nevyhnutelně proveden. Naproti tomu, pokud jsou preference chápány spíše jako mentální postoje, tj. Uvažované úsudky o tom, zda je volba lepší nebo vhodnější než jiná, pak jsou pochybnosti o úplnosti zmiňované výše relevantní (pro další diskusi viz Mandler 2001).otázka, zda by měla být uspokojena úplnost, závisí na významu preference. Například, pokud preference pouze reprezentují chování při výběru nebo dispozice výběru, jak to činí podle „odhalené teorie preferencí“populární mezi ekonomy (viz Sen 1973), pak je úplnost automaticky uspokojena za předpokladu, že výběr musí být nevyhnutelně proveden. Naproti tomu, pokud jsou preference chápány spíše jako mentální postoje, tj. Uvažované úsudky o tom, zda je volba lepší nebo vhodnější než jiná, pak jsou pochybnosti o úplnosti zmiňované výše relevantní (pro další diskusi viz Mandler 2001).pak je úplnost automaticky uspokojena za předpokladu, že musí být nevyhnutelně provedena volba. Naproti tomu, pokud jsou preference chápány spíše jako mentální postoje, tj. Uvažované úsudky o tom, zda je volba lepší nebo vhodnější než jiná, pak jsou pochybnosti o úplnosti zmiňované výše relevantní (pro další diskusi viz Mandler 2001).pak je úplnost automaticky uspokojena za předpokladu, že musí být nevyhnutelně provedena volba. Naproti tomu, pokud jsou preference chápány spíše jako mentální postoje, tj. Uvažované úsudky o tom, zda je volba lepší nebo vhodnější než jiná, pak jsou pochybnosti o úplnosti zmiňované výše relevantní (pro další diskusi viz Mandler 2001).
Většina filosofů a teoretiků rozhodnutí se přihlásí k druhé interpretaci preference jako druh úsudku, který vysvětluje, na rozdíl od toho, že je identický s, dispozice výběru a výsledné výběrové chování (viz např. Dietrich a List, 2015). Navíc si mnozí myslí, že úplnost není racionálně nutná; tato racionalita vyžaduje pouze požadavky na rozsudky, které agent skutečně zastává, ale neříká nic o tom, zda musí být rozsudek na prvním místě. Přesto, po Richardu Jeffreyovi (1983), většina teoretiků rozhodnutí naznačuje, že racionalita vyžaduje, aby preference byly soudržně rozšiřitelné. To znamená, že i když vaše preference nejsou úplné, mělo by být možné je dokončit bez porušení kterékoli z podmínek, které jsou racionálně vyžadovány, zejména Transitivity.
To nás přivádí k axiomu Transitivity, který říká, že pokud je volba (B) alespoň tak výhodná jako (A) a (C) je alespoň tak výhodná jako (B), pak (A) nelze striktně upřednostnit před (C). Nedávná výzva pro Transitive zapne heterogenní sady možností, jak je uvedeno v diskusi o úplnosti výše. Zde se však na srovnání možností projeví odlišná interpretace preference. Myšlenka je taková, že preference nebo úsudky vhodnosti mohou reagovat na podmínku výtečnosti. Předpokládejme například, že nejdůležitějším rysem při porovnávání automobilů (A) a (B) je to, jak rychle je lze řídit, a (B) není v tomto ohledu horší než (A), Nejvýraznějším rysem při porovnávání automobilů (B) a (C) je však jejich bezpečnost a to, že (C) není v tomto ohledu horší než (B). Dále,při porovnání (A) a (C) je nejdůležitější vlastností jejich krása. V takovém případě někteří argumentují (např. Temkin 2012), že neexistuje důvod, proč by měla být Transitivita uspokojena s ohledem na preference týkající se (A), (B) a (C). Jiní (např. Broome 1991a) tvrdí, že Transitivita je součástí samotného významu vztahu lepšího (nebo objektivního srovnávacího požadavku); je-li racionální preference úsudkem o vhodnosti nebo vhodnosti, pak je Transitivita neobchodovatelná. Pokud jde o příklad automobilu, Broome tvrdí, že by se vhodnost plně specifikované možnosti neměla lišit, jednoduše na základě toho, s jakými dalšími možnostmi je srovnávána. Kontext výběru ovlivňuje, jak agent vnímá danou možnost, a v takovém případě by měl popis možnosti odrážet toto,nebo jinak kontext výběru nemá na možnost vliv. V každém případě by měla být Transitivita uspokojena.
Upřednostňuje se přímější obrana Transitivity; obrana, která závisí na jistých ztrátách, které mohou postihnout každého, kdo poruší axiom. Toto je argument tzv. Penězové pumpy (nedávná diskuse a revize tohoto argumentu viz Gustafsson 2010 a 2013). Je založeno na předpokladu, že pokud shledáte (X) přinejmenším stejně žádoucí jako (Y), pak byste měli být rádi, že budete obchodovat za první. Předpokládejme, že porušujete Transitivitu, tj. Pro vás: (A / preceq B), (B / preceq C), ale (C / prec A). Navíc předpokládejme, že v současné době máte (A). Pak byste měli být ochotni vyměnit (A) za (B). Totéž platí pro (B) a (C): měli byste být ochotni vyměnit (B) za (C). Důrazně upřednostňujete (A) na (C), takže byste měli být ochotni obchodovat v (C) plus částku ($ x) za (A). Nyní jste však ve stejné situaci, ve které jste začínali a máte (A), ale ani (B) ani (C), kromě toho, že jste ztratili ($ x)! Takže v několika krocích, z nichž každý byl v souladu s vašimi preferencemi, se ocitnete v situaci, která je podle vašich vlastních světel jasně horší než v původní situaci. Obrázek je dramatičtější, pokud si představujeme, že tento proces by se mohl opakovat a proměnil vás v „peněžní čerpadlo“. Argument tedy pokračuje, že existuje něco (instrumentálně) iracionálního ohledně vašich nepřekonatelných preferencí. Pokud by vaše preference byly přechodné, pak byste nebyli zranitelní při výběru dominantní možnosti a sloužili jako peněžní pumpa. Vaše preference by proto měla být přechodná. Každá z nich byla v souladu s vašimi preferencemi, ocitnete se v situaci, která je podle vašich vlastních světel jasně horší než v původní situaci. Obrázek je dramatičtější, pokud si představujeme, že tento proces by se mohl opakovat a proměnil vás v „peněžní čerpadlo“. Argument tedy pokračuje, že existuje něco (instrumentálně) iracionálního ohledně vašich nepřekonatelných preferencí. Pokud by vaše preference byly přechodné, pak byste nebyli zranitelní při výběru dominantní možnosti a sloužili jako peněžní pumpa. Vaše preference by proto měla být přechodná. Každá z nich byla v souladu s vašimi preferencemi, ocitnete se v situaci, která je podle vašich vlastních světel jasně horší než v původní situaci. Obrázek je dramatičtější, pokud si představujeme, že tento proces by se mohl opakovat a proměnil vás v „peněžní čerpadlo“. Argument tedy pokračuje, že existuje něco (instrumentálně) iracionálního ohledně vašich nepřekonatelných preferencí. Pokud by vaše preference byly přechodné, pak byste nebyli zranitelní při výběru dominantní možnosti a sloužili jako peněžní pumpa. Vaše preference by proto měla být přechodná.o vašich nepřekonatelných preferencích existuje něco (instrumentálně). Pokud by vaše preference byly přechodné, pak byste nebyli zranitelní při výběru dominantní možnosti a sloužili jako peněžní pumpa. Vaše preference by proto měla být přechodná.o vašich nepřekonatelných preferencích existuje něco (instrumentálně). Pokud by vaše preference byly přechodné, pak byste nebyli zranitelní při výběru dominantní možnosti a sloužili jako peněžní pumpa. Vaše preference by proto měla být přechodná.
Zatímco výše uvedené diskuse nebyly vyřešeny, ve zbývající části této položky budou učiněny následující předpoklady: i) preferované objekty mohou být heterogenní vyhlídky, které zahrnují bohatou a rozmanitou doménu vlastností, ii) preference mezi možnostmi je úsudek srovnávací vhodnosti nebo vhodnosti výběru a iii) preference vyhovují jak Transitivitě, tak úplnosti (ačkoli druhá podmínka bude přezkoumána v oddíle 5). Nyní vyvstává otázka, zda existují další obecná omezení racionálního upřednostňování před opcemi.
2. Užitečná opatření preference
V našem pokračujícím zkoumání racionálních preferencí před vyhlídkami bude důležitá numerická reprezentace (nebo měření) preferenčních objednávek. Příslušná numerická měřítka jsou známa jako pomocné funkce. Dva hlavní typy obslužných funkcí, které budou hrát roli, jsou ordinální obslužná funkce a užitečnější funkce s intervalovou hodnotou (nebo kardinální funkce) bohatá na informace.
2.1 Řádné obslužné programy
Ukazuje se, že pokud je soubor perspektiv / možností, (S), konečný, může být jakýkoli slabý řád možností v (S) reprezentován běžnou obslužnou funkcí. Řekněme, že (u) je obslužná funkce s doménou (S). Řekneme, že funkce (u) představuje preferenci (preceq) mezi možnostmi v (S), pouze v případě:
) tag {1} text {Pro všechny} A, B / v S: u (A) leq u (B) Leftrightarrow A / preceq B)
Dalším způsobem, jak toho dosáhnout, je, že když výše uvedené platí, preferenční vztah může být reprezentován jako maximalizující obslužný program, protože vždy upřednostňuje možnost s nejvyšší obslužnou funkcí.
Jedinou informací obsaženou v řádkovém znázornění obslužného programu je to, jak agent, jehož preference jsou zastoupeny, objedná možnosti, od nejméně po nejvýhodnější. To znamená, že pokud (u) je ordinální obslužná funkce, která představuje uspořádání (preceq), pak jakákoli obslužná funkce (u '), která je ordinální transformací (u) - to znamená, jakákoli transformace (u), která také splňuje biconditional v (1) - představuje (preceq), stejně jako (u). Proto říkáme, že ordinální užitková funkce je jedinečná pouze do ordinálních transformací.
Výše uvedený výsledek lze shrnout takto:
Věta 1 (Řádná reprezentace). Nechť (S) bude konečná množina a (preceq) slabý preferenční vztah na (S). Pak existuje řádková obslužná funkce, která reprezentuje (preceq), pouze pokud je (preceq) úplná a přechodná.
Tato věta by neměla být příliš překvapivá. Pokud je (preceq) kompletní a tranzitivní přes (S), pak možnosti v (S) mohou být uspořádány v pořadí, od nejvíce k nejméně preferovaným, kde některé možnosti mohou spadat do stejné pozice (pokud jsou považovány za stejně žádoucí), ale pokud neexistují žádné cykly nebo smyčky. Věta 1 pouze říká, že můžeme možnostem v (S) přiřadit čísla způsobem, který představuje toto pořadí. (Jednoduchý důkaz věty 1, s výjimkou přísného, nikoli slabého preferenčního vztahu, konzultujte Peterson 2009: 95.)
Všimněte si, že pořadové nástroje nejsou příliš matematicky „mocné“. Nemá smysl například srovnávat pravděpodobnostní očekávání různých sad ordinálních utilit. Uvažujme například následující dva páry vyhlídek: prvkům prvního páru jsou přiřazeny pořadové utilitky 2 a 4, zatímco členům druhého páru jsou přiřazeny pořadové utilitky 0 a 5. Uveďme „ploché“rozdělení pravděpodobnosti v každém případě tak, že každý prvek ve dvou párech odpovídá pravděpodobnosti 0,5. Ve vztahu k tomuto přiřazení pravděpodobnosti je očekávání prvního páru řadových utilit 3, což je větší než 2,5, očekávání druhého páru. Přesto, když transformujeme ordinální nástroje přípustným způsobem - například zvýšením nejvyšší užitečnosti ve druhém páru z 5 na 10 - pořadí očekávání se obrátí; nyní je srovnání mezi 3 a 5. Význam tohoto bodu bude jasnější v tom, co následuje, když se podíváme na srovnávací hodnocení loterií a riskantních výběrů. Pro konzistentní hodnocení loterií / rizikových vyhlídek je nutná intervalová nebo kardinální užitková funkce. Stejným způsobem, za účelem vytvoření nebo konceptualizace kardinální užitkové funkce, se člověk obvykle odvolává na preference před loteriemi. Pro konzistentní hodnocení loterií / rizikových vyhlídek je nutná intervalová nebo kardinální užitková funkce. Stejným způsobem, za účelem vytvoření nebo konceptualizace kardinální užitkové funkce, se člověk obvykle odvolává na preference před loteriemi. Pro konzistentní hodnocení loterií / rizikových vyhlídek je nutná intervalová nebo kardinální užitková funkce. Stejným způsobem, za účelem vytvoření nebo konceptualizace kardinální užitkové funkce, se člověk obvykle odvolává na preference před loteriemi.
2.2 Nástroj pro kardinalizaci
Abychom získali kardinální (intervalově) reprezentaci utilit preferenčního uspořádání - tj. Opatření, které představuje nejen to, jak agent objednává možnosti, ale také říká něco o desirabilistické „vzdálenosti“mezi možnostmi - potřebujeme bohatší nastavení; sada voleb a odpovídající pořadí preferencí bude muset mít více struktury než pro běžné opatření. Jeden takový účet, kvůli Johnu von Neumannovi a Oskarovi Morgensternovi (1944), bude vyplacen podrobně níže. Prozatím je užitečné zaměřit se na druh možnosti, která je klíčem k pochopení a konstrukci kardinální užitkové funkce: loterií. [1]
Zvažte nejprve objednání tří pravidelných možností, např. Tří prázdninových destinací Amsterdam, Bangkok a Cardiff, označených (A), (B) a (C). Předpokládejme, že vaše preferované uspořádání je (A / prec B / prec C). Tyto informace postačují k řádnému vyjádření vašeho úsudku; Vzpomeňte si, že jakékoli přiřazení utilit je pak přijatelné, pokud (C) získá vyšší hodnotu než (B), která získá vyšší hodnotu než (A). Ale možná chceme vědět víc, než je možné z takové užitkové funkce odvodit - chceme vědět, kolik (C) je preferováno před (B), v porovnání s tím, kolik (B) je preferováno před (A). Například se může stát, že Bangkok je považován za téměř žádoucího jako Cardiff, ale Amsterdam je poměrně daleko za Bangkokem, relativně vzato. Nebo je snad Bangkok jen o něco lepší než Amsterdam,ve srovnání s tím, do jaké míry je Cardiff lepší než Bangkok. Tento druh informací o relativní vzdálenosti mezi možnostmi, pokud jde o sílu preference nebo vhodnosti, je přesně to, co je dáno užitečnou funkcí s hodnotou intervalu. Problém je v tom, jak zjistit tyto informace.
K vyřešení tohoto problému Ramsey (1926) a později von Neumann a Morgenstern (dále jen vNM) předložili následující návrh: konstruujeme novou možnost, loterii, (L), která má (A) a (C)) jako jeho možné „ceny“a my zjišťujeme, jakou šanci musí loterie udělit (C), abyste byli mezi touto loterií a dovolenou v Bangkoku lhostejní. Základní myšlenkou je, že váš úsudek o Bangkoku ve vztahu k Cardiffu na jedné straně a Amsterdamu na straně druhé, lze měřit podle rizikovosti loterie (L) zahrnující Cardiff a Amsterdam, které považujete za stejně žádoucí jako Bangkok. Například, pokud jste lhostejní mezi Bangkokem a loterií, která poskytuje velmi nízkou šanci na výhru výletu do Cardiffu, pak očividně nepovažujete Bangkok za mnohem lepší než Amsterdam, pokud jde o Cardiff; pro tebe,i malé zlepšení v Amsterdamu, tj. loterie s malou šancí na Cardiff spíše než v Amsterdamu, stačí, aby odpovídala Bangkoku.
Výše uvedená analýza předpokládá, že loterie jsou hodnoceny z hlediska očekávané vhodnosti výběru nebo vhodnosti. To znamená, že vhodnost loterie je ve skutečnosti součtem šancí na každou výhru vynásobenou žádoucím účinkem této výhry. Zvažte následující příklad: Předpokládejme, že jste lhostejní mezi loterií, (L) a dovolenou v Bangkoku, (B), když je šance na loterii, která má za následek dovolenou v Cardiffu, (3/4). Nazvěte tuto konkrétní loterii (L '). Myšlenka je taková, že Bangkok je tedy tři čtvrtiny cesty nahoru po požadované stupnici, která má Amsterdam dole a Cardiff nahoře. Pokud stanovíme, že (u (A) = 0) a (u (C) = 1), pak (u (B) = u (L ') = 3/4). To odpovídá očekávané vhodnosti - nebo, jak se obvykle říká, očekávané užitečnosti - loterie, protože (u (L ') = 1/4 / cdot 0 + 3/4 / cdot 1 = 3/4). To znamená, že hodnota loterie je pravděpodobnostně vážený součet užitečnosti jejích cen, kde je váha na každé ceně určena pravděpodobností, že loterie v této ceně vyústí.
Vidíme tedy, že intervalová užitková míra nad opcemi může být vytvořena zavedením loterijních opcí. Jak název napovídá, intervalová užitková míra poskytuje informace o relativních velikostech intervalů mezi možnostmi podle určité škály vhodnosti. To znamená, že nástroje jsou jedinečné poté, co jsme stanovili počáteční bod našeho měření a jednotkovou stupnici vhodnosti. Ve výše uvedeném příkladu bychom mohli například přiřadit užitečnou hodnotu 1 k (A) a 5 k (C), v takovém případě bychom museli přiřadit užitečnou hodnotu 4 k (B), protože 4 je 3/4 cesty mezi 1 a 5. Jinými slovy, jakmile jsme přiřadili hodnoty utility (A) a (C), utilitě (L ') a tak bylo určeno (B). Nazvěme tuto druhou pomocnou funkci (u '). Souvisí to s naší původní funkcí následovně: (u '= 4 / cdot u +1). Tento vztah vždy platí mezi dvěma takovými funkcemi: Pokud (u) je intervalová obslužná funkce, která představuje pořadí preferencí, (preceq) a (u ') je další obslužná funkce, která také představuje toto uspořádání, pak tam jsou konstanty (a) a (b), kde (a) musí být pozitivní, takže (u '= a / cdot u + b). To znamená, že intervalové užitkové funkce jsou jedinečné pouze do pozitivní lineární transformace.pak existují konstanty (a) a (b), kde (a) musí být kladné, takže (u '= a / cdot u + b). To znamená, že intervalové užitkové funkce jsou jedinečné pouze do pozitivní lineární transformace.pak existují konstanty (a) a (b), kde (a) musí být kladné, takže (u '= a / cdot u + b). To znamená, že intervalové užitkové funkce jsou jedinečné pouze do pozitivní lineární transformace.
Před ukončením diskuse o užitečnosti měření by měla být zmíněna dvě související omezení týkající se informací, které tato opatření sdělují. Zaprvé, protože obslužné programy opcí, ať už řádové nebo intervalové, mohou být určeny pouze ve vztahu k utilitám jiných opcí, neexistuje nic jako absolutní užitečnost opce, alespoň ne bez dalších předpokladů. [2]Zadruhé, podle stejného zdůvodnění nejsou ani intervalová, ani pořadová užitková opatření, jak jsou zde diskutována, interpersonálně úměrná s ohledem na úrovně a jednotky užitečnosti. Pro rychlou ilustraci předpokládejme, že vy i já máme výše uvedené uspořádání preferencí nad možnostmi dovolené: (A / prec B / prec C). Předpokládejme také, že, jak je uvedeno výše, jsme oba lhostejní mezi (B) a loterií (L '), která má (3/4) šanci na získání (C) a a (1/4) šance na výnos (A). Můžeme tedy říci, že udělení karty Cardiff a Bangkoku by se rovnalo stejné „celkové touze“jako udělení karty Cardiff a Bangkoku? Nemáme právo to říci. Naše společné předvolby objednávek jsou napříkladv souladu se mnou najít dovolenou v Cardiffu se splní sen, zatímco vy prostě zjistíte, že je to nejlepší ze špatného. Navíc ani nemůžeme říci, že rozdíl v potřebnosti mezi Bangkokem a Amsterdamem je pro vás stejný jako pro mě. Podle mého názoru by se žádost o tři možnosti mohla pohybovat od živého pekla po sen, zatímco podle vás od špatného po docela špatný; obě hodnocení jsou v souladu s výše uvedeným uspořádáním preferencí. Ve skutečnosti by to samé mohlo platit pro naše preference nad všemi možnými možnostmi, včetně loterií: i kdybychom sdíleli totéž pořadí úplných preferencí, může to být v případě, že jste prostě negativní dispozice - nenajdete jinou možnost tak skvělou, zatímco já Jsem velmi extrémní - některé možnosti jsou vynikající, ale jiné pouhé mučení. Užitečné funkce,ať už s intervalovým nebo ordinálním, neumožňuje smysluplné mezilidské srovnání. (Elster a Roemer 1993 obsahuje řadu článků zabývajících se těmito otázkami; viz také položka SEP o teorii sociálních výběrů.)
2.3 Věta o reprezentaci von Neumanna a Morgenstern (vNM)
V poslední části bylo provedeno intervalové znázornění užitkových preferencí osoby před loteriemi za předpokladu, že loterie jsou hodnoceny z hlediska očekávané užitečnosti. Někteří to mohou najít trochu rychle. Proč bychom měli předpokládat, že lidé hodnotí loterie z hlediska očekávaných užitkových vlastností? VNM věta účinně zaplňuje mezery v uvažování přesunutím pozornosti zpět na preferenční vztah. Kromě Transitivity a Completity zavádí vNM další principy upravující racionální preference před loteriemi a ukazuje, že preference agenta mohou být reprezentovány jako maximalizace očekávané užitečnosti, kdykoli její preference tyto zásady splní.
Nejprve formálně definujeme očekávanou užitečnost loterie: Nechť (L_i) je loterie ze sady loterií (bL) a (O_ {ik}) výsledek, nebo cena loterie (L_i), která vzniká pravděpodobností (p_ {ik}). Očekávaný nástroj (L_i) je pak definován jako:
Rovnice vNM
[EU (L_i) dot = / sum_k u (O_ {ik}) cdot p_ {ik})
Předpokládaný dříve lze nyní formálně vyjádřit:
begin {equation} tag {2} text {Pro libovolné} L_i, L_j / in / bL: L_i / preceq L_j / Leftrightarrow EU (L_i) leq EU (L_j) end {equation}
Když výše uvedené platí, říkáme, že existuje očekávaná obslužná funkce, která představuje preference agenta; jinými slovy, agent může být reprezentován jako maximalizace očekávané užitečnosti.
Otázka, kterou vNM adresa zní: Jaké druhy preferencí mohou být reprezentovány? Abychom mohli odpovědět na tuto otázku, musíme se vrátit k základnímu preferenčnímu vztahu (preceq) nad množinou možností, v tomto případě u loterií. VNM věta vyžaduje, aby množina (bL) loterií byla poměrně rozsáhlá: je uzavřena pod "pravděpodobnostní směsí", tj. Pokud (L_i, L_j / in / bL), pak složené loterie, které mají (L_i) a (L_j) jako možné ceny jsou také v (bL). (Další technický předpoklad, o kterém nebudeme podrobně diskutovat, je, že složené loterie lze v souladu se zákony pravděpodobnosti vždy redukovat na jednoduché loterie, které zahrnují pouze základní ceny.)
Již bylo diskutováno základní omezení racionality preferenčního vztahu - že slabě nařizuje možnosti (tj. Splňuje Transitivitu a Úplnost). Následující notace bude použita k zavedení dvou dalších preferenčních axiomů vNM: ({pA, (1-p) B }) označuje loterii, která vyústí buď v (A), s pravděpodobností (p), nebo (B), s pravděpodobností (1-p).
Axiom 3 (kontinuita)
Předpokládejme (A / preceq B / preceq C). Pak existuje (p / in [0,1]) takový, že:
) {pA, (1-p) C } sim B)
Axiom 4 (Nezávislost)
Předpokládejme (A / preceq B). Pak pro jakékoli (C) a libovolné (p / in [0,1]):
) {pA, (1-p) C } preceq {pB, (1-p) C })
Kontinuita znamená, že žádný výsledek není tak špatný, že byste nebyli ochotni vzít nějakou hazard, která by mohla vést k tomu, že skončí s tímto výsledkem, ale jinak by mohla vést k tomu, že skončí s příznivějším výsledkem pomocí vašich současných světel, pokud šance na lepší výsledek jsou dost dobré. Intuitivně kontinuita zaručuje, že hodnocení loterií agenta je přiměřeně citlivé na pravděpodobnost výhry loterií. Rovněž zajišťuje, jak název napovídá, že dostatečně bohaté uspořádání preferencí před loteriemi může být reprezentováno kontinuální kardinální funkcí.
Nezávislost znamená, že pokud mají dvě alternativy stejnou pravděpodobnost pro určitý konkrétní výsledek, mělo by být naše hodnocení těchto alternativ nezávislé na našem názoru na tento konkrétní výsledek. Intuitivně to znamená, že preference mezi loteriemi by se měly řídit pouze vlastnostmi loterií, které se liší; společné rysy mezi loteriemi by měly být účinně ignorovány. Pořadí preferencí musí splňovat určitou verzi axiomu Nezávislosti, aby bylo možné ji reprezentovat jako maximalizaci toho, co se nazývá aditivně oddělitelná funkce; zejména funkce, podle které je hodnota (tj. očekávaná užitečnost) opce (pravděpodobnostně váženou) součtem hodnot jejích možných výsledků.
Někteří lidé považují axiom kontinuity za nepřiměřené omezení racionálních preferencí. Existuje nějaká pravděpodobnost (p) taková, že byste byli ochotni přijmout hazard, který má takovou pravděpodobnost, že ztratíte život a pravděpodobnost ((1-p)), že vyhrajete 10 $? Mnoho lidí si myslí, že tam není. Stejní lidé by však pravděpodobně procházeli ulicí a vyzvedli si účet ve výši 10 $, který upustili. Ale to je jen brát hazard, který má velmi malou pravděpodobnost, že bude zabit autem, ale mnohem vyšší pravděpodobnost získání 10 $! Obecněji řečeno, ačkoli lidé o tom jen zřídka přemýšlejí, neustále přijímají hazardní hry, které mají nepatrné šance vést k imanentní smrti a odpovídajícím způsobem vysoké šance na skromnou odměnu. Pokaždé, když jdeme na procházku, řídíme auto, někam létáme atd.,existuje určitá šance, že budeme mít fatální nehodu. Ale vzhledem k tomu, že pravděpodobnost těchto nehod je dostatečně malá, rozhodujeme se vzít naše šance.
Nezávislost se jeví jako naléhavý požadavek racionality, je-li posuzována abstraktně. Přesto existují známé příklady, kdy lidé často porušují nezávislost, aniž by se zdali iracionální. Tyto příklady zahrnují komplementaritu mezi možnými výsledky loterií. Obzvláště dobře známým příkladem je tzv. Allais Paradox, který francouzský ekonom Maurice Allais (1953) poprvé představil na počátku 50. let. Paradox zapíná porovnání preferencí lidí nad dvěma páry loterií podobných těm, které jsou uvedeny v tabulce 1. Loterie jsou popsány z hlediska cen, které jsou spojeny s konkrétními očíslovanými lístky, kde bude jedna tiketa losována náhodně (například (L_1) vede k výhře 2 500 $, pokud je losován jeden z čísel označených 2–34).
1 | 2–34 | 35–100 | |
(L_1) | 0 $ | 2500 $ | 2400 $ |
(L_2) | 2400 $ | 2400 $ | 2400 $ |
1 | 2–34 | 35–100 | |
(L_3) | 0 $ | 2500 $ | 0 $ |
(L_4) | 2400 $ | 2400 $ | 0 $ |
Tabulka 1. Allaisův paradox
V této situaci mnoho lidí striktně upřednostňuje (L_2) před (L_1), ale také (L_3) před (L_4) (což dokazuje jejich výběrové chování i jejich svědectví), pár preference, které budou označovány jako preference Allais. [3] Běžným způsobem, jak racionalizovat Allaisovy preference, je to, že v situaci první volby, riziko, že skončí s ničím, když by někdo mohl mít 2400 $, neodůvodňuje zvýšenou šanci na vyšší cenu. Ve druhé volbě je však minimální zisk 0 $, bez ohledu na to, kterou volbu si vyberete. Proto v tomto případě si mnoho lidí myslí, že mírné riziko navíc 0 $ stojí za šanci na lepší cenu.
Zatímco výše uvedené odůvodnění se může zdát přesvědčivé, Allaisovy preference jsou v rozporu s axiomem Nezávislosti. Následující situace platí pro obě možnosti výběru: bez ohledu na to, jakou volbu provedete, dostanete stejnou cenu, pokud bude vylosována jedna z tipů v posledním sloupci. Nezávislost proto znamená, že vaše preference mezi (L_1) a (L_2) i vaše preference mezi (L_3) a (L_4) by měly být nezávislé na cenách v tomto sloupci. Když ale ignorujete poslední sloupec, (L_1) se stane identickým s (L_3) a (L_2) s (L_4). Pokud tedy dáváte přednost (L_2) před (L_1), ale (L_3) před (L_4), zdá se, že ve vašem preferenčním uspořádání je nekonzistentnost. A rozhodně došlo k porušení nezávislosti. V důsledku toho nelze dvojici preferovaných diskusí reprezentovat jako maximalizaci očekávané užitečnosti. (Tedy „paradox“:mnoho lidí si myslí, že nezávislost je požadavek racionality, ale přesto chtějí tvrdit, že o Allaisových preferencích není nic iracionálního.)
Teoretici rozhodování reagovali na Allaisův paradox různými způsoby. Tato otázka bude přezkoumána v oddíle 5.2, kde budou projednány problémy s teorií EU. Současným cílem je jednoduše ukázat, že kontinuita a nezávislost jsou přesvědčivými omezeními racionální preference, i když ne bez jejich kritiků. Výsledek vNM prokázaný lze shrnout takto:
Věta 2 (von Neumann-Morgenstern)
Nechť (bO) je konečná množina výsledků, (bL) množina odpovídajících loterií, která je uzavřena v rámci pravděpodobnostní směsi a (preceq) slabý preferenční vztah na (bL). Pak (preceq) vyhovuje axiomům 1–4 pouze tehdy, existuje-li funkce (u), od (bO) do množiny reálných čísel, která je jedinečná až po pozitivní lineární transformaci, a vzhledem k tomu, které (preceq) lze reprezentovat jako maximalizaci očekávané užitečnosti.
David Kreps (1988) poskytuje přístupnou ilustraci důkazu této věty. Důkaz probíhá ve dvou krocích: nejprve se prokáže existence intervalové užitkové funkce, která splňuje preferenční axiomy (jedná se o užitkovou funkci, která vyhodnocuje loterie z hlediska jejich očekávané užitečnosti, jak bylo popsáno výše). Pak je prokázána jedinečnost tohoto užitečného opatření (až po pozitivní lineární transformaci).
3. Realizace skutečných rozhodnutí
VNM věta je velmi důležitým výsledkem pro měření síly preferencí racionálního agenta před jistými možnostmi (loterie efektivně usnadňují kardinální opatření nad jistými možnostmi). Ale to nás nedostane celou cestu k racionálním rozhodnutím v reálném světě; zatím nemáme skutečnou teorii rozhodování. Věta je omezena na vyhodnocení možností, které přicházejí s objektivním rozdělením pravděpodobnosti podle výsledků - teoretici a ekonomové rozhodnutí o situaci často označují jako „volbu pod rizikem“(Knight 1921).
Ve většině běžných situacích volby nejsou objekty volby, nad nimiž musíme mít nebo formovat preference, takto. Tvůrci rozhodnutí musí spíše konzultovat svá přesvědčení o pravděpodobnosti, že jeden nebo druhý výsledek vyplyne z konkrétní možnosti. Rozhodnutí za takových okolností jsou často popisována jako „rozhodnutí pod nejistotou“(Knight 1921). Zvažte například situaci horolezce, který rozhoduje o tom, zda se pokusit o nebezpečný výstup na vrchol, nebo ne, pokud je pro ni klíčovým faktorem počasí. Pokud má štěstí, může mít přístup ke komplexním statistikám o počasí v regionu. Statistiky počasí se však liší od loterie, protože neurčují pravděpodobnost možných výsledků pokusu proti pokusu o vrchol v určitý den. V neposlední řadě,horolezec musí zvážit, jak sebevědomá je v alt ="
Obrázek 1. Ulyssesův rozhodovací problém
Bylo nám řečeno, že před zahájením by Ulysses nejraději slyšel sirény a vrátil se domů do Ithace. Problém je v tom, že Ulysses předpovídá, že jeho budoucí já nebude vyhovovat: pokud plachtí neomezeně, bude později sváděn sirénami a ve skutečnosti nebude pokračovat domů do Ithaky, ale raději zůstane na ostrově neomezeně dlouho. Ulysses proto zdůvodňuje, že by bylo lepší být svázán se stožárem, protože by raději hanbu a nepohodlí byl svázán se stožárem a aby se vrátil domů, aby zůstal navždy na ostrově sirén.
Nelze popřít, že Ulysses dělá moudré rozhodnutí, když je svázán se stožárem. Někteří se však domnívají, že Ulysses je stěží příkladným agentem - konec konců, musí hrát proti svému budoucímu já, kterého budou bezděčně svádět sirény. Zatímco Ulysses je racionální podle standardů statického rozhodování, můžeme ho považovat za iracionálního podle standardů postupného rozhodování. Aby byl Ulysses racionální v sekvenčním nebo dynamickém smyslu, musel by prokazovat nepřetržitou racionalitu po delší časové období: musel by, například, jednat jako maximalizér EU ve všech bodech výběru a navíc by neměl podléhat žádným nevyrovnaným změnám víra nebo touha, tj. změny, které nejsou v souladu se standardním pravidlem učení bayesovské kondicionalizace (která uvádí, že po učení některých návrhů jsou víry aktualizovány na příslušné podmíněné pravděpodobnosti). Jinými slovy, jeden by mohl mít za to, že model postupného rozhodování řeší problémy racionality v čase.
Zatímco racionalita v čase může mít nějaký význam (řekněme, když nám umožní identifikovat sériové chování), záleží však na tom, jak by měl agent jednat v kterémkoli daném okamžiku. Za tímto účelem je model sekvenčního rozhodování plodněji vnímán jako nástroj, který pomáhá určit racionální volbu v určitém čase, stejně jako model statického rozhodování. Sekvenční strom rozhodování je efektivním způsobem vizualizace časové řady voleb a vzdělávacích událostí, které agent věří, že se mu v budoucnu postaví, v závislosti na tom, jakou část stromu rozhodování se ocitne. Klíčovou otázkou tedy je: Jak by si agent měl vybrat ze svých počátečních možností s ohledem na svůj projektovaný strom rozhodování? Tato otázka vyvolala překvapivé množství kontroverze. V literatuře se objevily tři hlavní přístupy k vyjednávání stromů postupného rozhodování. Jedná se o naivní nebo myopický přístup, sofistikovaný přístup a rozhodný přístup. Budou diskutovány postupně a bude navrženo, že spory nemusí být podstatné, ale spíše naznačují jemné rozdíly ve výkladu modelů postupného rozhodování.
Takzvaný naivní přístup k vyjednávání postupných rozhodnutí slouží jako užitečný kontrast k ostatním dvěma přístupům. Naivní agent předpokládá, že jakákoli cesta skrz rozhodovací strom je možná, a tak se vydá na kteroukoli cestu, která je optimální, vzhledem k jeho současným postojům. Například naivní Ulysses by jednoduše předpokládal, že má na výběr tři obecné strategie: buď nařídit posádce, aby ho přivázala ke stožáru, nebo nevydat žádný takový rozkaz a později zastavit na ostrově sirén, nebo nevydat žádný takový rozkaz a později se držel jeho kurzu. Ulysses upřednostňuje výsledek spojený s posledně uvedenou kombinací, a tak zahajuje tuto strategii tím, že nařídí posádce, aby jej omezovala. Tabulka 5 uvádí statický protějšek naivního Ulyssesova rozhodovacího problému. V důsledku,tento rozhodovací model nebere v úvahu současnou znalost Ulyssese o jeho budoucích preferencích, a proto radí, aby použil možnost, o které se předpokládá, že je nemožná.
Akt | Výsledek |
objednat vázání na stožár | dostat se domů, nějaké ponížení |
plachta bez omezení pak zůstane u sirén | život se sirénami |
plachta bez omezení pak domů do Ithacy | dosáhnout domova, žádné ponížení |
Tabulka 5. Naïve Ulyssesův rozhodovací problém
Není třeba pracovat na tom, že naivní přístup k sekvenční volbě je vhodně pojmenován. Naproti tomu charakteristickým znakem sofistikovaného přístupu je jeho důraz na zpětné plánování: sofistikovaný volič nepředpokládá, že všechny cesty skrz rozhodovací strom nebo jinými slovy všechny možné kombinace voleb v různých uzlech výběru budou možné.. Agent se spíše zamyslí nad tím, co si bude chtít zvolit v pozdějších uzlech výběru, když se dostane do dané časové pozice. Sofistikovaný Ulysses by vzal na vědomí skutečnost, že pokud dorazí na ostrov sirén bez omezení, bude se chtít zastavit na neurčito, kvůli transformačnímu účinku písně sirén na jeho preference. To se pak odráží ve statickém znázornění rozhodovacího problému, jak je uvedeno v tabulce 6. Státy se týkají Ulyssesových budoucích preferencí, jakmile dorazí na ostrov. Protože druhý stav má pravděpodobnost nula, jedná se o aktech na základě prvního stavu, takže se Ulysses moudře rozhodne být vázán ke stožáru.
Akt | později zvolte sirény ((p = 1)) | později zvolte Ithaca ((p = 0)) |
objednat vázání na stožár | domů, nějaké ponížení | domů, nějaké ponížení |
plachta bez omezení | život se sirénami | doma, žádné ponížení |
Tabulka 6. Problém sofistikovaného rozhodování Ulysses
Rozhodná volba se odchyluje od sofistikované volby pouze za určitých podmínek, které Ulysses nesplňuje, vzhledem k jeho nevysvětlitelné změně postojů. Obránci rozhodné volby obvykle hájí teorie rozhodování, které porušují zásadu axiomu nezávislosti / jistoty (zejména McClennen 1990 a Machina 1989; viz také Rabinowicz 1995 k diskusi), a vyzývají k rozhodné volbě, aby byla jejich rozhodovací teorie chutnější v sekvenčním kontextu.. Podle rozhodného výběru by měl agent ve vhodných kontextech (včetně preferencí, které jsou stabilní, ale porušují nezávislost), počítat s tím, že se jednoduše bude držet strategie, která byla původně považována za nejlepší ve všech budoucích výběrových uzlech. Otázkou je, zda má rozhodný přístup smysl vzhledem k standardní interpretaci modelu sekvenčního rozhodování. Může agent opravdu počítat s tím, že se v určitém čase rozhodne proti svým preferencím, aby splnil starý plán? Zdálo by se, že jde o případ padajícího klamného omylu. Agent může samozřejmě klást značný význam na plnění předchozích závazků. Jakékoli takové obavy týkající se integrity by však měly být patrně zohledněny ve skutečných preferencích agenta v daném okamžiku. Je to docela odlišné od toho, jak vybrat krok za krokem s něčím, co je vše považováno za preferenční.v dotyčném čase. Je to docela odlišné od toho, jak vybrat krok za krokem s něčím, co je vše považováno za preferenční.v dotyčném čase. Je to docela odlišné od toho, jak vybrat krok za krokem s něčím, co je vše považováno za preferenční.
Je pravděpodobné, že obránci rozhodné volby mají na mysli odlišnou interpretaci sekvenčních rozhodovacích modelů, přičemž budoucí „body výběru“nejsou ve skutečnosti body, v nichž si agentka může svobodně vybrat podle svých preferencí v té době. Pokud je to správné, znamená to změnu otázky nebo problému zájmu. V následujícím se bude předpokládat standardní interpretace modelů postupného rozhodování a navíc se bude předpokládat, že racionální agenti o takových rozhodnutích rozumně uvažují (mimo jiné podle Levi 1991, Maher 1992, Seidenfeld 1994).
6.2 Axiomy EU byly znovu revidovány
Viděli jsme, že sekvenční rozhodovací stromy mohou agentovi, jako je Ulysses, pomoci posoudit důsledky své současné volby, aby mohl lépe přemýšlet o tom, co dělat nyní. Literatura o postupném výběru se však týká především ambicióznějších otázek. Sekvenční nastavení skutečně nabízí nové způsoby „testování“teorií racionálních preferencí, jakož i racionálních změn víry / touhy. Jedná se o kontrolované testy v tom, že se předpokládá, že agent předpovídá stabilní preference v průběhu času, tj. Neočekává, že se její preferenční uspořádání před konečnými výsledky změní, s výjimkou způsobů, které odpovídají jejímu pravidlu pro změnu víry / touhy. Přísně vzato, co se testuje, je celý balíček rozhodovacích pravidel plus pravidlo učení. V praxi se k nim přistupuje samostatně:různá pravidla rozhodování jsou srovnávána za předpokladu, že učení je Bayesovskou kondicionací, nebo jiná pravidla učení jsou srovnávána za předpokladu, že agent maximalizuje očekávanou užitečnost. Otázkou je, zda je rozhodnutí agenta nebo pravidlo učení se v jistém smyslu v sekvenčním nastavení ukázáno jako sebezničující (nebo jinými slovy dynamicky nekonzistentní).
Podívejme se nejprve na argument postupného rozhodování pro učení v reakci na nové důkazy Bayesovskou kondicionací, protože slouží jako užitečné srovnání pro další sekvenční argumenty. Skyrms (1993) uvádí takový argument; je to pravděpodobně nejnáročnější verze takzvané „diachronické nizozemské knihy“, argument pro podmíněnost, která je jediným racionálním pravidlem učení. Předpokládá se, že agent je očekávaným maximalizátorem užitečnosti, který zaujímá sofistikovaný (zpětně uvažující) přístup k problémům postupného rozhodování. Skyrms ukazuje, že jakýkoli takový agent, který se chce učit způsobem, který je v rozporu s podmíněností, učiní v některých speciálně vymyšlených situacích postupného rozhodování sebeporazující rozhodnutí. Naproti tomu dobrý kondicionační agent nikdy nebude provádět rozhodnutí, která se tímto způsobem poráží. Druhem „porážkových možností“, o které zde jde, jsou ty, které představují jistou ztrátu. To znamená, že si agent vybere strategii, která je podle vlastních světel určitě horší než jiná strategie, kterou by si jinak mohla zvolit, kdyby pouze její pravidlo učení bylo takové, že by si vybrala jinak na jednom nebo více budoucích výběrových uzlech.
Podobný argument lze použít k obraně preferencí EU. V tomto případě předpokládáme, že pravidlo učení agenta je podmíněnost; navíc předpokládáme, jako dříve, že agent má stabilní preference a zaujímá sofistikovaný přístup k problémům postupného rozhodování. Hammond (1976, 1977, 1988b, c) uvádí argument „dynamické konzistence“pro teorii EU, který je podobný výše uvedenému pro podmíněnost; ukazuje, že pouze preference se strukturou EU jsou takové, že agent může plánovat cestu jakoukoli cestou ve stromě postupného rozhodování, které agent považuje za optimální z uzlu počáteční volby. Na rozdíl od jiných preferenčních struktur (rozhodovacích pravidel), preference EU nikdy nevedou k „sebeporazitelným rozhodnutím“,v tom smyslu, že agent je nucen zvolit si strategii, která je horší díky jejím vlastním světlům, než jiná strategie, kterou by si jinak mohla zvolit, kdyby pouze její preference byly takové, že by si v budoucích volbách uzlů vybrala jinak.
Hammondův argument pro teorii EU a pojem dynamické konzistence, který vyvolává, byl kritizován z různých čtvrtí, a to jak těmi, kteří hájí teorie, které porušují axiom nezávislosti, ale zachovávají axiomy úplnosti a transitivity (tj. Objednávání) teorie EU, a ti, kdo hájí teorie, které ji porušují (k diskusi viz Steele 2010). Přístup, který zaujali někteří obránci teorií porušujících nezávislost (zejména Machina 1989 a McClennen 1990), byl již zmiňován: Odmítají předpoklad sofistikované volby, která řídí argumenty dynamické konzistence. Seidenfeld (1988a, b, 1994, 2000a, b) spíše odmítá Hammondovo pojetí dynamické konzistence ve prospěch jemnější představy, která rozlišuje mezi teoriemi, které porušují Řád, a těmi, které porušují samotnou nezávislost; bývalý,na rozdíl od posledně jmenovaného, projít Seidenfeldovým testem. Tento argument také není bez jeho kritiků (viz McClennen 1988, Hammond 1988a, Rabinowicz 2000). Upozorňujeme, že náklady na jakékoli odklony od teorie EU jsou dobře zdůrazněny Al-Najjarem a Weinsteinem (2009) a Kadaneem a kol. (2008), zejména možnost averze k bezplatným informacím a averze k příležitostem pro větší výběr v budoucnosti.
7. Závěrečné poznámky
Závěrem je shrnutí hlavních důvodů, proč je teorie rozhodnutí, jak je popsáno výše, filozoficky zajímavá. Zaprvé, normativní teorie rozhodování je zjevně (minimální) teorií praktické racionality. Cílem je charakterizovat postoje agentů, kteří jsou prakticky racionální, a různé (statické a sekvenční) argumenty jsou obvykle učiněny, aby ukázaly, že určité praktické katastrofy postihují agenty, kteří nesplňují standardní omezení teoreticko-teoretických rozhodnutí. Za druhé, mnoho z těchto omezení se týká přesvědčení agentů. Zejména normativní teorie rozhodování vyžaduje, aby míra přesvědčení agentů uspokojila axiomy pravděpodobnosti a aby reagovaly na nové informace kondicionalizací. Teorie rozhodování má proto velké důsledky pro debaty v epistemologii a filozofii vědy; to znamená,za teorie epistemické racionality.
A konečně, teorie rozhodování by měla být velkým zájmem filozofů mysli a psychologie a dalších, kteří se zajímají o to, jak lidé chápou chování a úmysly druhých; a obecněji, jak můžeme interpretovat, co se děje v myslích ostatních lidí. Teoretici rozhodování obvykle předpokládají, že chování osoby lze plně vysvětlit z hlediska jejích přesvědčení a tužeb. Ale možná ještě zajímavější je, že některé z nejdůležitějších výsledků teorie rozhodování - různé věty o zastoupení, z nichž některé zde byly diskutovány - naznačují, že pokud osoba splňuje určité požadavky na racionalitu, můžeme si přečíst její přesvědčení a touhy a jak silné jsou tyto víry a touhy jsou z jejího výběru dispozic (nebo preferencí). Jak nám tyto věty skutečně říkají, je věcí debaty, jak bylo uvedeno výše. Ale při optimistickém čtení těchto výsledků nás ujišťují, že můžeme smysluplně hovořit o tom, co se děje v myslích ostatních lidí, aniž by bylo mnoho důkazů mimo informace o jejich dispozicích k výběru.
Bibliografie
- Al-Najjar, Nabil I. a Jonathan Weinstein, 2009, „Averzní literatura o nejednoznačnosti: kritické hodnocení“, ekonomie a filozofie, 25: 249–284. [al-Najjar a Weinstein 2009 k dispozici online (pdf)]
- Allais, Maurice, 1953, „Le Comportement de l'Homme Rationnel devant le Risque: Critique des Postulats et Axiomes de l'Ecole Américaine“, Econometrica, 21: 503–546.
- Anscombe, FJ, 1963, „Sequential Medical Trials“, Journal of American Statistical Association, 58: 365–383.
- Anscombe, FJ a Robert J. Aumann, 1963, „Definice subjektivní pravděpodobnosti“, Annals of Mathematical Statistics, 34: 199–204.
- Ben-Haim, Yakov, 2001, Teorie informační mezery: Rozhodnutí pod těžkou nejistotou, Londýn: Academic Press.
- Bermúdez, José Luis, 2009, Výzvy k teorii rozhodování, Oxford: Oxford University Press.
- Binmore, Ken, 2009, Racionální rozhodnutí, Princeton, NJ: Princeton University Press.
- Bolker, Ethan D., 1966, „Funkce připomínající kusy opatření“, Transakce americké matematické společnosti, 124: 292–312.
- –––, 1967, „Simultánní axiomatizace užitečnosti a subjektivní pravděpodobnosti“, Filozofie vědy, 34: 333–340.
- Bradley, Richard, 1998, „Reprezentační věta pro teorii rozhodování s podmínkami“, Synthese, 116: 187–222
- –––, 2004, „Ramseyova reprezentační věta“, Dialectica, 4: 484–497.
- ––– 2007, „Sjednocená bayesovská teorie rozhodnutí“, Teorie a rozhodnutí, 63: 233–263.
- Bradley, Richard a H. Orri Stefánsson, 2016, „Counterfactual Desirability“, British Journal for the Philosophy of Science, v tisku.
- ––– 2016, „Touha, očekávání a Invariance“, Mysl, v tisku.
- Broome, John, 1991a, Vážící zboží: Rovnost, Nejistota a Čas, Oxford: Blackwell.
- –––, 1991b, „Struktura dobra: Teorie rozhodování a etika“, v základech Teorie rozhodování, Michael Bacharach a Susan Hurley (ed.), Oxford: Blackwell, s. 123–146.
- –––, 1991c, „Touha, víra a očekávání“, Mind, 100: 265–267.
- –––, 1993, „Může být Human umírněný?“, V Value, Welfare and Morality, GR Frey and Christopher W. Morris (eds.), Cambridge: Cambridge University Press. str. 51–73.
- Buchak, Lara, 2013, Risk and Rationality, Oxford: Oxford University Press.
- –––, nadcházející „Teorie rozhodnutí“, v Oxfordské příručce pravděpodobnosti a filozofie, Christopher Hitchcock a Alan Hájek (ed.), Oxford: Oxford University Press.
- Byrne, Alex a Alan Hájek, 1997, „David Hume, David Lewis a Teorie rozhodování“, Mind, 106: 411–728.
- Chang, Ruth, 2002, „Možnost parity“, etika, 112: 659–688.
- Colyvan, Mark, Damian Cox a Katie Steele, 2010, „Modelování morální dimenze rozhodnutí“, Noûs, 44: 503–529.
- Dietrich, Franz a Christian List, 2013, „Důvodová teorie racionálního výběru“, Noûs, 47: 104–134.
- ––– 2015, „Výběr na základě odůvodnění a závislost na kontextu: vysvětlující rámec“, ekonomie a filozofie, v tisku.
- ––– 2015, „Mentalismus versus behaviourismus v ekonomii: filozofická věda“, ekonomie a filozofie, v tisku.
- Dreier, James, 1996, „Racionální preference: Teorie rozhodování jako teorie praktické racionality“, Teorie a rozhodnutí, 40: 249–276.
- Elster, Jon a John E. Roemer (eds.), 1993, Interpersonal Srovnání pohody, Cambridge: Cambridge University Press.
- Gärdenfors, Peter a Nils-Eric Sahlin, 1982, „Pravděpodobnosti nespolehlivosti, riskování a rozhodování“, dotisknut v P. Gärdenfors a N.-E. Sahlin (eds.), 1988, Decision, Probability and Utility, Cambridge: Cambridge University Press, 313–334.
- Gilboa, Itzhak a David Schmeidler, 1989, „Maxmin Očekávaná užitečnost s nejedinečnou předchozí“, Journal of Mathematical Economics, 18: 141–153.
- Good, IJ, 1967, „Na principu úplného důkazu“, British Journal for the Philosophy of Science, 17: 319–321.
- Guala, Francesco, 2006, „Byla vyvrácena teorie her?“, Journal of Philosophy, 103: 239–263.
- ––– 2008, „Paradigmatické experimenty: hra Ultimatum od testování po měřicí zařízení“, Filozofie vědy, 75: 658–669.
- Gustafsson, Johan E., 2010, „Peníze-pumpa pro acyklické intranzitivní preference“, Dialectica, 64: 251–257.
- ––– 2013, „Irelevance argumentu Dykronické peněžní pumpy pro acyklitu“, Journal of Philosophy, 110: 460–464.
- Hájek, Alan a Philip Pettit, 2004, „Desire Beyond Belief“, Australasian Journal of Philosophy, 82: 77–92.
- Halpern, Joseph Y., 2003, Rozum o nejistotě, Cambridge, MA: MIT Press.
- Hammond, Peter J., 1976, „Změna chutí a koherentní dynamická volba“, Přehled ekonomických studií, 43: 159–173.
- –––, 1977, „Dynamic Restrictions on Metastatic Choice“, Economica 44: 337–350.
- –––, 1988a „Teorie řádného rozhodování: komentář k profesorovi Seidenfeldovi“, ekonomie a filozofie, 4: 292–297.
- –––, 1988b, „Důsledek a Axiom nezávislosti“, v Risk, Decision and Rationality, BR Munier (ed.), Dordrecht: D. Reidel.
- –––, 1988c, „Následné základy pro očekávanou teorii užitečnosti“, teorie a rozhodnutí, 25: 25–78.
- Hausman, Daniel M., 2011, „Chyby o preferencích ve společenských vědách“, Filozofie sociálních věd, 41: 3–25.
- Heap, Shaun Hargreaves, Martin Hollis, Bruce Lyons, Robert Sugden a Albert Weale, 1992, Theory of Choice: Critical Introduction, Oxford: Blackwell Publishers.
- Hill, Brian, 2013, „Důvěra a rozhodnutí“, Hry a ekonomické chování, 82: 675–692.
- Jackson, Frank a Michael Smith, 2006, „Absolutistické morální teorie a nejistota“, The Journal of Philosophy, 103: 267–283.
- Jeffrey, Richard C., 1965, Logic of Decision, New York: McGraw-Hill.
- –––, 1974, „Předvolby mezi preferencemi“, The Journal of Philosophy, 71: 377–391.
- –––, 1983, „Bayesianismus s lidskou tváří“, v testování vědeckých teorií, John Earman (ed.), Minneapolis: University of Minnesota Press, str. 133–156.
- Joyce, James M., 1998, „Ned Pragmatická ospravedlnění pravděpodobnosti“, Filozofie vědy 65: 575–603.
- –––, 1999, základy teorie příčinných rozhodnutí, New York: Cambridge University Press.
- –––, 2002, „Levi o teorii příčinných rozhodnutí a možnost předpovídat vlastní činy“, filozofická studia, 110: 69–102.
- –––, 2010, „Obrana nepřesných kreditů při odvozování a rozhodování“, filozofické perspektivy, 24: 281–323.
- Kadane, Joseph B., Mark J. Schervish a Teddy Seidenfeld, 2008, „Je Ignorance Bliss?“, Journal of Philosophy, 105: 5–36.
- Keeney, Ralph L. a Howard Raiffa, 1993, Rozhodnutí s více cíli: Předvolby a hodnota kompromisů, Cambridge: Cambridge University Press.
- Klibanoff, Peter, Massimo Marinacci a Sujoy Mukerji, 2005, „Hladký model rozhodování pod dvojznačností“, Econometrica, 73: 1849–1892.
- Knight, Frank, 1921, Risk, Neistota a Zisk, Boston, MA: Houghton Mifflin Company.
- Kreps, David M., 1988, Poznámky k teorii volby, Boulder, Colorado: Westview Press.
- Levi, Isaac, 1986, Hard Choices: Rozhodování za nevyřešeného konfliktu, Cambridge: Cambridge University Press.
- –––, 1991, „Důsledek a sekvenční výběr“, v základech teorie rozhodování, M. Bacharach a S. Hurley (ed.), Oxford: Basil Blackwell, s. 70–101.
- Lewis, David, 1988, „Touha jako víra“, Mind, 97: 323–332.
- –––, 1996, „Touha jako víra II“, Mind, 105: 303–313.
- Loomes, Graham a Robert Sugden, 1982, „Teorie lítosti: Alternativní teorie racionálního výběru za nejistoty“, The Economic Journal, 92: 805–824.
- Machina, Mark J., 1989, „Dynamická konzistence a neočekávané užitečné modely výběru za nejistoty“, Journal of Economic Literature, 27: 1622–1668.
- Maher, Patrick, 1992, „Diachronic Racionalita“, Filozofie vědy, 59: 120–141.
- Mandler, Michael, 2001, „Obtížná volba v teorii preferencí: racionalita implikuje úplnost nebo transitivitu, ale ne obojí“, v různých praktických úvahách, Elijah Millgram (ed.), Cambridge, MA: MIT Press, str. 373–402.
- McClennen, Edward F., 1988, „Řád a nezávislost: komentář k profesorovi Seidenfeldovi“, ekonomie a filozofie, 4: 298–308.
- –––, 1990, Racionalita a dynamická volba: Základní zkoumání. Cambridge: Cambridge University Press.
- Peterson, Martin, 2009, Úvod do teorie rozhodování, Cambridge: Cambridge University Press.
- Pettit, Philip, 1993, „Teorie rozhodování a lidová psychologie“, v základech teorie rozhodování: problémy a zálohy, Michael Bacharach a Susan Hurley (ed.), Oxford: Blackwell, s. 147–175.
- Rabinowicz, Wlodek, 1995, „Mít dort a sníst ho, také: Postupná volba a porušení očekávané užitečnosti“, Journal of Philosophy, 92: 586–620.
- –––, 2000, „Preferenční stabilita a nahrazení indiferentů: duplika se Seidenfeldem“, Teorie a rozhodnutí, 48: 311–318.
- ––– 2002, „Vytváří praktická úvaha sebepředpovědi?“, Erkenntnis, 57: 91–122.
- Ramsey, Frank P., 1926/1931, „Pravda a pravděpodobnost“, v základech matematiky a dalších logických esejích, RB Braithwaite (ed.), Londýn: Kegan, Paul, Trench, Trubner & Co., s. 156– 198.
- –––, 1990, „Váha hodnoty znalostí“, British Journal for the Philosophy of Science, 41: 1-4.
- Resnik, Michael D., 1987, Choices: Úvod do teorie rozhodování, Minneapolis: University of Minnesota Press.
- Savage, Leonard J., 1954, základy statistik, New York: John Wiley a synové.
- Schervish, Mark J., Teddy Seidenfeld, Joseph B. Kadane a Isaac Levi, 2003, „Rozšíření očekávané teorie užitku a některých omezení párových srovnání“, sborník třetího ISIPTA (JM), 496–510.
- Seidenfeld, Teddy, 1988a, „Teorie rozhodování bez„ nezávislosti “nebo bez„ objednávání ““, ekonomie a filozofie, 4: 309–315.
- –––, 1988b, „Rejoinder [Hammondovi a McClennenovi““, Economics and Philosophy, 4: 309–315.
- –––, 1994, „Když se normální a rozsáhlá rozhodnutí o formě liší, logika, metodologie a filozofie vědy, IX: 451–463.
- –––, 2000a, „Substituce lhostejných možností v uzlech výběru a přípustnost: odpověď na Rabinowicze“, Teorie a rozhodnutí, 48: 305–310.
- –––, 2000b, „Postuláty nezávislosti, hypotetické a zavolané: Další odpověď Rabinowicze“, Teorie a rozhodnutí, 48: 319–322.
- Sen, Amartya, 1973, „Chování a koncepce preference“, Economica, 40: 241–259.
- –––, 1977, „Rational Fools: Critique of Behavioural Foundations of theory of theory of theory of theory of Economic Theory“, Filozofie a veřejné záležitosti, 6: 317–344.
- Skyrms, Brian, 1993, „Chyba v argumentech dynamické koherence?“, Filozofie vědy, 60: 320–328.
- Stalnaker, Robert C., 1987, Poptávka, Cambridge, MA: MIT Press.
- Steele, Katie S., 2010, „Jaké jsou minimální požadavky racionálního výběru ?: Argumenty z nastavení sekvenčního rozhodnutí“, Teorie a rozhodnutí, 68: 463–487.
- Stefánsson, H. Orri, 2014, „Touhy, přesvědčení a podmíněná touha“, Synthese, 191: 4019–4035.
- Suppes, Patrick, 2002, Reprezentace a invence vědeckých struktur, Stanford, CA: Publikace CSLI.
- Temkin, Larry, 2012, Přehodnocení dobrého: Morální ideály a povaha praktického uvažování, Oxford: Oxford University Press.
- Tversky, Amos, 1975, „Kritika očekávané teorie užitku: popisné a normativní úvahy“, Erkenntnis, 9: 163–173.
- Villegas, C., 1964, „O kvalitativní pravděpodobnosti (sigma) - Algebry“, Annals of Mathematical Statistics, 35: 1787–1796.
- von Neumann, John a Oskar Morgenstern, 1944, Teorie her a ekonomického chování, Princeton: Princeton University Press.
- Walley, Peter, 1991, Statistické uvažování s nepřesnými pravděpodobnostmi, New York: Chapman and Hall.
- Zynda, Lyle, 2000, „Reprezentační věty a realismus o stupních víry“, Filozofie vědy, 67: 45–69.
Akademické nástroje
![]() |
Jak citovat tento záznam. |
![]() |
Náhled na PDF verzi tohoto příspěvku v Friends of the SEP Society. |
![]() |
Vyhledejte toto vstupní téma v projektu Internet Philosophy Ontology Project (InPhO). |
![]() |
Vylepšená bibliografie tohoto záznamu ve PhilPapers s odkazy na jeho databázi. |
Další internetové zdroje
- Bradley, Richard, 2014, Teorie rozhodování: Formální filozofický úvod.
- Hansson, Sven Ove, 1994, Teorie rozhodnutí: Stručný úvod.
Doporučená:
Středověké Teorie Svědomí

Vstupní navigace Obsah příspěvku Bibliografie Akademické nástroje Náhled PDF přátel Informace o autorovi a citaci Zpět na začátek Středověké teorie svědomí Poprvé publikováno po 23. listopadu 1998; věcná revize Čt 23.
Teorie Vědomí Sedmnáctého Století

Vstupní navigace Obsah příspěvku Bibliografie Akademické nástroje Náhled PDF přátel Informace o autorovi a citaci Zpět na začátek Teorie vědomí sedmnáctého století První publikováno Čt 29 července 2010; věcná revize pá 3.
Středověké Teorie Důsledků

Vstupní navigace Obsah příspěvku Bibliografie Akademické nástroje Náhled PDF přátel Informace o autorovi a citaci Zpět na začátek Středověké teorie důsledků Poprvé publikováno po 11. června 2012; věcná revize Čt 7. července 2016 Latinské středověké teorie důsledků jsou systematické analýzy latinských středověkých autorů [
Teorie Společného Smluvního Práva

Vstupní navigace Obsah příspěvku Bibliografie Akademické nástroje Náhled PDF přátel Informace o autorovi a citaci Zpět na začátek Teorie společného smluvního práva První publikované Pá 9. září 2015 Smlouva je pobočkou soukromého práva.
Teorie Příčinných Rozhodnutí

Vstupní navigace Obsah příspěvku Bibliografie Akademické nástroje Náhled PDF přátel Informace o autorovi a citaci Zpět na začátek Teorie příčinných rozhodnutí První publikováno 25. října 2008; věcná revize Út 15. listopadu 2016 Teorie kauzálního rozhodnutí přijímá principy racionální volby, které dbají na důsledky aktu.