Normativní Teorie Racionálního Výběru: Očekávaný Užitek

Obsah:

Normativní Teorie Racionálního Výběru: Očekávaný Užitek
Normativní Teorie Racionálního Výběru: Očekávaný Užitek

Video: Normativní Teorie Racionálního Výběru: Očekávaný Užitek

Video: Normativní Teorie Racionálního Výběru: Očekávaný Užitek
Video: Max Weber: Teoria da Burocracia - Brasil Escola 2024, Březen
Anonim

Vstupní navigace

  • Obsah příspěvku
  • Bibliografie
  • Akademické nástroje
  • Náhled PDF přátel
  • Informace o autorovi a citaci
  • Zpět na začátek

Normativní teorie racionálního výběru: Očekávaný užitek

První publikováno 8. srpna 2014; věcná revize Čt 15. srpna 2019

Často musíme činit rozhodnutí za podmínek nejistoty. Získání titulu v biologii může vést k lukrativnímu zaměstnání nebo k nezaměstnanosti a rozdrcení dluhu. Lékařské jmenování může mít za následek včasné odhalení a léčbu nemoci, nebo to může být plýtvání penězi. Očekávaná teorie užitku je popis toho, jak racionálně zvolit, když si nejste jisti, jaký výsledek vyplyne z vašich jednání. Jeho základní slogan je: vybrat akt s nejvyšší očekávanou užitečností.

Tento článek pojednává o očekávané užitkové teorii jako o normativní teorii - tedy o tom, jak by se lidé měli rozhodovat. V klasické ekonomice se očekávaná teorie užitečnosti často používá jako popisná teorie - to jest, teorie, jak lidé dělají rozhodnutí - nebo jako prediktivní teorie - to je teorie, která sice nemusí přesně modelovat psychologické mechanismy rozhodování, správně předpovídá výběr lidí. Očekávaná teorie užitku činí chybné předpovědi o rozhodnutích lidí v mnoha situacích volby skutečného života (viz Kahneman a Tversky 1982); to však neřeší, zda by se lidé měli rozhodovat na základě očekávaných úvah o prospěšnosti.

Očekávaná užitečnost činu je vážený průměr užitečnosti každého z jeho možných výsledků, přičemž užitečnost výsledku měří rozsah, v jakém je tento výsledek přednostní nebo výhodnější než alternativy. Užitečnost každého výsledku je zvážena podle pravděpodobnosti, že akt k tomuto výsledku povede. Sekce 1 podrobněji popisuje tuto základní definici očekávané užitečnosti a diskutuje její vztah k výběru. Část 2 popisuje dva typy argumentů pro očekávanou teorii užitečnosti: věty o reprezentaci a dlouhodobé statistické argumenty. Část 3 se zabývá námitkami proti očekávané teorii užitečnosti; oddíl 4 diskutuje jeho aplikace ve filozofii náboženství, ekonomie, etiky a epistemologie.

  • 1. Definování očekávané obslužnosti

    • 1.1 Podmíněné pravděpodobnosti
    • 1.2 Výsledkové nástroje
  • 2. Argumenty očekávané teorie užitku

    • 2.1 Dlouhodobé argumenty
    • 2.2 Reprezentační věty
  • 3. Námitky proti očekávané teorii užitečnosti

    • 3.1 Maximalizace očekávané užitečnosti je nemožná
    • 3.2 Maximalizace očekávané užitečnosti je iracionální
  • 4. Aplikace

    • 4.1 Ekonomika a veřejná politika
    • 4.2 Etika
    • 4.3 Epistemologie
    • 4.4 Zákon
  • Bibliografie
  • Akademické nástroje
  • Další internetové zdroje
  • Související záznamy

1. Definování očekávané obslužnosti

Koncept očekávané užitečnosti je nejlépe ilustrován na příkladu. Předpokládejme, že plánuji dlouhou procházku a je třeba se rozhodnout, zda si vezmu deštník. Za slunečného dne bych raději nebral deštník, ale raději bych s deštníkem čelil dešti než bez něj. K dispozici jsou dva akty: vzít deštník a nechat ho doma. Který z těchto činů bych si měl vybrat?

Tento neformální popis problému může být přepracován, trochu formálně, z hlediska tří druhů entit. Za prvé, existují výsledky - ukázky nemateriálních preferencí. V příkladu bychom mohli rozlišit tři výsledky: buď skončím suchým a nezatíženým; Nakonec jsem suchý a zatížený nepraktickým deštníkem; nebo skončím mokrý. Za druhé, existují rozhodnutí, která jsou mimo kontrolu tvůrce rozhodnutí a která ovlivňují výsledek rozhodnutí. V příkladu jsou dva stavy: buď prší, nebo ne. Konečně jsou zde činy - ukázky instrumentálních preferencí tvůrce rozhodnutí a v jistém smyslu věci, které může udělat. V příkladu jsou dva akty: mohu přinést deštník; nebo to nechte doma. Očekávaná teorie užitečnosti poskytuje způsob klasifikace aktů podle toho, jak jsou vhodné:čím vyšší je očekávaná užitečnost, tím lepší je vybrat akt. (Proto je nejlepší vybrat akt s nejvyšší očekávanou užitečností - nebo jedním z nich, v případě, že bude spojeno několik aktů.)

Na základě obecné konvence učiním následující předpoklady o vztazích mezi činy, stavy a výsledky.

  • Státy, akty a výsledky jsou návrhy, tj. Sady možností. Existuje maximální sada možností, (Omega), jejichž každý stav, akt nebo výsledek je podmnožinou.
  • Sada aktů, sada stavů a sada výsledků jsou všechny oddíly na (Omega). Jinými slovy, činy a stavy jsou individualizovány tak, že každá možnost v (Omega) je taková, kde přesně jeden stát získá, agent vykonává přesně jeden akt a přesně následuje jeden výsledek.
  • Akty a státy jsou logicky nezávislé, takže žádný stát nevylučuje provedení jakéhokoli činu.
  • V tuto chvíli předpokládám, že vzhledem ke stavu světa má každý akt přesně jeden možný výsledek. (Oddíl 1.1 stručně pojednává o tom, jak lze tento předpoklad oslabit.)

Příklad deštníku lze tedy znázornit v následující matici, kde každý sloupec odpovídá stavu světa; každý řádek odpovídá činu; a každý záznam odpovídá výsledku, který vyplývá, když je akt proveden ve stavu světa.

státy
prší neprší
jedná vzít deštník zatížený, suchý zatížený, suchý
nechat deštník mokrý zdarma, suché

Po nastavení základního rámce mohu nyní přesně definovat očekávanou užitečnost. Očekávaná užitečnost aktu (A) (například s ohledem na můj deštník) závisí na dvou vlastnostech problému:

  • Hodnota každého výsledku, měřená skutečným číslem, se nazývá nástroj.
  • Pravděpodobnost každého výsledku podmíněného (A).

S ohledem na tyto tři informace je očekávaná utilita (A) definována jako:

[EU (A) = / sum_ {o / in O} P_ {A} (o) U (o))

kde (O) je sada výsledků, (P_ {A} (o)) je pravděpodobnost výsledku (o) podmíněného (A) a (U (o)) je obslužný program (o).

Následující dvě pododdíly rozbalí podmíněnou pravděpodobnostní funkci (P_A) a pomocnou funkci (U).

1.1 Podmíněné pravděpodobnosti

Termín (P_ {A} (o)) představuje pravděpodobnost (o) danou (A) - zhruba, jak je pravděpodobné, že k tomuto výsledku dojde (o) za předpokladu, že agent vybere akt (A). (Pro axiomy pravděpodobnosti viz položka o interpretacích pravděpodobnosti.) Abychom pochopili, co to znamená, musíme odpovědět na dvě otázky. Za prvé, která interpretace pravděpodobnosti je vhodná? A za druhé, co to znamená přiřadit pravděpodobnost za předpokladu, že si agent vybere akt (A)?

Očekávaní teoretici užitečnosti často interpretují pravděpodobnost jako měření individuálního stupně víry, takže výrok (E) je pravděpodobný (pro agenta) do té míry, že tento agent je přesvědčen o (E) (viz například Ramsey 1926, Savage 1972, Jeffrey 1983). Ale nic ve formalismu očekávané teorie užitku nás nutí tuto interpretaci. Místo toho bychom mohli interpretovat pravděpodobnosti jako objektivní šance (jako v von Neumann a Morgenstern 1944), nebo jako stupně víry, které jsou podloženy důkazy, pokud bychom si mysleli, že to jsou lepší vodítka pro racionální jednání. (Viz položka o interpretacích pravděpodobnosti pro diskusi o těchto a dalších možnostech.)

Jaká je pravděpodobnost, že agent vybere (A)? Zde jsou dva základní typy odpovědí, které odpovídají teorii evidenčního rozhodování a teorii kauzálního rozhodnutí.

Podle teorie důkazů rozhodování, kterou schválil Jeffrey (1983), je příslušnou předpokládanou pravděpodobností (P_ {A} (o)) podmíněná pravděpodobnost (P (o / mid A)), definovaná jako poměr dvou bezpodmínečné pravděpodobnosti: (P (A / amp o) / P (A)).

Proti Jeffreyho definici očekávané užitečnosti Spohn (1977) a Levi (1991) namítají, že tvůrce rozhodnutí by neměl přiřadit při rozhodování pravděpodobnosti samotným jednáním: při svobodném rozhodování, zda provést čin (A), byste neměli ' t vzít v úvahu vaše přesvědčení o tom, zda budete provádět (A). Pokud mají Spohn a Levi pravdu, Jeffreyho poměr není definován (protože jeho jmenovatel není definován).

Nozick (1969) vznáší další námitku: Jeffreyova definice dává podivné výsledky v problému Newcomb. Prediktor vám podá uzavřenou krabici, která obsahuje buď 0, nebo 1 milion $, a nabídne vám otevřenou krabici, která obsahuje dalších 1 000 $. Můžete buď odmítnout otevřené pole („one-box“), nebo otevřít otevřené pole („two-box“). Ale je tu háček: prediktor předem předpověděl váš výběr a všechny její předpovědi jsou 90% přesné. Jinými slovy, pravděpodobnost, že jste jedno pole, vzhledem k tomu, že vás předpovídá jedno pole, je 90%, a pravděpodobnost, že vás dvě pole, vzhledem k tomu, že vám předpovídá dvě pole, je 90%. A konečně, obsah uzavřeného boxu závisí na predikci: pokud si prediktor myslel, že byste dva-box, nedala nic do uzavřeného boxu, zatímco pokud si myslela, že byste jeden-box, vložila 1 milion dolarů do uzavřeného boxu. Matice pro vaše rozhodnutí vypadá takto:

státy
1 milion dolarů v uzavřené krabici 0 $ v uzavřené krabici
jedná jedna krabice 1 000 000 $ 0 $
dvě krabice 1 000 000 $ 1 000 $

V jednom stavu dominuje dvoupóra: v každém státě vede dvojí box k lepšímu výsledku. Přesto je Jeffreyho definice podmíněné pravděpodobnosti, jedno-box má vyšší očekávanou užitečnost než dva-box. Existuje vysoká podmíněná pravděpodobnost nalezení 1 milionu USD v uzavřeném boxu, vzhledem k tomu, že máte jedno pole, takže jedno pole má vysokou očekávanou utilitu. Stejně tak existuje vysoká podmíněná pravděpodobnost, že v uzavřeném boxu nic nenajdete, vzhledem k tomu, že máte dva, takže dvou-box má nízkou očekávanou užitečnost.

Teorie příčinných rozhodnutí je alternativní návrh, který tyto problémy obchází. Nevyžaduje (ale stále dovoluje) jednání, aby měla pravděpodobnosti, a doporučuje, aby se v problému Newcomb objevilo dva pole.

Teorie příčinných rozhodnutí přichází v mnoha variantách, ale vezmu v úvahu reprezentativní verzi navrženou Savage (1972), která spočítá (P_ {A} (o)) sčítáním pravděpodobností stavů, které v kombinaci s aktem (A), vede k výsledku (o). Nechť (f_ {A, s} (o)) je výstupem, který mapuje (o) na 1, pokud (o) je výsledkem provádění (A) ve stavech s, maps (o) jinak 0. Pak

[P_ {A} (o) = / sum_ {s / in S} P (s) f_ {A, s} (o))

Na Savageův návrh přichází dvou box s vyšší očekávanou obslužností než jedno box. Tento výsledek neplatí bez ohledu na to, jaké pravděpodobnosti přidělíte státům před rozhodnutím. Nechť (x) je pravděpodobnost, kterou přiřadíš stavu, že uzavřené pole obsahuje $ 1 milion. Podle Savage jsou očekávané utajení jednoho boxu a dvou boxů:

[x { cdot} U ({1 000 000 $}) + (1 - x) { cdot} U (0 $))

a

[x { cdot} U ({1 000 000 $}) + (1 - x) { cdot} U ({1 000 $}))

Pokud jsou větší peněžní částky přiděleny přísně větším utilitám, je zaručeno, že druhá částka (užitek dvou boxů) bude větší než první (užitečnost jednoho boxu).

Savage předpokládá, že každý akt a stav jsou dostatečné k tomu, aby jednoznačně určily výsledek. Existují však případy, kdy se tento předpoklad rozpadne. Předpokládejme, že mi nabídnete prodat následující hazard: hodíš minci; pokud mince přistane, vyhraju 100 $; a pokud mince přistane ocasy, ztratím 100 dolarů. Ale odmítám hazard a mince se nikdy nehazují. Neexistoval by žádný výsledek, který by vyústil, kdyby se hodila mince - možná bych vyhrál 100 $ a mohl bych ztratit 100 $.

Můžeme zobecnit Savageův návrh tím, že necháme (f_ {A, s}) být pravděpodobnostní funkcí, která mapuje výsledky na reálná čísla v intervalu ([0, 1]). Lewis (1981), Skyrms (1980) a Sobel (1994) srovnávají (f_ {A, s}) s objektivní šancí, že (o) by byl výsledkem, kdyby byl získán stát (s) a agent vybral akci (A).

V některých případech - nejznámějším je Newcombův problém - Jeffreyova definice a Savageova definice očekávané užitečnosti se rozpadnou. Ale pokud jsou splněny následující dvě podmínky, souhlasí.

  • Činy jsou pravděpodobně na státech nezávislé. Formálně pro všechny činy (A) a stavy (s), [P (s) = P (s / střed A) = / frac {P (s / amp A)} {P (A)}.) (Toto je stav, který je porušen v problému Newcomb.)
  • Pro všechny výstupy (o), akty (A) a stavy (s), (f_ {A, s} (o)) se rovná podmíněné pravděpodobnosti dané (o) (A) a (s); z formálního hlediska, [f_ {A, s} (o) = P (o / mid A / amps) = / frac {P (o / amp A / amp)} {P (A / amp)}}.) (Potřeba této podmínky nastane, když činy a státy nedokážou jednoznačně určit výsledek; viz Lewis 1981.)

1.2 Výsledkové nástroje

Termín (U (o)) představuje užitečnost výsledku (o) - zhruba, jak cenný (o) je. Formálně je (U) funkce, která každému výsledku přiřazuje skutečné číslo. (Jednotky spojené s (U) se obvykle nazývají utiles, takže pokud (U (o) = 2), říkáme, že (o) má hodnotu 2 utiles.) Čím větší obslužný program, tím více cenný výsledek.

Jaký druh hodnoty se měří v utilitách? Utili se obvykle nepovažují za měnové jednotky, jako jsou dolary, libry nebo jen. Bernoulli (1738) tvrdil, že peníze a jiné zboží mají klesající mezní užitečnost: jak agentka zbohatne, každý následný dolar (nebo zlaté hodinky nebo jablko) je pro ni méně cenný než ten poslední. Dává následující příklad: Je rozumné, aby bohatý muž, ale ne za chudáka, zaplatil 9 000 dukátů výměnou za loterii, která dává 50% šanci na 20 000 dukátů a 50% šanci na nic. Protože loterie dává oběma mužům stejnou šanci na každou peněžní cenu, musí mít ceny různé hodnoty v závislosti na tom, zda je hráč chudý nebo bohatý.

Klasičtí utilitáři jako Bentham (1789), Mill (1861) a Sidgwick (1907) interpretovali užitečnost jako měřítko potěšení nebo štěstí. Pro tyto autory je třeba říci, že (A) má větší užitečnost než (B) (pro agenta nebo skupinu agentů) znamená, že (A) má za následek větší potěšení nebo štěstí než (B) (pro tohoto agenta nebo skupinu agentů).

Jedna námitka proti této interpretaci užitečnosti spočívá v tom, že nemusí existovat jediný dobrý (nebo dokonce žádný dobrý), který racionalita vyžaduje, abychom hledali. Pokud však rozumíme „užitečnost“dostatečně široko, aby zahrnovala všechny potenciálně žádoucí cíle - potěšení, znalosti, přátelství, zdraví atd. - není jasné, že existuje jedinečný správný způsob, jak dosáhnout kompromisů mezi různými výrobky, takže každý výsledek obdrží nástroj. Možná neexistuje dobrá odpověď na otázku, zda život asketického mnicha obsahuje více či méně dobrý život než šťastný libertin - ale přiřazení pomůcek těmto možnostem nás nutí je porovnat.

Teoretici současného rozhodování obvykle interpretují užitečnost jako měřítko preference, takže říci, že (A) má větší užitečnost než (B) (pro agenta), je jednoduše říci, že agent preferuje (A) k (B). Pro tento přístup je rozhodující to, že preference neslouží pouze mezi výsledky (jako je množství potěšení nebo kombinace potěšení a znalostí), ale také mezi nejistými vyhlídkami (jako je loterie, která zaplatí 1 milion dolarů, pokud některá mince dopadne na hlavu, a mince způsobí hodinu bolestivých elektrických šoků, pokud mince dopadne na ocasy). Část 2 tohoto článku se podrobně věnuje formálnímu vztahu mezi preferencí a výběrem.

Očekávaná teorie užitku nevyžaduje, aby preference byly sobecké nebo se zajímaly. Někdo může raději dát peníze na charitu než utrácet peníze za bohaté večeře, nebo raději obětovat svůj vlastní život před povolením svého dítěte zemřít. Sen (1977) navrhuje, aby psychologie každého člověka byla nejlépe zastoupena pomocí tří pozic: jedno představující úzký vlastní zájem člověka, druhé reprezentující vlastní zájem člověka, který byl konstruován širším způsobem, aby odpovídal za pocity soucitu (např. Utrpení při sledování jiné osoby) trpět) a třetí představující závazky osoby, které mohou vyžadovat, aby jednala proti jejímu široce vykládanému zájmu.

Broome (1991) interpretuje utilit jako měření srovnání objektivní bezradnosti a zoufalství spíše než osobních preferencí: říci, že (A) má větší užitečnost než (B), znamená, že (A) je objektivně lepší než (B), nebo že by racionální člověk upřednostňoval (A) před (B). Stejně jako ve formalismu teorie pravděpodobnosti není nic, co vyžaduje, abychom používali spíše subjektivní než objektivní pravděpodobnosti, tak neexistuje nic ve formalismu očekávané teorie užitečnosti, která vyžaduje, abychom používali spíše subjektivní než objektivní hodnoty.

Ti, kdo vykládají nástroje z hlediska osobních preferencí, čelí zvláštní výzvě: tzv. Problému srovnání mezilidských užitků. Při rozhodování o tom, jak distribuovat sdílené zdroje, často chceme vědět, zda by naše jednání Alici zlepšilo lépe než Bob - a pokud ano, o kolik lépe. Pokud je však užitečnost měřítkem individuální preference, neexistuje žádný jasný a smysluplný způsob, jak tato srovnání provést. Alice je utvořena podle Aliceových preferencí, Bobova utilitka je vytvořena podle Bobových preferencí a neexistují žádné preference překlenující Alice a Boba. Nemůžeme předpokládat, že Alice's utility 10 je ekvivalentní Bob's utility 10, víc než můžeme předpokládat, že získání stupně A v diferenciálních rovnicích je ekvivalentní získání stupně A v tkaní košů.

Nyní je vhodný čas zvážit, které funkce obslužné funkce nesou smysluplné informace. Porovnání jsou informativní: pokud (U (o_1) gt U (o_2)) (pro osobu), pak (o_1) je lepší než (nebo preferováno) (o_2). Ale nejde jen o informativní srovnání - užitková funkce musí nést další informace, má-li očekávaná teorie užitečnosti přinést smysluplné výsledky.

Chcete-li zjistit, proč, znovu zvažte příklad deštníku. Tentokrát jsem vyplnil pravděpodobnost pro každý stav a užitečnost pro každý výsledek.

státy
prší ((P = 0,6)) neprší ((P = 0,4))
jedná vzít deštník zatížený, suchý ((U = 5)) zatížený, suchý ((U = 5))
nechat deštník mokrý ((U = 0)) zdarma, suché ((U = 10))

Očekávaná užitečnost zastřešování je

) begin {zarovnat} EU (take) & = P _ { take} (encumbered, / dry) cdot 5 \& / quad + P _ { take} (wet) cdot 0 \& / quad + P _ { take} (free, dry) cdot 10 \& = 5 / end {zarovnat})

zatímco očekávaná užitečnost opuštění deštníku je

) begin {align} EU (leave) & = P _ { leave} (encumbered, / dry) cdot 5 \& / quad + P _ { leave} (wet) cdot 0 \& / quad + P _ { leave} (free, dry) cdot 10 \& = 4 / end {zarovnat})

Protože (EU (take) gt EU (leave)), očekávaná teorie užitku mi říká, že vzít deštník je lepší než opustit ho.

Nyní však předpokládejme, že změníme nástroje výsledků: namísto použití (U) používáme (U ').

státy
prší ((P = 0,6)) neprší ((P = 0,4))
jedná vzít deštník zatížený, suchý ((U '= 4)) zatížený, suchý ((U '= 4))
nechat deštník mokrý ((U '= 2)) zdarma, suché ((U '= 8))

Nová očekávaná užitečnost zastřešování je

) begin {zarovnat} EU '(take) & = P _ { take} (encumbered, / dry) cdot 4 \& / quad + P _ { take} (wet) cdot 2 \& / quad + P _ { take} (free, dry) cdot 8 \& = 4 / end {zarovnat})

zatímco nová očekávaná užitečnost opuštění deštníku je

) begin {zarovnat} EU '(leave) & = P _ { leave} (encumbered, / dry) cdot 4 \& / quad + P _ { leave} (wet) cdot 2 \& / quad + P _ { leave} (free, dry) cdot 8 \& = 4.4 / end {zarovnat})

Protože (EU '(take) lt EU' (leave)), očekávaná teorie užitku mi říká, že opustit deštník je lepší než vzít ho.

Pomocné funkce (U) a (U ') řadí výsledky přesně stejným způsobem: nejlepší je suchý, suchý; zatížené, suché řady uprostřed; a mokrý je nejhorší. Očekávaná teorie užitečnosti však ve dvou verzích problému poskytuje odlišné rady. Musí tedy existovat nějaký podstatný rozdíl mezi preferencemi vhodně popsanými v (U) a preferencemi vhodně popsanými v (U '). V opačném případě je očekávaná teorie užitečnosti nejasná a při změně různých popisů stejného problému může změnit své rady.

Kdy dvě užitkové funkce představují stejný základní stav? Teorie měření odpovídá na otázku charakterizováním přípustných transformací užitkových funkcí - způsobů změny, které ponechávají všechny její smysluplné vlastnosti nedotčené. Pokud charakterizujeme přípustné transformace užitkové funkce, určili jsme tedy, které z jejích funkcí jsou smysluplné.

Obránci očekávané teorie užitku obvykle vyžadují, aby užitečnost byla měřena lineárním měřítkem, kde přípustné transformace jsou všechny a pouze pozitivní lineární transformace, tj. Funkce (f) formy

[f (U (o)) = x { cdot} U (o) + y)

pro reálná čísla (x / gt 0) a (y).

Pozitivní lineární transformace výsledných utilit nikdy neovlivní výroky očekávané teorie užitku: pokud (A) má větší očekávané užitečnost než (B), kde se užitečnost měří funkcí (U), pak (A) bude mít také větší očekávanou užitečnost než (B), kde se užitečnost měří jakoukoli pozitivní lineární transformací (U).

2. Argumenty očekávané teorie užitku

Proč zvolit akty, které maximalizují očekávaný užitek? Jednou z možných odpovědí je, že očekávaná teorie užitku je racionální podloží - to znamená, že racionalita na konci v podstatě zahrnuje maximalizaci očekávané užitečnosti. Pro ty, kteří považují tuto odpověď za neuspokojivou, však existují dva další zdroje ospravedlnění. Zaprvé existují dlouhodobé argumenty, které se opírají o důkazy o tom, že maximalizace očekávané užitečnosti je dlouhodobě ziskovou politikou. Za druhé, existují argumenty založené na reprezentačních větách, které naznačují, že určitá racionální omezení preferencí znamenají, že všichni racionální agenti maximalizují očekávané užitečnost.

2.1 Dlouhodobé argumenty

Jedním z důvodů maximalizace očekávané užitečnosti je to, že přispívá k dobrým zásadám v dlouhodobém horizontu. Feller (1968) uvádí verzi tohoto argumentu. Opírá se o dvě matematická fakta o pravděpodobnostech: silné a slabé zákony velkého počtu. Obě tato fakta se týkají sekvencí nezávislých, identicky distribuovaných pokusů - jakési nastavení, které je výsledkem opakovaného sázení stejným způsobem na sekvenci ruletových otočení nebo hraných her. Jak slabé, tak silné zákony velkého počtu tvrdě tvrdí, že v dlouhodobém horizontu je průměrné množství užitečnosti získané na soud velmi pravděpodobně blízko očekávané hodnotě jednotlivého soudu.

Slabý zákon velkých čísel uvádí, že tam, kde má každý soud očekávanou hodnotu (mu), pro libovolná malá reálná čísla (epsilon / gt 0) a (delta / gt 0) je nějaký konečný počet pokusů (n), takový, že pro všechny (m) větší nebo rovno (n), s pravděpodobností alespoň (1- / del), je průměrný zisk hráče pro první (m) pokusy spadají do (epsilon) z (mu). Jinými slovy, v dlouhodobém horizontu podobné hazardní hry je průměrný zisk na pokus vysoce pravděpodobný, že se v omezené době stane libovolně blízkou očekávané hodnotě hazardu. Takže v konečném dlouhodobém horizontu je průměrná hodnota spojená s hazardem převážně blízká očekávané hodnotě.

Silný zákon velkých čísel uvádí, že tam, kde má každý soud očekávanou hodnotu (mu), pro libovolné libovolné malé reálné číslo (epsilon / gt 0), jak se počet pokusů zvyšuje, pravděpodobnost, že průměrné výhry hráčů za pokus spadají do (epsilon) z (mu) konvergují k 1. Jinými slovy, jak se počet opakování hazardu přiblíží k nekonečnu, průměrný zisk za test se bude libovolně blížit k očekávaná hodnota hazardu s pravděpodobností 1. Takže z dlouhodobého hlediska je průměrná hodnota spojená s hazardem prakticky jistá, že se rovná očekávané hodnotě.

Proti těmto dlouhodobým argumentům existuje několik námitek. Zaprvé, mnoho rozhodnutí nelze opakovat po neurčitě mnoho podobných soudních řízení. Rozhodnutí o tom, jakou kariéru sledovat, koho se oženit a kde například žít, se dělají přinejlepším krátkou dobu. Kromě toho, pokud jsou tato rozhodnutí učiněna více než jednou, různé zkoušky zahrnují různé možné výsledky s různými pravděpodobnostmi. Není jasné, proč by se dlouhodobé úvahy o opakovaných hazardech měly vztahovat na tyto volby jednoho případu.

Za druhé, argument vychází ze dvou předpokladů nezávislosti, z nichž jeden nebo oba mohou selhat. Jeden předpoklad se domnívá, že pravděpodobnosti různých zkoušek jsou nezávislé. To platí o hazardních hrách v kasinu, ale neplatí o jiných možnostech, kde bychom chtěli použít teorii rozhodnutí - např. Rozhodnutí o lékařském ošetření. Moje zbývající nemoc po jednom cyklu antibiotik zvyšuje pravděpodobnost, že budu nemocný po příštím kurzu, protože to zvyšuje šanci, že se bakterie rezistentní na antibiotika budou šířit mým tělem. Tento argument také vyžaduje, aby obslužné programy různých zkoušek byly nezávislé, takže vyhrávání ceny v jedné zkoušce přispívá stejným způsobem k celkové užitečnosti rozhodovacího subjektu bez ohledu na to, co vyhraje v jiných zkouškách. Tento předpoklad je však v mnoha případech skutečného světa porušen. V důsledku klesající mezní užitkovosti peněz nemá výhra 10 milionů dolarů na deseti hrách rulety desetkrát tolik výher než 1 milion dolarů na jednu hru rulety.

Třetím problémem je, že silné a slabé zákony velkého počtu jsou modálně slabé. Žádný zákon neznamená, že pokud by se hazard opakoval na neurčito (za příslušných předpokladů), průměrný zisk z jednoho pokusu by byl blízko očekávanému užitku hry. Zjišťují pouze, že průměrný zisk z jednoho pokusu by byl s velkou pravděpodobností blízko očekávaného užitku hry. Ale vysoká pravděpodobnost - dokonce pravděpodobnost 1 - není jistota. (Standardní teorie pravděpodobnosti odmítá Cournotův princip, který říká, že k událostem s nízkou nebo nulovou pravděpodobností nedojde. Ale viz Shafer (2005) pro obhajobu Cournotova principu.) Pro jakoukoli sekvenci nezávislých, identicky distribuovaných pokusů je možné průměrně výplata užitku za soud, aby se libovolně odklonila od očekávané užitečnosti jednotlivého soudního řízení.

2.2 Reprezentační věty

Druhý typ argumentu pro očekávanou užitnou teorii se opírá o tzv. Reprezentační věty. Sledujeme Zyndovu (2000) formulaci tohoto argumentu - mírně upravenou tak, aby odrážela roli utilit a pravděpodobností. Argument má tři předpoklady:

Podmínka racionality.

Axiomy očekávané užitkové teorie jsou axiomy racionálních preferencí.

Zastupitelnost.

Jestliže preference člověka se řídí axiomy očekávané teorie užitku, pak může být reprezentována jako osoba s mírou víry, která dodržuje zákony pravděpodobnostního počtu [a užitečnou funkci tak, že preferuje jednání s vyšší očekávanou užitečností].

Stav reality.

Jestliže osoba může být reprezentována jak mít míry víry, které poslouchají pravděpodobnostní počet [a užitečnou funkci takový že ona preferuje akty s vyšší očekávanou užitečností], pak osoba opravdu má míry víry, které dodržují zákony pravděpodobnostního počtu [a opravdu dává přednost úkonům s vyšší očekávanou užitečností].

Tyto prostory znamenají následující závěr.

Pokud osoba [nedokáže jednat s vyšší očekávanou užitečností], pak tato osoba poruší alespoň jeden z axiomů racionální preference.

Pokud jsou prostory pravdivé, argument ukazuje, že existuje něco špatného s lidmi, jejichž preference jsou v rozporu s očekávanou teorií užitečnosti - porušují axiomy racionálních preferencí. Podívejme se na každou z těchto prostor podrobněji, počínaje klíčovým předpokladem Reprezentace.

Pravděpodobnostní funkce a obslužná funkce společně představují sadu preferencí, pouze pokud následující vzorec platí pro všechny hodnoty (A) a (B) v doméně preferenčního vztahu

[EU (A) gt EU (B) text {pouze a pokud} A / text {je upřednostňován před} B.)

Matematické důkazy reprezentability se nazývají reprezentační věty. Oddíl 2.1 zkoumá tři nejvlivnější reprezentační věty, z nichž každá se spoléhá na jiný soubor axiomů.

Bez ohledu na to, kterou sadu axiomů používáme, je podmínka racionality kontroverzní. V některých případech preference, které se zdají racionálně přípustné - možná i racionálně nutné - porušují axiomy očekávané teorie užitečnosti. Oddíl 3 tyto případy podrobně popisuje.

Realitní podmínka je také kontroverzní. Hampton (1994), Zynda (2000) a Meacham a Weisberg (2011) poukazují na to, že být reprezentovatelný pomocí pravděpodobnostní a užitkové funkce nemá pravděpodobnostní a užitečnou funkci. Koneckonců agent, který může být reprezentován jako očekávaný nástroj maximalizující se stupněm víry, který dodržuje počet pravděpodobnosti, může být také zastoupen jako někdo, kdo nedokáže maximalizovat očekávaný užitek se stupněm přesvědčení, který porušuje počet pravděpodobnosti. Proč si myslíte, že očekávané zastoupení nástrojů je správné?

Existuje několik možností. Možná, že obránce teorémů reprezentace může stanovit, že to, co má mít zvláštní míru víry a utilit, je pouze mít odpovídající preference. Hlavním úkolem obránců této odpovědi je vysvětlit, proč jsou reprezentace z hlediska očekávané užitečnosti vysvětlitelně užitečné a proč jsou lepší než alternativní reprezentace. Nebo jsou pravděpodobně pravděpodobnosti a pomůcky dobrým vyčištěným teoretickým náhražkou našich lidových představ o víře a vědeckých náhražkách našich lidových představ. Meacham a Weisberg zpochybňují tuto odpověď a argumentují tím, že pravděpodobnosti a utajení jsou špatnými stand-iny pro naše lidové představy. Třetí možností, kterou navrhuje Zynda, je skutečnost, že fakta o stupních víry jsou pravdivá nezávisle na preferencích agenta,a poskytnout principiální způsob, jak omezit rozsah přijatelných reprezentací. Úkolem obránců tohoto typu reakce je určit, jaké jsou tyto další skutečnosti.

Nyní se podívám na tři vlivné věty o reprezentaci. Tyto věty o reprezentaci se od sebe liší třemi filozoficky významnými způsoby.

Za prvé, různé věty o reprezentaci nesouhlasí s objekty preferencí a užitečnosti. Jsou opakovatelné? Musí být zcela pod kontrolou agenta

Za druhé, reprezentační věty se liší v zacházení s pravděpodobností. Nesouhlasí s tím, které entity mají pravděpodobnosti a zda stejné objekty mohou mít pravděpodobnosti i obslužné programy.

Zatřetí, zatímco každá věta o reprezentaci dokazuje, že pro vhodné uspořádání preferencí existuje pravděpodobnostní a užitková funkce představující preferenční uspořádání, liší se, jak jedinečná je tato pravděpodobnostní a užitková funkce. Jinými slovy se liší v tom, které transformace pravděpodobnostních a užitkových funkcí jsou přípustné.

2.2.1 Ramsey

Myšlenka reprezentační věty o očekávané užitečnosti se datuje k Ramseyovi (1926). (Jeho náčrt reprezentační věty je následně vyplněn Bradleyem (2004) a Elliottem (2017).) Ramsey předpokládá, že preference jsou definovány před doménou hazardních her, což dává jednu cenu za podmínky, že výrok (P) je true a jiná cena za podmínky, že (P) je false. (Příklady hazardních her: obdržíte onesie, pokud máte dítě a láhev skotské jinak; obdržíte dvacet dolarů, pokud Bojack vyhraje v Kentucky Derby a ztratíte dolar jinak.)

Ramsey nazývá výrok eticky neutrální, když „dva možné světy lišící se pouze [svou pravdou] mají vždy stejnou hodnotu“. Pro eticky neutrální nabídku lze pravděpodobnost 1/2 definovat z hlediska preference: taková nabídka má pravděpodobnost 1/2 pouze v případě, že jste lhostejní, na kterou stranu sázíte. (Takže pokud Bojack vyhraje Kentucky Derby je eticky neutrální nabídka, má pravděpodobnost 1/2 jen v případě, že jste lhostejní mezi vyhráváním dvaceti dolarů, pokud je to pravda, a prohráním dolaru jinak, a vyhráváním dvaceti dolarů, pokud je to nepravdivé, a prohráním dolaru v opačném případě.)

Tím, že předloží eticky neutrální nabídku s pravděpodobností 1/2, spolu s bohatým prostorem cen, definuje Ramsey numerické pomůcky pro ceny. (Hrubý nápad je, že pokud jste lhostejní mezi přijetím ceny za prostředník (m) pro jistotu a hazardem, který dává lepší cenu (b), pokud je eticky neutrální nabídka pravdivá a horší cenou (w) pokud spadne, pak je utilita (m) na půli cesty mezi obslužnými programy (b) a (w).) Pomocí těchto numerických obslužných programů pak použije definici očekávaného obslužného programu k definování pravděpodobnosti pro všechny další návrhy.

Hrubým nápadem je využít bohatství prostoru cen, což zajišťuje, že pro každý hazard (g), který dává lepší cenu (b), pokud (E) je pravda a horší cena (w) pokud (E) je nepravdivý, agent je lhostejný mezi (g) a nějakou middlingovou cenou (m). To znamená, že (EU (g) = EU (m)). Při použití nějaké algebry a skutečnosti, že (EU (g) = P (E) U (b) + (1-P (E)) U (w)), Ramsey ukazuje, že

[P (E) = / frac {(1 - U (m)} {(U (b) - U (w))})

2.2.2 Von Neumann a Morgenstern

Von Neumann a Morgenstern (1944) tvrdí, že preference jsou definovány před doménou loterií. Některé z těchto loterií jsou konstantní a s jistotou vydají jednu cenu. (Ceny mohou zahrnovat banán, milion dolarů, dluh v hodnotě milionu dolarů, smrt nebo nové auto.) V loteriích mohou být také ceny jako loterie, takže jeden může mít loterii s 40% šancí na výtěžek banán a 60% šance na výhru 50-50 mezi milionem dolarů a smrtí.) Doména loterií je uzavřena smíšením, takže pokud (L) a (L ') jsou loterie a (x) je reálné číslo v intervalu ([0, 1]), pak je loterie (x L + (1-x) L '), která dává (L) s pravděpodobností (x) a (L ') s pravděpodobností (1-x). Ukazují, že každý preferenční vztah dodržující určité axiomy může být reprezentován pravděpodobnostmi použitými pro definování loterií, spolu s užitečnou funkcí, která je jedinečná až po pozitivní lineární transformaci.

2.2.3 Savage

Místo toho, aby pravděpodobnosti považovali za samozřejmost, jak to von Neumann a Morgenstern dělají, Savage (1972) je definuje jako preferenci před jednáním. Savage představuje tři samostatné domény. Pravděpodobnost se váže k událostem, které můžeme považovat za disjunkce států, zatímco užitečnost a vnitřní preference se připojují k výsledkům. Očekávané nástroje a neinherentní preference se připojují k aktům.

Pro Savage musí činy, stavy a výsledky splňovat určitá omezení. Akty musí být zcela pod kontrolou agenta (takže zveřejnění mého příspěvku v mysli není aktem, protože to částečně závisí na rozhodnutí editora, které nekontroluji). Výsledky musí mít stejnou užitečnost bez ohledu na to, který stát získá (takže „Vyhraju fantastické auto“není výsledek, protože užitečnost fantazijního automobilu bude větší ve státech, kde osoba, na kterou chci nejvíce zapůsobit, si přeje, abych měl fantazii auto a méně ve státech, kde ztrácím řidičský průkaz). Žádný stát nemůže vyloučit výkon jakéhokoli činu a činy a stát společně musí určit výsledek s jistotou. Pro každý výsledek (o) existuje konstantní akt, který dává v každém stavu (o). (Pokud je tedy světový mír výsledkem, jedná se o akt, který má za následek světový mír,bez ohledu na to, jaký je stav světa.) Nakonec předpokládá, že u jakýchkoli dvou aktů (A) a (B) a každé události (E) existuje smíšený akt (A_E / amp B_ { sim E}), který dává stejný výsledek jako (A), pokud (E) je pravda, a stejný výsledek jako (B) jinak. (Pokud tedy světový mír i konec světa jsou výsledkem, pak existuje smíšený akt, který má za následek světový mír, pokud hlava určité mince přistane, a konec světa jinak.)))

Savage postuluje preferenční vztah před jednáním a dává axiomy řídící tento preferenční vztah. On pak definuje subjektivní pravděpodobnosti, nebo míry víry, v podmínkách preferencí. Klíčovým krokem je definovat „přinejmenším stejně pravděpodobný“vztah mezi událostmi; Parafrázuji zde.

Předpokládejme, že (A) a (B) jsou konstantní činy, takže (A) je upřednostňováno před (B). Pak (E) je přinejmenším stejně pravděpodobné jako (F) jen v případě, že agent buď preferuje (A_E / amp B _ { sim E}) (akt, který dává (A), pokud (E) získá, a (B) jinak) na (A_F / amp B _ { sim F}) (akt, který dává (A), pokud (F) získá, a (B)) jinak) nebo jinak je lhostejný mezi (A_E / amp B _ { sim E}) a (A_F / amp B _ { sim F}).

Myšlenka za definicí je, že agent zvažuje (E) přinejmenším stejně pravděpodobné jako (F) jen pro případ, že by raději vsadila na (F) než na (E)).

Savage pak dává axiomům omezujícím racionální preference a ukazuje, že jakákoli sada preferencí, která tyto axiomy splňují, poskytuje „přinejmenším stejně pravděpodobný“vztah, který může být jedinečně reprezentován pravděpodobnostní funkcí. Jinými slovy, existuje pouze jedna pravděpodobnostní funkce (P) taková, že pro všechny (E) a (F), (P (E) ge P (F)), pokud a pouze pokud (E) je přinejmenším stejně pravděpodobné jako (F). Každý preferenční vztah dodržující Savageovy axiomy je reprezentován touto pravděpodobnostní funkcí (P), spolu s užitečnou funkcí, která je jedinečná až po pozitivní lineární transformaci.

Savageova věta o reprezentaci dává silné výsledky: počínaje samotným preferenčním uspořádáním najdeme jednu pravděpodobnostní funkci a úzkou třídu užitečných funkcí, které reprezentují toto preferenční uspořádání. Nevýhodou však je, že Savage musí stavět nepravděpodobně silné předpoklady o doméně jednání.

Luce a Suppes (1965) poukazují na to, že Savageovy neustálé činy jsou nepravděpodobné. (Připomeňme, že konstantní činy přinášejí stejný výsledek a stejnou hodnotu v každém státě.) Vezměte si pro každého velmi dobrý výsledek - celkový blaženost. Existuje skutečně neustálý akt, který má tento výsledek v každém možném stavu, včetně států, kde je lidská rasa zničena meteorem? Problematické je také Savageovo spoléhání se na bohatý prostor smíšených činů. Savage musel předpokládat, že nějaké dva výstupy a jakákoli událost, existuje smíšený akt, který přinese první výsledek, pokud k události dojde, a druhý výsledek jinak? Existuje skutečně akt, který přináší úplnou blaženost, pokud je každý zabit morem odolným vůči antibiotikům, a totální bída jinak? Luce a Krantz (1971) navrhují způsoby přeformulování Savage 's věta o reprezentaci, která tyto předpoklady oslabuje, ale Joyce (1999) tvrdí, že i při oslabených předpokladech zůstává doména aktů neuvěřitelně bohatá.

2.2.4 Bolker a Jeffrey

Bolker (1966) dokazuje obecnou reprezentační větu o matematických očekáváních, kterou Jeffrey (1983) používá jako základ pro filosofický popis očekávané užitkové teorie. Bolkerova věta předpokládá jedinou doménu výroků, které jsou předmětem preference, užitečnosti a pravděpodobnosti. Tvrzení, že dnes prší, má tedy užitečnost i pravděpodobnost. Jeffrey interpretuje tuto pomůcku jako hodnotu zprávy podle návrhu - měřítko toho, jak jsem šťastný nebo zklamaný, kdybych se dozvěděl, že návrh byl pravdivý. Konvencí stanoví hodnotu potřebného výroku na 0 - nezbytný výrok není žádná novinka! Stejně tak je pravděpodobné, že má užitečnost i užitečnost, že si vezmu deštník do práce, což je akt. Jeffrey to interpretuje tak, že mám určité přesvědčení o tom, co udělám.

Bolker dává axiomům omezující preference a ukazuje, že jakékoli preference vyhovující jeho axiomům mohou být reprezentovány pravděpodobnostním měřítkem (P) a užitečným měřítkem (U). Bolkerovy axiomy však nezajišťují, že (P) je jedinečný nebo že (U) je jedinečný až do pozitivní lineární transformace. Nedovolují nám také definovat srovnávací pravděpodobnost z hlediska preference. Místo toho, kde (P) a (U) společně představují uspořádání preferencí, Bolker ukazuje, že pár (langle P, U / rangle) je jedinečný až do zlomkové lineární transformace.

Technicky řečeno, kde (U) je užitečná funkce normalizovaná tak, že (U (Omega) = 0), (inf) je největší dolní mez hodnot přiřazených (U), (sup) je nejnižší horní mez hodnot přiřazených pomocí (U) a (lambda) je parametr spadající mezi (- 1 / inf) a (- 1 / sup), zlomková lineární transformace (langle P _ { lambda}, U _ { lambda} rangle) z (langle P, U / rangle) odpovídající (lambda) je dána:

) begin {zarovnat} P _ { lambda} & = P (x) (1 + / lambda U (x)) / U _ { lambda} & = U (x) ((1+ / lambda) / (1 + / lambda U (x)) end {zarovnat})

Všimněte si, že zlomkové lineární transformace páru pravděpodobnost-užitečnost mohou nesouhlasit s původním párem, o nichž jsou výroky pravděpodobnější než které jiné.

Joyce (1999) ukazuje, že s dalšími zdroji lze Bolkerovu teorém upravit tak, aby zřetelil jedinečný (P) a (U), který je jedinečný až do pozitivní lineární transformace. Potřebujeme pouze doplnit uspořádání preferencí primitivním „pravděpodobnějším než“vztahem, který se řídí jeho vlastním souborem axiomů a je spojen s vírou několika dalšími axiomy. Joyce modifikuje Bolkerův výsledek tak, aby ukázal, že vzhledem k těmto dalším axiomům je vztah „pravděpodobnější než“reprezentován jedinečným (P) a pořadí preferencí je reprezentováno (P) spolu s užitečnou funkcí, která je jedinečná až po pozitivní lineární transformaci.

2.2.5 Shrnutí

Dohromady tyto čtyři věty o reprezentaci výše lze shrnout do následující tabulky.

Teorém Přednostní předměty

Pořadí

stavby

Přípustné

transformace:

pravděpodobnost

Přípustné

transformace:

obslužný program

Ramsey hazard preference → užitečnost → pravděpodobnost identita pozitivní lineární

von Neumann /

Morgenstern

loterie (preference a pravděpodobnost) → nástroj N / A pozitivní lineární
Savage jedná preference → pravděpodobnost → utilita identita pozitivní lineární
Jeffrey / Bolker návrhy preference → (pravděpodobnost a užitečnost) - zlomkový lineární -

Všimněte si, že pořadí konstrukce se mezi věty liší: Ramsey konstruuje reprezentaci pravděpodobnosti pomocí utility, zatímco von Neumann a Morgenstern začínají pravděpodobnostmi a konstruují reprezentaci utility. Ačkoli tedy šipky představují matematický vztah reprezentace, nemohou reprezentovat metafyzický vztah uzemnění. Podmínka reality musí být odůvodněna nezávisle na jakékoli věty o reprezentaci.

Vhodně strukturované ordinální pravděpodobnosti (vztahy vybírané „alespoň tak pravděpodobnými“, „pravděpodobnějšími než“a „stejně pravděpodobnými“) jsou v souvztažném vztahu s kardinálními pravděpodobnostními funkcemi. Konečně, šedá čára od preferencí k ordinálním pravděpodobnostem naznačuje, že každá pravděpodobnostní funkce splňující Savageovy axiomy je reprezentována jedinečnou kardinální pravděpodobností - ale tento výsledek neplatí pro Jeffreyovy axiomy.

Všimněte si, že je často možné sledovat šipky v kruzích - od preference k ordinální pravděpodobnosti, od ordinální pravděpodobnosti k kardinální pravděpodobnosti, od kardinální pravděpodobnosti a preference k očekávané užitečnosti a od očekávané užitečnosti zpět k preferenci. Ačkoli tedy šipky představují matematický vztah reprezentace, nepředstavují metafyzický vztah uzemnění. Tato skutečnost je hnací silou důležitosti nezávislého ospravedlnění teorémů reprezentace podmínky stavu nemůže ospravedlnit očekávanou teorii užitečnosti bez dalších předpokladů.

3. Překážky v očekávané teorii užitečnosti

3.1 Maximalizace očekávané užitečnosti je nemožná

To by mohlo znamenat, ale je lidsky možné maximalizovat očekávanou užitečnost? March a Simon (1958) poukazují na to, že pro výpočet očekávaných utilit potřebuje agent skličující komplexní pochopení dostupných aktů, možných výsledků a hodnot těchto výsledků a že výběr nejlepšího aktu je mnohem náročnější než výběr aktu, který je dost dobrý. Podobné body se objevují v Lindblom (1959), Feldman (2006) a Smith (2010).

McGee (1991) tvrdí, že maximalizace očekávané užitečnosti není matematicky možná ani pro ideální počítač s neomezenou pamětí. Abychom maximalizovali očekávaný užitek, museli bychom přijmout jakoukoli sázku, kterou jsme dostali, na pravdy aritmetiky, a odmítnout jakoukoli sázku, kterou jsme dostali, na falešné věty v jazyce aritmetiky. Ale aritmetika je nerozhodnutelná, takže žádný Turingův stroj nemůže určit, zda daná aritmetická věta je pravdivá nebo nepravdivá.

Jednou z reakcí na tyto obtíže je omezený přístup racionality, jehož cílem je nahradit očekávanou teorii užitečnosti některými lépe sledovatelnými pravidly. Dalším argumentem je argumentovat, že požadavky na očekávanou užitnou teorii jsou lépe sledovatelné, než se zdají (Burch-Brown 2014; viz také Greaves 2016), nebo že relevantní zásada „by mohl znamenat může“je nepravdivá (Srinivasan 2015).

3.2 Maximalizace očekávané užitečnosti je iracionální

Řada autorů uvedla příklady, ve kterých se zdá, že očekávaná teorie užitku dává nesprávné recepty. Oddíly 3.2.1 a 3.2.2 pojednávají o příkladech, kde se zdá, že racionalita umožňuje preference, které nejsou v souladu s očekávanou teorií užitečnosti. Tyto příklady naznačují, že maximalizace očekávané užitečnosti není nutná pro racionalitu. Oddíl 3.2.3 popisuje příklady, kde očekávaná teorie užitku umožňuje preference, které se zdají iracionální. Tyto příklady naznačují, že maximalizace očekávané užitečnosti není dostatečná pro racionalitu. Oddíl 3.2.4 popisuje příklad, kde očekávaná teorie užitku vyžaduje preference, které se zdají být racionálně zakázané - výzva jak k nezbytnosti, tak dostatečnosti očekávané užitečnosti pro racionalitu.

3.2.1 Protiklady zahrnující transitivitu a úplnost

Očekávaná teorie užitku znamená, že struktura preferencí odráží strukturu většího než reálného vztahu. Podle očekávané teorie užitku tedy musí být preference přechodné: Pokud je (A) preferováno před (B) (takže (U (A) gt U (B))) a (B)) je upřednostňováno před (C) (takže (U (B) gt U (C)))), pak (A) musí být upřednostňováno před (C) (protože to musí být (U (A) gt U (C))). Stejně tak musí být předvolby úplné: v případě jakýchkoli dvou možností musí být jedna preferována před druhou nebo agent musí být mezi nimi lhostejný (od svých dvou nástrojů musí být jedna větší nebo dvě musí být stejné). Existují však případy, kdy se zdá, že racionalita dovoluje (nebo možná dokonce vyžaduje) selhání transitu a selhání úplnosti.

Příkladem preferencí, které nejsou tranzitivní, ale přesto se jeví jako racionálně přípustné, je Quinnova hádanka sebezranitele (1990). Self-torturer je připojen k stroji s číselníkem s nastavením označeným 0 až 1000, kde nastavení 0 nedělá nic, a každé následné nastavení způsobí mírně silnější elektrický šok. Nastavení 0 je bezbolestné, zatímco nastavení 1 000 způsobuje nesnesitelnou bolest, ale rozdíl mezi jakýmikoli dvěma sousedními nastaveními je tak malý, že je nepostřehnutelný. Ciferník je vybaven rohatkou, takže ji lze otočit nahoru, ale nikdy dolů. Předpokládejme, že v každém nastavení je samopraviteli nabídnuto 10 000 $, aby se posunul nahoru k dalšímu, takže za tolerování nastavení (n) obdrží výplatu (n { cdot} {10 000}). Je povoleno, aby samoučitel upřednostňoval nastavení (n + 1) před nastavením (n) pro každý (n) mezi 0 a 999 (protože rozdíl v bolesti je nepostřehnutelný, zatímco rozdíl v penězích výplaty jsou významné), ale ne upřednostňovat nastavení 1 000 před nastavením 0 (protože bolest při nastavení 1 000 může být tak nesnesitelná, že za ni nevymůže žádné množství peněz).

Zdá se také racionálně přípustné mít neúplné preference. U některých dvojic akcí nemusí agent mít žádný uvážený názor na to, které upřednostňuje. Zvažte Jane, elektrikářku, která se nikdy příliš nenapadlo stát se profesionální zpěvačkou nebo profesionálním astronautem. (Možná jsou obě tyto možnosti neuskutečnitelné, nebo možná považuje obě za mnohem horší než její stálá práce elektrikáře). Je nepravdivé, že Jane dává přednost tomu, aby se stala zpěvačkou, než se stala astronautem, a je nepravdivé, že dává přednost tomu, aby se stala astronautem, než aby se stala zpěvačkou. Je však také nepravdivé, že je lhostejná mezi zpěvačkou a astronautkou. Dává přednost tomu, aby se stala zpěvačkou a získala bonus 100 $, než aby se stala zpěvačkou, a kdyby byla lhostejná mezi tím, aby se stala zpěvačkou a stala se astronautem,byla by racionálně donucena raději být zpěvačkou a získat bonus 100 $, než se stát astronautem.

Mezi výše uvedenými dvěma příklady je jeden zásadní rozdíl. Janeovy preference lze rozšířit přidáním nových preferencí bez odstranění těch, které má, způsobem, který nám umožňuje reprezentovat ji jako očekávaného maximalizátoru nástrojů. Na druhou stranu neexistuje možnost, jak rozšířit preference sebezranitele tak, aby mohl být reprezentován jako očekávaný nástroj maximalizátor. Některé z jeho preferencí by musely být změněny. Jednou z populárních odpovědí na neúplné preference je tvrzení, že ačkoli racionální preference nemusí uspokojovat axiomy dané věty o reprezentaci (viz oddíl 2.2), musí být možné je rozšířit tak, aby uspokojily axiomy. Z tohoto slabšího požadavku na preference - že jsou rozšiřitelné na preferenční uspořádání, které splňuje příslušné axiomy - lze prokázat existenci polovin příslušných věty o reprezentaci. Nelze však již prokázat, že každé uspořádání preferencí má reprezentaci, která je jedinečná až do přípustných transformací.

Taková odezva není k dispozici v případě sebezranitele, jehož preference nelze rozšířit, aby uspokojil axiomy očekávané teorie užitečnosti. Viz položka o preferencích pro podrobnější diskusi o případu mučitele.

3.2.2 Protipříklady zahrnující nezávislost

Allais (1953) a Ellsberg (1961) navrhují příklady preferencí, které nelze reprezentovat očekávanou užitkovou funkcí, ale přesto se zdají racionální. Oba příklady zahrnují porušení axiomu Savage's Independence:

Nezávislost. Předpokládejme, že (A) a (A ^ *) jsou dva akty, které produkují stejné výsledky v případě, že (E) je false. Pak, pro každý akt (B), jeden musí mít

  • (A) je upřednostňováno před (A ^ *) pouze tehdy, pokud (A_E / amp B _ { sim E}) je preferováno před (A ^ * _ E / amp B _ { sim E})
  • Agentka je lhostejná mezi (A) a (A ^ *) pouze tehdy, je-li lhostejná mezi (A_E / amp B _ { sim E}) a (A ^ * _ E / amp B_ { sim E})

Jinými slovy, pokud dva akty mají stejné důsledky, kdykoli je (E) nepravdivé, pak preference agenta mezi těmito dvěma akty by měly záviset pouze na jejich důsledcích, když (E) je pravda. Na Savageově definici očekávané užitečnosti zahrnuje očekávaná teorie užitku nezávislost. A podle Jeffreyho definice zahrnuje očekávaná teorie užitku nezávislost za předpokladu, že státy jsou pravděpodobně na činech nezávislé.

První protějšek, Allais Paradox, zahrnuje dva oddělené rozhodovací problémy, ve kterých je lístek s číslem mezi 1 a 100 náhodně vylosován. V prvním problému si musí agent vybrat mezi těmito dvěma loteriemi:

  • Loterie (A)
  • • 100 milionů dolarů s jistotou
  • Loterie (B)
  • • 500 milionů dolarů, pokud je losován jeden z lístků 1–10
  • • 100 milionů dolarů, pokud je losován jeden z lístků 12–100
  • • Nic, pokud je losován lístek 11

V druhém problému s rozhodnutím musí agent vybrat mezi těmito dvěma loteriemi:

  • Loterie (C)
  • • 100 milionů dolarů, pokud je losován jeden z lístků 1–11
  • • Nic jiného
  • Loterie (D)
  • • 500 milionů dolarů, pokud je losován jeden z lístků 1–10
  • • Nic jiného

Zdá se rozumné upřednostňovat (A) (což nabízí jistých 100 milionů dolarů) před (B) (kde přidaná 10% šance na 500 milionů dolarů je více než vyvážena rizikem, že se nic nedostane). Zdá se také rozumné upřednostnit (D) (10% šance na 500 milionů dolarů) před (C) (mírně větší 11% šance na mnohem menší 100 milionů dolarů). Ale společně tyto preference (nazývají se preferencemi Allais) porušují nezávislost. Loterie (A) a (C) získají stejnou cenu 100 milionů dolarů za vstupenky 12–100. Mohou být převedeny na loterie (B) a (D) nahrazením této ceny 100 milionů $ 0 $.

Protože porušují nezávislost, preference Allais jsou nekompatibilní s očekávanou užitečnou teorií. Tato nekompatibilita nevyžaduje žádné předpoklady o relativních utilitách $ 0, 100 milionů $ a 500 milionů $. Tam, kde má 500 milionů dolarů nástroj (x), 100 milionů dolarů má nástroj (y) a 0 $ má nástroj (z), očekávané utility loterií jsou následující.

) begin {zarovnat} EU (A) & = 0,11y + 0,89y \\ EU (B) & = 0,10x + 0,01z + 0,89y \\ EU (C) & = 0,11y + 0,89z \\ EU (D) & = 0,10x + 0,01z + 0,89z / end {zarovnat})

Je snadno vidět, že podmínka, za níž (EU (A) gt EU (B)) je přesně stejná jako podmínka, za níž (EU (C) gt EU (D)): obě nerovnosti získat jen v případě (0,11 r / 0,10 x + 0,01 z)

Ellsbergův paradox také zahrnuje dva problémy s rozhodováním, které způsobují porušení zásady jistoty. V každém z nich je koule vytažena z urny obsahující 30 červených koulí a 60 koulí, které jsou buď bílé nebo žluté v neznámých poměrech. V prvním problému s rozhodnutím musí agent vybrat mezi těmito loteriemi:

  • Loterie (R)
  • • Vyhrajte 100 $, pokud je vylosován červený míč
  • • Prohrajte jinak 100 USD
  • Loterie (W)
  • • Vyhrajte 100 $, pokud je vylosován bílý míč
  • • Prohrajte jinak 100 USD

V případě druhého rozhodnutí musí agent vybrat mezi těmito loteriemi:

  • Loterie (RY)
  • • Vyhrajte 100 $, pokud je vylosován červený nebo žlutý míč
  • • Prohrajte jinak 100 USD
  • Loterie (WY)
  • • Vyhrajte 100 $, pokud je vylosován bílý nebo žlutý míč
  • • Prohrajte jinak 100 USD

Zdá se rozumné upřednostňovat (R) před (W), ale zároveň upřednostňovat (WY) před (RY). (Volejte tuto kombinaci preferencí Ellsbergovy preference.) Stejně jako preference Allais, Ellsbergovy preference narušují nezávislost. Loterie (W) a (R) přinášejí ztrátu 100 $, pokud je nakreslena žlutá koule; mohou být převedeny na loterie (RY) a (WY) jednoduše nahrazením této ztráty $ 100 jistým ziskem $ 100.

Protože porušují nezávislost, Ellsbergovy preference nejsou slučitelné s očekávanou užitkovou teorií. Tato nekompatibilita opět nevyžaduje žádné předpoklady o relativních utilitách vyhrávání 100 USD a ztráty 100 USD. Nepotřebujeme ani žádné předpoklady o tom, kde mezi 0 a 1/3 pravděpodobnost padnutí žluté koule klesne. Tam, kde výhra 100 $ má nástroj (w) a ztráta 100 $ má nástroj (l),) begin {zarovnat} EU (R) & = / tfrac {1} {3} w + P (W) l + P (Y) l \\ EU (W) & = / tfrac {1} {3} l + P (W) w + P (Y) l \\ EU (RY) & = / tfrac {1} {3} w + P (W) l + P (Y) w \\ EU (WY) & = / tfrac {1} {3} l + P (W) w + P (Y) w / end {zarovnat})

Je snadné vidět, že podmínka, ve které (EU (R) gt EU (W)) je přesně stejná jako podmínka, za níž (EU (RY) gt EU (WY)): obě nerovnosti získat pouze v případě (1/3 \, w + P (W) l / gt 1/3 \, l + P (W) w).

Existují tři pozoruhodné reakce na parlaxy Allais a Ellsberg. Za prvé, jeden by mohl následovat Savage (101 ff) a Raiffa (1968, 80–86), a bránit očekávanou teorii užitku z toho důvodu, že preference Allais a Ellsberg jsou iracionální.

Za druhé, mohli bychom následovat Buchaka (2013) a tvrdit, že preference Allais a Ellsberg jsou racionálně přípustné, takže očekávaná teorie užitku selhává jako normativní teorie racionality. Buchak vyvíjí propustnější teorii racionality, s dalším parametrem představujícím postoj rozhodovatele k riziku. Tento rizikový parametr interaguje s utilitami výstupů a jejich podmíněnými pravděpodobnostmi činů, které určují hodnoty činů. Jedno nastavení parametru riziko poskytuje očekávanou užitečnou teorii jako zvláštní případ, ale jiná nastavení „averze k riziku“racionalizují preference Allais.

Zatřetí je možné sledovat Loomes and Sugden (1986), Weirich (1986) a Pope (1995) a argumentovat, že výsledky v paradoxech Allais a Ellsberg lze znovu popsat, aby vyhovovaly preferencím Allais a Ellsberg. Údajný konflikt mezi preferencemi Allais a Ellsberg na jedné straně a očekávanou teorií užitečnosti na straně druhé byl založen na předpokladu, že daná částka peněz má stejnou užitečnost bez ohledu na to, jak je získána. Někteří autoři tento předpoklad zpochybňují. Loomes a Sugden naznačují, že kromě peněžních částek zahrnují výsledky hazardních her pocity zklamání (nebo nadšení) z toho, že je méně (nebo více), než se očekávalo. Papež rozlišuje pocity pocitu nadšení nebo zklamání od „po výsledku“pocity vzrušení, strachu, nudy nebo bezpečí,a poukazuje na to, že oba mohou ovlivnit obslužné programy pro výstupy. Weirich navrhuje, že hodnota peněžní částky závisí částečně na rizicích, která se do ní dostala, bez ohledu na pocity hráče, takže (například) 100 milionů dolarů v důsledku jisté sázky je více než 100 milionů dolarů z hazardu, který mohl platit nic.

Broome (1991) vyvolává obavy z tohoto re-popisného řešení. Jakékoli preference mohou být odůvodněny přepsáním prostoru výsledků, čímž se axiomy očekávané teorie užitku zbaví obsahu. Broome vyvrátí tuto námitku tím, že navrhne další omezení na preferenci: jestliže (A) je přednostní k (B), pak (A) a (B) se musí lišit nějakým způsobem, který odůvodňuje upřednostnění jednoho před jiný. Očekávaný nástrojový teoretik pak může počítat preference Allaise a Ellsberga jako racionální, a pouze tehdy, existuje-li nepeněžní rozdíl, který ospravedlňuje umisťování výsledků stejné peněžní hodnoty na různá místa v preferenčním pořadí.

3.2.3 Protipříklady zahrnující pravděpodobnost 0 událostí

Výše jsme viděli domnělé příklady racionálních preferencí, které porušují očekávanou teorii užitečnosti. Existují také údajné příklady iracionálních preferencí, které uspokojují očekávanou teorii užitečnosti.

Při typickém porozumění očekávané teorii užitečnosti, když jsou dva akty spojeny s tím, že mají nejvyšší očekávanou užitečnost, se od agentů vyžaduje, aby byli mezi nimi lhostejní. Skyrms (1980, s. 74) poukazuje na to, že tento pohled nám umožňuje odvodit podivné závěry o událostech s pravděpodobností 0. Například předpokládejme, že se chystáte hodit bodovou šipku na kulatou terč. Klasické teorie pravděpodobnosti počítají situace, ve kterých má šipka pravděpodobnost 0 zásahu do určitého bodu. Nabízíte mi následující mizerný obchod: pokud šíp zasáhne desku v jejím přesném středu, bude mi účtovat 100 $; jinak peníze nezmění ruce. Můj rozhodovací problém lze zachytit pomocí následující matice:

státy
centrum zásahu ((P = 0)) miss center ((P = 1))
jedná přijmout dohodu (-100) (0)
odmítnout obchod (0) (0)

Očekávaná teorie užitku říká, že je přípustné, abych přijala dohodu - přijímá očekávanou užitečnost 0. (To platí jak pro Jeffreyovu definici, tak pro Savageovu definici, pokud předpokládáme, že teritorium šipek je pravděpodobně nezávislé na tom, jak vy bet.) Ale zdravý rozum říká, že není přípustné, abych dohodu přijal. Přijímání slabě dominuje odmítnutí: v některých státech přináší lepší výsledek a v žádném státě horší výsledek.

Skyrms navrhuje rozšířit zákony klasické pravděpodobnosti s dalším požadavkem, aby pravděpodobnost byla přiřazena pouze nemožnost 0. Easwaran (2014) tvrdí, že bychom místo toho měli odmítnout názor, že očekávaná teorie užitku vyvolává lhostejnost mezi činy se stejným očekávaným užitkem. Místo toho očekávaná teorie užitečnosti není úplnou teorií racionality: když dva akty mají stejnou očekávanou užitečnost, neříká nám, které preferovat. Jako tiebreakers můžeme použít neočekávané užitečné aspekty, jako je slabá dominance.

3.2.4 Protipříklady zahrnující neomezený obslužný program

Užitková funkce (U) je omezena výše, existuje-li meze toho, jak dobré věci mohou být podle (U), nebo formálně, pokud existuje nějaké přirozené číslo (sup) takové, že pro každou (A) v doméně (U), (U (A) le sup). Podobně, (U) je ohraničený dole jestliže tam je limit jak špatné věci mohou být podle (U), nebo více formálně, jestliže tam je nějaké největší přirozené číslo (inf) takový to pro každého (A) v doméně (U), (U (A) ge inf). Očekávaná teorie užitečnosti se může potýkat s problémy, pokud jsou pomocné funkce neomezené nad, pod nebo obojí.

Jedním z problematických příkladů je hra St. Petersburg, původně publikovaná Bernoulli. Předpokládejme, že se hodí mince, dokud poprvé nepřistane ocasy. Pokud dopadne ocasy na první hod, vyhrajete 2 $; pokud dopadne ocasy na druhý hod, vyhrajete 4 $; pokud dopadne ocas na třetí hod, vyhrajete 8 $, a pokud dopadne ocas na hod ((n)), vyhrajete $ (2 ^ n). Za předpokladu, že každý dolar stojí za jeden utile, očekávaná hodnota hry St Petersburg je

[(tfrac {1} {2} cdot 2) + (tfrac {1} {4} cdot 4) + (tfrac {1} {8} cdot 8) + / cdots + (tfrac {1} {2 ^ n} cdot 2 ^ n) + / cdots) nebo [1 + 1 + 1 + / cdots = / infty)

Ukazuje se, že tato částka se liší; hra St Petersburg má nekonečné očekávané využití. Podle očekávané teorie užitku byste tedy měli dát přednost hře Petrohradu před jakoukoli konečnou částkou peněz, bez ohledu na to, jak velká. Kromě toho, protože nekonečná očekávaná utilita vynásobená jakoukoli nenulovou náhodou je stále nekonečná, cokoli, co má pozitivní pravděpodobnost, že získá hru St Petersburg, má nekonečnou očekávanou užitečnost. Podle očekávané teorie užitku byste tedy měli raději hrát jakoukoli šanci na hru v Petrohradě, ať už štíhlou, před jakoukoli konečnou částkou peněz, ať už je velká.

Nover a Hájek (2004) tvrdí, že kromě hry v Petrohradě, která má nekonečně očekávanou užitečnost, existují i další infinitární hry, jejichž očekávané utilitky jsou nedefinované, i když racionalita mezi nimi vyžaduje určité preference.

Jednou z odpovědí na tyto problematické infinitární hry je argumentovat, že samotné rozhodovací problémy jsou špatně položeny (Jeffrey (1983, 154); další je přijmout upravenou verzi očekávané teorie užitečnosti, která v běžném případě souhlasí s jeho verdikty, ale přináší intuitivně přiměřené verdikty o infinitárních hrách (Thalos a Richardson 2013) (Fine 2008) (Colyvan 2006, 2008) (Easwaran 2008).

4. Aplikace

4.1 Ekonomika a veřejná politika

Ve 40. a 50. letech 20. století získala očekávaná teorie užitku měnu v USA za svůj potenciál poskytnout mechanismus, který by vysvětlil chování makroekonomických proměnných. Jak se ukázalo, že očekávaná teorie užitečnosti přesně nepředpovídá chování skutečných lidí, její zastánci namísto toho rozšířili názor, že by to mohlo sloužit spíše jako teorie, jak by racionální lidé měli reagovat na nejistotu (viz Herfeld 2017).

Očekávaná teorie užitečnosti má ve veřejné politice řadu aplikací. V ekonomice blahobytu Harsanyi (1953) důvody od očekávané teorie užitku k tvrzení, že sociálně spravedlivější uspořádání je uspořádání, které maximalizuje celkové blaho distribuované v celé společnosti. Teorie očekávané užitečnosti má také přímější aplikace. Howard (1980) zavádí koncepci mikromortů nebo šancí na smrt jednoho milionu lidí a používá očekávané výpočty užitečnosti k odhadu, která rizika úmrtnosti jsou přijatelná. Ve zdravotní politice jsou roky života s přizpůsobením kvality, neboli QALY, měřítkem očekávaných užitečností různých zdravotních zásahů používaných k vedení zdravotní politiky (viz Weinstein et al 2009). McAskill (2015) využívá očekávanou teorii užitečnosti k řešení ústřední otázky efektivního altruismu:"Jak mohu udělat to nejlepší?" (Utilties v těchto aplikacích jsou přirozeně interpretovány jako měření něčeho, jako je štěstí nebo pohodu, spíše než subjektivní uspokojení preferencí pro jednotlivého agenta.)

Další oblastí, kde očekávaná teorie užitku najde aplikace, je prodej pojištění. Pojišťovny, stejně jako kasina, přijímají vypočítaná rizika s cílem dlouhodobého finančního zisku a musí brát v úvahu šanci, že se v krátkodobém horizontu zlomí.

4.2 Etika

Utilitarians, spolu s jejich potomky současní následníci, si myslí, že správnost nebo nesprávnost činu je určována mravní dobrotou nebo špatností jeho důsledků. Někteří následníci, jako například (Railton 1984), to interpretují tak, že bychom měli dělat cokoli, co bude mít ve skutečnosti nejlepší důsledky. Je však těžké - možná nemožné - znát dlouhodobé důsledky našich činů (Lenman 2000, Howard-Snyder 2007). Ve světle tohoto pozorování Jackson (1991) tvrdí, že správný akt je ten, který má největší očekávanou morální hodnotu, nikoli ten, který ve skutečnosti přinese nejlepší důsledky.

Jak poznamenává Jackson, očekávaná morální hodnota aktu závisí na tom, s jakou pravděpodobnostní funkcí pracujeme. Jackson tvrdí, že zatímco každá pravděpodobnostní funkce je spojena s „by“, „by nemělo“, na kterém záleží nejvíce, je ta, která je spojena se stupněm víry v rozhodování v okamžiku akce. Jiní autoři tvrdí, že priorita pro jiné „oughts“: Mason (2013) upřednostňuje pravděpodobnostní funkci, která je nejvhodnější, aby agentka přijala odpověď na její důkazy, vzhledem k jejím epistemickým omezením, zatímco Oddie a Menzies (1992) upřednostňují objektivní náhodnou funkci jako měřítko objektivní správnosti. (Vyzývají ke složitější pravděpodobnostní funkci, aby definovali pojem „subjektivní práva“pro rozhodovatele, kteří nevědí o objektivních šancích.)

Ještě jiní (Smart 1973, Timmons 2002) tvrdí, že i když bychom měli dělat cokoli, co bude mít nejlepší důsledky, očekávaná teorie užitku může hrát roli rozhodovacího postupu, když si nejsme jisti, jaké důsledky budou mít naše činy. Feldman (2006) objekty, které očekávaly výpočty užitku, jsou hrozně nepraktické. Ve většině skutečných životních rozhodnutí jsou kroky potřebné pro výpočet očekávaných utilit mimo naši ken: seznam možných výsledků našich činů, přiřazení každého výsledku užitečnosti a podmíněné pravděpodobnosti dané každému činu a provedení aritmetiky nezbytné pro očekávané výpočty užitečnosti.

Očekávaná verze nástroje pro maximalizaci očekávané užitečnosti není striktně řečeno teorií racionálního výběru. Je to teorie morální volby, ale to, zda racionalita vyžaduje, abychom dělali to, co je morálně nejlepší, je na debatě.

4.3 Epistemologie

Očekávaná teorie užitečnosti může být použita k řešení praktických otázek v epistemologii. Jednou z takových otázek je, kdy přijmout hypotézu. V typických případech je důkaz logicky kompatibilní s více hypotézami, včetně hypotéz, kterým poskytuje malou indukční podporu. Vědci navíc obvykle nepřijímají pouze ty hypotézy, které jsou s největší pravděpodobností vzhledem k jejich údajům. Kdy je pravděpodobné, že si hypotéza zaslouží přijetí?

Bayesians, jako je Maher (1993), navrhují, aby toto rozhodnutí bylo učiněno na základě očekávaných užitkových důvodů. To, zda přijmout hypotézu, je problém s rozhodnutím a přijetí a odmítnutí jako činy. Lze ji zachytit pomocí následující rozhodovací matice:

státy
hypotéza je pravdivá hypotéza je nepravdivá
jedná přijmout správně přijmout chybně přijmout
odmítnout chybně odmítnout správně odmítnout

Podle Savageovy definice je očekávaná užitečnost přijetí hypotézy určena pravděpodobností hypotézy spolu s utilitami každého ze čtyř výstupů. (Můžeme očekávat, že Jeffreyova definice souhlasí s Savageem, na základě věrohodného předpokladu, že vzhledem k důkazům, které máme v držení, je hypotéza pravděpodobně nezávislá na tom, zda ji akceptujeme nebo odmítneme.) Zde lze nástroje chápat jako ryze epistemické hodnoty, protože je epistemicky cenné věřit zajímavým pravdám a odmítat klamství.

Kritici Bayesian přístupu, takový jako Mayo (1996), namítají, že vědecké hypotézy nemohou rozumně dostat pravděpodobnosti. Mayo tvrdí, že pro přiřazení užitečné pravděpodobnosti události potřebujeme statistický důkaz o frekvencích podobných událostí. Vědecké hypotézy jsou však pravdivé jednou provždy, nebo falešné jednou provždy - neexistuje žádná populace světů, jako je ta naše, ze kterých můžeme smysluplně čerpat statistiky. Subjektivní pravděpodobnosti nemůžeme použít ani pro vědecké účely, protože by to bylo nepřijatelně svévolné. Očekávané nástroje pro přijetí a odmítnutí jsou proto nedefinované a měli bychom použít metody tradiční statistiky, které se spoléhají na porovnání pravděpodobnosti našich důkazů podmíněných každou z hypotéz.

Očekávaná teorie užitečnosti také poskytuje návod, kdy shromažďovat důkazy. Good (1967) argumentuje z očekávaných užitkových důvodů, že je vždy racionální shromažďovat důkazy před jednáním, za předpokladu, že důkazy jsou zdarma. Čin s nejvyšší očekávanou užitečností po dodatečných důkazech bude vždy vždy přinejmenším stejně dobrý jako čin s nejvyšší očekávanou užitečností předem.

V teorii epistemického rozhodování se očekávané nástroje používají k posouzení stavů víry jako racionálních nebo iracionálních. Pokud uvažujeme o formování víry jako o duševním činu, o faktech o obsahu víry agenta jako o událostech a o blízkosti k pravdě jako o žádoucím rysu výsledků, pak můžeme použít očekávanou teorii užitečnosti k vyhodnocení míry víry z hlediska jejich očekávaného očekávání blízkost k pravdě. Položka o argumentech epistemické užitečnosti pro pravděpodobnost zahrnuje přehled očekávaných užitečných argumentů pro různé epistemické normy, včetně kondicionování a principu principu.

4.4 Zákon

Kaplan (1968) tvrdí, že očekávané užitkové úvahy mohou být použity k stanovení standardu důkazu v soudním řízení. Porota rozhodující o tom, zda se zbavit nebo odsoudit, čelí následujícímu rozhodovacímu problému:

státy
provinile nevinný
jedná odsoudit skutečné přesvědčení falešné přesvědčení
osvobodit nepravdivé osvobození skutečné osvobození

Kaplan ukazuje, že (EU (odsouzený)> EU (osvobozený)) kdykoli

[P (provinile)> / frac {1} {1+ / frac {U (mathrm {true ~ přesvědčení}) - U (mathrm {false ~ osvobození})} {U (mathrm {true ~ osvobození}) -U (mathrm {false ~ přesvědčení})}})

Kvalitativně to znamená, že se úroveň důkazu zvyšuje, jak se zvyšuje disutilita usvědčování nevinné osoby ((U (mathrm {true ~ presvědčení)) - U (mathrm {false ~ osvobození}))) nebo klesá disutilita při osvojení vinného ([(U (mathrm {true ~ acquittal}) - U (mathrm {false ~ presvědčení)))).

Kritici tohoto rozhodovacího teoretického přístupu, jako je Laudan (2006), tvrdí, že je obtížné nebo nemožné překlenout propast mezi důkazy přijatelnými u soudu a skutečnou pravděpodobností viny obžalovaného. Pravděpodobnost viny závisí na třech faktorech: rozdělení zjevné viny mezi skutečně vinné, rozdělení zjevné viny mezi skutečně nevinné a poměr skutečné viny k skutečně nevinným obžalovaným, kteří se účastní soudu (viz Bell 1987). Překážky ve výpočtu kteréhokoli z těchto faktorů budou blokovat závěr, jak soudce nebo jury vnímají zjevnou vinu ke skutečné pravděpodobnosti viny.

Bibliografie

  • Allais M., 1953, „Le Comportement de l'Homme Rationnel devant le Risque: Critique des Postulats et Axiomes de l'École Americaine“, Econometrica, 21: 503–546.
  • Bell, R., 1987, „Teorie rozhodování a řádný proces: Kritika tvorby zákonů Nejvyššího soudu pro důkazní břemeno“, Žurnál trestního práva a kriminologie, 78: 557-585.
  • Bentham, J., 1961. Úvod do zásad morálky a legislativy, Garden City: Doubleday. Původně publikoval v roce 1789.
  • Bernoulli, D., 1738, „Specimen theoriae novae de mensura sortis“, Commentarii Academiae Scientiarum Imperialis Petropolitanae 5. Přeložil Louise Somer a přetiskl jako „Expozice nové teorie o měření rizika“1954, Econometrica, 22: 23– 36.
  • Bolker, E., 1966, „Funkce připomínající kusy opatření“, Transakce American Mathematical Society, 2: 292–312.
  • Bradley, R., 2004, „Ramseyova reprezentační věta“, Dialectica, 58: 483–497.
  • Burch-Brown, JM, 2014, „Stopy pro následníky“, Utilitas, 26: 105-119.
  • Buchak, L., 2013, Risk and Rationality, Oxford: Oxford University Press.
  • Colyvan, M., 2006, „No Expectations“, Mind, 116: 695–702.
  • Colyvan, M., 2008, „Teorie relativního očekávání“, Journal of Philosophy, 105: 37–44.
  • Easwaran, K., 2014, „Pravidelnost a hyperrealita“, The Philosophical Review, 123: 1–41.
  • Easwaran, K., 2008, „Silná a slabá očekávání“, Mind, 117: 633–641.
  • Elliott, E., 2017, „Ramsey bez etické neutrality: věta o nové reprezentaci“, Mind, 126: 1-51.
  • Ellsberg, D., 1961, „Riziko, dvojznačnost a Savage Axioms“, Quarterly Journal of Economics, 75: 643–669.
  • Feldman, F. 2006, „Skutečná užitečnost, námitka z nepraktičnosti a posun k očekávané užitečnosti“, Philosophical Studies, 129: 49–79.
  • Fine, T., 2008, „Vyhodnocování her Pasadena, Altadena a St Petersburg“, Mind, 117: 613–632.
  • Dobrý, IJ, 1967, „Na principu úplného důkazu“, Britský časopis pro filozofii vědy, 17: 319–321
  • Greaves, H. 2016, „Bezradnost“, sborník Aristotelian Society, 116: 311-339.
  • Hampton, J., „Selhání teorie očekávané užitečnosti jako teorie rozumu“, ekonomie a filozofie, 10: 195–242.
  • Harsanyi, JC, 1953, „Kardinální užitečnost v sociální ekonomii a v teorii riskování“, Journal of Political Economy, 61: 434–435.
  • Herfeld, C., „Od teorií lidského chování k pravidlům racionálního výběru: Sledování normativního obratu u Cowlesovy komise, 1943-1954“, Dějiny politické ekonomiky, 50: 1-48.
  • Howard, RA, 1980, „O rozhodování o životě a smrti“, v RC Schwing a WA Albers, Posouzení společenského rizika: Jak je v bezpečí dost?, New York: Plenum Press.
  • Howard-Snyder, F., 1997, „Odmítnutí objektivního následku“, Utilitas, 9: 241–248.
  • Jackson, F., 1991, „Rozhodnutí-teoretický důsledek a nejbližší a nejdražší námitka“, etika, 101: 461–482.
  • Jeffrey, R., 1983, The Logic of Decision, 2. vydání, Chicago: University of Chicago Press.
  • Jevons, WS, 1866, „Obecná matematická teorie politické ekonomiky“, Journal of Royal Statistical Society, 29: 282–287.
  • Joyce, J., 1999, základy teorie příčinných rozhodnutí, Cambridge: Cambridge University Press.
  • Kahneman, D. & Tversky A., Rozsudek pod nejistotou: Heuristika a zkreslení, New York: Cambridge University Press.
  • Kaplan, J., 1968, „Teorie rozhodnutí a proces hledání skutečností“, Stanford Law Review, 20: 1065-1092.
  • Kolmogorov, AN, 1933, Grundbegriffe der Wahrscheinlichkeitrechnung, Ergebnisse Der Mathematik; přeloženo jako Foundations of Pravděpodobnost, New York: Chelsea Publishing Company, 1950.
  • Laudan, L., 2006, Pravda, chyby a trestní právo, Cambridge: Cambridge University Press.
  • Lenman, J., 2000. „Důslednost a bezradnost“, Filozofie a veřejné záležitosti, 29 (4): 342–370.
  • Lewis, D., 1981, „Causal Decision Theory“, Australasian Journal of Philosophy, 59: 5-30.
  • Levi, I., 1991, „Následný socialismus a sekvenční výběr“, v M. Bacharach a S. Hurley (eds.), Základy teorie rozhodování, Oxford: Basil Blackwell Ltd, 92–12.
  • Lindblom, CE, 1959, „The Science of Muddling Through““, Recenze veřejné správy, 19: 79–88.
  • Loomes, G. And Sugden, R., 1986, „Zklamání a dynamická konzistence při výběru za nejistoty“, Přehled ekonomických studií, 53 (2): 271–282.
  • Maher, P., 1993, Sázení na teorie, Cambridge: Cambridge University Press.
  • March, JG a Simon, H., 1958, Organisation, New York: Wiley.
  • Mason, E., 2013, „Objektivismus a vyhlídky na správnost“, Žurnál etiky a sociální filozofie, 7: 1–21.
  • Mayo, D., 1996, Chyba a růst experimentálních znalostí, Chicago: University of Chicago Press.
  • McAskill, W., 2015, Doing Good Better, New York: Gotham Books.
  • McGee, V., 1991, „My Turing Machines nejsou očekávané nástroje maximalizátory (dokonce ideálně)“, Philosophical Studies, 64: 115-123.
  • Meacham, C. a Weisberg, J., 2011, „Reprezentační věty a základy teorie rozhodování“, Australasian Journal of Philosophy, 89: 641–663.
  • Menger, K., 1871, Grundsätze der Volkswirtschaftslehre, přeložil James Dingwall a Bert F. Hoselitz jako Principy of Economics, New York: New York University Press, 1976; dotisk online, Ludwig von Mises Institute, 2007.
  • Mill, JS, 1861. Utilitarianismus. Editováno úvodem Rogera Crispa. New York: Oxford University Press, 1998.
  • von Neumann, J., a Morgenstern, O., 1944, Teorie her a ekonomického chování, Princeton: Princeton University Press.
  • Nover, H. & Hájek, A., 2004, „Vexing očekávání“, Mind, 113: 237–249.
  • Nozick, R., 1969, „Newcombův problém a dva principy volby“, v Nicholas Rescher (ed.), Eseje na počest Carla G. Hempela, Dordrecht: Reidel, 114–115.
  • Oliver, A., 2003, „Kvantitativní a kvalitativní test paradoxu Allais pomocí výsledků zdraví“, Journal of Economic Psychology, 24: 35–48.
  • Pope, R., 1995, „Směrem k přesnějšímu rozhodovacímu rámci: oddělení negativního užitku náhody od snižování mezního užitečnosti a preference pro bezpečnost“, Teorie a rozhodnutí, 39: 241–265.
  • Raiffa, H., 1968, Analýza rozhodnutí: Úvodní přednášky o možnostech pod nejistotou, Reading, MA: Addison-Wesley.
  • Ramsey, FP, 1926, „Pravda a pravděpodobnost“, v základech matematiky a dalších esejích, RB Braithwaite (ed.), Londýn: Kegan, Paul, Trench, Trubner, & Co., 1931, 156–198; dotisknuto ve studiích subjektivní pravděpodobnosti, HE Kyburg, Jr. a HE Smokler (eds.), 2. vydání, New York: RE Krieger Publishing Company, 1980, 23–52; dotisknuto v Philosophical Papers, DH Mellor (ed.), Cambridge: Cambridge University Press, 1990.
  • Savage, LJ, 1972, základy statistiky, 2. vydání, New York: Dover Publications, Inc.
  • Sen, A., 1977, „Racionální blázni: Kritika behaviorálních základů ekonomické teorie“, filosofie a veřejné záležitosti, 6: 317–344.
  • Shafer, G., 2007, „Od Cournotova principu k tržní efektivitě“, v Augustin Cournot: Modeling Economics, Jean-Philippe Touffut (ed.), Cheltenham: Edward Elgar, 55–95.
  • Sidgwick, H., 1907. The Ethics Methods, Seventh Edition. Londýn: Macmillan; první vydání, 1874.
  • Simon, H., 1956, „Behaviorální model racionální volby“, The Quarterly Journal of Economics, 69: 99–118.
  • Skyrms, B., 1980. Příčinná nezbytnost: Pragmatické vyšetřování nezbytnosti zákonů, New Haven, CT: Yale University Press.
  • Smith, HM, „Subjektivní pravost“, sociální a politická filozofie, 27: 64-110.
  • Sobel, JH, 1994, Využití šancí: Eseje o racionálním výběru, Cambridge: Cambridge University Press.
  • Spohn, W., 1977, „Kde Luce a Krantz opravdu zobecňují Savageův rozhodovací model“, Erkenntnis, 11: 113–134.
  • Srinivasan, A., 2015, „Normativity without Cartesian Privilege“, Noûs, 25: 273-299.
  • Suppes, P., 2002, Reprezentace a invence vědeckých struktur, Stanford: CSLI Publications.
  • Thalos, M. and Richardson, O., 2013, „Kapitalizace v Petrohradě: Proč statistické rozdělení záleží“, Politics, Philosophy & Economics, 13: 292-313.
  • Weinstein, MC, Torrence, G., a McGuire, A., 2009 „QALYs: základy“, Value in Health, 12: S5 – S9.
  • Weirich, P., 1986, „Očekávaný užitek a riziko“, British Journal for the Philosophy of Science, 37: 419–442.
  • Zynda, L., 2000, „Reprezentační věty a realismus o stupních víry“, Filozofie vědy, 67: 45–69.

Akademické nástroje

ikona sep muž
ikona sep muž
Jak citovat tento záznam.
ikona sep muž
ikona sep muž
Náhled na PDF verzi tohoto příspěvku v Friends of the SEP Society.
ikona inpho
ikona inpho
Vyhledejte toto vstupní téma v projektu Internet Philosophy Ontology Project (InPhO).
ikona papíry phil
ikona papíry phil
Vylepšená bibliografie tohoto záznamu ve PhilPapers s odkazy na jeho databázi.

Další internetové zdroje

  • Rozhodnutí, hry a racionální výběr, materiály pro kurz vyučovaný na jaře 2008 Robertem Stalnakerem, MIT OpenCourseWare.
  • Mikroekonomická teorie III, materiály pro kurz vyučovaný na jaře 2010 Muhametem Yildizem, MIT OpenCourseWare.
  • Výběr pod nejistotou, poznámky k přednášce Jonathana Levina.
  • Očekávaná teorie užitku, Philippe Mongin, položka pro The Handbook of Economic Methodology.
  • Počátky očekávané užitkové teorie, esej Yvan Lengwiler.

Doporučená: