Tip:
Highlight text to annotate it
X
Det vil være nyttig å introdusere litt basisterminologi
som brukes innenfor kunstig intelligens for å skille forskjellige typer problemer.
Det første begrepet jeg vil lære deg er fullstendig kontra delvis observerbart.
Omgivelser er fullstendig observerbart dersom det din agent kan sanse
til enhver tid er tilstrekkelig komplett slik at en optimal beslutning kan tas.
Så, for eksempel, i mange kortspill
når alle kortene er på bordet, er alt lagt til rette
for å ta det optimale valget.
Dette er i motsetning til noen andre omgivelser der du trenger minne
i agenten for å ta den best mulige beslutningen.
For eksempel, i et pokerspill er ikke kortene åpent tilgjengelige på bordet,
så det å huske tidligere trekk vil hjelpe deg til å ta en bedre beslutning.
For helt å forstå forskjellen, tenk deg hvordan samhandlingen mellom en agent
og miljøet den er i påvirker dens sensorer og aktuatorer,
og denne samhandlingen går over flere sykluser,
ofte kalt persepsjons-aksjons sykluser.
For mange miljøer er det praktisk å forutsette
at miljøet har et slags initialstadium.
For eksempel, i et kortspill der kortene ikke ligger åpent på bordet,
er utgangspunktet avhengig av de kortene du har på hånd.
Et miljø er fullstendig observerbart dersom sensorene alltid kan se
miljøets komplette tilstand.
Det er delvis observerbart dersom sensorene bare kan oppfatte en del av tilstanden
men der lagrede målinger gir oss tilleggsinformasjon om tilstanden
som tilgjengelige målinger ikke kan gi alene.
Så ethvert spill, for eksempel, der tidligere trekk innehar informasjon om
hva som kan finnes i motstanderens eie, er delvis observerbart
og krever en annen tilnærming.
Veldig ofte har agenter som forholder seg til delvis observerbare miljøer
behov for å tilegne seg lagrede data for å forstå hva
miljøets tilstand er, og dette kommer vi grundig tilbake til
når vi snakker om skjulte Markov modeller om hvordan denne strukturen
har et slikt internminne.
En annen terminologi for miljøer omhandler om miljøer
er deterministiske eller stokastiske.
Et deterministisk miljø er et der din agents handlinger
entydig definerer resultatet.
Så, for eksempel, i sjakk er det ingen tilfeldigheter i spill når du flytter på en brikke.
Effekten av å flytte brikken er fullstendig predeterminert,
og uansett hvor jeg kommer til å flytte den samme brikken, er resultatet det samme.
Det kaller vi deterministisk.
Spill med terninger, for eksempel, så som backgammon, er stokastiske.
Selv om det finnes determinisme i hvordan du flytter brikkene,
er resultatet også avhengig av at terningene kastes,
noe du ikke kan forutsi resultatet av.
Det finnes en viss tilfeldighet involvert i resultatet av terningkastet,
og derfor kaller vi dette stokastisk.
La meg snakke om diskret kontra kontinuerlig.
Et diskret (eller avgrenset) miljø er et hvor du har en endelig antall handlemåter,
og et endelig antall ting du kan sanse.
Så, for eksempel, i sjakk, igjen, finnes det et endelig antall posisjoner,
og et endelig antall ting du kan gjøre.
Det er forskjellig fra et kontinuerlig miljø
hvor mulighetsrommet over ting du kan gjøre og ting du kan sanse er uendelig.
Så, for eksempel, hvis du spiller darts, så er det uendelig mange måter å vinkle pilene på
og akselerere dem.
Til slutt skiller vi mellom benigne (vennlige) kontra antagonistiske miljøer.
I benigne miljøer kan miljøet være tilfeldig.
Eller det kan være stokastisk, men det har intet mål i seg selv
som motvirker dets eget formål.
Så, for eksempel, været er benignt.
Det kan være tilfeldig. Det kan komme til å påvirke dine handlinger.
Men det er ikke egentlig ute etter å ta deg.
Se dette opp mot antagonistiske miljøer, slik du finner det i mange spill, som sjakk,
hvor motstanderen din virkelig er ute etter deg.
Det viser seg å være mye vanskeligere å finne gode handlingsalternativer i antagonistiske miljøer
hvor motstanderen aktivt observerer hva du gjør og bekjemper det du prøver å oppnå
opp mot benigne miljøer hvor miljøet egentlig bare er stokastisk
men ikke egentlig interessert i å gjøre livet ditt værre.
Så, la oss se i hvilken grad disse begrepene virker fornuftige for deg
ved å gå til vår neste quiz.
Så her er de 4 begrepsgruppene igjen: delvis kontra fullstendig observerbart
stokastisk kontra deterministisk, kontinuerlig kontra diskret,
antagonistisk kontra benignt.
La meg spørre deg om et slag dam.
Klikk en eller flere av de attributter som gjelder.
Hvis du tror dam er delvis observerbart, klikk her.
Hvis ikke, la være å klikke.
Hvis du tror det er stokastisk, klikk her,
kontinuerlig, klikk her, antagonistisk, klikk her.
Hvis du ikke kjenner til spillet Dam, kan du google det
og finne mer informasjon om det.