I dette blogginnlegget skal vi utforske om vurderingssystemer er den beste måten å vurdere ferdigheter på en rettferdig måte, eller om de avslører begrensningene ved kvantifisering.
Ferdighet er evnen til å gjøre noe. Dette «noe» kan være alt fra studier, konkurranser, brettspill, online spill og mer. Folk sier ofte at de er «gode» i noe fordi de ser folk som er bedre enn dem i det. Det er imidlertid vanskelig å objektivt måle ferdigheter. Objektive mål på ferdigheter handler om å gi folk en målestokk som lar dem objektivt sammenligne sine ferdigheter med dine. Det er her vanskeligheten kommer inn. I de fleste felt er det vanskelig å sette sammen ferdighetene til forskjellige mennesker på en enkel måte.
I tillegg er ferdighetsbegrepet iboende subjektivt, så det å sammenligne seg med andre er ikke nødvendigvis nøyaktig. For eksempel handler ikke musikalsk dyktighet bare om teknisk dyktighet; det handler også om emosjonelt uttrykk og kreativitet. På samme måte påvirker mental styrke, spillhåndtering og andre faktorer prestasjonen i tillegg til fysisk styrke og ferdigheter i idrett. Det vil alltid være kontroversielt å redusere kompleksiteten til «ferdighet» til ett enkelt tall.
Fordelene med å kvantifisere ferdigheter er imidlertid klare. I et miljø der konkurranse er uunngåelig, er det nødvendig å tilby en rettferdig standard. Om noen er en bedre student, en bedre sjakk- eller Go-spiller, eller en bedre gamer, er ikke noe som kan avgjøres etter bare én test eller ett spill. Dusinvis, hundrevis eller til og med tusenvis av datapunkter må samles inn før vi kan sammenligne to personers ferdigheter, og det er vanskelig å ta så mange tester eller kamper.
For å løse dette problemet har det blitt gjort forsøk på å objektivt måle ferdigheter innen ulike felt. Et slikt eksempel er «vurderingssystemet», som har som mål å gjøre den tvetydige metrikken «ferdighet» om til et «tall» eller en «vurdering» som alle objektivt kan gjenkjenne. Dette tallet justeres for å gjenspeile riktig ferdighetsnivå ved å øke når du presterer bra mot andre og synke når du presterer dårlig. Måten vurderinger skaleres på varierer fra felt til felt, og som et resultat finnes det mange forskjellige navn og forskjellige typer vurderingssystemer. I dette blogginnlegget skal vi se nærmere på historien, prinsippene og bruken av vurderingssystemer.
Det første vurderingssystemet ble introdusert i sjakk. Tidlig på 1900-tallet og før ble sjakk spilt ganske enkelt ved å konkurrere mot hverandre i turneringer, så selv om du var en veldig god spiller, og du ble eliminert tidlig i en turnering, ville du bli vurdert som en dårligere spiller, eller du måtte spille i større turneringer for å bli evaluert. For å løse disse problemene ble et vurderingssystem først introdusert i 1950. Ideen var å objektivt sammenligne spillernes evner ved å ta med «hver» kamp mellom to spillere med samme vurdering i ferdighetsvurderingsskalaen.
De første vurderingssystemene hadde imidlertid mange problemer med formlene og kriteriene sine, og de klarte ofte ikke å gi en objektiv sammenligning av ferdigheter, og mange holdt seg fortsatt til den klassiske metoden. Det var Dr. Arpad Elo, en amerikansk fysikkprofessor og sjakkspiller, som løste dette problemet og sørget for at vurderingene nøyaktig representerte hver spillers ferdigheter. Til ære for arbeidet hans kalles det nåværende vurderingssystemet for sjakk Elo Rating, og det brukes på omtrent samme måte for andre konkurransedyktige brettspill og online spill.
Det er to hovedprinsipper som ligger til grunn for rangeringssystemet. For det første starter alle spillere med samme rangering, og rangeringen deres øker eller synker når de vinner eller taper kamper. Dette gir mening, ettersom rangeringer er et mål på ferdigheter. For det andre påvirkes mengden økning/reduksjon i rangeringen din av forskjellen mellom rangeringen din og motstanderens rangering, dvs. forskjellen i ferdigheter. Hvis du vinner mot en spiller med lavere rangering enn deg, vil rangeringen din øke mindre, og hvis du taper, vil rangeringen din synke mer. Omvendt, hvis du vinner mot en spiller med høyere rangering, vil rangeringen din øke, og hvis du taper, vil rangeringen din synke. Årsaken til dette er å gi en mer nøyaktig vurdering av ferdigheter.
En sjakkspiller i verdensklasses seier over en middelmådig student vil ikke gjøre spillerens vurdering noe bedre enn den var før; den vil rett og slett bli tatt for gitt. Metoden beskrevet ovenfor gjenspeiler dette. Hvis en sjakkspiller vinner mot en gjennomsnittlig student, endres verken sjakkspillerens vurdering eller studentens vurdering mye. Men hvis en student beseirer en sjakkspiller, stiger studentens vurdering dramatisk, og sjakkspillerens vurdering synker. Dette er fordi det faktum at studenten har slått sjakkspilleren øker studentens vurdering av ferdighetene deres, mens sjakkspillerens vurdering synker. Disse to grunnleggende prinsippene er matematikken bak vurderingssystemet.
I tillegg til disse to grunnleggende prinsippene introduserer Elo-vurderingssystemet et annet prinsipp. Dette nye prinsippet sier at «relative odds alltid er konstante for like ratingforskjeller». For eksempel er seiersraten i en kamp mellom en spiller med en Elo-vurdering på 1200 og en spiller med en Elo-vurdering på 1300 den samme som seiersraten i en kamp mellom en spiller med en Elo-vurdering på 1900 og en spiller med en Elo-vurdering på 2000. Dette er fordi i begge tilfeller er forskjellen i vurderinger den samme, 100. Endringen i seiersraten basert på denne forskjellen er gitt av en logaritmisk funksjon, som teoretisk sett antyder at for hver ratingforskjell på 400, reduseres seiersraten med 1/10. Spillernes vurderinger vil endre seg fra kamp til kamp i henhold til denne formelen.
La oss se på sjakk-eksemplet igjen. Alle spillere får en Elo-vurdering på 1200 for det første spillet. Etter hvert som spillet skrider frem, endres spillernes vurderinger, og til slutt representerer vurderingene en rimelig representasjon av ferdighetene deres. Statistikk viser at hvis det er en forskjell på 100 i Elo-vurderingen, har spilleren med den høyeste vurderingen en gjennomsnittlig 64 % sjanse til å vinne. For en forskjell på 200 er seiersraten 76 %, for en forskjell på 366 er den 90 %, og for en forskjell på 677 er den 99 %, noe som er ganske i tråd med den teoretiske seiersraten basert på forskjellen i vurderinger. Dette var et vellykket resultat for å kvantifisere ferdigheter og kunne brukes mye i både teori og praksis.
I tillegg til å jevne ut konkurransevilkårene i et gitt felt, har vurderingssystemer fordelen av å gi deltakerne konstant motivasjon. Etter hvert som vurderingene stiger, føler deltakerne at de forbedrer seg, og omvendt, når vurderingene synker, innser de at de må jobbe med sine mangler. I denne forstand kan et vurderingssystem være mer enn bare et verktøy for ferdighetsvurdering; det kan være en katalysator for kontinuerlig læring og vekst.
Organiserte vurderingssystemer som dette brukes i dag innen en rekke felt. På konkurransesiden brukes uformelle vurderingssystemer vanligvis i programmeringskonkurranser som tar i bruk OL-lignende problemer. I dette tilfellet måles brukernes vurderinger basert på resultatene av online mock-konkurranser organisert av forskjellige nettsteder. Basert på disse vurderingene gir arrangørene av konkurransen spørsmål på nivå med deltakernes vurderinger, og deltakerne kan løse spørsmålene på sitt nivå. I tillegg øver mange studenter på nettsider utenfor konkurransen for å forbedre vurderingene sine. Disse eksemplene viser at vurderingssystemer ikke bare er begrenset til ett felt, men har et bredt spekter av bruksområder innen mange forskjellige felt.
Rangeringssystemer spiller også en svært viktig rolle i online spill. En variant av Elo-rangeringen brukes som et rangeringssystem i spill som League of Legends, Dota 2 og StarCraft 2. Den brukes på en rekke måter for å maksimere moroa i spillet ved å matche spillere med motstandere med lignende ferdigheter, og for å redusere urettferdigheten som kan oppstå i kamper med store ferdighetsgap. Dette lar spillere spille med motstandere med lignende ferdigheter som dem selv, noe som bidrar mye til å forbedre brukeropplevelsen av spillet.
Til slutt er vurderingssystemer ikke bare begrenset til konkurransearenaen; de kan også brukes i utdanning. For eksempel kan et vurderingssystem brukes til å evaluere elevenes prestasjoner og gi dem læringsmateriell deretter. På denne måten kan du skreddersy undervisningen til hver elevs nivå, noe som vil bidra til å maksimere læringen.
Som du kan se, er vurderingssystemer nyttige på mange felt, og bruksområdene deres vil sannsynligvis vokse i fremtiden. Når du ser på hvordan systemet oppsto i sjakk og hvordan det har blitt tilpasset og brukt på mange forskjellige felt i dag, kan du se viktigheten av vurderingssystemer for å vurdere ferdigheter på en rettferdig måte og gi den rette utfordringen.