Selles ajaveebi postituses uurime esinduslike väärtuste seadmise paikapidavust evolutsiooniuuringutes. Analüüsime, kas keskmised, mediaan- ja väikseimad väärtused võivad evolutsiooni täpselt kajastada.
Kui teadlased viivad läbi uuringuid, on andmete analüüsimise protsess hädavajalik. Need andmed võivad olla evolutsioonikatsete tulemused või statistilised andmed. Sama kehtib ka evolutsiooniuuringute kohta. Kuna evolutsioonikatsete tegemine võtab liiga kaua aega, põhinevad evolutsiooniprotsessi senised statistilised kujutised fossiilidel ja neist arenenud olenditel. Kui evolutsiooniandmed oleksid ideaaljuhul normaaljaotuse kujulised, oleks seda tore uurida. Kuid tegelikkus pole nii lihtne. Evolutsioon on olnud ja on jätkuvalt väga ettearvamatu. Stephen Jay Gould, raamatu Full House autor, väidab, et evolutsiooni uurides peaksime vaatlema süsteemi kui terviku variatsiooni laienemist ja kahanemist, mitte konkreetse andmepunkti muutumise trendi. Teisisõnu peaksime vaatama tervikut, mitte mingi konkreetse väärtuse muutust. Kuigi ma ei nõustu Gouldi väitega, et evolutsioon on suundumusteta ja juhuslik, nõustun täielikult sellega, et ükski valim ei esinda evolutsiooni ja et me peaksime vaatlema süsteemi tervikuna. Seetõttu kaldun Gouldiga nõustuma.
Uuringute läbiviimisel eelistame määrata oma andmetele representatiivsed väärtused. Meile meeldib mõelda, et tüüpilised väärtused, nagu keskmine, mediaan ja väikseimad väärtused, esindavad andmeid tervikuna. Kuid evolutsiooniuuringutes ei tohiks me teha saatuslikku viga, valides esindusliku väärtuse. Evolutsiooniline esindaja on isend või liik, mis on evolutsioonisuundadele kõige lähemal. Järgnevalt selgitan, miks ei tohiks evolutsiooniuuringutes valida esinduslikku väärtust.
Kõigepealt vaatame kõige sagedamini kasutatavat tüüpilist väärtust: keskmist. Kui keskmise lai definitsioon hõlmab mediaani ja väikseimat väärtust, siis statistilise üldkogumi tunnuste kirjeldamiseks ühes arvus kasutame keskmise kitsast määratlust. Keskmisi on mitut tüüpi, sealhulgas aritmeetiline keskmine, geomeetriline keskmine ja harmooniline keskmine, kuid me kasutame tavaliselt aritmeetilist keskmist. Aritmeetilise keskmise eeliseks on see, et kõik andmed on kaasatud keskmise väärtuse määramisse. Erinevalt mediaanist, mis hõlmab ainult tsentreeritud andmeid, või kõige harvematest andmetest, mis hõlmavad ainult kõige sagedasemaid andmeid, hõlmab andmete suuruse järgi järjestamisel aritmeetiline keskmine representatiivse väärtuse määramisel kõiki andmeid, mistõttu kipume arvama, et keskmine on andmete parim esitus. Olen sellega osaliselt nõus. Keskmise eelis, "kõik andmed on kaasatud", võib aga saada saatuslikuks probleemiks selle kasutamisel evolutsiooniteoorias esindusliku väärtusena.
Mõelgem näiteks olukorrale, kus tahame saada Harvardi ülikooli üliõpilaste GPA jaoks representatiivset väärtust. Sel juhul oleks hea võtta juhuslik valim 100 õpilasest ja kasutada nende keskmist väärtust representatiivse väärtusena. Kuid oletame, et soovite saada esindusliku valimi inimeste sissetulekutest üle kogu maailma, näiteks umbes 100,000 100,000 inimese kohta. Kas saate ikkagi kasutada keskmist tüüpilise väärtusena? Kui lisate selle 100,000 10,000 hulka ühe inimese, öelge Bill Gates, suurendab tema sissetulek 0 4.3 inimese keskmist sissetulekut umbes 0 XNUMX dollari võrra. Statistikas ei esinda aritmeetiline keskmine andmeid, kui seda mõjutab oluliselt äärmuslik varieeruvus. See ei ole probleem, kui proovite saada GPA tüüpilist väärtust, kuna GPA on piiratud vahemikuga XNUMX–XNUMX. Sissetulek seevastu algab nullist, kuid sellel pole ülempiiri. See tähendab, et kuigi keskmist on lihtne kasutada tüüpilise väärtusena olukordades, kus andmetel on piiratud ja prognoositav väärtus, võib see olla problemaatiline muudes olukordades.
Mõelge evolutsiooniuuringute olukorrale. Organismide areng on ettearvamatum kui inimeste sissetulek kogu maailmas ja evolutsiooni ei saa piirata ühegi vahemikuga. Niisiis, kas evolutsiooniuuringutes on mõtet kasutada keskmist tüüpilise väärtusena? Ma ei usu. Evolutsioonilistes andmetes on tüüpilist väärtust tõenäoliselt moonutanud äärmuslikud andmed ja evolutsiooniuuringute aluseksvõtmine sellistel kallutatud tüüpilistel väärtustel on kohatu. Keskmised on esindajatena tähenduslikud, kui neid mõjutab suurem varieeruvus. Näiteks dinosauruseid nimetatakse sageli mesosoikumi kriidiperioodi esindajateks, kuid Maa ajaloos pole kunagi olnud aega, mil selgroogsete arv ületaks selgrootute arvu või liikide arvu. See, kuidas meie arvates evolutsioon üldiselt välja näeb, on tegelikult erijuhtumite tulemus.
Teiseks, vaatame mediaani. Mediaan on väärtus, mis asub suuruse järgi järjestatud andmete keskel. Mediaani põhjal on pooled andmetest mediaanist suuremad ja pooled mediaanist väiksemad. Mediaani arvutamine on keeruline, kui andmetes on dubleerivad väärtused. Sel juhul saab mediaani saamiseks kasutada valemit, mis arvutab välja punktid, mille kumulatiivne protsent on 50%. Mediaan võib olla sobivam esitus kui evolutsiooniuuringute keskmine, kuna see on vähem vastuvõtlik äärmuslike andmete varieerumisele kui keskmine. Samas on probleeme ka mediaani kasutamisega.
Selle illustreerimiseks kaaluge mõisteid "seinad" ja "sabad". Seinad on piiravad punktid. Andmehulga joonistamisel nimetatakse väärtust, mis ei saa olla ühestki väärtusest vasakul, vasakpoolseks seinaks. "Saba" on seina vastand, mis tähendab, et andmed võivad olla lõpmatult vasakul või paremal. Äärmuslikud väärtused on aga nii harvad, et need paistavad järjest väiksemaks muutuvate sabadena. Eelmainitud maailma inimeste sissetulekute uuringu puhul on null vasak sein, sest kellelgi pole sissetulekut alla nulli. Teisest küljest oleks ülempiirita sissetulekul graafikus parem saba.
Mediaani kasutamine mõne inimese sissetuleku esindamiseks on ilmselt hea. Kas evolutsiooniteooria uurimisel on aga õige eeldada, et evolutsioonis on suundumus ja valida esindajaks mediaan? Ei, sest kui mõelda sellele, et organism areneb ja muutub oma struktuurilt keerukamaks või lihtsamaks, ei saa ta muutuda lihtsamaks kui elutegevuseks vajalik põhistruktuur, mis tekitaks andmetesse “seina”. Kui vaadata x-telge kui organismi ehituse keerukust, on vasakul seinad ja paremal sabad. Seinte ja sabadega andmed toovad paratamatult kaasa kõvera, mis on pigem ühele poole kaldu kui normaalselt jaotunud kõver. Ei ole mõtet kasutada mediaani esindajana kõveral, millel see sümmeetria puudub.
Kaldus kõvera korral ei ole mediaan graafiku keskel ega ka kõige sagedasem väärtus. On ebamõistlik pidada väärtust, millel ei ole neid tüüpilisi omadusi, evolutsiooni esindajaks.
Lõpuks vaatame kõige harvemini kasutatavat väärtust. Kui andmekogum näitab suundumust, võib kõige harvemini esinevat väärtust pidada andmete heaks esituseks. Evolutsiooni uurimisel pole see aga kohane. Oletame, et evolutsioonis on suundumus. Kas evolutsiooni tendentsi olemasolu tähendab, et enamikul organismidel on sarnased omadused? Ma ei nõustu, sest evolutsioon on aeglane protsess, mis toimub pika aja jooksul ja evolutsioonil on väga raske toimuda. Niisiis, kas on palju organisme, mis on tendentsile lähedal, või on palju neid, mis ei ole? Me ei tea, kui me ei tea, kui kaugele meie maailm on arenenud. Võib-olla pole kõige väiksem ühisosa mitte elu, mis on edukalt arenenud ja tendentsiks koondunud, vaid pigem elu, mis pole veel välja kujunenud.
Mõned võivad väita, et enamikul elust on õnnestunud areneda, kuna elu algusest on möödunud palju aega. Kogu elu Maal pole aga kunagi eksisteerinud samal ajal. Ja isegi kui nad seda tegid, ei saa me öelda, et nad arenesid samadel tingimustel. On palju juhtumeid, kus samad liigid arenesid erinevates keskkondades. Kas siis kõike seda arvesse võttes saame pidada miinimumväärtust evolutsiooni esindajaks? Ma arvan, et mitte, sest organisme, mis on teatud trendile lähedal, on palju rohkem kui neid, mis ei ole, nii et kui evolutsioonis on trend, siis on kohatu määrata esindajana miinimumväärtust.
Siiani oleme arutanud, miks keskmisi, mediaan- ja väikseimaid väärtusi ei saa kasutada evolutsiooniuuringute esindusväärtustena. Evolutsiooniandmed erinevad suuresti sellest, millega oleme harjunud. Pole olemas ühtset andmepunkti, mille kohta võiks öelda, et see esindaks evolutsiooni, ning on mõttetu püüda kindlaks teha üht evolutsiooniprotsesside tendentsi. Selle tulemusena on võimatu seada evolutsioonile esinduslikku väärtust. Evolutsiooni uurimine ei ole midagi, mida saab uurida ühe esindaja kaudu.