Šajā emuāra ziņojumā mēs pētām reprezentatīvo vērtību noteikšanas derīgumu evolūcijas pētījumos. Mēs analizējam, vai vidējās, vidējās un mazākās vērtības var precīzi atspoguļot attīstību.
Kad zinātnieki veic pētījumus, datu analīzes process ir būtisks. Šie dati var būt evolūcijas eksperimentu rezultāti vai arī statistikas dati. Tas pats attiecas uz evolūcijas pētījumiem. Tā kā evolūcijas eksperimentu veikšana prasa pārāk ilgu laiku, līdz šim evolūcijas procesa statistiskie priekšstati ir balstīti uz fosilijām un radībām, kas attīstījušās no tām. Ja evolūcijas dati būtu ideāli veidoti kā normāls sadalījums, to būtu lieliski izpētīt. Taču realitāte nav tik vienkārša. Evolūcija ir bijusi un joprojām ir ļoti neparedzama. Stīvens Džejs Goulds, grāmatas Full House autors, apgalvo, ka, pētot evolūciju, mums jāskatās uz variāciju paplašināšanos un samazināšanos sistēmā kopumā, nevis uz izmaiņu tendenci konkrētā datu punktā. Citiem vārdiem sakot, mums jāskatās kopumā, nevis kādas konkrētas vērtības izmaiņas. Lai gan es nepiekrītu Gūlda apgalvojumam, ka evolūcija ir bez tendences un nejauša, es pilnībā piekrītu, ka neviens paraugs nav reprezentatīvs evolūcijai un ka mums vajadzētu aplūkot sistēmu kopumā. Tāpēc es sliecos piekrist Gouldam.
Veicot pētījumu, mēs dodam priekšroku mūsu datu reprezentatīvu vērtību noteikšanai. Mums patīk domāt, ka reprezentatīvās vērtības, piemēram, vidējās, vidējās un mazākās vērtības, atspoguļo datus kopumā. Tomēr evolūcijas pētījumos mums nevajadzētu pieļaut fatālu kļūdu, izvēloties reprezentatīvu vērtību. Evolūcijas pārstāvis ir indivīds vai suga, kas visciešāk atbilst evolūcijas tendencei. Tālāk es paskaidrošu, kāpēc evolūcijas pētījumos nevajadzētu izvēlēties reprezentatīvu vērtību.
Vispirms apskatīsim visbiežāk izmantoto reprezentatīvo vērtību: vidējo. Lai gan plašā vidējā definīcija ietver vidējo un mazāko vērtību, mēs izmantosim šauru vidējā definīciju, lai aprakstītu statistiskās kopas raksturlielumus vienā skaitļā. Ir vairāki vidējo veidu veidi, tostarp vidējais aritmētiskais, ģeometriskais vidējais un harmoniskais vidējais, taču mēs parasti izmantosim vidējo aritmētisko. Vidējā aritmētiskā priekšrocība ir tā, ka vidējās vērtības noteikšanā tiek iesaistīti visi dati. Atšķirībā no mediānas, kas ietver tikai centrētos datus, vai retāk sastopamos datus, kas ietver tikai biežākos datus, kad dati ir sakārtoti lieluma secībā, vidējais aritmētiskais reprezentatīvās vērtības noteikšanā ietver visus datus, tāpēc mums ir tendence uzskatīt, ka vidējais ir vislabākais datu attēlojums. Tam es piekrītu daļēji. Tomēr vidējā priekšrocība, “ir iesaistīti visi dati”, var būt liktenīga problēma, izmantojot to kā reprezentatīvu vērtību evolūcijas teorijā.
Piemēram, apsveriet situāciju, kad mēs vēlamies iegūt reprezentatīvu vērtību Hārvardas universitātes studentu GPA. Šajā gadījumā būtu pareizi ņemt izlases veidā 100 studentus un izmantot viņu vidējo vērtību kā reprezentatīvo vērtību. Bet pieņemsim, ka vēlaties iegūt reprezentatīvu cilvēku ienākumu izlasi visā pasaulē, piemēram, aptuveni 100,000 100,000 cilvēku. Vai jūs joprojām varat izmantot vidējo kā reprezentatīvu vērtību? Ja jūs iekļaujat vienu cilvēku šajos 100,000 10,000, teiksim Bils Geitss, viņa ienākumi palielinās 0 4.3 vidējos ienākumus par aptuveni 0 XNUMX USD. Statistikā vidējais aritmētiskais nav reprezentatīvs datiem, ja to lielā mērā ietekmē ārkārtēja mainīgums. Tā nav problēma, mēģinot iegūt reprezentatīvu GPA vērtību, jo GPA ir ierobežots diapazonā no XNUMX līdz XNUMX. No otras puses, ienākumi sākas ar XNUMX, bet tiem nav augšējās robežas. Tas nozīmē, ka, lai gan vidējo vērtību ir viegli izmantot kā reprezentatīvu vērtību situācijās, kad datiem ir ierobežota un paredzama vērtība, citās situācijās tas var būt problemātiski.
Apsveriet situāciju evolūcijas pētījumos. Organismu evolūcija ir neparedzamāka nekā cilvēku ienākumi visā pasaulē, un evolūciju nevar ierobežot nevienā diapazonā. Tātad, vai ir jēga izmantot vidējo vērtību kā reprezentatīvu vērtību evolūcijas pētījumos? Es tā nedomāju. Evolūcijas datos reprezentatīvo vērtību, visticamāk, sagroza ekstrēmi dati, un nav pareizi evolūcijas pētījumus balstīt uz šādām šķībām reprezentatīvām vērtībām. Vidējie rādītāji ir nozīmīgi kā pārstāvji, ja tos ietekmē lielāka mainīgums. Piemēram, dinozauri bieži tiek minēti kā mezozoja krīta perioda pārstāvji, taču Zemes vēsturē nekad nav bijis laika, kad mugurkaulnieku populācijā vai sugās būtu vairāk nekā bezmugurkaulnieku. Tas, kā mēs domājam, evolūcija kopumā izskatās, patiesībā ir īpašu gadījumu rezultāts.
Otrkārt, aplūkosim mediānu. Mediāna ir vērtība, kas atrodas datu centrā, ja tie ir sakārtoti pēc lieluma. Pamatojoties uz mediānu, puse datu ir lielāka par mediānu un puse ir mazāka par vidējo. Mediānas aprēķināšana ir sarežģīta, ja datos ir dublētās vērtības. Šādā gadījumā varat izmantot formulu, kas aprēķina punktus, kuru kumulatīvā procentuālā vērtība ir 50%, lai iegūtu mediānu. Mediāna var būt piemērotāks attēlojums nekā vidējais evolūcijas pētījumos, jo tas ir mazāk pakļauts ārkārtēju datu izmaiņām nekā vidējais. Tomēr ir arī problēmas ar mediānas lietošanu.
Lai to ilustrētu, apsveriet jēdzienus “sienas” un “astes”. Sienas ir ierobežojošie punkti. Grafikā veidojot datu kopu, vērtību, kas nevar pastāvēt pa kreisi no vērtības, sauc par kreiso sienu. “Aste” ir pretēja sienai, kas nozīmē, ka dati var pastāvēt bezgalīgi pa kreisi vai pa labi. Tomēr galējās vērtības ir tik reti, ka tās parādās kā astes, kas kļūst arvien mazākas. Iepriekš minētā pētījuma par cilvēku ienākumiem visā pasaulē gadījumā nulle ir kreisā siena, jo nevienam nav ienākumu, kas mazāks par nulli. No otras puses, ienākumiem bez augšējās robežas būtu labā puse, ja to attēlo grafikā.
Iespējams, ir pareizi izmantot mediānu, lai atspoguļotu dažu cilvēku ienākumus. Tomēr, pētot evolūcijas teoriju, ir pareizi pieņemt, ka evolūcijā ir tendence un izvēlēties mediānu kā pārstāvi? Nē, jo, domājot par organismu, kas attīstās un kļūst sarežģītāks vai vienkāršāks savā struktūrā, tas nevar kļūt vienkāršāks par dzīvības uzturēšanai nepieciešamo pamatstruktūru, kas radītu datos “sienu”. Ja skatāties uz x asi kā organisma struktūras sarežģītību, jums būs sienas kreisajā pusē un astes labajā pusē. Dati ar sienām un astēm neizbēgami radīs līkni, kas ir šķība uz vienu pusi, nevis normāli sadalītu līkni. Nav jēgas izmantot mediānu kā pārstāvi līknē, kurai trūkst šīs simetrijas.
Izliektā līknē mediāna neatrodas diagrammas centrā, un tā nav arī visizplatītākā vērtība. Nav saprātīgi uzskatīt vērtību, kas neuzrāda šīs reprezentatīvās īpašības, par evolūcijas pārstāvi.
Visbeidzot, apskatīsim retāk sastopamo vērtību. Ja datu kopa parāda tendenci, retāk sastopamo vērtību var uzskatīt par labu datu attēlojumu. Tomēr evolūcijas izpētē tas nav piemērots. Pieņemsim, ka evolūcijā ir tendence. Vai evolūcijas tendences esamība nozīmē, ka lielākajai daļai organismu ir līdzīgas īpašības? Es nepiekrītu, jo evolūcija ir lēns process, kas notiek ilgā laika periodā, un evolūcijai ir ļoti grūti notikt. Tātad, vai ir daudz organismu, kas ir tuvu tendencei, vai ir daudz tādu, kas nav? Mēs nezinām, ja vien nezinām, cik tālu mūsu pasaule ir progresējusi. Varbūt mazākais kopsaucējs ir nevis dzīve, kas ir veiksmīgi attīstījusies un sakrājusies tendencē, bet gan dzīve, kas vēl nav attīstījusies.
Daži varētu iebilst, ka lielākajai daļai dzīves ir izdevies attīstīties, jo ir pagājis ilgs laiks kopš dzīves sākuma. Tomēr visa dzīvība uz Zemes nekad nav pastāvējusi vienlaikus. Un pat ja viņi to darītu, mēs nevaram teikt, ka tie attīstījās tādos pašos apstākļos. Ir daudz gadījumu, kad viena un tā pati suga attīstījās dažādās vidēs. Tātad, ņemot vērā to visu, vai minimālo vērtību varam uzskatīt par evolūcijas pārstāvi? Es tā nedomāju, jo ir daudz vairāk organismu, kas ir tuvu noteiktai tendencei, nekā tādi, kas nav, tāpēc, ja evolūcijā ir tendence, nav pareizi noteikt minimālo vērtību kā pārstāvi.
Līdz šim mēs esam apsprieduši, kāpēc vidējās, vidējās un mazākās vērtības nevar izmantot kā reprezentatīvās vērtības evolūcijas pētījumiem. Evolūcijas dati ļoti atšķiras no tiem, pie kuriem mēs esam pieraduši. Nav neviena datu punkta, par kuru varētu teikt, ka tas reprezentētu evolūciju, un ir bezjēdzīgi mēģināt noteikt vienu evolūcijas procesu tendenci. Rezultātā evolūcijai nav iespējams noteikt reprezentatīvu vērtību. Evolūcijas izpēte nav kaut kas tāds, ko var pētīt ar viena pārstāvja starpniecību.