Olib tashlash yoki olib tashlamaslik uchun: Testosteron ma'lumotlarida ahamiyatlilik testiga ta'sirchan ishlov berishning ta'siri
Gormonal tadqiqotlarda tashqaridan olib tashlash odatiy holdir. Bu erda biz gormonal ma'lumotlardan tashqarida bo'lganlarni olib tashlash qanchalik statistik xulosalarga olib kelishini tekshirdik. Dastlab biz eng keng tarqalgan chegaralarni aniqlash qoidalari o'rtacha qiymatdan bir qator standart og'ishlarga (SD) asoslanganligini ko'rsatamiz. Keyinchalik, biz haddan tashqari chiqarib tashlangan test statistik jihatdan ahamiyatli natija berganida statistik xulosalar qay darajada farqlanishini o'rganish uchun simulyatsiyalardan foydalandik, ammo haddan tashqari inklyuziya bilan test yo'q edi yoki aksincha ( p= .05 da). Mustaqil namunalar uchun simulyatsiyalar ikki nusxada bajarildi t- testlar va takroriy o'lchovlar ANOVA loyihalari va haqiqiy testosteron (T) ma'lumotlariga asoslangan va T ma'lumotlarining nazariy gamma taqsimoti. Biz har xil namuna o'lchamlari (30 dan 100 gacha) va undan yuqori olib tashlash qoidalari (2,5 SD va 3 SD) uchun simulyatsiyalar o'tkazdik. Muhim t-sinovlari uchun biz aniqlangan holatlarning 14% dan 55% gacha bo'lgan davrda statistik jihatdan ahamiyatli natija berganligini, aksincha haddan tashqari inklyuziya bilan o'tkazilgan test natijasi bo'lmaganligini yoki aksincha (o'rtacha pfarq: .03– .06). ANOVA-larning muhim takroriy choralari uchun biz 7% dan 28% gacha bo'lgan holatlarda, tashqaridan chiqarib tashlash statistik jihatdan muhim natija berganligini, aksincha, haddan tashqari inklyuziya bilan o'tkazilgan test bo'lmaganligini yoki aksincha (median pfarq: .01 – .03). Statistik jihatdan ahamiyatli natijaga olib keladigan har qanday test (yoki tashqariga chiqish (yoki ikkalasini ham qo'shib qo'yish) bilan o'tkazilgan test) haqida xabar berganda , mustaqil namunadagi t-testlarning 5,15% dan 6,89% gacha bo'lgan qismi statistik jihatdan ahamiyatli va takrorlangan uchun ANOVA dizaynini aniqlaydi, bu testlarning 6,32% dan 7,62% gacha bo'lgan. Bizning natijalar shuni ko'rsatadiki, tashqi ishlov berish ahamiyatlilikni sinashga sezilarli ta'sir ko'rsatishi mumkin. Chet elga ishlov berish uchun bir nechta potentsial echimlarni taklif qilamiz va gormonal ma'lumotlarda tashqi ko'rsatkichlarni sinchkovlik bilan baholashni talab qilamiz.
Kirish
Turli xil ilmiy intizomlar o'zlarining ma'lumotlarida muntazam ravishda "chet elliklar" bilan uchrashadilar (masalan, Aguinis va boshq. 2013; Bakker va Vicherts 2014). Chiqib ketuvchilar odatda namunadagi boshqa holatlarning ko'pchiligidan farq qiluvchi kuzatuvlar deb ta'riflanadi (Barnett 1978; Barnett va Lyuis 1994; Grubbs 1969; Hawkins 1980; Orr va boshq. 1991; Osborne va Overbay 2004; Rousseuw va Hubert 2011). Bunday kelishmovchilik, masalan: o'lchov yoki kodlash xatosi, noto'g'ri populyatsiyadan namuna olish, istisno holatlar yoki statistik modelga mos kelmasligi bilan bog'liq bo'lishi mumkin. Chet elliklar muhim va bir nechta mashhur holatlar mavjud, ular hatto bitta holat ham natijalarga jiddiy ta'sir qiladi (masalan, Hollenbek va boshq. 2006). Masalan, jurnal Acta Crystallographica A2009 yilgacha 2,24 atrofida barqaror ta'sir koeffitsientiga ega edi, 5624 ta iqtibos bilan bitta qog'oz tufayli 49,9 ta ta'sir koeffitsientiga erishdi (Dimitrov va boshq. 2010). Chet eldan ishlov berish bo'yicha juda katta miqdordagi adabiyotlar mavjud va statistik namunalarni tan olishning butun sohasi tashqaridan aniqlash va ishlashga bag'ishlangan (masalan, Ritter va Gallegos 1997). Shu sababli, ushbu qisqa hisobotning maqsadi chet elliklarning ahamiyati va ta'sirini ko'rib chiqish yoki chet elliklar bilan ishlashning barcha mumkin bo'lgan usullarini ko'rib chiqish emas (masalan, Aguinis va boshq. 2013; Barnett va Lyuis 1994; Dikson 1953; Grubbs 1969; Hawkins 1980; Osborne va Overbay 2004; Rousseeuw va Hubert 2011; Shiffler 1988). Aksincha, biz endokrinologik tadqiqotlar doirasida statistik xulosalarga ta'sirchan olib tashlash qarorlarining qay darajada ta'sir qilishini tekshirishni istaymiz,va ayniqsa testosteron (T) bilan shug'ullanadiganlar.
Tashqi ko'rinish endokrinologik tadqiqotlar uchun juda muhimdir, chunki T kabi gormonal ma'lumotlar odatda normal tarqalishga mos kelmaydi. Masalan, qiyshiq taqsimoti tufayli T odatda normal taqsimotga asoslangan chegaralarni belgilashda ko'p sonli ko'rsatkichlarni o'z ichiga oladi (quyidagi 1-rasm; Stanton 2011: 1-rasm). Ushbu cheklovlarni kiritish yoki chiqarib tashlash muhim bo'lishi mumkin, ayniqsa ushbu tadqiqot sohasidagi namunaviy o'lchamlarni hisobga olgan holda. Shuning uchun biz qanday qilib chetga chiqishlarni olib tashlash statistik ahamiyatga asoslangan turli xil statistik xulosalarga olib kelishini tekshirdik ( p= .05). Bizning tahlillarimiz T ga qaratildi, chunki bu gormon eng ko'p o'rganilgan gormonlar qatoriga kiradi va bizda T bo'yicha etarli ma'lumotlar mavjud edi.
433 ta testosteron namunalarining gistogrammasi
Birinchidan, biz Psixonuroendokrinologiya, gormonlar va xulq-atvoriva biologik psixologiyadagibarcha maqolalar bo'yicha odamlarga T darajasining ba'zi o'lchovlarini o'z ichiga olgan 2010 yil 1 yanvardan 2015 yil 1 maygacha bo'lgan davrniko'rib chiqdik (ESM jadvali 1-2-3). 133 ta hujjatning 43 tasida (32,33%) ko'proq ishlov berish qayd etilgan va bu asosan olib tashlashdan iborat (43 dan 35 tasi). Ba'zida haddan tashqari holatlarning qiymatlarini, masalan, 95-foizli ball bilan qayta belgilashni o'z ichiga olgan vinsorizatsiya ishlatilgan (Ghosh and Vogt 2012; Hastings Jr va boshq. 1947). Shu bilan birga, eng yuqori ko'rsatkichni aniqlash uchun eng ko'p qo'llaniladigan qoida (43 ta qog'ozdan 24 tasi) o'rtacha o'rtacha ballardan uzoqlashtirilgan ma'lum miqdordagi og'ishlar (SD) bo'lgan holatga asoslandi.
Shunday qilib, tez-tez tashqi ko'rsatkichlar haqida xabar berilishi va odatda ularni olib tashlash qo'llaniladigan protsedura ekanligi aniq. Bu erda ' p= ga asoslangan statistik xulosalar qanchalik tez-tez ko'rib chiqildi .05 ahamiyati farqli o'laroq istisno qilingan test statistik jihatdan ahamiyatli natija berganida ajralib chiqdi, ammo undan yuqori darajadagi inklyuziya bilan test yo'q edi yoki aksincha. Shuningdek , ushbu statistik xulosalar turlicha bo'lganida pqiymatlari qancha farq qilganligi bilan ham baholadik . Va nihoyat, biz statistik jihatdan ahamiyatli bo'lgan har qanday natija haqida xabar berishda qancha testlar muhimligini tekshirdik (yoki ortiqcha miqdorlarni kiritish yoki chiqarib tashlash bilan test). Shu maqsadda biz mustaqil namunalarni tsimulyatsiya qildik- sinov namunasi va post-postdan oldin ANOVA dizayni har xil namuna o'lchamlari (30 dan 100 gacha) va undan yuqori olib tashlash qoidalari (2.5 SD va 3 SD). Simulyatsiyalar ikki nusxada haqiqiy gormonal ma'lumotlar va T ma'lumotlarining nazariy gamma taqsimoti bo'yicha amalga oshirildi.
Usullari
T qiymatlari erkaklarning 433 tupurik namunalaridan olingan (mualliflar tomonidan nashr etilmagan 7 ta tadqiqot, shuningdek bitta nashr etilgan tadqiqot (van der Meij va boshq. 2015). Barcha namunalar xuddi shu protokol orqali shu tarzda to'plangan (tafsilotlar uchun: van der Meij va boshq. 2015) va Drezden Texnologiya Universitetining Biologik Psixologiya laboratoriyasi tomonidan tahlil qilingan.T kengaytirilgan diapazonda tuprikli T fermenti-immunoassay to'plami (kat. nu 1-2402) orqali Salimetrics (Suffolk, Ichki va tahlillar koeffitsientlari 10% va 12% dan pastroqdir. Ma'lumotlar bazasidan hech qanday haddan tashqari ko'rsatkichlar olib tashlanmagan (2.5 va 3 SD qoidalariga asosan, mos ravishda 13 va 9 ta ortiqcha bo'lishi kerak).
Simulyatsiyalar
Haqiqiy ma'lumotlarga asoslangan simulyatsiyalar - mustaqil namunalar T-test ssenariysi
R 3.0.2 (R Development Core Team 2008) dan foydalanish (ishlatilgan paketlar: Meyer va boshq. 2015; Wickham 2011, 2009, 2007, qarang ESM 4). P= .05 da har xil statistik xulosalarga olib kelishini qanchalik tez-tez ko'rib chiqish uchun biz moslashtirilgan skript tuzdik. Bundan tashqari, ushbu statistik xulosalar pqiymati jihatidan qanchalik farq qilishini o'rganib chiqdik . Izohlangan skript va ma'lumotlar ESM 4-ga kiritilgan. Ssenariy ikki nusxada ishlangan (1 va 2-band) va quyidagicha ishlagan. Birinchidan, u bizning ma'lumotlarimizdan n(o'rnini bosgan holda , n= 30-100) namunasini oldi ( N= 433 T o'lchovlari; Shakl 1). Ikkinchidan, skriptlar jurnali ma'lumotlarni o'zgartirgan (log10) (masalan, Dabbs va boshq. 1995; Feldman va boshq. 2002; Pollet va boshq. 2013; van der Meij va boshq. 2008). Uchinchidan, u keyinchalik ma'lumotlarni ikki guruhga bo'lish orqali teng o'lchamdagi ikkita o'zboshimchalik shartlarini yaratdi. To'rtinchidan, skript, ikki mustaqil namunalar ijro tbir: mustaqil o'zgaruvchilar sifatida ikki ilgari barpo guruhlar bilan -tests Thar qanday qo'pol xato baholari va bir olishdan holda -test tbilan -test barchaolib alohida qiymatlar. Haddan tashqari ko'rsatkichlar xom ma'lumotlar yordamida 2,5 SD yoki undan ko'p yoki o'rtacha 3 SD yoki undan ko'proq masofada aniqlandi. Mustaqil namunalar t -sinovlari teng bo'lmagan farqlar uchun tuzatilgan (Welch's t- sinov, Ruxton 2006 ga qarang; Zimmerman 2004). Barcha pqiymatlari ikki tomonli edi va biz 5% ahamiyatlilik chegarasini qo'lladik ( p= .05). Beshinchidan, stsenariy bir-to'rt bosqichlarni 100000 marta bajargan. Ushbu 100,000 holatlarning har biri boshqacha tadqiqot sifatida talqin qilinishi mumkin (garchi ular bizning n= 433-dan o'rnini bosish bilan olingan bo'lsa). Oltinchidan, u tashqaridan olib tashlangan va olib tashlanmasdan muhim t -sinovlar sonini hisobladi . Stsenariy shuningdek, qanday holatlarning ahamiyatliligiga asoslangan statistik xulosalar farq qilganligini hisoblab chiqdi: istisno qilingan test statistik jihatdan ahamiyatli natija berdi, ammo haddan tashqari qo'shilgan test natija bermadi yoki aksincha ( p= da .05). Buni tekshirish uchun bizda 100000 (holatlar yo'q) × 2 matritsasi mavjud (istisno qilish yoki qo'shib qo'yish). % Divergentsiyani hisoblash uchun stsenariy statistik xulosalar turlicha bo'lgan barcha holatlarni sarhisob qildi - ya'ni matritsada bitta satr yozuvi muhim, ikkinchisi qatorda bo'lmagan ( p da= .05 darajasi). Keyinchalik, ushbu summa muhim testlarning umumiy soniga bo'linib, keyin yuzga ko'paytirilib, foiz (%) ga ega bo'ldi. Shunday qilib, ushbu o'lchov nazariy jihatdan 0% dan 100% gacha bo'lishi mumkin. Nolinchi foizli kelishmovchilik statistik xulosalardagi mukammal yozishmalarni anglatardi, ya'ni agar haddan tashqari miqdorlarni hisobga olmaganda ish ahamiyatli bo'lgan bo'lsa, u holda bu haddan tashqari sonlarni qo'shganda ham har doim muhim bo'lgan va aksincha. Yuz foizli kelishmovchilik statistik xulosada nol yozishmalarni anglatardi, ya'ni agar haddan tashqari ko'rsatkichlarni hisobga olmaganda ish ahamiyatli bo'lsa, bu haddan tashqari sonlarni qo'shganda hech qachon ahamiyatli bo'lmagan va aksincha ( p= .05 da). Va nihoyat, ssenariy p ningqancha ekanligini hisoblab chiqdiahamiyatlilikka asoslangan statistik xulosalar turlicha bo'lgan barcha holatlar uchun qiymatlar mutlaq ma'noda farq qiladi. Biz pqiymatlaridagi mutloq farqlarning o'rtacha qiymatini va mutlaq pqiymatlardagi bu farqlarning 2,5 va 97,5 foizini bildirdik . Bundan tashqari, 100000 ta yozuvning qanchasi p= .05 da statistik jihatdan ahamiyatli ekanligi haqida xabar bergan edik, agar ortiqcha imtiyozlarni kiritish yoki chiqarib tashlash bilan test tanlangan bo'lsa (bu ikkala yozuv ham muhim bo'lgan holatlarni hisobga oladi).
Haqiqiy ma'lumotlarga asoslangan simulyatsiyalar - takroriy o'lchov ANOVA stsenariysi (RM-ANOVA)
R 3.0.2 (R Development Core Team 2008) dan foydalangan holda mustaqil t-testlar stsenariysida bo'lgani kabi, biz p= .05 da har xil statistik xulosalarga olib kelishini qanchalik tez-tez ko'rib chiqishni tekshirish uchun moslashtirilgan skript tuzdik. ESM 4) RM-ANOVA dizayni uchun. Bizning modelimiz ishtirokchilar ikkita shartdan biriga tayinlangan holda postdan oldingi dizaynga mos keladi. Ssenariy ikki nusxada ishlangan (1 va 2-band) va quyidagicha ishlagan. Birinchidan, u bir namunasi qaratdi nbizning ma'lumotlar zaxira (T1) bilan (30-80) ( N= 433 T o'lchovlari; Shakl 1). Ikkinchidan, skript har bir T1 ma'lumotlar nuqtasi uchun o'zaro bog'liq Time 2 (T2) ma'lumotlarini yaratish uchun Cholesky transformatsion matritsasidan foydalangan (Stevenson 2013). Shu maqsadda biz avval namunamizdan T2 ma'lumotlarini tanladik ( N= 433) almashtirish bilan, biz T1 uchun qilganimiz kabi. Keyinchalik T1 va T2 matritsalari bilan ushbu matritsani T1 va T2 o'rtasida ma'lum bir korrelyatsiya bilan bog'liq qiymatlarni olish uchun o'zgartirish mumkin. Matritsali algebra Golub va Van Loan 2012 da uzoq vaqt tasvirlangan. R-da 'chol (matritsa)' buyrug'i transformatsiyani ta'minlaydi va bunday Xoleskiy konvertatsiya R-dagi simulyatsiyalar uchun o'zaro bog'liq ma'lumotlarni yaratish usulidir (Matlab uchun: (Van den Berg nd.), SAS uchun: (SAS 2009; UCLA: Statistical Consulting Group 2016)). Biz ushbu protsedura T1 bilan o'zaro bog'liq bo'lgan T5 qiymatlarini yaratishga ruxsat berdik .5 qiymati, chunki nashr etilmagan ma'lumotlarimiz namunasida T1 va T2 taxminan ushbu qiymat bilan bog'liq edi ( r69= .551). Shu bilan birga, o'lchovlar orasidagi vaqt (o'zaro yaqinroq bo'lgan namunalar ko'proq korrelyatsiya) tufayli korrelyatsiya eksperimental dizaynlarda sezilarli darajada farq qilishi mumkin. Ushbu farqlar qisman bizning tahlillarimizda hisobga olinadi, chunki bitta simulyatsiya uchun haqiqiy (namunaviy) korrelyatsiya aholi darajasidagi korrelyatsiyadan sezilarli darajada farq qilishi mumkin. Uchinchidan, har bir "ishtirokchini" ushbu shartlardan biriga o'zboshimchalik bilan berish orqali teng o'lchamdagi ikkita o'zboshimchalik shartlari hosil bo'ldi (har bir ishtirokchi T1 va T2 ma'lumotlar nuqtasiga ega edi). To'rtinchidan, stsenariyda ikkita takroriy chora-tadbirlar ANOVA amalga oshirildi: bittasi haddan tashqari qo'shilganlar va bittasi ortiqcha bo'lganlar chiqarib tashlandi (2.5 va 3-sonli SD-ni olib tashlash qoidalariga asoslanib, 2.2.1-ga qarang). Ikkala stsenariy uchun skript p nihisoblab chiqdio'zaro ta'sir ta'sirining qiymati (ikki tomonli) (o'zaro ta'sir o'tkazish: shart * vaqt). Beshinchidan, bu jarayon 100000 marta takrorlangan. Oltinchidan, u tashqaridan olib tashlangan va olib tashlanmasdan muhim t -sinovlar sonini hisobladi . Stsenariyda, shuningdek, holatlarning ko'pchiligida ahamiyatlilikka asoslangan statistik xulosalar turlicha bo'lganligi hisoblab chiqilgan: istisno qilingan test statistik jihatdan muhim natija bergan, ammo haddan tashqari qo'shilgan test natija bermagan yoki aksincha ( p= .05 da). Mustaqil namunalardagi kabi t- sinov stsenariysi, shuning uchun biz 100000 (holatlar soni) × 2 matritsasini ko'rib chiqdik (tashqariga chiqarib tashlash yoki qo'shib qo'yish). % Divergentsiyani hisoblash uchun stsenariy statistik xulosalar turlicha bo'lgan barcha holatlarni sarhisob qildi - ya'ni matritsada bitta satr yozuvi muhim, ikkinchisi qatorda bo'lmagan ( p da= .05 darajasi). Keyinchalik, ushbu summa muhim testlarning umumiy soniga bo'linib, keyin yuzga ko'paytirilib, foiz (%) ga ega bo'ldi. Shunday qilib, ushbu o'lchov nazariy jihatdan 0% dan 100% gacha bo'lishi mumkin. Nolinchi foizli kelishmovchilik statistik xulosalardagi mukammal yozishmalarni anglatardi, ya'ni agar haddan tashqari miqdorlarni hisobga olmaganda ish ahamiyatli bo'lgan bo'lsa, u holda bu haddan tashqari sonlarni qo'shganda ham har doim muhim bo'lgan va aksincha. Yuz foizli kelishmovchilik statistik xulosada nol yozishmalarni anglatardi, ya'ni agar haddan tashqari ko'rsatkichlarni hisobga olmaganda ish ahamiyatli bo'lsa, bu haddan tashqari sonlarni qo'shganda hech qachon ahamiyatli bo'lmagan va aksincha ( p= .05 da). Va nihoyat, ssenariy p ningqancha ekanligini hisoblab chiqdiahamiyatlilikka asoslangan statistik xulosalar turlicha bo'lgan barcha holatlar uchun qiymatlar mutlaq ma'noda farq qiladi. Biz pqiymatlaridagi mutloq farqlarning o'rtacha qiymatini va mutlaq pqiymatlardagi bu farqlarning 2,5 va 97,5 foizini bildirdik . Mustaqil namunalar t-test stsenariysida bo'lgani kabi, biz 100000 ta yozuvning qanchasi p= .05 da statistik jihatdan ahamiyatli ekanligi haqida xabar bergan edik, agar haddan tashqari ko'rsatkichlarni kiritish yoki chiqarib tashlash bilan test tanlangan bo'lsa (bu ikkala yozuv ham kiritilgan holatlarni hisobga oladi) muhim).
Nazariy ma'lumotlarga asoslangan simulyatsiyalar
Kamchilik shundaki, bizning qayta namunalarni rasmiylashtirish protseduramiz haqiqiy ma'lumotlarga asoslangan va shu sababli, faqat shu qiymatlar bilan cheklangan. Shuning uchun biz T qiymatlarining taqsimlanishini tavsiflashga va haqiqiy qiymatlardan ko'ra nazariy taqsimotdan olingan simulyatsiyalardan foydalanishga intildik. T taqsimotining shaklini hisobga olgan holda (1-rasm) biz bir nechta nomzodlarning tarqalishini ko'rib chiqdik (normal, lognormal, Weibull va gamma tarqalishi, (R ichida MASS to'plami) (Ripley va boshq. 2015)). Kolmogorov-Smirnov testlari ('ks.test' R: ks.test (gamma) = 0.05, p= .15; ks.test (normal) = 1, p) asosida olingan ma'lumotlarga gamma taqsimoti eng yaxshi mos keldi. p= .003; ks.test (lognormal) = 0.069, p= .034). Ks.test (gamma) statistik jihatdan ahamiyatli emasligini hisobga olib, biz kuzatilgan taqsimot nazariy taqsimotga o'xshash degan nol gipotezani saqlab qoldik. Shunga qaramay, shuni ta'kidlash kerakki, kattaroq namunalar uchun Kolmogorov-Smirnov testi (juda) konservativ sinovdir, shuning uchun gammadan tashqari boshqa nomzodlarning tarqatilishi adolatsiz ravishda rad etilishi mumkin edi.
Biz 2.2.1 va 2.2.2-bo'limlarda tushuntirilgan skriptlarni ishga tushirdik, ammo 433 T qiymatlaridan chizma o'rniga gamma taqsimotidan namunalar oldi. Nazariy taqsimot bizning namunamiz asosida yaratilganligini unutmang. Shuning uchun, erkak gormoni namunalarining "haqiqiy" tarqalishi biz modellashtirilganidan farq qilishi mumkin.
Natijalar
Asosiy simulyatsiya natijalari 1-4 jadvallarda umumlashtirilgan. Jadvallarni qanday talqin qilish kerakligini ko'rsatish uchun biz 1-jadvaldagi 1-chi ishga tushirishning birinchi qatorini sharhlaymiz. Namuna hajmi n= 30, haqiqiy ma'lumotlar va 2,5 SD dan yuqori olib tashlash qoidasi bilan birinchi simulyatsiya (1-yugurish) bazani topdi haddan tashqari ko'rsatkichlar kiritilganda 4.85% stavkaning ahamiyati (a) yo'q va barcha tashqi ko'rsatkichlar chiqarib tashlanganida 4.72% testlar (a). 49,37% muhim holatlarda, shu jumladan, haddan tashqari natijalar statistik jihatdan muhim natijaga olib keldi, ammo tashqaridan chiqarib tashlash statistik jihatdan ahamiyatsiz natijaga olib keldi yoki aksincha ( p= .05 da sarlavha ustuniga qarang va shuningdek, uslub bo'limidagi tavsifga qarang). Statistik xulosalar turlicha bo'lganida, ular p-da6% atrofida farq qildilarqiymati (o'rtacha baho, 95% oralig'i: 1% dan 26% gacha), sarlavha ustuniga qarang. 2-rasmda bu xilma-xil taxminlar berilgan (maksimal pqiymati .84 (!) Bo'lgani uchun yuqori 2,5% dumi ko'rsatilmagan ).
Divergensiyaning tasviri: Chegaralarni qo'shganda yoki chiqarib tashlaganda pqiymatlarining mutlaq farq gistogrammasi (1, 2.5 SD qoida, n= 30, haqiqiy ma'lumotlar) va statistik xulosalar p= .05 da farq qiladi . Kesilgan chiziq o'rtacha taxminiy ko'rsatkichdir. Izoh: Ma'lumotlarning yuqori 2,5% ko'rsatilmagan (maksimal p= .84 bo'lgani uchun). Shuni e'tiborga olingki, bu 1-jadvaldagi faqat bitta yozuvning tasviri, 1-4-jadvaldagi boshqa yozuvlar uchun gistogrammalar chizish uchun kod ESM 4-ga kiritilgan.
Barcha simulyatsiyalar bo'yicha, eng yomon vaziyat senariy shuni ko'rsatadiki, muhim holatlarning 50% dan ortig'ida, shu jumladan, haddan tashqari ko'rsatkichlar statistik jihatdan muhim natijaga olib keldi, ammo istisno qilish statistik bo'lmagan ahamiyatga ega natijaga olib keldi yoki aksincha, agar natijalar boshqacha bo'lsa, pqiymatlarining o'rtacha farqi .07 ni tashkil etdi (masalan, p= .04 va p= .11) (statistik testga qarab, n,tashqariga chiqarib tashlash qoidasi, namuna kattaligi va "Ishga tushirish raqami"), 1-4 jadvallarga qarang. natijalar. Shunga qaramay, alohida holat uchun bu .07 dan katta bo'lishi mumkinligini unutmang. Agar diapazonning yuqori bahosini olsak, u pqiymatidagi .37 farqgacha bo'lishi mumkin . Bu, masalan, p= .04 dan p= .41 gacha . Biroq, eng yaxshi ssenariy shuni ko'rsatadiki, xulosalar faqatgina 7% hollarda o'zgarishi mumkin va agar bu holatlar turlicha bo'lsa, ular pqiymatida .01 ga teng.
Mustaqil namunalar t-Test
Haqiqiy ma'lumotlarga asoslangan mustaqil namunalar uchun t-stsenariysi, muhim holatlarning 32% dan 55% gacha bo'lganida, istisno qilingan test statistik jihatdan ahamiyatli natijani berdi, ammo haddan tashqari inklyuziya bilan test yo'q edi yoki aksincha ( p= da .05, n gaqarab , tashqariga olib tashlash qoidasi va Run no.). Bu statistik xulosalar farq edi, ular bo'yicha .07 uchun .05 o'rtasida ixtilof pqiymat (umumiy diapazon: .01 dan .37 gacha). Nazariy taqsimotga asoslangan simulyatsiyalar uchun natijalar haqiqiy ma'lumotlarga nisbatan kichikroq farqni ko'rsatdi: inklyuziya va ortiqcha miqdorlarni chiqarib tashlashga asoslangan statistik xulosalar muhim holatlarning 15% dan 45% gacha farq qildi va ular farq qilganda, ular o'rtasidagi farq Pqiymati bo'yicha .05 dan .07 gacha (umumiy diapazon: .01 dan .23 gacha, n gaqarab , olib tashlash qoidasi va ishga tushirish raqami.).
RM-ANOVA
Haqiqiy ma'lumotlarga asoslangan simulyatsiyalar uchun namuna kattaligiga, tashqariga chiqarib tashlash qoidasiga va No-ni ishlatishga bog'liq bo'lib, muhim holatlarning 15 dan 28% gacha bo'lgan muddat, istisno qilingan holda statistik jihatdan ahamiyatli natijani berdi, ammo undan yuqori qo'shilgan holda test o'tkazilmadi yoki aksincha ( p= .05 daraja). Nazariy taqsimotga asoslangan simulyatsiyalar uchun statistik xulosalar muhim holatlarning 7 dan 20 foizigacha farq qiladi. Statistik xulosalar bir-biridan farq qiladigan holatlar uchun pqiymatlar haqiqiy ma'lumotlarga asoslangan simulyatsiyalar uchun .02 – .03 atrofida va nazariy taqsimotlarga asoslangan simulyatsiyalar uchun .01 –02 atrofida edi. Tegishli diapazonlar (2,5 foizli va 97,5 foizli) haqiqiy ma'lumotlarga asoslangan simulyatsiyalar uchun
Sog'lomlik va namuna hajmi
Yugurish oralig'ida natijalar umuman barqaror edi. Yugurishlar orasidagi eng past korrelyatsiya nazariy ma'lumotlarga asoslangan RM-ANOVA stsenariysi (divergent testlarning nisbati uchun: 2.5 SD dan yuqori olib tashlash qoidasi uchun r= .85 , 3 SD dan yuqori olib tashlash qoidasi uchun r= .92). Qolgan stsenariylar uchun divergent testlarning nisbati uchun 1-yugurish va 2-runt o'rtasidagi korrelyatsiyalar>.94) ni tashkil etdi.
Natijalar shuni ko'rsatdiki, divergent testlarning ulushi kichikroq namuna hajmiga qaraganda kattaroq namuna hajmida katta bo'lgan. Mustaqil namunalar uchun t -sinovlar stsenariysi, turli xil testlarning% namunalari hajmi bo'yicha ortdi. Masalan, 3 ta SDni olib tashlash qoidasi bilan, sinovlarning 32% i namunaviy kattaligi 30 ga teng, 100 ga teng bo'lgan o'lchov uchun esa 47% atrofida edi (1-jadvalga qarang). P-dagi o'rtacha farq5-6% atrofida nisbatan barqaror bo'lib qoldi. Haqiqiy ma'lumotlarga asoslangan RM-ANOVA stsenariy simulyatsiyalari uchun namunalar hajmining ko'payishi, shuningdek, turli xil xulosalar bilan testlarning yuqori qismini keltirib chiqardi (3-jadval: 3-sonli SDni olib tashlash qoidasi: 15 dan 21% gacha). Ushbu topilmalar uchun potentsial tushuntirish shundan iboratki, kattaroq namunalarda kattaroq kattaliklar paydo bo'lishi ehtimoli katta. Ushbu kattaroq namunalarda potentsial ravishda olib tashlash uchun ko'proq mablag 'mavjud va shuning uchun chet ellarni kiritish yoki chiqarib tashlash ko'pincha muhim bo'lishi mumkin.
Bundan tashqari, ahamiyatlilikka asoslangan statistik xulosalar, 3 SD dan yuqori olib tashlash qoidalariga qaraganda 2.5 SD dan yuqori olib tashlash qoidalariga nisbatan tez-tez farq qilar edi (1-4 jadval). Masalan, 2.5 ta SD-ni tashqariga chiqarib tashlash qoidasi va haqiqiy ma'lumotlarga asoslanib t-testda xulosalar holatlarning 44% dan 54% gacha ( nva Run No ga qarab ) farq qilgan, 3 ta SDni olib tashlash qoidasi uchun statistik xulosalar 32% dan 48% gacha farq qildi. Ushbu topilmalar uchun potentsial tushuntirish shundan iboratki, 3 SD qoidasiga qaraganda 2.5 SD qoidasi yordamida ko'proq me'yorlar aniqlanadi va shuning uchun haddan tashqari miqdorlarni kiritish yoki chiqarib tashlash ko'pincha muhim bo'lishi mumkin. P-dagi kelishmovchilik uchun tegishli o'rtacha taxminlarqiymati 2.5 SD va 3 SD qoidalari o'rtasida deyarli farq qilmaydi. Masalan, 2.5 SD va 3 SD qoidalari uchun ham tafovutlar bo'yicha o'rtacha hisob-kitoblar haqiqiy ma'lumotlarga asoslangan t-testlar uchun pqiymati bo'yicha .05 va .07 gacha bo'lgan .
Asosiy stavkaning ahamiyati
Shuningdek, har 100000 ta sinov uchun dastlabki ahamiyatga ega bo'lgan ko'rsatkichlarni oldik. Mustaqil namunalar uchun t -sinovlari biz barcha namuna o'lchamlari bo'yicha 5% ga yaqin ahamiyatga ega ekanligini aniqladik (100000 ta testdan 1-2: 4680 dan 5104 gacha jadvallar statistik jihatdan ahamiyatli edi). Shu bilan birga, RM-ANOVA stsenariysi uchun boshlang'ich ahamiyat darajasi ancha yuqori edi (100000 ta testdan 3-4: 5884 dan 6924 gacha jadvallar). 5.9% dan 6.9% gacha bo'lgan asosiy stavka, I toifa xatolarining ko'tarilganligini ko'rsatadi. Ushbu inflyatsiyaning mumkin bo'lgan sababi shundaki, RM-ANOVA ning normalligi haqidagi taxmin buzilgan. Log10 xom T ballarini o'zgartirgandan keyin ham bizning ma'lumotlarimizda biroz chayqalishlar qolganligi (Skewness statistikasi: :.505; log10 (T) qiymatlari uchun bitta namunali Kolmogorov-Smirnov testi: .07, p= .03).
Statistik jihatdan ahamiyatli natijaga olib keladigan har qanday test haqida xabar berishda (yoki haddan tashqari miqdorlarni kiritish yoki chiqarib tashlash bilan test), 5,15% dan 6,89% gacha bo'lgan mustaqil tanlov t-testlari statistik ahamiyatga ega (5-6-jadval; tavsifga qarang ANOVA dizayni bo'yicha takroriy tadbirlar uchun bu testlarning 6,32% dan 7,62% gacha bo'lgan (7-8-jadvallar).
Muhokama va xulosa
Bizning natijalarimiz shuni ko'rsatadiki, agar ahamiyatlilikka asoslangan statistik xulosalar tez-tez va sezilarli darajada farq qilishi mumkin, agar ustunliklar kiritilsa yoki chiqarib tashlansa. Bizning simulyatsiyalarimiz shuni ko'rsatdiki, muhim holatlarning 7% dan 54% gacha bo'lgan muddat oralig'ida istisno qilingan test statistik jihatdan ahamiyatli natijani bergan, aksincha, haddan tashqari inklyuziya bilan o'tkazilgan test natijasi bo'lmagan yoki aksincha, statistik test, namuna kattaligi va mezonga bog'liq. . Shunday qilib, bizning simulyatsiyalarimiz endokrinologik tadqiqotlarda xulosalar qanday xilma-xil bo'lishi mumkinligini ko'rsatadigan misol sifatida qabul qilinishi kerak.
Bundan tashqari, bizning natijalarimiz shuni ko'rsatadiki, chetga chiqishlarni kiritish yoki chiqarib tashlash " phack" uchun bitta variantni taqdim etadi (Simmons va boshq. 2011). Shunday qilib, tadqiqotchilar statistik xulosalarni ahamiyatsizdan ahamiyatli tomonga o'zgartirishi mumkin (yoki aksincha), nisbatan yuqori foizli holatlarga cheklovlarni kiritish yoki chiqarib tashlash orqali. Bizning natijalarimiz shuni ko'rsatdiki, 5,15% dan 7,62% gacha bo'lgan testlar statistik jihatdan ahamiyatli natija bergan har qanday test haqida hisobot berishda (ortiqcha miqdorlarni kiritish yoki chiqarib tashlash) statistik ahamiyatga ega. Mutlaq ma'noda ushbu alfa inflyatsiyasini kichik deb hisoblash mumkin edi. Ammo, agar ahamiyatlilikka asoslangan statistik xulosalar bir-biriga zid bo'lsa, pning farqiikki xulosa orasidagi qiymat ba'zi hollarda sezilarli edi. Binobarin, tashqaridan ishlov berish ba'zi xulosalarni xulq-atvor endokrinologiyasida takrorlash qiyin bo'lgan (qo'shimcha) muhim sabab bo'lishi mumkin (masalan, Oksitotsin: Nave va boshq. 2015). Shunday qilib, tadqiqotchilar, sharhlovchilar va muharrirlar gormonal ma'lumotlarga nisbatan ko'proq ishlashga murojaat qilishlari kerak. Ammo, agar kimdir muhim natijalarga erishishga bel bog'lagan bo'lsa, unda boshqa marshrutlar ham mavjud, masalan, bir nechta testlarni o'tkazish (tuzatishsiz) va faqat muhim sinovlarga e'tibor berish (Gelman va Loken 2013). Kelajakdagi tadqiqotlar pning nisbiy imkoniyatlarini aniqlash uchun zarurdirturli xil shubhali tadqiqot amaliyotlari uchun hack. Bunday shubhali tadqiqot amaliyotlarini modellashtirish, masalan, haddan tashqari olib tashlashning moslashuvchanligi, tadqiqot uchun kelajakdagi qiziqarli yo'l bo'ladi. Bu orqali, masalan qilinishi mumkin pegri (Simonsohn boshq. 2014).
Chetdan olib tashlash bilan bog'liq ushbu masalalarni qanday hal qilishimiz mumkin? Biz ko'plab echimlar mavjudligiga ishonamiz. Birinchidan, biz natijalarni aniqroq chiqarib tashlash va qo'shib qo'yish bilan hisobot berishni qat'iy tavsiya qilamiz va agar xulosalar keskin farq qilsa, ehtiyotkorlik talab etiladi (Kruskal 1960). Ideal holda, bu grafik jihatdan amalga oshiriladi, shunda ma'lum bir chetga chiqish natijasini ko'rish mumkin. Ikkinchidan, tadqiqotchilar, shuningdek, aniqroq aniqlash uchun parametr bo'lmagan mezonlardan foydalanishni o'ylashlari kerak. Masalan, o'rtacha emas, balki medianing mutlaq og'ishlarini ishlatish (Leys va boshq. 2013) yoki undan yuqori olib tashlash uchun interkartil oralig'iga tayanish (Tukey 1977). Uchinchi variant, biron bir "ortiqcha" ni olib tashlamaslik (agar ular o'lchov xatosidan kelib chiqmasa) va ma'lumotlarni bootstrapping bilan tahlil qilishdir (Devison va Hinkley 1997),chunki boshlang'ich savdosida mutanosib ravishda kamroq vazn olinadi. Shu bilan bir qatorda, ishonchli statistik ma'lumotlardan ham foydalanish mumkin (Huber 2011; Rousseeuw va Hubert 2011; Rousseeuw va Leroy 2005). To'rtinchidan, tashqaridan olib tashlash bo'yicha oldindan belgilangan mezonni belgilash ham foydalidir. Tadqiqotchilar xom ma'lumotni mavjud bo'lishiga imkon beradigan bo'lsa, ushbu oldingi barcha tavsiyalar katta ta'sirga ega bo'ladi, shunda barcha tashqi muomalalar ochiq, oshkora va takrorlanadigan bo'ladi (Nosek va boshq. 2015). Va nihoyat, uzoq vaqt davomida, agar balandlik bo'yicha qilinganidek, aholi soniga mos yozuvlar qiymatlarini yaratish uchun turli xil manbalardan tuprik ma'lumotlarini birlashtira olsak, bu juda yaxshi qadam bo'ladi (masalan, Wikland va boshq. 2002). Bunday ma'lumot bazasi keyinchalik ba'zi bir qadriyatlarni haddan tashqari deb hisoblash yoki olmaslik to'g'risida qaror qabul qilishda mazmunli xizmat qilishi mumkin.
Bizning sharhimizda biz eng keng tarqalgan chegaralarni aniqlash qoidalari o'rtacha qiymatdan 2,5 yoki 3 SD farqiga asoslangan qoida ekanligini ko'rsatdik. Biroq, bu, ehtimol, T ma'lumotlarida tashqi ko'rsatkichlarni aniqlashning eng yaxshi usuli emas, chunki bu ma'lumotlar taqsimotlarni chalg'itgan. Shunday qilib, odatdagidek taqsimlangan ma'lumotlardan farqli o'laroq, qiyshiq ma'lumotlarda SD-ni olib tashlash qoidasi yordamida ko'proq ko'rsatkichlar aniqlanadi. Misol tariqasida, bizning ma'lumotlar bazamizda ( n= 433), 3 ta SD qoida ma'lumotlarning 2,1% gacha bunday mezon asosida olib tashlashga imkon beradi (9 ta holat, hammasi yuqori quyruqda). Bu o'n besh baravarhaddan tashqari ko'payish: odatdagi normal taqsimot uchun bu atigi 0,1% bo'lishi kerak (0,6 holat, yuqori quyruqda). Shuni takrorlash kerakki, ba'zi hollarda, masalan, o'lchov xatosi tufayli, haddan tashqari olib tashlash to'liq kafolatlanishi mumkin. Biroq, oddiy taqsimotga asoslanib olib tashlanadigan chetga olib tashlash qoidasini ko'r-ko'rona qo'llash, ba'zi holatlarni "haqiqiy" T taqsimotidan chetga chiqmasligi sharti bilan chegara deb belgilaydi.
Bizning o'rganishimiz uchun ba'zi cheklovlar mavjud. Masalan, biz o'zimizni bitta gormon - testosteron bilan chekladik. Xuddi shunday, bizning boshlang'ich nuqtamiz 433 T namunadir va shuning uchun bizning simulyatsiyalarimiz ushbu namuna bilan cheklangan bo'ladi. Shuningdek, biz effekt o'lchamlarini kamaytirishni modellashtirishdan ko'ra, p= .05 mezoniga e'tibor qaratdik . Buning sababi shundaki, pqiymatlari va 5% chegirma hali ham adabiyotda muhim o'rin tutishi aniq (masalan, Bakker va boshq. 2012; Button va boshq. 2013; Ioannidis va boshq. 2014) va ko'plab tadqiqotchilar, sharhlovchilar va tahrirlovchilar topilmalar p≤ .05 (masalan, psixofizikada: Hoekstra va boshq. 2006; shuningdek qarang: Head va boshq. 2015; Leggett va boshq. 2013) bo'lsa, topilmalar muhim deb qaror qiladi .
Xulosa qilib aytganda, gormonal tadqiqotlar chog'ida muomalada bo'lish masalasini hal qilish kerak, deb hisoblaymiz, chunki bizning simulyatsiyalarimiz statistik xulosalar sezilarli darajada chetga chiqishlarni kiritish yoki chiqarib tashlash asosida qanday o'zgarishini ko'rsatib beradi. Birinchi, erishish mumkin bo'lgan qadam, agar natijalar chiqarib tashlansa yoki kiritilsa, natijalar qanday farq qilishi haqida ko'proq ochiqlikni rag'batlantirish bo'ladi. Ikkinchi qadam, gormonal ma'lumotlarda hisobotlarni olib tashlash va ularni olib tashlash bo'yicha ko'rsatmalar yaratishdir (masalan, Aguinis va Edvards 2014; Aguinis va boshq. 2013). Umid qilamizki, bizning maqolamiz tashqi ko'rsatkichlar va ularning gormonlar va xulq-atvor sohasidagi statistik xulosalarga ta'siri bo'yicha bahs-munozaralarga birinchi qadam bo'lib xizmat qilishi mumkin.
Adabiyotlar
Aguinis, H., va Edvards, JR (2014). Keyingi o'n yillik uchun uslubiy istaklar va istaklarni qanday amalga oshirish. Menejmentni o'rganish jurnali, 51, 143–174. doi: 10.1111 / joms.12058.
Aguinis, H., Gottfredson, RK va Joo, H. (2013). Chegaralarni aniqlash, aniqlash va ulardan foydalanish bo'yicha eng yaxshi amaliyot tavsiyalar. Tashkiliy tadqiqot usullari, 16, 270-301. doi: 10.1177 / 1094428112470848.
Bakker, M., & Wicherts, JM (2014). Mustaqil namunalardagi t testlardan ustunlik bilan olib tashlash, yig'indilar ballari va I tipdagi xatolik darajasi inflyatsiyasi: alternativalar va tavsiyalarning kuchi. Psixologik usullar, 19, 409-427. doi: 10.1037 / met0000014.
Bakker, M., van Deyk, A., va Vicherts, JM (2012). Psixologik fan deb nomlangan o'yin qoidalari. Psixologiya fanining istiqbollari, 7, 543-555. doi: 10.1177 / 1745691612459060.
Barnett, V. (1978). Chegaralarni o'rganish: maqsadi va modeli. Qirollik statistika jamiyati jurnali, S seriyasi (Amaliy statistika), 27, 242-250. doi: 10.2307 / 2347159.
Barnett, V., va Lyuis, T., (1994). Statistik ma'lumotlarda ustunlik. Uili, Nyu-York, Nyu-York.
Button, KS, Ioannidis, JPA, Mokrysz, C., Nosek, BA, Flint, J., Robinson, ESJ, & Munafò, MR (2013). Elektr quvvati uzilishi: nega kichik namunalar nevrologiyaning ishonchliligini susaytiradi. NatureReview Neuroscience, 14, 365-376. doi: 10.1038 / nrn3475.
Dabbs, JM, Kempbell, BC, Gladue, BA, Midgley, AR, Navarro, MA, Read, GF, Susman, EJ, Swinkels, LM, and Worthman, CM (1995). Tuprik testosteron o'lchovlarining ishonchliligi: ko'p markazli baholash. Klinik kimyo, 41, 1581-1584.
Devison, AC va Xinkli, D. V, (1997). Bootstrap usullari va ularni qo'llash. Kembrij universiteti matbuoti, Kembrij, Buyuk Britaniya.
Dimitrov, JD, Kaveri, SV va Bayry, J. (2010). Metrikalar: jurnalning impakt-faktori bitta qog'ozga egilib. Tabiat, 466, 179. doi: 10.1038 / 466179b.
Dikson, VJ (1953). Tashqi ko'rsatkichlar uchun ma'lumotlarni qayta ishlash. Biometriya, 9, 74-89.
Feldman, HA, Longcope, C., Derbi, CA, Yoxannes, CB, Araujo, AB, Coviello, AD, Bremner, WJ va McKinlay, JB (2002). O'rta yoshdagi erkaklarda sarum testosteron va boshqa gormonlar darajasining yosh tendentsiyalari: Massachusets shtatidagi erkaklarning qarishini o'rganish natijalari bo'yicha uzunlamasına natijalar. Klinik endokrinologiya va metabolizm jurnali, 87, 589-598. doi: 10.1210 / jc.87.2.589.
Gelman, A., & Loken, E., (2013). Forking yo'llari bog'i: Nega bir necha marta taqqoslash muammoga olib kelishi mumkin, hatto "baliq ovlash ekspeditsiyasi" yoki "p-xakerlik" mavjud emas va tadqiqot gipotezasi muddatidan ilgari paydo bo'lgan [WWW Document]. URL http://www.stat.columbia.edu/
Ghosh, D., & Vogt, A., (2012). Chiqishlar: metodologiyani baholash [WWW hujjati]. Jt. Stat Meet URL manzili https://www.amstat.org/sections/srms/proceedings/y2012/files/304068_72402.pdf
Golub, GH va Van Kredit, CF, (2012). Matritsali hisoblash. Jons Xopkins universiteti matbuoti, Baltimor, tibbiyot fanlari doktori.
Grubbs, FE (1969). Namunalardagi chekka kuzatuvlarni aniqlash tartibi. Technometrics, 11, 1-21.
Xastings Jr, C., Mosteller, F., Tukey, JW va & Winsor, CP (1947). Kichik namunalar uchun past momentlar: buyurtma statistikasini qiyosiy o'rganish. Matematik statistika yilnomalari, 18, 413-426.
Hawkins, DM, (1980). Ortiqcha ko'rsatkichlarni aniqlash. Springer, Nyu-York, Nyu-York.
Head, ML, Holman, L., Lanfear, R., Kah, AT, & Jennions, MD (2015). P-xakerlikning fandagi darajasi va natijalari. PLoS Biology, 13, e1002106. doi: 10.1371 / journal.pbio.1002106.
Hoekstra, R., Finch, S., Kiers, HL va Jonson, A. (2006). Ehtimollik aniqligi kabi ehtimollik: ikkilamchi fikrlash va pqiymatlaridan noto'g'ri foydalanish . Psixonomik byulleten & Review, 13, 1033-1037. doi: 10.3758 / BF03213921.
Hollenbek, JR, DeRue, DS va Mannor, M. (2006). Statistika kuchi va parametrlarning barqarorligi, mavzular kam bo'lsa va testlar ko'p bo'lsa: Peterson, Smit, Martorana va Ouens (2003) haqida sharh. Amaliy psixologiya jurnali, 91, 1-5. doi: 10.1037 / 0021-9010.91.1.1.
Xuber, PJ, (2011). Sog'lom statistika, In: Lovric, M. (Ed.), Xalqaro Statistik Ilmiy Entsiklopediya. Springer Berlin Heidelberg, Berlin, Heidelberg, 1248–1251-betlar. doi: 10.1007 / 978-3-642-04898-2_594
Ioannidis, JPA, Munafo, MR, Fusar-Poli, P., Nosek, BA va Devid, SP (2014). Kognitiv fanlarda nashr etish va boshqa hisobot yo'nalishlari: aniqlash, tarqalishi va oldini olish. Kognitiv fanlarning tendentsiyalari, 18, 235-241. doi: 10.1016 / j.tics.2014.02.010.
Kruskal, WH (1960). Yovvoyi kuzatuvlar haqida ba'zi fikrlar. Technometrics, 2, 1-3.
Leggett, NC, Tomas, NA, Loetscher, T., & Nicholls, MER (2013). P: "Faqat muhim" natijalar o'sib bormoqda. Har chorakda eksperimental psixologiya jurnali, 66, 2303-2309. doi: 10.1080 / 17470218.2013.863371.
Leys, S, Ley, S, Klein, O., Bernard, P., va Licata, L. (2013). Haddan tashqari ko'rsatkichlarni aniqlash: o'rtacha atrofida o'rtacha og'ish ishlatmang, o'rtacha atrofida o'rtacha og'ish ishlating. Eksperimental ijtimoiy psixologiya jurnali, 49, 764-766. doi: 10.1016 / j.jesp.2013.03.013.
Meyer, D., Dimitriadu, E., Hornik, K., Vaynessel, A., Leysh, F., Chang, C.-C. va boshq. (2015). Paket e1071.
Nave, G., Camerer, C., & McCullough, M. (2015). Oksitotsin odamlarga bo'lgan ishonchni kuchaytiradimi? Tadqiqotni tanqidiy ko'rib chiqish. Psixologiya fanining istiqbollari, 10, 772-789. doi: 10.1177 / 1745691615600138.
Nosek, BA, Alter, G., Banks, GC, Borsboom, D., Bowman, SD, Breckler, SJ, Buck, S., Chambers, CD, Chin, G., Christensen, G., Contestabile, M., Dafoe, A., Eich, E., Freese, J., Glennerster, R., Goroff, D., Green, DP, Gessen, B., Humphreys, M., Ishiyama, J., Karlan, D., Kraut , A., Lupiya, A., Mabri, P., Madon, T., Malxotra, N., Mayo-Uilson, E., Maknut, M., Migel, E., Paluk, EL, Simonsohn, U., Soderberg, C., Spellman, BA, Turitto, J., VandenBos, G., Vazire, S., Wagenmakers, EJ, Wilson, R., & Yarkoni, T. (2015). Ochiq tadqiqot madaniyatini targ'ib qilish. Ilm-fan, 348, 1422–1425. doi: 10.1126 / science.aab2374.
Orr, JM, Sackett, PR va Dubois, CLZ (1991). I / O psixologiyasida aniqroq aniqlash va davolash: tadqiqotchilar e'tiqodlarini o'rganish va empirik illyustratsiya. Xodimlar psixologiyasi, 44, 473-486. doi: 10.1111 / j.1744-6570.1991.tb02401.x.
Osborne, JW, va Overbay, A. (2004). O'zgarishlar kuchi (va nima uchun tadqiqotchilar har doim ularni tekshirishlari kerak). Amaliy baholash tadqiqotlari va baholash, 9, 1-12.
Pollet, TV, Cobey, KD va van der Meij, L. (2013). Testosteron darajasi erkaklardagi befarqlik bilan salbiy bog'liq, ammo otalarda nasllar soni bilan ijobiy bog'liq. PloS One, 8, e60018. doi: 10.1371 / journal.pone.0060018.
R Development Core Team (2008). R: statistik hisoblash uchun til va muhit. Vena: R Statistik hisoblash uchun asos.
Ripley, B., Venables, B., Bates, DM, Hornik, K., Gebhardt, A., Firth, D. va boshq. (2015). MASS to'plami. CRAN-dan olingan: http://cran.r-project.org/web/packages/MASS/MASS.pdf.
Ritter, G., va Gallegos, MT (1997). Statistik naqshlarni aniqlashda ustunliklar va avtomatik xromosomalarni tasniflash uchun dastur. Pattern Recognition Letters, 18, 525-539. doi: 10.1016 / S0167-8655 (97) 00049-4.
Rousseeuw, PJ, & Hubert, M., (2011). Aniqroq aniqlash uchun ishonchli statistika. WIREs Ma'lumotlarni qazib olish va bilimlarni kashf etish, 73-79. doi: 10.1002 / widm.2
Rousseeuw, PJ, & Leroy, AM, (2005). Kuchli regressiya va undan yuqori aniqlanish. John Wiley & Sons, Nyu-York.
Ruxton, GD (2006). T-testning tengsizligi talabaning t-testi va Mann-Uitni U testiga kam qo'llanilgan alternativadir. Xulq-atvor ekologiyasi, 17, 688-690. doi: 10.1093 / beheco / ark016.
Shiffler, RE (1988). Maksimal Z ballari va undan yuqori ko'rsatkichlar. Amerika Statistikasi, 42, 79-80. doi: 10.1080 / 00031305.1988.10475530.
Simmons, JP, Nelson, LD va Simonsohn, U. (2011). Noto'g'ri ijobiy psixologiya: ma'lumotlarni yig'ish va tahlil qilishda aniq bo'lmagan moslashuvchanlik har qanday narsani muhim deb taqdim etishga imkon beradi. Psixologiya fanlari. doi: 10.1177 / 0956797611417632.
Simonsohn, U., Nelson, LD va Simmons, JP (2014). P-egri chizig'i: fayl tortmasining kaliti. Eksperimental psixologiya jurnali: Umumiy, 143, 534-547. doi: 10.1037 / a0033242.
Stanton, SJ (2011). Insonlarning xulq-atvor endokrinologiyasini o'rganishda jinsning muhim ta'siri. Behavioral Neuroscience, 5, 9. doi: 10.3389 / fnbeh.2011.00009.
Stivenson, V. (2013). Tasodifiy ko'p o'zgaruvchan o'zaro bog'liq ma'lumotlarni simulyatsiya qilish (doimiy o'zgaruvchilar) [WWW hujjati]. URL http://www.r-bloggers.com/simulating-random-multivariate-correlated-data-continuous-variables/ (kirish 3.23.16).
Tukey, JW (1977). Ma'lumotlarni tahlil qilish. Addison-Uesli, Reading, Ma.
UCLA: Statistik konsalting guruhi (2016). SAS makrolari: corr2data [WWW Document]. URL http://www.ats.ucla.edu/stat/sas/macros/corr2data_demo.htm (kirish 3.24.16).
Van den Berg, T. (nd) o'zaro bog'liq tasodifiy sonlarni yaratish [WWW Document]. URL http://www.sitmo.com/article/generating-correlated-random-numbers/#comment-325 (kirish 3.24.16).
van der Meij, L., Buunk, AP, van de Sande, JP va Salvador, A. (2008). Ayolning mavjudligi tajovuzkor dominant erkaklarda testosteronni oshiradi. Gormonlar va o'zini tutish, 54, 640-644. doi: 10.1016 / j.yhbeh.2008.07.001.
van der Meij, L., Klauke, F., Mur, HL, Lyudvig, YS, Almela, M. va van Lange, PAM (2015). Futbol muxlislarining tajovuzkorligi: past bazal kortizol va odil hakamning ahamiyati. PloS One, 10, e0120103. doi: 10.1371 / journal.pone.0120103.
Vikem, H. (2007). Qayta shakllantirish to'plami bilan ma'lumotlarni qayta shakllantirish. Statistik dasturlar jurnali, 21, 1-20.
Vikem, H. (2009). ggplot2. Springer Nyu-York, Nyu-York, Nyu-York. doi: 10.1007 / 978-0-387-98141-3
Vikem, H. (2011). Ma'lumotlarni tahlil qilish uchun bo'linish-qo'llash-birlashtirish strategiyasi. Statistik dasturlar jurnali, 40, 1–29. doi: 10.18637 / jss.v040.i01.
Wikland, KA, Luo, ZC, Niklasson, A. va Karlberg, J. (2002). Tug'ilgandan 18 yoshgacha bo'yi, vazni va bosh atrofi bo'yicha Shvetsiya aholisiga asoslangan uzunlamasına mos yozuvlar qiymatlari. ActaPaediatrica , 91, 739-754. doi: 10.1080 / 08035250213216.
Zimmerman, DW (2004). Variantlarning tengligini dastlabki sinovlari to'g'risida eslatma. Britaniya matematik va statistik psixologiya jurnali, 57, 173–181. doi: 10.1348 / 000711004849222.
Rahmat
Ushbu ish qisman NWO (Veni, 451.10.32) va Gollandiyaning gumanitar va ijtimoiy fanlar bo'yicha ilg'or o'rganish instituti (NIAS) tomonidan birinchi muallifga va ikkalasiga ham ichki fakultet (uskunalar fondi) tomonidan berilgan grant tomonidan qo'llab-quvvatlandi. mualliflar.
Muallif haqida ma'lumot
Hamkorliklar
Eksperimental va amaliy psixologiya kafedrasi, Amsterdam VU universiteti, Transitorium binosi, 1B17, 1081BT xona, Amsterdam, Niderlandiya