ความสุขของสถิติ

ความสุขของสถิติ

ศิลปะแห่งสถิติ: การเรียนรู้จากข้อมูล David Spiegelhalter Pelican (2019)

คำพังเพย “ทุกรุ่นผิด แต่บางรุ่นมีประโยชน์” ซึ่งมาจากนักสถิติ George Box เป็นความคิดโบราณด้วยเหตุผล มันตัดหัวใจของความท้าทายหลักที่นักวิจัยเผชิญในหลายพื้นที่ของวิทยาศาสตร์ โลกนี้ซับซ้อนกว่าสิ่งใดๆ ที่แบบจำลองทางคณิตศาสตร์ วิทยาศาสตร์ หรือสถิติสามารถจับได้ กระนั้น โมเดลของโลกที่แม้จะไม่สมบูรณ์ก็ตาม ก็มีความจำเป็นสำหรับการสรุปทุกอย่างตั้งแต่ประสิทธิภาพทางเภสัชกรรมไปจนถึงตัวเลขการว่างงาน ศิลปะแห่งสถิติของ David Spiegelhalter ให้ความกระจ่างว่าเราสามารถใช้ข้อมูลที่เพิ่มมากขึ้นเรื่อย ๆ เพื่อปรับปรุงความเข้าใจของเราในโลก – และข้อผิดพลาดบางอย่างที่เราพบในความพยายาม

หนังสือเล่มนี้เป็นส่วนหนึ่งของแนวโน้มในการศึกษาสถิติโดยเน้นที่ความเข้าใจเชิงแนวคิดมากกว่าความคล่องแคล่วในการคำนวณ ซอฟต์แวร์สถิติสามารถทำการทดสอบแบบแบตเตอรีและทำการวัดใดๆ จากชุดข้อมูลขนาดใหญ่ได้ในพริบตา ดังนั้น ความสามารถในการคำนวณค่าเบี่ยงเบนมาตรฐานของตัวอย่างในระยะยาวจึงมีความสำคัญน้อยกว่าการทำความเข้าใจวิธีออกแบบและตีความการศึกษาทางวิทยาศาสตร์ด้วยสายตาที่เข้มงวด

ตลอดทั้งเล่ม Spiegelhalter เน้นย้ำถึงความสำคัญของโครงสร้าง “PPDAC”: Problem-Plan-Data-Analysis-Conclusion เขาอธิบายว่านักสถิติเข้าถึงแต่ละส่วนของการสืบสวนอย่างไร และเครื่องมือต่างๆ ที่เข้ามามีบทบาทอย่างไร PPDAC เริ่มต้นด้วยการกำหนดปัญหาหรือคำถาม และพัฒนาแผนสำหรับสิ่งที่จะวัด วิธีวัดผล และการวิเคราะห์ใดจะดีที่สุด จากนั้นนักวิจัยจะรวบรวมข้อมูล วิเคราะห์ตามแผน และตัดสินใจว่าข้อสรุปใดที่จะตามมาอย่างสมเหตุสมผล

Spiegelhalter มีอาชีพนักสถิติมายาวนาน

และโดดเด่น และข้อความที่น่าสนใจที่สุดบางส่วนก็เกิดขึ้นเมื่อเขาดึงม่านออกและอธิบายตัวเลือกที่เขาและเพื่อนร่วมงานได้ทำในระหว่างการวิจัย ตัวอย่างเช่น เขาเป็นผู้นำทีมที่ตรวจสอบอัตราการเสียชีวิตในเด็กหลังการผ่าตัดหัวใจในโรงพยาบาลในอังกฤษ แม้แต่ตัวเลขที่ดูเหมือนชัดเจน เช่น จำนวนเด็กที่ได้รับการผ่าตัดหัวใจและจำนวนผู้เสียชีวิต ก็มีความคลาดเคลื่อนระหว่างแหล่งข้อมูลและคำจำกัดความ

การตัดสินใจเกี่ยวกับวิธีการจัดการกับความคลุมเครือที่อาจเกิดขึ้นและกรณีที่เกิดขึ้นอาจส่งผลกระทบอย่างมากต่อผลลัพธ์ของการศึกษา ตัวอย่างเช่น ความตายควรเกิดจากการผ่าตัดนานเท่าใดหลังจากการผ่าตัด? เนื่องจากความชัดเจนและความเที่ยงธรรมทั้งหมดเป็นไปไม่ได้ ผู้ที่อ่านเกี่ยวกับการศึกษาเหล่านี้ โดยเฉพาะนักการเมืองหรือคณะลูกขุนที่ต้องตัดสินใจว่าจำนวนผู้เสียชีวิตที่ผิดปกติจากการผ่าตัดชี้ไปที่อาชญากรรมหรือการทุจริตต่อหน้าที่ ควรตระหนักถึงปัจจัยที่อาจก่อให้เกิดความยุ่งยาก หากเพียง อารมณ์ความเชื่อมั่นของพวกเขาในการค้นพบ

จากตัวอย่างดังกล่าว ประเด็นสำคัญจากหนังสือเล่มนี้คือความรอบคอบเกี่ยวกับความมั่นใจของเราในสิ่งที่เป็นที่รู้จัก ดังที่ Spiegelhalter เขียนไว้ จุดประสงค์ของวิทยาศาสตร์ทางสถิติคือการช่วยให้เราผ่อนคลายผ่านขั้นตอนของการอนุมานจากการศึกษาแบบควบคุมไปสู่ความเข้าใจในโลกแห่งความเป็นจริง “และในที่สุด ด้วยความถ่อมตัว เราสามารถพูดสิ่งที่เราสามารถและไม่สามารถเรียนรู้จากข้อมูลได้ ” ความอ่อนน้อมถ่อมตนนั้นอาจขาดหายไปเมื่อใช้สถิติในการอภิปรายเกี่ยวกับประเด็นที่ถกเถียงกัน เช่น ค่าใช้จ่ายและประโยชน์ของการตรวจคัดกรองมะเร็ง