האם "אווטאר" הוא באמת הסרט הכי מצליח? ספר חדש חושף כיצד נוצרים עיוותים סטטיסטיים

ספרו של צ'ארלס וילן, "סטטיסטיקה עירומה", מתווך בצורה בהירה ועניינית את התחום, וגם מסביר מתי כדאי לחשוד במסקנות המבוססות על נתונים כמותיים

שניר פלג | 20.04.2023

נייטירי, נסיכת שבט האומטקייה, מתוך הסרט ''אווטאר''. אולפני הוליווד השתמשו בנתונים נומינליים / צילום: ויקיפדיה

נייטירי, נסיכת שבט האומטקייה, מתוך הסרט ''אווטאר''. אולפני הוליווד השתמשו בנתונים נומינליים / צילום: ויקיפדיה

בין אם אנחנו אוהבים סטטיסטיקה או בין אם לא, היא חלק בלתי נפרד מחיינו. כיום, כל תחום מבוסס על סטטיסטיקה: מזג אוויר, תחרויות ספורט, בדיקות דנ"א, זיהוי גורמים של מחלות, משחקי לוטו, שעשועי טלוויזיה ומה לא.

"סטטיסטיקה עירומה: האמת מאחורי הנתונים", הוא הספר השני של צ'ארלס וילן (Charles Wheelan) המתורגם לעברית. קדם לו "כלכלה עירומה" מ־2006 שעסק במושגי יסוד בכלכלה. וילן, 57, הוא מרצה בכיר בנושאי מדיניות חינוך, בריאות, מדיניות מס, אי שוויון בהכנסה, עמית במרכז רוקפלר בדארטמות' קולג', כתב לשעבר ב"האקונומיסט" ומחברם של ספרי עיון בנושא כלכלה. ספרו "סטטיסטיקה עירומה" תואר על ידי העיתון "שיקגו טריביון" כספר תמציתי, אינפורמטיבי ושנון, והוא אכן כזה. מטרתו ברורה: מצד אחד להוכיח לנו שתחום הסטטיסטיקה יכול להיות מעניין ולא משעמם, ומצד שני לחשוף אותנו לבעיות המהותיות שקיימות בניתוח סטטיסטי, שכן שימוש לא נכון בו עלול להוביל למסקנות מוטעות ולעיתים אף מסוכנות.

סטטיסטיקה עירומה: האמת מאחורי הנתונים

מחבר: צ'ארלס וילן
ז'אנר: עיון/עסקים
תרגום מאנגלית: מיכל אילן
הוצאה: ספרי עליית הגג/ידיעות ספרים
מספר עמודים: 358
מחיר: 78 שקלים
זמן הוצאה: ינואר 2023

כריכת הספר סטטיסטיקה עירומה: האמת מאחורי הנתונים

 כריכת הספר סטטיסטיקה עירומה: האמת מאחורי הנתונים

לא כל נתון מדויק הוא בהכרח נכון

וילן מתייחס לסטטיסטיקה כאל עבודת בילוש טובה: מהנתונים שאספנו אנחנו שואבים רמזים ודפוסים שיובילו למסקנות בעלות ערך. אלא שסטטיסטיקה כמעט לעולם לא חושפת את האמת, או כדבריו: "מדדים סטטיסטיים מתוחכמים יכולים לשפוך אור על השאלה, אבל הם לעולם לא יתנו תשובה מוחלטת".

ספרו של וילן ממחיש שלא כל נתון מדויק הוא בהכרח נכון. כדי לבסס את קביעתו הוא מעלה את השאלה האם הגלובליזציה מגדילה או מקטינה את אי השוויון בהכנסות בעולם?

על פי פרשנות אחת, הגלובליזציה אכן החמירה את חוסר השוויון: מדינות שהיו עשירות ב־1980 נטו לצמוח מהר יותר בעשרים השנים הבאות - כלומר המדינות העשירות רק התעשרו יותר. אלא שוילן מראה לנו שאת הנתונים אפשר לפרש גם אחרת: מדינות עם שיעור העניים הגבוה בעולם דוגמת סין והודו, היו עניות ב־1980 והן נותרו כאלה גם בעשרים השנים הבאות, למרות שחוו גלובליזציה מהירה.

עוד בסדרהלכל הכתבות

הצג עוד

העיוותים הסטטיסטיים ברשימות של הוליווד

אחת הדוגמאות לעיוות סטטיסטי הוא המידע שמספקים לנו אולפני הסרטים בהוליווד. לדברי וילן, אלו משווים נתונים מתקופות זמן שונות, תוך התעלמות מעיוותים שהאינפלציה גורמת. הוא מדגים את טענתו באמצעות רשימת חמשת הסרטים הרווחיים בכל הזמנים נכון ל־2011. במקום הראשון "אווטאר" ואחריו, לפי הסדר: "טיטאניק", "האביר האפל", "מלחמת הכוכבים - פרק 4"
ו"שרק 2".

אך האם אלו באמת שוברי הקופות הגדולים בכל הזמנים? מה שברור הוא שהנתונים נופחו, שכן האולפנים משתמשים בנתונים נומינליים (נתונים שלא הותאמו לאינפלציה), ומחירי הכרטיסים היום גבוהים משהיו לפני עשר או חמישים שנה. וילן מדגים כיצד על ידי התאמה לאינפלציה, מתקבלת רשימה אחרת לגמרי: במקום הראשון "חלף עם הרוח" ואחריו לפי הסדר: "מלחמת הכוכבים - פרק 4", "צלילי המוזיקה", "אי.טי" ו"עשרת הדברות".

פיגועי 11/9 הובילו לקטל בדרכים

הספר לא רק מתמקד בטעויות סטטיסטיות, אלא גם במושגי יסוד בסטטיסטיקה, למשל תורת ההסתברות. זו על פי וילן "חקר המאורעות והתוצאות שיש בהם יסוד של אי ודאות. השקעה במניות כרוכה באי ודאות וכך גם הטלת מטבע שיכול ליפול על עץ או פלי".

בהקשר לזה אחת הדוגמאות המעניינות שהוא מביא הוא המחקר שערכו חוקרים מאוניברסיטת קורנל בניו יורק שהראה כי מאז פיגועי ה־11 בספטמבר אלפי אמריקאים נהרגו בגלל פחד הטיסה שלהם. הם העדיפו לנהוג מאשר לטוס, למרות שההסתברות למות בתאונה גבוהה פי כמה מאשר בטיסה.

הפגמים הגנטיים שלא נלקחו בחשבון

דוגמא נוספת שמביא וילן הוא מקרה מוות בעריסה. מכיוון שמיתה מסוג הזה מיסתורית ולא מובנת היא מעוררת חשד: לעיתים מיתה זו מסתירה רשלנות או התעללות מצד ההורים, ולא תמיד היה אפשר לקבוע אם מדובר מוות טבעי או מוות בנסיבות פליליות.

סר רוי מדו, רופא ילדים בריטי מוכר, העיד במשפטים רבים שכאלו, ואף יש חוק המכונה "חוק מדו": מות תינוק הוא טרגדיה, מותם של שני תינוקות במשפחה מעורר חשד ומותם של שלושה תינוקות הוא רצח. מדו הסביר את החישוב: היות שמוות בעריסה הוא מאורע נדיר - ההסתברות שלו היא אחד ל־8500, הסיכוי של שני מקרים של מוות בעריסה באותה משפחה הוא בערך אחד ל־73 מיליון, ומכאן שמדובר בפשע. על בסיס ההנחה הזו הורים רבים נשלחו לכלא. במקרים אחרים תינוקות נלקחו מהוריהם לאחר הלידה בגלל מוות בלתי מוסבר של אחיהם.

אך "האקונומיסט" הראה כיצד הסטטיסטיקה של מדו שגויה, שכן יש גורמים נוספים, דוגמת פגמים גנטיים, המגדילים את ההסתברות של מוות בעריסה במשפחה אחת. ב־2004 ממשלת בריטניה הכריזה על בדיקה מחודשת של 258 משפטים בהם הורשעו הורים ברצח התינוקות שלהם.

כוח ספרו של וילן הוא בכתיבה הבהירה, בהומור השנון ובעושר הדוגמאות. אלה מסייעים לאנשים שאינם מכירים את תחום הסטטיסטיקה, שלא לומר נרתעים ממנו, לצלול לתוכו ואף להבין את מושגיו המסובכים. בעולם הנוכחי, המוטה עובדות ונתונים, וילן עושה בו סדר. וזה לא מעט בשביל ספר.

צרו איתנו קשר *5988