סקר | ניתוח

כולם יודעים שהסקרים טועים, המשרוקית של גלובס בדקה בכמה

חודשיים לפני הבחירות הרביעיות בתוך שנתיים, פנינו לשלוש הקודמות ומצאנו את ההיגיון בשיגעון: יש מי שהסקרים בעקביות טועים בהערכת כוחם • הליכוד אכן מתחזק באופן ניכר בקלפי, הציונות הדתית נחלשת, ובמפלגות הסקטוריאליות הסוקרים די מדייקים, חוץ מאשר במשותפת

כולם יודעים שהסקרים טועים
כולם יודעים שהסקרים טועים

עם הנבואות שפמפמו השבוע כלי התקשורת, נדמה כאילו אין בכלל טעם ביום הבחירות עצמו. אבל מה שווים הסקרים עשרה שבועות לפני הבחירות? אילו רק ידענו לחשב כעת את המרחק המדויק בין התחזיות לבין תוצאות האמת, זאת הייתה בדיקת העובדות המושלמת. ובכל זאת, לפני שמתמכרים עוד פעם לספקולציות החדשות, אפשר לנסות ללמוד מהעבר. ניתוח מדוקדק שביצעה "המשרוקית" לסקרים שפורסמו בסבבים הקודמים חושף סטיות והטיות קבועות, ומאפשר להצמיד לעיוותים מספרים. 

 
  

מקור המידע העיקרי שלנו הוא הפרויקט הגלובסי הוותיק "סקר הסקרים" - דיווח שוטף שעורכת עמיתתנו שלומית רביד אחרי כל סקר חדש שמוצג בערוצי הטלוויזיה והרדיו, באתרי אינטרנט ובעיתונים המודפסים. עם התחממות המרוץ הפוליטי, הפרויקט חזר השבוע לספק למכורות ולמכורים את מנת הסם שלהם: "נתניהו מגדיל את הפער מסער", נכתב שם; "ימינה ויש עתיד עם 13 כל אחת"; "הרשימה המשותפת עם 10 מנדטים"; "סקר צופה 28 מנדטים לרשימה מאוחדת בהשתתפות יש עתיד, הישראלים, כחול לבן, תל"ם, תנופה, העבודה והכלכלית החדשה". אבל אותנו לא עניינו המבזקים הטריים, אלא מאגר המידע העצום שאספה רביד בשלושת הסבבים הקודמים, ובו הממצאים של כמעט 200 סקרים ומדגמים. אפילו למכוני הסקרים אין אוצר כזה.

כדי לבדוק באיזו מידה נטו הסקרים להפריז או להמעיט בהישגים של כל מפלגה, חילקנו אותם קודם כל בהתאם למרחק מיום ההצבעה. תחילה סקרים שפורסמו עד 60 יום לפני הבחירות, אחר כך 45 יום, 30 יום, וכן הלאה. בכל חלון זמן כזה עומדים לרשותנו, מכל הסבבים יחד, כ-20 סקרים. זה שפע של חומר להוציא ממנו מסקנות. את המנדטים שחזו הסקרים לכל רשימה או קבוצת רשימות השווינו לתוצאה הסופית באותו סבב, וקיבלנו את מידת הפספוס: כמה מושבים עודפים או חסרים הוערכו לכל רשימה.

את המסקנות תוכלו למצוא בגרפים, שמספרים כיצד הסקרים הלכו והתקרבו למציאות בדרך ליום הבחירות. ככל שרשימה קרובה לציר האפס, כך הסקרים דייקו בהישגים שלה. כשהיא מרחפת מעליו, היא הוערכה ביתר, כלומר הסקרים היו אופטימיים מדי. כשהיא מתחתיו - היא הוערכה בחסר, כלומר הם היו פסימיים. שלושת הגרפים הקטנים מוקדשים כל אחד לסבב בחירות מסוים. הגרף הגדול מתרגם אותם לסיפור טיפוסי, שהוא הממוצע של השלושה.

חודשיים לפני: הקשר למציאות עוד רופף

כמה ימים לפני הבחירות הסקרים מתחילים לדייק? כחודשיים לפני ההצבעה, הנקודה שבה אנחנו נמצאים כרגע, הפער בין התחזיות ובין ההישגים הממשיים של הרשימות עמד, בממוצע, על יותר משני מנדטים מעלה או מטה. הקשר למציאות היה רעוע במיוחד בסקרים שפורסמו לקראת סבב א', באפריל 2019. העמודות הצבעוניות בסקרים שהציגו שישה כלי תקשורת בשבוע שבין 4 ל-11 בפברואר סטו מתוצאות האמת בשניים וחצי מנדטים בממוצע.

בכל המערכות הקודמות נשמר המצב הזה עד חודש לפני הבחירות לפחות, אם כי הבלגן לקראת אפריל 2019 היה גדול במיוחד. הדיוק של הסקרים הלך וירד עם הזמן, עד שבחמישה סקרים שפורסמו בחמשת הימים שלפני ההצבעה, הטעות הממוצעת נסקה לכארבעה מנדטים מעלה או מטה. לא פלא שחשיפת המדגמים הביכה את הסוקרים והפרשנים. בשני הסבבים הבאים, הסקרים התכנסו אט-אט לכיוון תוצאות האמת, אבל עשרה ימים לפני הבחירות עדיין החטיאו בממוצע במנדט שלם.

לקחי העבר: הליכוד עולה, ימינה יורדת

אבל התובנה המעניינת ביותר בגרפים היא שיש היגיון בשיגעון. יש מפלגות וגושים שהסקרים ממעיטים בעקביות בכוחם. המקרה המובהק ביותר הוא הליכוד. המספרים מאשרים את הטענה הרווחת שהליכוד חזק בקלפי יותר מאשר בסקרים. בכל הסבבים, עקומת הליכוד נמצאת כמעט כל הזמן מתחת לאפס, כלומר פחות מהתוצאות הסופיות. בסבב א' ההפרש היה לרוב ארבעה-שמונה מנדטים. בסבב ג', שלושה-ארבעה מנדטים.

תמונת הראי היא גוש רשימות הציונות הדתית, שהישגיהן בסקרים עד סמוך לבחירות היו גבוהים בממוצע בשלושה-ארבעה מנדטים מההישגים בקלפי. הטעות הייתה חריפה במיוחד בסבב א', בשל מנדטים שאבדו כשהימין החדש לא עברה את אחוז החסימה. אבל היא ניכרה גם בשני הסבבים הבאים. אם ההיסטוריה תחזור על עצמה בפעם הרביעית, הרי שגם הפעם הליכוד יתעלה על 28 המנדטים שצופים לו, ורשימת ימינה תאבד אחדים מ-13 המושבים שהיא מקבלת בסקרים הנוכחיים.

די קולעים: המפלגות החרדיות וישראל ביתנו

הערכת חסר של המפלגה הגדולה והערכת יתר של המפלגות הקטנות ניכרת גם בצד השני של המפה. עקומת המפלגות שהרכיבו בסופו של דבר את רשימת העבודה-מרצ-גשר נמצאת בדרך כלל שניים-שלושה מנדטים מעל ציר האפס, כלומר מעל ההישג הממשי של אותן מפלגות. בסבב א' הסטייה אפילו גברה עם הזמן, והגיעה לחמישה מנדטים מדומים ימים ספורים לפני הבחירות. כחול לבן, בממוצע, סובלת מהערכת חסר, אבל ההטיה לא עקבית. לקראת סבב ג' במרץ 2020 הסקרים ייחסו לה רוב הזמן שני מנדטים מיותרים.

עוד ממצא עקבי: חודשיים לבחירות, הסקרים חוזים לרשימה המשותפת שלושה מנדטים בממוצע פחות מההישג האמיתי. מידת הסטייה משתנה מסבב לסבב, אבל המגמה דומה.
הניתוח גם מראה היכן אפשר לסמוך יותר על הסקרים. לש"ס, לישראל ביתנו, ובמיוחד ליהדות התורה יש כנראה אלקטורט יציב במיוחד, והתוצאות שהסקרים מנבאים להן קרובות בדרך כלל למציאות. כשבוחנים למעלה מ-100 סקרים שהתפרסמו בחודשיים שקדמו לסבבי הבחירות הקודמים, הטעות הממוצעת לגבי ש"ס הייתה פחות ממנדט וחצי; לישראל ביתנו - קצת פחות ממנדט; וליהדות התורה 0.6 מנדטים בלבד. אם כבר להתבשם מסקרים - עדיף להיות ליברמן או ליצמן.