נבואה מודרנית עליזה

נבואה היא עיסוק עתיק, שנדמה כארכאי. על האפשרות שמסתובבים בינינו, גם בימינו, נביאים מסוג דומה אך שונה.

איך הייתם מגיבים לטענה שבתוך 20 שנים מהיום, זהו זה, זה ייגמר, הספרים ייעלמו מן העולם כלא היו, ויוחלפו בטכנולוגיות קריאה דיגיטאליות בלבד? אם היו שואלים אותי הייתי עונה שעם יד על הלב אני ממש לא בטוח לגבי זה: יוכיחו ה-Kindles וה-E-books. הם אמנם הצליחו לתפוס איזשהו נתח מהרגלי הקריאה שלנו, אך הספר הכתוב, הטוב והמוכר, בניגוד לכל ההספדים, עוד לא אמר את מילתו האחרונה: בארצות הברית נמכרו 675 מיליון ספרים בשנת 2019, ונתונים של הספרייה הלאומית בישראל מראים על גידול שנתי מתמיד בכמות הספרים היוצאים לאור.

בשנת 1999 התיישב ריי קורצווייל (Ray Kurzweil), העתידן הנודע, לכתוב את הספר 'The Age of Spiritual Machines' ('עידן המכונות החושבות'). החלק השלישי של הספר המכונה 'To Face the Future' מפוצל לארבעה פרקים. בכל פרק סדרת נבואות לשנה עתידית: ל-2009, 2019, 2029 ו-2099.

לגבי 2019 הוא חזה את נבואת הפתיחה – שהספרים ייעלמו מן העולם. אנחנו כמובן כבר יודעים שחזיון הספרים הנעלמים היה לא יותר מחלום באספמיא. קורצוייל, עתידן בעל תעוזה, לא התבייש ולא הסתפק בכך והתנבא לגבי שלל פעילויות אנושיות אחרות: מה יקרה בטכנולוגיה, לאן תתפתח הגנטיקה, איזו כלכלה תהיה, ואיך בני אדם יתקשרו האחד עם השני. זה אותו קורצווייל אגב שטוען שבשנת 2045, פחות או יותר, נחצה את הנקודה הסינגולרית שבה המכונות יעקפו את בני האדם בסיבוב, סופית וחד-משמעית.

ריי קורצווייל, עתידן בעל תעוזה (מקור: ויקיפדיה)

אני מתלבט מזה שנים לגבי עמדתי ביחס לעתידנים – מצד אחד זו פעילות אינטלקטואלית די מורכבת, היא דורשת יכולת הסקה, ודמיון וחזון לא מבוטלים. עתידנים הם אנשים נועזים – הם מביעים דעות ביחס ללא נודע, וכשהם חוזים מה יהיה בעוד 10 או 20 שנה, הם מסכנים את המוניטין שלהם. מצד שני בעתידנות יש שרלטנות: היא עושה הרבה כותרות לשעתה, בהתבסס על כלום, וכשמגיע הזמן לפרוע את הצ'ק ולבדוק האם התממשו הנבואות, לעיתים אין את מי לשאול, ובמקרה הטוב תיתקלו בהתחמקות.

קורצווייל מצדו עומד על כך שהוא עתידן רציני עם מתודה ושיטה. על פי התזה המרכזית שלו ('The Law of Accelerating Returns'), ההתפתחות של טכנולוגיית המידע עוקבת אחר נתיב בר-חיזוי ואקספוננציאלי. בשל תגלית זו מתעקש קורצווייל שהעתיד אינו מורכב מכדי לחזותו. עם זאת, הוא מודה בצניעות מה שיש דברים שאינם ברי-חיזוי – והוא אף מציין דבר שאמור לצער אותנו:

There are still many things – which project, company or technical standard will prevail in the marketplace, or when peace will come to the Middle East – that remain unpredictable

ואני, עתידן מתחיל, אומר שהשלום במזרח התיכון יקרה לא יאוחר מ-2099.

תיקוף נבואות

בשנת 2009 הגיעה ההזדמנות הראשונה לבדוק אם קורצווייל צדק או טעה בענק.

הכותרות לא ממש החמיאו לו. כך למשל כתבה בפורבס מ-2012, שגם אחרי הארכת זמן של 3 שנים, הגיעה למסקנה שמתוך 12 נבואות לשנת 2009 שנבדקו, צדק קורצוויל בלא יותר מאחת – הוא חזה את פיתוחם של מכשירי קריאה קטנים לעיוורים, ומכשירי שמיעה לחירשים. הכותב בפורבס הסכים ברוב חמלתו להעניק ציון עובר לקורצוייל על נבואה זו, כיוון שאפשר להתייחס לסמארטפונים כמימוש הנבואה. שאר ה-11 הנבואות להערכתו היו מוצלחות הרבה פחות: לא, מוזיקאים אנושיים אינם מג'מג'ים עם נגנים קיברנטיים; רוב הטקסטים אינם נכתבים באמצעי זיהוי קול; עדיין לא הצליחו להקטין בצורה דרסטית את התמותה מסרטן ומחלות לב.

קורצווייל לא נשאר חייב ויצא לקרב הגנה. במאמר תגובה מפורט שהתבסס על מסמך ארוך הוא הציג כל נבואה ונבואה והסביר למה בסך הכל הוא הגיע לרמת חיזוי מרשימה. הוא טען כי מתוך 147 הנבואות, 115 (78%) התבררו כמדויקות לגמרי, 12 (8%) נכונות ברמה העקרונית, כלומר בסך הכל 86% של נבואות נכונות.

אז איך יכול היה כתב פורבס להגיע למסקנות שגויות כל כך? קורצווייל הסביר שהוא דירג את הנבואות באופן מוטה ומתוך חוסר היכרות עם המציאות. איך אפשר להגיד שהנבואה לגבי זה שרוב הטקסטים ייכתבו בזיהוי קולי אינה נכונה בעוד אנשים מכתיבים הודעות טקסט ומיילים בעזרת Siri ואחיותיה? טקסטים, כך קורצווייל, הם לא רק ספרים או מסמכי וורד – טקסט הוא טקסט גם אם הוא אי-מייל שטחי ורגעי. הוא הסביר גם, בניגוד למה שחשב כתב פורבס, שהנבואות ניתנו למעשה לעשורים: מה שנכתב ל-2009 יכול להיות נכון גם אם התממש ב-2010, 2011 ואפילו 2015.

הויכוח המתומצת הזה רק מראה כמה שהעניין נתון לפרשנות – נבואות הן בסופו של דבר מילים שנכתבו. עוד לא הומצאה המילה שאינה ניתנת לפרשנות, כולל המילה 'טקסט', וכולל המילה 'כולל', דבר שמביא למחלוקת בהערכת התגשמות הנבואות. האם קורצוויל צריך להיות הפרשן המוסמך לנבואות של עצמו? הרי הוא כתב אותן, ולכן צריך להקשיב לו. מצד שני, אולי הוא נוגע מדי בדבר? האם נכון לתת לחתול לשמור על השמנת?

היה הייתה 2019

אל שנת 2019 אנחנו כבר מתגעגעים, שנה בלי מגפות. לתקופה הזו יש ערך גם בהקשר אחר, ההקשר שלנו – עוד הזדמנות לתקף את נבואות קורצווייל. גם ב-2019 היו אמורים להתגשם כל מיני דברים לפי קורצווייל: דיברנו למעלה על ההצהרה לגבי היעלמות הספרים אבל גם – רוב הלמידה מבוצעת בעזרת תוכנות חכמות המדמות מורים אמיתיים; רוב בני האדם הבוגרים משקיעים את רוב זמנם ברכישת ידע ומיומנויות חדשות; אתה ואת יכולים לעשות כל דבר באופן וירטואלי מבלי להיות תלוי בקרבה פיזית.

Stuart Armstrong מ-LessWrong (אתר מומלץ בחום) ביקש לקיים בדיקה מעמיקה של נבואות קורצווייל. המטרה – לבדוק האם קורצווייל של 99' דייק לגבי 2019, עד כמה, ואם לא – למה לא?

תחילה הוא ריכז את 105 הנבואות של קורצווייל לשנת 99' ולאחר מכן הוא הוציא קול קורא למתנדבים שיחוו דעתם לגביהן. 34 המתנדבים שנענו לבקשה נדרשו להעניק ציון על סקאלה: 1 – אמת; 2 – בקושי אמת; 3 – קשה לי להחליט; 4 – בקושי שגוי; 5 – שגוי. בסך הכל ניתנו 3078 חוות דעת לנבואות השונות.

טלו למשל את הנבואה הבאה:

"מחשבים הם כעת [2019] לרוב בלתי נראים. הם משולבים בכל מקום – בקירות, בשולחנות, בכסאות, בשולחנות עבודה, בבגדים, בתכשיטים ובגוף האנושי."

איזה ציון הייתם אתם נותנים להצהרה זו? לדעתי מגיע לה 4 או 5, כלומר – היא לא התממשה. מצד אחד המחשוב אכן חדר לרכיבים ועצמים רבים, אך דווקא לתוך הדברים שציין קורצווייל הם לא נכנסו, אולי למעט לגוף האנושי אם לוקחים בחשבון אביזרים לבישים כגון שעונים חכמים. רוב רובם של המתנדבים העניקו ציון דומה, הגם שכמה הפריזו ונתנו 3 ואפילו 2.

והנה עוד דוגמא לקושי הפרשני ביחס לנבואות. הנבואה שזכתה למנעד הציונים הרחב ביותר הייתה: "המחשוב נמצא בכל מקום, כמעט ואין סטודנטים שאינם מחזיקים במחשב אישי". כיצד להסביר את המחלוקת בעניין זה? ייתכן מאוד שלא כולם הבינו את ה"בכל מקום" באותה דרך – האם הכוונה לכל מקום ממש, או לזה שפריסת אמצעי מחשוב היא רחבה, והם נגישים יותר מבחינת עלותם הכספית?

התיקוף איפשר גם לרכז תוצאות כלליות של נבואות קורצווייל לשנת 2019:

בסך הכל 24% הצלחה (אמת או כמעט אמת), מול 67% של טעות (טעות או כמעט טעות). נתונים שמעלים שאלה מעניינת… מה נחשבת הצלחה של עתידן? מצד אחד אחוזי ההצלחה נמוכים. מאידך גיסא – כמה מאיתנו מסוגלים לרדת לרזולוציה כמו של קורצווייל ולהצליח באותה מידה? והנה לנו בעיה פרשנית בריבוע – זה לא רק שיכולות להיות מחלוקות לגבי התגשמות נבואה כזו או אחרת, אלא שיכולה להיות מחלוקת גם לגבי מהי הצלחה בתמונה הכוללת.

נביאים למיניהם

קורצווייל הוא אמנם תופעה מודרנית, אך הנבואה היא כידוע מקצוע עתיק. לגבי כל הנביאים כולם ניתן לשאול – מה דוחף אותם להתנבא? מהו אותו דחף ולהט שמצית אצלם את החיזיון, את החזון, ואת היכולת לקפוץ שנה, שנתיים, עשור או עשורים קדימה כדי לקבוע מה יתרחש אז?

עם הנבואה המקראית רובנו מיודדים במידה כזו או אחרת. ירמיהו, ישעיהו או עמוס – נביאים שהלהט שדחף אותם היה, אם להכליל באופן גס – דתי, אתי ומוסרי. תפסה אותם התגלות או תובנה שגרמה להם להבין שהנה אסון מתרגש לבוא על העם, או לחלופין שבמועד מסוים יתממשו הבטחות טובות ונהדרות לבטחון ושגשוג. מוסר ההשכל מנבואותיהם היה אמור להשליך על ההתנהגות של העם – אם תתנהגו היטב, לא תחמסו ולא תרצחו, יקרו דברים טובים או לכל הפחות לא תיענשו. מטרתם כנביאים הייתה, אם כן, להגשים בתוך החברה אידיאל של חברה צודקת ומוסרית. דחף בלתי נשלט, שהפך את חלקם למציקים הלאומיים והשניא אותם על סובביהם. כך למשל ירמיהו מעיד על תדמיתו הרעה: "אוֹי לִי אִמִּי כִּי יְלִדְתִּנִי אִישׁ רִיב וְאִישׁ מָדוֹן לְכָל הָאָרֶץ לֹא נָשִׁיתִי וְלֹא נָשׁוּ בִי כֻּלֹּה מְקַלְלַונִי" (ירמיהו טו', י'). כשאתה נביא רציני אתה אוטומטית מתויג כילד רע.

וכעת אל המאה ה-16 הקרובה לנו יותר אז פעלה דמות מסקרנת לכל הדעות –  מישל דה נוסטרדמוס. מהדורת ה'נבואות' שלו שהתפרסמה לראשונה בשנת 1555 כללה לאחר כמה גלגולים מאות נבואות למאות שנים קדימה. נוסטרדמוס ביקש שלא להיקרא 'נביא', וכך כתב לבנו סזר (César) – "בני, על אף שהשתמשתי במילה נביא, לא הייתי מייחס לעצמי תואר כה נשגב".

ההתכחשות של נוסטרדמוס לתפקידו כנביא לא ממש עזרה, ועד היום, בכל שנה ושנה, נשאלת השאלה – האם נבואות נוסטרדמוס לשנה שזה עתה תמה התגשמו? יש הטוענים שנוסטרדמוס הצליח לחזות כמה מן האירועים שהשפיעו יותר מכל על תקופתנו כגון פיגוע התאומים, וכמובן, איך לא – גם את המגיפה הנוכחית. אך לרובנו, בני המאה ה-21, הנבואות של נוסטרדמוס נראות כלהט מוזר של הסתכלות במפות בכוכבים, בשילוב עם מיני טקסים מאגיים, כאילו הם מכילים מסרים על העתיד כולו, והכל בתיבול של דרמטיזציה לעתיד הרסני יותר. לא משהו שעובר מסך.

נוסטרדמוס – הכל בתיבול של דרמטיזציה לעתיד הרסני יותר (מקור: וואללה! 01.01.20)

קורצווייל מצידו מתאר את הסיבה לעיסוקו בחיזוי העתיד באופן הבא:

The reason I became interested in trying to predict certain aspects of technology is that I realized about 30 years ago that the key to being successful as an inventor was timing. Most inventions and inventors fail, not because they are unable to get their gadgets to work, but because their timing is wrong, either introducing their innovation before all of the enabling factors are in place, or too late, missing the window of opportunity

נבואה זה עניין של טיימינג! העניין הוא לזהות חלון הזדמנויות לקידום גאדג'טים! זה הדחף של קורצווייל לעיסוק בעתיד. בהמשך הוא מספר שכמהנדס הוא התחיל לאסוף דאטה על טכנולוגיה בתחומים שונים. בהתחלה, כך הוא מסביר, הוא לא ציפה שהמחקר שלו יצייר תמונה ברורה והוא בסך הכל קיווה להצליח להפיק כמה ניחושים חכמים. והכל במטרה להתאים את הפרויקטים הטכנולוגיים שלו, מתוך הבנה שבזמן שהממציא עובד על המצאותיו, העולם משתנה.

מה שגילה קורצווייל להפתעתו היה שבטכנולוגיה של מידע – האינטרנט, המחשוב, הבנת הגנום או המוח – ההתקדמות היא תמיד מעריכית-אקספוננסיאלית. התפתחות הטכנולוגיה עוקבת אחר תנועת S באופן מדויק – פרדיגמה ממריאה בתנופה, ממצה את הפוטנציאל שלה ואז מתמתנת. בשלב הזה מתכנסים הממציאים כדי ליצור את הפרדיגמה הבאה, עד שהטכנולוגיה ממריאה מחדש להשלמת ה-S, וחוזר חלילה.

המדעיזציה של הנבואה

מעניין לבחון, דווקא על רקע נביאי העבר, את קורצווייל כנביא מודרני.

מצד אחד אנחנו מוצאים מוטיב חוזר – אדם שפיתח שיטה להפקת נבואות, שמאמין ביכולתו לאפיין עתיד על בסיס נתונים ומידע עכשווי. זה אותו שכנוע בשיטה, אותה אמונה בהבנה של תהליכי עומק וראייה דרך המציאות, אותו ביטחון באפשרות לצפות גלגולי גלגולים.

מצד שני, יש גם כמה הבדלים מהותיים. תוכן הנבואות של קורצווייל הוא פומפוזי אך כפי שראינו, הדחף המקורי שלו היה די פשוט, יש שיאמרו פשטני: " I realized about 30 years ago that the key to being successful as an inventor was timing". שמתי לב, רציתי להצליח, מצאתי לי שיטה. מדובר בדחף אישי, אולי אפילו עסקי. והמטרה מה היא? בסך הכל להתאים את הטכנולוגיה הנכונה לתזמון המתאים.

קורצווייל נבדל מקודמיו גם מבחינת קהל היעד שלו. במקרה של ירמיהו אם אין עם חוטא שצריך לקבל נזיפה, אין ירמיהו. הנביא המקראי שואב את הצדקתו ממצב פגום – וכשהכל מושלם אין טעם שיתנבא, וכדאי להסב מקצוע. בניגוד לזה, קורצווייל, לפחות במקור, פיתח נבואות כמו שג'ובס וגייטס פיתחו מחשבים – במוסך. אמנם עם הזמן נוצר הייפ די משמעותי ביחס לנבואות קורצווייל, הוא עצמו הפך לסוג של רוקסטאר של העתידנות, והנבואות שלו הפכו ליותר ויותר מהדהדות. אבל כשקוראים את דברי קורצווייל לגבי הדחף הראשוני שלו, הדברים חוזרים פתאום לפרופורציה סבירה בהרבה.

ייתכן שלשוני הזה, שזיהינו מתוך השתלשלות הנביאים מהתקופות השונות – המקראיים, נוסטרדמוס, קורצווייל – אפשר גם לתת שם, שכן אולי יש לנו מול העיניים מגמה מעניינת של מדעיזציה של הנבואה.

לירמיהו לא היו, מטבע הדברים, יומרות מדעיות – נבואה מקראית נובעת לרוב מחזיון או חלום שממלאים את הנביא באיזו תובנה חדשה. הנבואה של נוסטרדמוס כבר עשתה איזשהו צעד – היא הייתה מבוססת אסטרולוגיה. אסטרולוגיה נתפסת היום כפסאודו-מדעית במקרה הטוב, אבל מבחינת נוסטרדמוס היא הייתה עיסוק מכובד ביותר (אם כי יש להזכיר שמבחינת הכנסייה הדבר נחשב לכפירה בעיקר). ואולי זו עוד סיבה לכך שהוא לא רצה להיקרא נביא? כאילו הוא רוצה להדגיש שהוא אינו שרלטן, אלא חוזה עתידות מכובד?

בהגיענו לקורצווייל אפשר לראות צעדים משמעותיים לנבואה כמו-מדעית, ואולי מדעית ממש. יש לו שיטה עם חוקיות ברורה שרלוונטית לטכנולוגיות מסוימות, אך לא לאחרות. הנבואות ניתנות לתיקוף, הגם שהן נתונות לפרשנויות שונות. ועוד, מתקיים ויכוח ביחס לאותן פרשנויות. וכשקורצווייל יוצא להגנת עצמו הוא לא מהסס להביא הסברים אנליטים, מדודים וחדים.

האורקל מדלפי

עם כל זאת, ישנה הסתברות לא נמוכה שקורצווייל יישאר בראי ההיסטוריה נביא נקודתי ואזוטרי. הזמן ימשיך לזרום, ונבואותיו יתגשמו, כן או לא. ובמקרה הטוב ב-2099 תתפרסם כתבה בסגנון נוסטרדמוס.

מה שבאמת מעניין בכל המהלך הזה הוא התובנה שתהליך המדעיזציה, הוא סימפטום למשהו עמוק בהרבה. למעשה, היחס שלנו כחברה אנושית לעתיד הוא שהשתנה. החיוניות שבלחזות את העתיד, הקריטיות של יכולת זו להמשך ההתפתחות (המעריכית?) שלנו כחברה – שוברת כל שיא. חשבו על זה כך: ללא אמונה בעתיד – אין כלכלה, אין תכנון ארוך טווח, אין לבשל בערב שבת כי מחר שבת. הקידמה תלויה במידת האמון של בני האדם בעתיד של עצמם – אפשר גם להרגיש זאת היום, עת בה האמון מתפורר לו במעט. מעניין אגב מה יהיה לקורצווייל להגיד על זה. הוא הרי טוען שכוח המחשוב הגדל מעריכית הוא שמבטיח התפתחות טכנולוגית מעריכית. אני הייתי רוצה להזכיר לו שאם לבני אדם לא היה אמון מבוסס תחזית שבעוד X שנים יהיה צורך בכל הטכנולוגיה המעריכית המדוברת – ייתכן ששום דבר לא היה קורה.

המקום שתופס תכנון העתיד הביא לכך שפותחו עם השנים יותר ויותר כלי חיזוי. הזדמן לי לאחרונה לעיין באחד מהם – 'שיטת דלפי', אולי דווקא בגלל המיתוג המעניין: לוקחים מוטיב מיתולוגי-נבואי אולד-סקול, ומגיירים אותו לשפה מודרנית. ואם כבר מוטיב חוזר, אז בדיעבד ממציאי השיטה לא רצו את האיצטלה הניסית הזו, ממש כמו נוסטרדמוס. כך במילותיו של Dalkey, אחד ממפתחי השיטה וחוקר במכון RAND:

[…] the term implies something oracular, something smacking a little of the occult – whereas, as a matter of face, precisely the opposite is involved; it is primarily concerned with making the best you can of a less than perfect fund of information

שיטת דלפי מבוססת על תהליך של 'להעריך-לדבר-להעריך'. מגישים לקבוצה של מומחים שאלון בנושא מסוים. פותחים בסבב ראשון שבו המומחים ממלאים את השאלון. מגישים אותו למנחה שמנתח את התשובות ומפיק מסקנות ראשוניות. מפרסמים אותן בצורה אנונימית ולאחר מכן פוצחים בסבב נוסף של תיקונים. השיטה מאמינה שבזכות החוכמה המשותפת, מנעד התשובות יקטן, והקבוצה תתקדם לעבר 'תשובה נכונה'.

האם נכון לסדר שיטות כמו דלפי על הספקטרום הנבואי, יחד עם החברים האחרים שבהם עסקנו לעיל? אולי זו נבואה שונה במהות – היא מבקשת לוותר על היומרה לחוקיות, מתנחמת בחוכמת המונים ומקווה שעם קצת הכוונה היא תספק תשובה נכונה (בתרגום חופשי לדברי Dalkey: "ברמה העקרונית, השיטה מנסה לעשות את המיטב עם בסיס מידע פחות ממושלם").

יש פה עוד הרבה חומר למחשבה, ובטוח שהכותב הבודד לא יוכל לספק כאן תשובה נכונה. אבל מעתה אפשר אולי להודות באיזושהי אמת – נבואה היא נבואה היא נבואה.

תמונת שער: Alina Vilchenko

רגע, לא הבנתי – פרק 2

למה בכל זאת חשוב שנבין מה קורה בתוך האלגוריתם

בפוסט הקודם דיברנו על פער ההבנה, הנקודה שבה אנחנו מבינים שהמודל מורכב מדי מכדי שנוכל להבין אותו. הקופסא שמקבלת קלט ומוציאה פלט הופכת לקופסא שחורה מבחינתנו. ראינו שהיכולת של המודל להיות גמיש מגדילה את היכולות שלו, וגורם לכך שהוא יתמודד עם משימות קשות בעולם האמיתי. הפעם נתמקד בקשיים ביישום מודלים מורכבים, ונסביר למה, למרות שאנחנו רוצים מודלים גמישי ואפקטיבים, עדיין צריך לגשר בין ההבנה האנושית לבין יכולות החיזוי של המכונה.

דבר ראשון, מהזווית הכי פרקטית בעולם, קשה לעבוד עם מודל מורכב. תהליך עבודה של מדען נתונים הוא לא מאוד שונה מתהליך עבודה של מהנדס תוכנה. כותבים משהו, זה בערך עובד, מנסים משהו אחר, עובד קצת יותר טוב. משנים משהו נוסף, ופתאום שום דבר לא מצליח. היכולת של מהנדס תוכנה לדבג (debug), לעבור שלב שלב אחרי ביצוע של הקוד שהוא כותב, היא קריטית.

כך לדוגמא, אפילו על טעות קטנה וטיפשית, אפשר לבזבז שעות על גבי שעות. דמיינו שקיבלתם משימה להכין מודל שינבא רמת הכנסה, ובין הפרמטרים נמצאים מספר הרשעות ושנות השכלה. אך אבוי, העתקתם את הקובץ באופן לא נכון, והשמות של המשתנים הוחלפו. במודל הפשוט, נוכל להבחין ישירות שבאופן תמוה רמת ההכנסה צפויה לעלות עם מספר ההרשעות. כמה נורות אדומות ידלקו, וכנראה שדי מהר נמצא את הגיבוי ששמרנו בצד, ונתקן את המודל. אבל במודל מורכב, הנורות ידלקו הרבה יותר מאוחר. המודל אמנם יציג תוצאות לא טובות כאשר נבחן אותו, אבל לא נוכל למצוא בקלות את הבעיה. לא נוכל לזהות באופן מיידי שיש בעיה עם משתנה מסוים, אלא נתחיל לגשש באפלה. בעיה זו תמשיך להתעצם ככל שיש יותר משתנים והמודל עצמו הוא מורכב יותר.

אפשר כמובן לא להתרשם, ולטעון שאולי זה קצת מעיק, אבל בהחלט לא הרסני – זו בעיה של המפתח, שיתמודד. כל זה נכון בסביבה סטרילית שבה המטרה של המודל פשוטה, כנראה שבסוף נגיע לפתרון של בעיות כמו שתיארתי. אבל כאשר המטרה לאו דווקא ברורה או כאשר הנתונים סבוכים וענקיים – סביר שבלי כלי דיבוג טובים, טעויות רעות בהחלט יוכלו להסתנן למודל.

דוגמא מפורסמת לכך היא הזיהוי השגוי והמעליב של אנשים שחורים על ידי גוגל. בשנת 2015 גילה מהנדס תוכנה בשם ג'קי אלסין, שתמונות שהוא העלה לGoogle Photos מסווגות אותו ואת חבר שלו כגורילות. אין ספק שגוגל רואה בכך תקלה חמורה מאוד, אך עד היום, גוגל לא הצליחה ל"דבג", ולפתור את הבעיה.

זיהוי של שחורים בתור גורילות

אבל כמובן שזה לא נגמר פה. גם אם נבטיח שכל הנתונים נכונים, המטרה מוגדרת היטב והמדדים הבסיסיים מראים על דיוק גבוה, עדיין מודלים מורכבים יכולים להיות בעייתיים ואפילו מסוכנים.

מקרה מעניין ומלמד היה הניסיון לזהות את החומרה של דלקת ריאות בעזרת רשתות נוירונים. הנתונים היו נהדרים, כמיליון חולים שאושפזו בעקבות דלקת ריאות, כ-1000 מדדים רפואיים ושאלת מחקר ברורה – "האם החולה שלפנינו אכן דורש אשפוז?". מצד אחד, אם יש סכנה להתפתחות של דלקת ריאות חמורה, כדאי מאוד לאשפז את החולה על מנת שיהיה בהשגחה צמודה. מצד שני אם אין סכנה אמיתית, ממש לא כדאי לסכן את החולה בזיהומים – הרי, לבית חולים אתה נכנס בריא ויוצא חולה – וגם אין רצון להקשות על החולה ועל משפחתו ולבזבז כסף לבית החולים.

מדדי הדיוק הניבו תוצאות יפות מאוד, והמודל היה צריך להיות מיושם בבית חולים. במקביל צוות חוקרים אחר ניסה לנתח את התופעה על ידי אלגוריתם אחר ופשוט, המתבסס על מציאת כללים סטטיסטיים בין הפיצ'רים. להפתעתם הרבה, היה כלל אחד מוזר מאוד שבלט: יש אסטמה > סכנה נמוכה להחמרה בדלקת ריאות.

רגע, מה קורה פה? איך זה יכול להיות? זה לא אמור להיות הפוך? אז כן בערך. התברר שכאשר מגיע חולה אסטמה עם דלקת ריאות, יש פרוטוקול מסודר, הרופאים יודעים בדיוק מה לעשות ועושים את זה. זה כמובן לא אומר שהסכנה נמוכה באופן כללי, אלא שכאשר נלקחים לחשבון כל הפרטים, יודעים לטפל בה. ולכן ניתוח נאיבי של הנתונים לימד באופן שגוי כי לחולה אסטמה יש סכנה נמוכה להחמרה בדלקת ריאות.    

עכשיו תארו לעצמכם שמודל רשתות הנוירונים היה מיושם. סביר מאוד להניח שאותו הקשר הסטטיסטי בין אסטמה לסיכון נמוך ימצא. ההבדל העיקרי יהיה שלא יהיה אפשר לזהות אותו, כי הוא יבלע במורכבות של המודל. חולי אסטמה שיבואו עם דלקת ריאות יבחנו, והאלגוריתם ככל הנראה יחליט שהסכנה נמוכה, הם יקבלו אנטיביוטיקה וישוחררו לביתם… זה לא טוב בכלל.

אז אולי הפתרון הוא שנגדיר חריגה במודל, ונחליט שלמי שיש אסטמה, למרות שהמודל מכריע שהוא בסיכון נמוך, נתייחס אליו בתור סיכון גבוה. גישה זו לא ריאלית, כי אם נחריג כל כלל סטטיסטי שנמצא, לא ישאר שום דבר מהמודל. ובכל מקרה, הסכנה הגדולה היא דווקא מדפוסים שנמצאים מתחת לפני השטח שהאלגוריתם הצליח לחשוף. כלומר, יחסית קל לחשוף ולהבין שיש בעיה בכלל של האסטמה, ואפילו מישהו ללא השכלה רפואית יכול להבין שאולי יש פה בעיה. אבל הדפוסים העמוקים שהאלגוריתם מוצא יכולים להיות מסוכנים בדיוק באותה מידה, ואותם לא נוכל לחשוף בכלל.

בפוסט שיתפרסם בהמשך בסדרה זו ניגע באתגר נוסף, שממשיך לעורר שיח וצובר תאוצה – אפלייה והטיה באלגוריתמים, ונתחיל לדבר על מה אפשר לעשות.

רגע, לא הבנתי – פרק 1

על פער ההבנה – הנקודה שבה אנחנו מבינים … שאנחנו לא מבינים

[קישור לפרק 2 בסדרה]

ילדים קטנים שואלים שאלות על כל דבר…  שאלות יומיומיות כמו "למה יתושים מזמזמים?" אבל גם שאלות תיאולוגיות עמוקות כמו "לאן הולכים אחרי שמתים?". זהו גיל שבו אנחנו צמאים לידע על איך העולם מתנהל. גם כאשר התדירות יורדת אנחנו ממשיכים בתהליך זה כל החיים. אנחנו צוברים מבנים ותרשימי זרימה דמיוניים על חוקים, סיבות ותוצאות.

שיטות החיזוי המסורתיות לא הלכו רחוק מאוד מזה. לבעיה נתונה, הוצג מודל פשוט שבו יש משתנים מסבירים (פיצ'רים, "סיבות") ומשתנה מוסבר (תוצאה). במשך מאות שנים המדע היה צריך להתמודד עם בעיות בעזרת ניסויים מבוקרים או שיטות סטטיטיות זהירות אחרות. המודל אמר כמה X משפיע על Y. כל זה היה בימים היפים והתמימים, אבל היום אנחנו חיים בעולם אחר לגמרי.

בעת האחרונה, מודלים חדשים ומתוחכמים הרבה יותר מביאים המון ברכה לאנושות, תחומים שבהם לא הצלחנו להגיע להישגים משמעותיים, כמו לדוגמא ראייה ממוחשבת, היום מוגדרים כ"פתורים" על ידי מדעני מחשב. אין הכוונה כמובן שנגמר מה לעשות בתחום, אבל ככל הנראה העבודה המחקרית מתחילה להראות תפוקה שולית פוחתת ביחס למהפכה הגדולה של שימוש ברשתות נוירונים בתחום זה. ראייה נוספת לכך היא שבמשימות מסוימות, כמו זיהוי פרצופים, כנראה שהמכונות כבר עקפו אותנו בסיבוב.

מודלים מודרניים כמו רשתות נוירונים (למידה עמוקה) מסוגלים לתפוס קשרים מסובכים ונסתרים מעיננו. הדרך בה הם עושים את זה היא לחפש קשרים בין הפיצ'רים ובין התגובה: האלגוריתם לא עוצר בחיפוש קשרים לינאריים כמו "אם נגדיל את ההשכלה בשנת לימוד, השכר יעלה ב2000 שקל", אלא ינסה למצוא קשרים מסובכים יותר כמו "אם נגדיל את ממוצע בגרות*גיל*גוון צבע עור*גובה אזי המשכורת תעלה ב1000 שקל" או "אם הגובה שלך הוא מעל 175 ס"מ וגם נולדת בתל אביב אבל לא היית במינוס בבנק בשנה האחרונה – אזי המשכורת שלך תעלה ב500 שקל". למעשה, אפילו הדוגמאות הללו הן הרבה הרבה יותר פשוטות מאשר הכללים שרשתות הנוירונים באמת לומדות.

כך למעשה, אנשים שעוסקים בלמידת מכונה למחייתם יכולים להעביר את חייהם המקצועיים בלבנות מערכות שאת תוצאותיה הם לא מבינים. אותו הילד הסקרן שגדל והתבגר, למד שיש מגבלות להבנה. נדגיש, האמירה ש"אנחנו לא יודעים מה רשתות ניורונים עושה" היא פשטנית למדי. אנחנו כן יודעים איך הרשת נבנת, אנחנו הרי כותבים קוד שבונה רשתות כאלו. אלא שיכולתו של המודל להיות גמיש ולהתאים את עצמו לדפוס מורכב, לא תמיד מאפשרת לנו לעקוב אחרי התוצאות שלו.

AMAZING Domino Rally Trick Screen Link! - YouTube
אלגוריתם מורכב הוא כמו דומינו ראלי ענק, אנחנו רואים שקורה משהו, אבל אנחנו מתקשים להסבירו. מקור: Youtube

נסו לחשוב על דומינו ראלי, משחק הילדים שבו בונים מסלול שבו כל אבן דומינו מפילה את האבן העוקבת. די נחמד לעקוב אחרי מסלול כזה שיוצר צורות מרהיבות. עכשיו חשבו על דומינו ראלי שמתחיל ב1000 מקומות, וכולל פיצולים, איחודים, מבויים סתומים, גשרים ומנהרות. כמו כן, הרשת שנוצרת ממסלולי הדומינו מתפרשת על שטח בגודל של מגרש כדורגל. האם תצליחו לעקוב? האם תבינו את המודל?

אותו פער הבנה הוא תוצאה בלתי נמנעת של חיכוך בין שני רצונות עקרוניים. מצד אחד, הרצון לספק תשובות טובות ככל האפשר לכל שאלה. ומהצד השני הרצון להבין את המנגנון הפנימי של הבעיה. נדמה, שלעיתים קרובות שני רצונות אלו מתנגשים בעוצמה.

אבל מה הבעיה בעצם? אם המערכת יכולה למצוא את כללי ההחלטה עבור בעיה נתונה, למה שנדאג? המערכת הרי תמצא לבד את הכלל האופיטימלי, ולא צריך להיות לנו אכפת מהו, העיקר שזה עובד, העיקר שזה אפקטיבי. אולי בעצם הצפייה להבין היא צפייה ילדותית? הרי זוהי תמימות לחשוב שבאמת קיימים בעולם האמיתי קשרים פשוטים כל כך שניתן להציג אותם בצורה כל כך ישירה. אף אחד לא באמת חושב שאם "אם נגדיל את ההשכלה בשנת לימוד, השכר יעלה ב2000 שקל". ברור שיש אינטרקציות בין כל הפרמטרים, ברור שהעולם מורכב, ואולי רק מודלים מורכבים יצליחו לתאר אותו? ואולי פשוט הגיע הזמן להתבגר ולהשלים עם פער ההבנה?

תם ולא נשלם.

בפוסט הבא ננסה לענות על שאלות אלו בעזרת מיקוד בצורך האנושי בהבנה, ומה אפשר לעשות כדי לגשר על הפער.

[קישור לפרק 2 בסדרה]