נבואה מודרנית עליזה

נבואה היא עיסוק עתיק, שנדמה כארכאי. על האפשרות שמסתובבים בינינו, גם בימינו, נביאים מסוג דומה אך שונה.

איך הייתם מגיבים לטענה שבתוך 20 שנים מהיום, זהו זה, זה ייגמר, הספרים ייעלמו מן העולם כלא היו, ויוחלפו בטכנולוגיות קריאה דיגיטאליות בלבד? אם היו שואלים אותי הייתי עונה שעם יד על הלב אני ממש לא בטוח לגבי זה: יוכיחו ה-Kindles וה-E-books. הם אמנם הצליחו לתפוס איזשהו נתח מהרגלי הקריאה שלנו, אך הספר הכתוב, הטוב והמוכר, בניגוד לכל ההספדים, עוד לא אמר את מילתו האחרונה: בארצות הברית נמכרו 675 מיליון ספרים בשנת 2019, ונתונים של הספרייה הלאומית בישראל מראים על גידול שנתי מתמיד בכמות הספרים היוצאים לאור.

בשנת 1999 התיישב ריי קורצווייל (Ray Kurzweil), העתידן הנודע, לכתוב את הספר 'The Age of Spiritual Machines' ('עידן המכונות החושבות'). החלק השלישי של הספר המכונה 'To Face the Future' מפוצל לארבעה פרקים. בכל פרק סדרת נבואות לשנה עתידית: ל-2009, 2019, 2029 ו-2099.

לגבי 2019 הוא חזה את נבואת הפתיחה – שהספרים ייעלמו מן העולם. אנחנו כמובן כבר יודעים שחזיון הספרים הנעלמים היה לא יותר מחלום באספמיא. קורצוייל, עתידן בעל תעוזה, לא התבייש ולא הסתפק בכך והתנבא לגבי שלל פעילויות אנושיות אחרות: מה יקרה בטכנולוגיה, לאן תתפתח הגנטיקה, איזו כלכלה תהיה, ואיך בני אדם יתקשרו האחד עם השני. זה אותו קורצווייל אגב שטוען שבשנת 2045, פחות או יותר, נחצה את הנקודה הסינגולרית שבה המכונות יעקפו את בני האדם בסיבוב, סופית וחד-משמעית.

ריי קורצווייל, עתידן בעל תעוזה (מקור: ויקיפדיה)

אני מתלבט מזה שנים לגבי עמדתי ביחס לעתידנים – מצד אחד זו פעילות אינטלקטואלית די מורכבת, היא דורשת יכולת הסקה, ודמיון וחזון לא מבוטלים. עתידנים הם אנשים נועזים – הם מביעים דעות ביחס ללא נודע, וכשהם חוזים מה יהיה בעוד 10 או 20 שנה, הם מסכנים את המוניטין שלהם. מצד שני בעתידנות יש שרלטנות: היא עושה הרבה כותרות לשעתה, בהתבסס על כלום, וכשמגיע הזמן לפרוע את הצ'ק ולבדוק האם התממשו הנבואות, לעיתים אין את מי לשאול, ובמקרה הטוב תיתקלו בהתחמקות.

קורצווייל מצדו עומד על כך שהוא עתידן רציני עם מתודה ושיטה. על פי התזה המרכזית שלו ('The Law of Accelerating Returns'), ההתפתחות של טכנולוגיית המידע עוקבת אחר נתיב בר-חיזוי ואקספוננציאלי. בשל תגלית זו מתעקש קורצווייל שהעתיד אינו מורכב מכדי לחזותו. עם זאת, הוא מודה בצניעות מה שיש דברים שאינם ברי-חיזוי – והוא אף מציין דבר שאמור לצער אותנו:

There are still many things – which project, company or technical standard will prevail in the marketplace, or when peace will come to the Middle East – that remain unpredictable

ואני, עתידן מתחיל, אומר שהשלום במזרח התיכון יקרה לא יאוחר מ-2099.

תיקוף נבואות

בשנת 2009 הגיעה ההזדמנות הראשונה לבדוק אם קורצווייל צדק או טעה בענק.

הכותרות לא ממש החמיאו לו. כך למשל כתבה בפורבס מ-2012, שגם אחרי הארכת זמן של 3 שנים, הגיעה למסקנה שמתוך 12 נבואות לשנת 2009 שנבדקו, צדק קורצוויל בלא יותר מאחת – הוא חזה את פיתוחם של מכשירי קריאה קטנים לעיוורים, ומכשירי שמיעה לחירשים. הכותב בפורבס הסכים ברוב חמלתו להעניק ציון עובר לקורצוייל על נבואה זו, כיוון שאפשר להתייחס לסמארטפונים כמימוש הנבואה. שאר ה-11 הנבואות להערכתו היו מוצלחות הרבה פחות: לא, מוזיקאים אנושיים אינם מג'מג'ים עם נגנים קיברנטיים; רוב הטקסטים אינם נכתבים באמצעי זיהוי קול; עדיין לא הצליחו להקטין בצורה דרסטית את התמותה מסרטן ומחלות לב.

קורצווייל לא נשאר חייב ויצא לקרב הגנה. במאמר תגובה מפורט שהתבסס על מסמך ארוך הוא הציג כל נבואה ונבואה והסביר למה בסך הכל הוא הגיע לרמת חיזוי מרשימה. הוא טען כי מתוך 147 הנבואות, 115 (78%) התבררו כמדויקות לגמרי, 12 (8%) נכונות ברמה העקרונית, כלומר בסך הכל 86% של נבואות נכונות.

אז איך יכול היה כתב פורבס להגיע למסקנות שגויות כל כך? קורצווייל הסביר שהוא דירג את הנבואות באופן מוטה ומתוך חוסר היכרות עם המציאות. איך אפשר להגיד שהנבואה לגבי זה שרוב הטקסטים ייכתבו בזיהוי קולי אינה נכונה בעוד אנשים מכתיבים הודעות טקסט ומיילים בעזרת Siri ואחיותיה? טקסטים, כך קורצווייל, הם לא רק ספרים או מסמכי וורד – טקסט הוא טקסט גם אם הוא אי-מייל שטחי ורגעי. הוא הסביר גם, בניגוד למה שחשב כתב פורבס, שהנבואות ניתנו למעשה לעשורים: מה שנכתב ל-2009 יכול להיות נכון גם אם התממש ב-2010, 2011 ואפילו 2015.

הויכוח המתומצת הזה רק מראה כמה שהעניין נתון לפרשנות – נבואות הן בסופו של דבר מילים שנכתבו. עוד לא הומצאה המילה שאינה ניתנת לפרשנות, כולל המילה 'טקסט', וכולל המילה 'כולל', דבר שמביא למחלוקת בהערכת התגשמות הנבואות. האם קורצוויל צריך להיות הפרשן המוסמך לנבואות של עצמו? הרי הוא כתב אותן, ולכן צריך להקשיב לו. מצד שני, אולי הוא נוגע מדי בדבר? האם נכון לתת לחתול לשמור על השמנת?

היה הייתה 2019

אל שנת 2019 אנחנו כבר מתגעגעים, שנה בלי מגפות. לתקופה הזו יש ערך גם בהקשר אחר, ההקשר שלנו – עוד הזדמנות לתקף את נבואות קורצווייל. גם ב-2019 היו אמורים להתגשם כל מיני דברים לפי קורצווייל: דיברנו למעלה על ההצהרה לגבי היעלמות הספרים אבל גם – רוב הלמידה מבוצעת בעזרת תוכנות חכמות המדמות מורים אמיתיים; רוב בני האדם הבוגרים משקיעים את רוב זמנם ברכישת ידע ומיומנויות חדשות; אתה ואת יכולים לעשות כל דבר באופן וירטואלי מבלי להיות תלוי בקרבה פיזית.

Stuart Armstrong מ-LessWrong (אתר מומלץ בחום) ביקש לקיים בדיקה מעמיקה של נבואות קורצווייל. המטרה – לבדוק האם קורצווייל של 99' דייק לגבי 2019, עד כמה, ואם לא – למה לא?

תחילה הוא ריכז את 105 הנבואות של קורצווייל לשנת 99' ולאחר מכן הוא הוציא קול קורא למתנדבים שיחוו דעתם לגביהן. 34 המתנדבים שנענו לבקשה נדרשו להעניק ציון על סקאלה: 1 – אמת; 2 – בקושי אמת; 3 – קשה לי להחליט; 4 – בקושי שגוי; 5 – שגוי. בסך הכל ניתנו 3078 חוות דעת לנבואות השונות.

טלו למשל את הנבואה הבאה:

"מחשבים הם כעת [2019] לרוב בלתי נראים. הם משולבים בכל מקום – בקירות, בשולחנות, בכסאות, בשולחנות עבודה, בבגדים, בתכשיטים ובגוף האנושי."

איזה ציון הייתם אתם נותנים להצהרה זו? לדעתי מגיע לה 4 או 5, כלומר – היא לא התממשה. מצד אחד המחשוב אכן חדר לרכיבים ועצמים רבים, אך דווקא לתוך הדברים שציין קורצווייל הם לא נכנסו, אולי למעט לגוף האנושי אם לוקחים בחשבון אביזרים לבישים כגון שעונים חכמים. רוב רובם של המתנדבים העניקו ציון דומה, הגם שכמה הפריזו ונתנו 3 ואפילו 2.

והנה עוד דוגמא לקושי הפרשני ביחס לנבואות. הנבואה שזכתה למנעד הציונים הרחב ביותר הייתה: "המחשוב נמצא בכל מקום, כמעט ואין סטודנטים שאינם מחזיקים במחשב אישי". כיצד להסביר את המחלוקת בעניין זה? ייתכן מאוד שלא כולם הבינו את ה"בכל מקום" באותה דרך – האם הכוונה לכל מקום ממש, או לזה שפריסת אמצעי מחשוב היא רחבה, והם נגישים יותר מבחינת עלותם הכספית?

התיקוף איפשר גם לרכז תוצאות כלליות של נבואות קורצווייל לשנת 2019:

בסך הכל 24% הצלחה (אמת או כמעט אמת), מול 67% של טעות (טעות או כמעט טעות). נתונים שמעלים שאלה מעניינת… מה נחשבת הצלחה של עתידן? מצד אחד אחוזי ההצלחה נמוכים. מאידך גיסא – כמה מאיתנו מסוגלים לרדת לרזולוציה כמו של קורצווייל ולהצליח באותה מידה? והנה לנו בעיה פרשנית בריבוע – זה לא רק שיכולות להיות מחלוקות לגבי התגשמות נבואה כזו או אחרת, אלא שיכולה להיות מחלוקת גם לגבי מהי הצלחה בתמונה הכוללת.

נביאים למיניהם

קורצווייל הוא אמנם תופעה מודרנית, אך הנבואה היא כידוע מקצוע עתיק. לגבי כל הנביאים כולם ניתן לשאול – מה דוחף אותם להתנבא? מהו אותו דחף ולהט שמצית אצלם את החיזיון, את החזון, ואת היכולת לקפוץ שנה, שנתיים, עשור או עשורים קדימה כדי לקבוע מה יתרחש אז?

עם הנבואה המקראית רובנו מיודדים במידה כזו או אחרת. ירמיהו, ישעיהו או עמוס – נביאים שהלהט שדחף אותם היה, אם להכליל באופן גס – דתי, אתי ומוסרי. תפסה אותם התגלות או תובנה שגרמה להם להבין שהנה אסון מתרגש לבוא על העם, או לחלופין שבמועד מסוים יתממשו הבטחות טובות ונהדרות לבטחון ושגשוג. מוסר ההשכל מנבואותיהם היה אמור להשליך על ההתנהגות של העם – אם תתנהגו היטב, לא תחמסו ולא תרצחו, יקרו דברים טובים או לכל הפחות לא תיענשו. מטרתם כנביאים הייתה, אם כן, להגשים בתוך החברה אידיאל של חברה צודקת ומוסרית. דחף בלתי נשלט, שהפך את חלקם למציקים הלאומיים והשניא אותם על סובביהם. כך למשל ירמיהו מעיד על תדמיתו הרעה: "אוֹי לִי אִמִּי כִּי יְלִדְתִּנִי אִישׁ רִיב וְאִישׁ מָדוֹן לְכָל הָאָרֶץ לֹא נָשִׁיתִי וְלֹא נָשׁוּ בִי כֻּלֹּה מְקַלְלַונִי" (ירמיהו טו', י'). כשאתה נביא רציני אתה אוטומטית מתויג כילד רע.

וכעת אל המאה ה-16 הקרובה לנו יותר אז פעלה דמות מסקרנת לכל הדעות –  מישל דה נוסטרדמוס. מהדורת ה'נבואות' שלו שהתפרסמה לראשונה בשנת 1555 כללה לאחר כמה גלגולים מאות נבואות למאות שנים קדימה. נוסטרדמוס ביקש שלא להיקרא 'נביא', וכך כתב לבנו סזר (César) – "בני, על אף שהשתמשתי במילה נביא, לא הייתי מייחס לעצמי תואר כה נשגב".

ההתכחשות של נוסטרדמוס לתפקידו כנביא לא ממש עזרה, ועד היום, בכל שנה ושנה, נשאלת השאלה – האם נבואות נוסטרדמוס לשנה שזה עתה תמה התגשמו? יש הטוענים שנוסטרדמוס הצליח לחזות כמה מן האירועים שהשפיעו יותר מכל על תקופתנו כגון פיגוע התאומים, וכמובן, איך לא – גם את המגיפה הנוכחית. אך לרובנו, בני המאה ה-21, הנבואות של נוסטרדמוס נראות כלהט מוזר של הסתכלות במפות בכוכבים, בשילוב עם מיני טקסים מאגיים, כאילו הם מכילים מסרים על העתיד כולו, והכל בתיבול של דרמטיזציה לעתיד הרסני יותר. לא משהו שעובר מסך.

נוסטרדמוס – הכל בתיבול של דרמטיזציה לעתיד הרסני יותר (מקור: וואללה! 01.01.20)

קורצווייל מצידו מתאר את הסיבה לעיסוקו בחיזוי העתיד באופן הבא:

The reason I became interested in trying to predict certain aspects of technology is that I realized about 30 years ago that the key to being successful as an inventor was timing. Most inventions and inventors fail, not because they are unable to get their gadgets to work, but because their timing is wrong, either introducing their innovation before all of the enabling factors are in place, or too late, missing the window of opportunity

נבואה זה עניין של טיימינג! העניין הוא לזהות חלון הזדמנויות לקידום גאדג'טים! זה הדחף של קורצווייל לעיסוק בעתיד. בהמשך הוא מספר שכמהנדס הוא התחיל לאסוף דאטה על טכנולוגיה בתחומים שונים. בהתחלה, כך הוא מסביר, הוא לא ציפה שהמחקר שלו יצייר תמונה ברורה והוא בסך הכל קיווה להצליח להפיק כמה ניחושים חכמים. והכל במטרה להתאים את הפרויקטים הטכנולוגיים שלו, מתוך הבנה שבזמן שהממציא עובד על המצאותיו, העולם משתנה.

מה שגילה קורצווייל להפתעתו היה שבטכנולוגיה של מידע – האינטרנט, המחשוב, הבנת הגנום או המוח – ההתקדמות היא תמיד מעריכית-אקספוננסיאלית. התפתחות הטכנולוגיה עוקבת אחר תנועת S באופן מדויק – פרדיגמה ממריאה בתנופה, ממצה את הפוטנציאל שלה ואז מתמתנת. בשלב הזה מתכנסים הממציאים כדי ליצור את הפרדיגמה הבאה, עד שהטכנולוגיה ממריאה מחדש להשלמת ה-S, וחוזר חלילה.

המדעיזציה של הנבואה

מעניין לבחון, דווקא על רקע נביאי העבר, את קורצווייל כנביא מודרני.

מצד אחד אנחנו מוצאים מוטיב חוזר – אדם שפיתח שיטה להפקת נבואות, שמאמין ביכולתו לאפיין עתיד על בסיס נתונים ומידע עכשווי. זה אותו שכנוע בשיטה, אותה אמונה בהבנה של תהליכי עומק וראייה דרך המציאות, אותו ביטחון באפשרות לצפות גלגולי גלגולים.

מצד שני, יש גם כמה הבדלים מהותיים. תוכן הנבואות של קורצווייל הוא פומפוזי אך כפי שראינו, הדחף המקורי שלו היה די פשוט, יש שיאמרו פשטני: " I realized about 30 years ago that the key to being successful as an inventor was timing". שמתי לב, רציתי להצליח, מצאתי לי שיטה. מדובר בדחף אישי, אולי אפילו עסקי. והמטרה מה היא? בסך הכל להתאים את הטכנולוגיה הנכונה לתזמון המתאים.

קורצווייל נבדל מקודמיו גם מבחינת קהל היעד שלו. במקרה של ירמיהו אם אין עם חוטא שצריך לקבל נזיפה, אין ירמיהו. הנביא המקראי שואב את הצדקתו ממצב פגום – וכשהכל מושלם אין טעם שיתנבא, וכדאי להסב מקצוע. בניגוד לזה, קורצווייל, לפחות במקור, פיתח נבואות כמו שג'ובס וגייטס פיתחו מחשבים – במוסך. אמנם עם הזמן נוצר הייפ די משמעותי ביחס לנבואות קורצווייל, הוא עצמו הפך לסוג של רוקסטאר של העתידנות, והנבואות שלו הפכו ליותר ויותר מהדהדות. אבל כשקוראים את דברי קורצווייל לגבי הדחף הראשוני שלו, הדברים חוזרים פתאום לפרופורציה סבירה בהרבה.

ייתכן שלשוני הזה, שזיהינו מתוך השתלשלות הנביאים מהתקופות השונות – המקראיים, נוסטרדמוס, קורצווייל – אפשר גם לתת שם, שכן אולי יש לנו מול העיניים מגמה מעניינת של מדעיזציה של הנבואה.

לירמיהו לא היו, מטבע הדברים, יומרות מדעיות – נבואה מקראית נובעת לרוב מחזיון או חלום שממלאים את הנביא באיזו תובנה חדשה. הנבואה של נוסטרדמוס כבר עשתה איזשהו צעד – היא הייתה מבוססת אסטרולוגיה. אסטרולוגיה נתפסת היום כפסאודו-מדעית במקרה הטוב, אבל מבחינת נוסטרדמוס היא הייתה עיסוק מכובד ביותר (אם כי יש להזכיר שמבחינת הכנסייה הדבר נחשב לכפירה בעיקר). ואולי זו עוד סיבה לכך שהוא לא רצה להיקרא נביא? כאילו הוא רוצה להדגיש שהוא אינו שרלטן, אלא חוזה עתידות מכובד?

בהגיענו לקורצווייל אפשר לראות צעדים משמעותיים לנבואה כמו-מדעית, ואולי מדעית ממש. יש לו שיטה עם חוקיות ברורה שרלוונטית לטכנולוגיות מסוימות, אך לא לאחרות. הנבואות ניתנות לתיקוף, הגם שהן נתונות לפרשנויות שונות. ועוד, מתקיים ויכוח ביחס לאותן פרשנויות. וכשקורצווייל יוצא להגנת עצמו הוא לא מהסס להביא הסברים אנליטים, מדודים וחדים.

האורקל מדלפי

עם כל זאת, ישנה הסתברות לא נמוכה שקורצווייל יישאר בראי ההיסטוריה נביא נקודתי ואזוטרי. הזמן ימשיך לזרום, ונבואותיו יתגשמו, כן או לא. ובמקרה הטוב ב-2099 תתפרסם כתבה בסגנון נוסטרדמוס.

מה שבאמת מעניין בכל המהלך הזה הוא התובנה שתהליך המדעיזציה, הוא סימפטום למשהו עמוק בהרבה. למעשה, היחס שלנו כחברה אנושית לעתיד הוא שהשתנה. החיוניות שבלחזות את העתיד, הקריטיות של יכולת זו להמשך ההתפתחות (המעריכית?) שלנו כחברה – שוברת כל שיא. חשבו על זה כך: ללא אמונה בעתיד – אין כלכלה, אין תכנון ארוך טווח, אין לבשל בערב שבת כי מחר שבת. הקידמה תלויה במידת האמון של בני האדם בעתיד של עצמם – אפשר גם להרגיש זאת היום, עת בה האמון מתפורר לו במעט. מעניין אגב מה יהיה לקורצווייל להגיד על זה. הוא הרי טוען שכוח המחשוב הגדל מעריכית הוא שמבטיח התפתחות טכנולוגית מעריכית. אני הייתי רוצה להזכיר לו שאם לבני אדם לא היה אמון מבוסס תחזית שבעוד X שנים יהיה צורך בכל הטכנולוגיה המעריכית המדוברת – ייתכן ששום דבר לא היה קורה.

המקום שתופס תכנון העתיד הביא לכך שפותחו עם השנים יותר ויותר כלי חיזוי. הזדמן לי לאחרונה לעיין באחד מהם – 'שיטת דלפי', אולי דווקא בגלל המיתוג המעניין: לוקחים מוטיב מיתולוגי-נבואי אולד-סקול, ומגיירים אותו לשפה מודרנית. ואם כבר מוטיב חוזר, אז בדיעבד ממציאי השיטה לא רצו את האיצטלה הניסית הזו, ממש כמו נוסטרדמוס. כך במילותיו של Dalkey, אחד ממפתחי השיטה וחוקר במכון RAND:

[…] the term implies something oracular, something smacking a little of the occult – whereas, as a matter of face, precisely the opposite is involved; it is primarily concerned with making the best you can of a less than perfect fund of information

שיטת דלפי מבוססת על תהליך של 'להעריך-לדבר-להעריך'. מגישים לקבוצה של מומחים שאלון בנושא מסוים. פותחים בסבב ראשון שבו המומחים ממלאים את השאלון. מגישים אותו למנחה שמנתח את התשובות ומפיק מסקנות ראשוניות. מפרסמים אותן בצורה אנונימית ולאחר מכן פוצחים בסבב נוסף של תיקונים. השיטה מאמינה שבזכות החוכמה המשותפת, מנעד התשובות יקטן, והקבוצה תתקדם לעבר 'תשובה נכונה'.

האם נכון לסדר שיטות כמו דלפי על הספקטרום הנבואי, יחד עם החברים האחרים שבהם עסקנו לעיל? אולי זו נבואה שונה במהות – היא מבקשת לוותר על היומרה לחוקיות, מתנחמת בחוכמת המונים ומקווה שעם קצת הכוונה היא תספק תשובה נכונה (בתרגום חופשי לדברי Dalkey: "ברמה העקרונית, השיטה מנסה לעשות את המיטב עם בסיס מידע פחות ממושלם").

יש פה עוד הרבה חומר למחשבה, ובטוח שהכותב הבודד לא יוכל לספק כאן תשובה נכונה. אבל מעתה אפשר אולי להודות באיזושהי אמת – נבואה היא נבואה היא נבואה.

תמונת שער: Alina Vilchenko

מוזיאון של שטויות: על ארכיון האינטרנט

יום אחד מצא את עצמו האינטרנט כלוא בתוך כונן קשיח ומאז הוא מתחבט לגבי הזהות של עצמו.

בקהיר, בירת מצרים, ניצב לו מבנה. במבנה זה, שאינו אלא בית כנסת, נמצאת עליית גג. אם תעלו אליה, תמצאו אוצר: רבבות רבבות עמודים של כתבי יד עתיקים ונדירים ביותר שוכבים להם שם כבר מאות בשנים. זוהי 'גניזת קהיר'. היא התגלתה לגמרי במקרה בשנות ה-1860 והפכה מאז למקור בלתי נדלה של כתבי יד נשכחים: יהודים, נוצרים ומוסלמים כאחד חשפו בה תגליות מרתקות.

אל גניזה משליכים ספרים כלאחר יד. ההלכה היהודית מבקשת שספרים הנושאים שמות קדושים יכובדו ושבמקום להיזרק אל הלא נודע, הם יזכו לאכסניה ראויה. אם תרצו – הגניזה אינה אלא פח אשפה מכובד אליו משליכים בני אדם אוצרות בחוסר מודעות מוחלטת. וראו זה פלא – דווקא מפח אשפה זה, צמחו להם גילויים כה חשובים.

לא הרבה יותר ממאה שמונים קילומטרים משם נח לו מאגר עצום מסוג אחר. ב-"Bibliotheca Alexandrina" שבמרכז אלכסנדריה, אוגר מאז 2002 ה-Internet Archive, "ארכיון האינטרנט", את בסיס הנתונים העצום שלו. בתחילה ביקש הארכיון האמריקאי מהמצרים לשמור אצלם 1 פטה-בייט (1000 טרה-בייט) שהחזיקו את כל האינטרנט מהשנים 1996-2001. אך מהר מאוד צר היה המקום מלהכיל. הקפיצה הראשונה הייתה ל-1.5 פטה-בייט. היום יש בספריה כבר 4.9 פטה-בייט, קפיצה של כמעט 500 אחוזים, מספר דמיוני שמהווה רק נתח מסוים מתוך הארכיון, המגיע לכדי 45 פ"ב בסך הכל.

ה-Bibliotheca Alexandrina – אוגרת את האינטרנט מאז 2002 (מקור: Carsten Whimster)

אגרנים ללא מעצורים

מכירים את האנשים האלו שיעדיפו לאגור הכל בארגזים חתומים בעליות גג, העיקר לא לזרוק לפח?

יש סיכוי לא רע ש-Brewster Kahle הוא אחד מאלו. קייל, חוקר ב-M.I.T, הקים לפני כעשרים שנה את ארכיון האינטרנט ומאז הוא עומד בראשו. הרעיון שלו היה פשוט – האינטרנט הוא יצירה אנושית, ובתור שכזה צריך להנציחו, לטובתנו ולטובת הדורות הבאים.

רעיון קטן לקייל, משמעות גרנדיוזית לארכיון. המשמעות של לשמור-את-האינטרנט-כולו היא שהיום הארכיון מחזיק בשרתים שלו לא פחות מ-400 מיליארד פריטי מידע – דפי אינטרנט, סרטים, ספרים, שהם בערך 1000 פעמים ספריית הקונגרס האמריקאי, הספרייה הגדולה בעולם, שאליה נחזור גם בהמשך.

שמירת האינטרנט היא שיטה לא רעה להתמודדות עם התזזיתיות של המדיום: אתרים עולים, אחרים יורדים; קישורים משתנים ומתיישנים. ממש כמו פרח שפורח רגע אחד ונובל בחטף. חוקרים מלוס אלמוס, ניו מקסיקו, שהתעניינו בתופעה הזו בחנו 3.5 מיליון מחקרים אקדמיים במדע, טכנולוגיה ורפואה מהשנים 1997-2012. מסקנתם הייתה שחמישית מהקישורים המובאים בהערות שוליים במאמרים אקדמיים מובילים לשומקום, פשוט אבד עליהם הכלך. כן כן, אותן הערות השוליים שאמורות לבסס את המחקר, להושיב את החוקר על כתפי ענקים ולהפוך את המאמר לאמין – מסתבר שהן תזזיתיות בעצמן. ויש לזה אפילו שם – The Reference Rot ('ריקבון הקישור').

איך זה עובד? היכונו למסע בזמן

באינטרנט מסתובבים להם זחלנים (Web Crawlers). הזחלן הוא בוט הסורק בהתמדה את הרשת ואוגר עותקים של דפים באופן שיטתי. כשהוא מגיע לדף הבית של אתר מסוים, הוא קודם כל ישמור אותו, ולאחר מכן הוא יגלוש דרך כל הקישורים שנמצאים בדף. וכך הלאה – בכל דף הוא יאתר את הקישורים, יזדחל דרכם עד שיגיע לרמת העומק שהוגדרה לו, כלומר, דרך כמה דפים עליו לעבור עד שהוא צריך לעצור.

כדי לאפשר שימוש נוח במידע שנאגר, נבנתה ברבות הימים "מכונת הזמן" (Wayback Machine). הגשמת חלום ישן – בחרו אתר, בחרו תקופה, וצאו למסע לעבר. בדרך תראו אולי נופים מרתקים – החל מה-gif של אתרים שב-"under construction" שהיה כה אהוב בשנים הראשונות לאינטרנט, מוני המבקרים בספרות הירוקות המכוערות, הפורומים של שנות ה-2000, ועד ה-Web 3.0 הבוגר אותו אנו מכירים.

עידן התמימות: פייסבוק מחברת בין בתי ספר, על החתום מ. צוקרברג (פייסבוק ב-12.12.2005, מכונת הזמן)

דילמת הארכיונאי

כשאתם מסדרים את הארון ומחליטים מה לשמור ומה לזרוק, אתם מקבלים החלטה. החלטה קלה אולי, חסרת משמעות לכאורה, אבל החלטה. השאלה שעולה ביחס למאגרי מידע, בהיסטוריה הקלאסית כמו גם בדיגיטלית, היא בדיוק אותה השאלה: כיצד לנצל את המשאבים המוגבלים? מה לשמור ועל מה לוותר? על מה יתבזבזו משאבי הזחלן והשרתים?זוהי דילמת הארכיונאי.

מבחינה טכנית נפתרת הדילמה בכמה דרכים. לא כל האתרים נדגמים באותה תדירות, ולמען האמת בנתחים משמעותיים מהרשת הרובוט מבקר רק לעיתים רחוקות. המנהג שלו הוא לבקר כל חודשיים ולפעמים יותר כך שנוצרים מרווחי זמן ריקים וחוסר המשכיות. לרובוט יש טריק נוסף כדי לחסוך בזיכרון: כשהוא מזהה שאובייקט כבד משקל לא השתנה בין הביקורים, כגון תמונות, הוא ישמור את הדף מבלי לעדכן את התמונה. על פי הדיווחים זה מביא לתקלות לעיתים, כמו אתר שנשמר עם תמונה לא מתאימה בשל טעות בזיהוי. ולבסוף, כאמור, לרובוט מגבילים גם את עומק החיפוש באתר, אז ייתכן מאוד שדפים בעומק שלישי או רביעי של האתר לא  ישמרו.

להחלטות טכניות יש תמיד השלכות אנושיות וערכיות, החורגות מהטכניות הצרה. צריך רק לפקוח עיניים כדי לזהות אותן. בהקשר הארכיון אחת ההשלכות היא שאם אי פעם תרצו לחקור את התפתחותו של האינטרנט בעזרת מכונת הזמן – תצטרכו לזכור שאתם לא פוגשים את האינטרנט כפי שהיה. מה שנמצא אל מול עיניכם אינו אלא בבואה של האינטרנט ברגע נתון. צילום מסך.

כלומר, הגם שהארכיון מאוד היה רוצה להנציח את האינטרנט בשלמותו ומושלמותו, זה לא לגמרי זה. וכפי שנראה, מכאן, זה רק הולך ומסתבך.

הפוליטיקה של הזיכרון

ככל שדיון ברשת מתארך, הסבירות שמישהו יעשה השוואה לנאצים עולה – כך על פי חוק גודווין. לאחרונה מתפתח חוק אוניברסלי קצת אחר: בסוף כל משפט שאתם אומרים ברשת, יושב טראמפ עם נרגילה. הנשיא מעורר המחלוקת נוטה לשמש כדוגמה האולטימטיבית, או כאנטי-דוגמה, בהרבה מאוד דיונים. גם אנחנו ניכנע לטרנד, ולו רק לרגע קט.

ביולי 2016 הצהיר טראמפ בראיון: "אין לי שום קשר לפוטין… נראה לי שמעולם לא פגשתי אותו". המראיין העמיד אותו מיד על כך שבעבר הוא דווקא כן הודה בקשרים עם השליט הרוסי. מזל שאחד השותפים של ארכיון האינטרנט, Political TV Archive, איפשר בדיקת עובדות מהירה שהפריכה גם היא את ההכחשה של טראמפ. דוגמה ראשונה לאתגור של הנשיא ההסגוני מצד הארכיון.

בנובמבר באותה השנה הכריע טראמפ את הילארי. מיד הודיע קייל, מייסד הארכיון, שהוא פועל בנמרצות ליצירת העתק של הארכיון בקנדה. קייל חשש, באמת ובתמים כנראה, שממשל טראמפ יטיל מגבלות שונות ומשונות על הארכיון והכין תכנית מילוט.

לא עברו חודשיים והודיע הארכיון על הקמת "ארכיון טראמפ". לא… אין מדובר בשגעון גדלות של הנשיא האמריקאי, אלא להיפך, על מאגר מידע שיזם ארכיון האינטרנט שמתמקד אך ורק בדונאלד טראמפ. בהודעה על ההקמה השתדלו מאוד אנשי הארכיון להביא הצדקות לכאורה-ניטרליות לחשיבות של ארכיון טראמפ – "חשוב לבדוק עובדות", "בהמשך נקים עוד כאלו"… אך כפי שנאמר יפה באחת התגובות: "שמתי לב שהמאמר הזה לא כלל קישור לארכיון אובמה… ארכיון האינטרנט מאבד מאמינותו ופוגע בתדמיתו כמאגר ציבורי המשרת את הציבור מבלי לנקוט בעמדה פוליטית".

"שמתי לב שהמאמר הזה לא כלל קישור לארכיון אובמה… " – טוקבקיסט עוקצני על ארכיון טראמפ

כן, זה סופו של כל בלון. אמנם, אנחנו בעידן של 'פוסט-אמת' שבו השימוש ב'בודקי עובדות' מאפשר להתמודד עם מי שמביא את עיוות האמת לדרגת אומנות. אך לא ניתן להתעלם מכך שבימינו, לבדוק עובדות נגד טראמפ זה גם לנקוט בעמדה פוליטית. המעורבות של הארכיון בענייני פוליטיקה, גם אם בכובע של 'בודקי-עובדות', מראה שוב איך ליקוט ההיסטוריה, במקרה הזה על ידי זחלן ניטרלי שאוסף מידע ברשת, ומכונת זמן ללא תודעה פוליטית, איננו-וגם-לא-יכול-להיות יוזמה ניטרלית באמת. מי שמחזיק במאגר כה עצום, מי שבוחר ביחס למי למקד משאבים, וביחס למי לא, נוקט עמדה בתוך המשחק הפוליטי.

פח הזבל של האנושות

ב-2010 הכריזה ספריית הקונגרס האמריקאי שהיא תרכוש מטוויטר את כל הציוצים מאז 2006. היוזמה הזו שימחה אחדים, במיוחד היסטוריונים, אך הצחיקה אחרים שנטו לזלזל בה, עד כדי טענה שמדובר בהקמת "מוזיאון של שטויות" שלא ראויות להיכלל בפנתיאון הספרותי הלאומי (כאן).

האגירה הכוללנית נמשכה רק עד 2017, אז הספרייה הודיעה על מפנה במדיניות – מעכשיו היא תסנן חלקים מספריית הטוויטר ותתמקד בציוצים הנוגעים לאירועים שיש בהם אינטרס לאומי. ב'ווייט פייפר' בנושא הסבירה ספריית הקונגרס שטוויטר השתנתה עם השנים, ושלספרייה די בכל הציוצים שכבר ברשותה ואשר מתעדים את תקופת עליית הרשת החברתית. יתרה מזאת, היא הוסיפה, אין מה להיות מופתעים מהמהלך – מדיניות הארכוב של הספרייה תמיד הייתה סלקטיבית. גם כאן, חלק ראו את המפנה כמהלך מושכל, ואחרים כינו אותו "כישלון ברמה היסטורית".

ובאמת, ישאל השואל – איזה ערך יש בשימור הטוויטר, או כל רשת חברתית חברתית אחרת? מה חשיבות כל ערימת ההבלים המצויה שם, הבוטים, הפייקים, הציוצים הפוליטיים, שיתופי מנות המסעדות, כמות הלייקים בפוסטים חולפים ומתחלפים, תגובות שטניות, העמדת פנים לסלפי איקס, פוטושופ לסלפי וואי, מידע חסר חשיבות על היום שעבר עלי או על ההוא שמחפש דירה בנסיבות משמחות. כפי שהצהיר האינטלקטואל הצרפתי אלן פינקלקראוט – מה שהולך באינטרנט "זה פח זבל" ("c'est une poubelle"). ואם אכן זה פח אשפה – מה העניין בלהנציח את זה?

האינטרנט הוא פח זבל (מקור: Pawel Czerwinski, Unsplash)

האינטרנט הוא פח זבל. אבל האם אין מה להרוויח מפחי זבל? זה הזמן לזכור שתגליות ארכיולוגיות והיסטוריות חשובות התגלו דווקא בזכות פחי זבל: שאריות האוכל והגללים שהשאירו בני אדם לפני כמה אלפי שנים בנונשלנטיות הם שיעור מאלף לחוקר, ממש בית ספר לאדם. הם לפעמים מלמדים יותר מכל דבר אחר לגבי הרגלי תזונה, חקלאות, ציביליזציה.

מאיפה לנו לדעת מה יועיל למחקר של העתיד ומה לא? קחו למשל את אבן רוזטה שבזכותה פוענח כתב החרטומים המצרי. זוהי כתובת אבן שנחקקה לשעתה – למחוקק, במובן הפשוט של המילה, לא הייתה קמצוץ כוונה שהיא תמלא תפקיד היסטורי. כך גם גניזת קהיר, שאיתה פתחנו את המאמר, ועוד רבים וטובים.

ובמילים אחרות – באיזו זכות נוכל להחליט מה שווה ומה לא? אולי הזבל של היום הוא האוצר של המחר? רק ההיסטוריה יודעת לשפוט.

כונן קשיח מחפש זהות

בהתחלה נאגר האינטרנט כדי להנציח יצירה אנושית בשלמותה. אך אט אט החלו הזדחלו להן שאלות בדבר הניטרליות של הכונן הזה, ותהיות לגבי זהותו.

האם האינטרנט צריך להישמר כפח זבל אחד גדול, מאגר מבולגן וניטרלי שבו מקסימום מידע מהרשת ללא הבדל מקור/חשיבות/רלוונטיות, ושמשאיר לדורות הבאים את החירות לסנן ולהחליט מה מעניין ומה לא?

או שמא יש מקום לעיבוד מסוים: כמו גניזה שבה נשמרים רק החלקים הראויים לכבוד או כמו ספריית הקונגרס האמריקאי ששומרת עכשיו רק את הציוצים בעלי הערך, קרי – אלו שבני האדם של היום החליטו שיהיה להם ערך בראי ההיסטוריה של המחר?

ואולי הארכיון צריך להפוך במרוצת הזמן למוזיאון? קומה ראשונה – תערוכת "נשיאים מהעבר" – קצת טראמפ, קצת אובמה. במתחלפות – תצוגת "קורונה – המגפה (שלא) הייתה". ובאגף הנוער תמצאו את "להיות מילניאל" – מבחר סרטוני טיק-טוק משנות ה-2010. הכל מסודר לביקור, עכשיו רק תבחר.

זו שאלה להיסטוריון שבקהל – מה היית מעדיף אי-שם ב-2050 או 2070 בתור חוקר היסטוריה אינטרנטית? שיעשו לך חצי עבודה ויסדרו לך את עיקרי הדברים יפה יפה, או שישאירו לך את החדר מבולגן, ואתה כבר תדאג לעשות בו סדר? שהארכיונאי העכשווי יהיה איש חמור סבר שמזלזל במה שנחזה כשטויות ברשת, או שייתן את החופש לשמר הכל – כי מי יודע, אולי זה יעניין מישהו מהעתיד?

וזו כמובן גם שאלה לכולנו – איך אנחנו רוצים שיזכרו אותנו? אנחנו מעדיפים להיחקק יחד עם כל האוצרות והשטויות שיודע האינטרנט להציע? או שטוב לנו לזקק את שעותינו היפות, במחיר יומרנות מסוימת כאילו אנחנו יודעים מה טוב ומה רע, מה נכון לשמור, ומה לא?

ולסיום, זחלן אם אתה שומע אותי, ארכב נא את הפוסט הזה – יש בי עוד תקווה שהוא יעניין את דורות העתיד.

(תמונת שער: Anna Shvets, Pexels)

מאמר אורח: מחשבות על אקזיט

על עסקת המיליארדים של מוביט, מידע ציבורי, ואיך כל זה מתחבר לקפיצה קטנה שעשיתי לכנסת במרץ 2018 הרחוקה

במאמר זה אנחנו שמחים לארח את דן ברקת, מדען נתונים, חוקר NLP, חובב תחבורה ציבורית מושבע, מוביל פרוייקט "תחבורה ציבורית פתוחה" בסדנא לידע ציבורי.

המאמר של דן מצטרף למאמרים קודמים שהתפרסמו בבלוג בנושא דאטה: פועלי הדאטה – התאחדו! ו-דאטה, מי ההורים שלך?

לא, ברשומה הבאה אני לא הולך לספר לכם על שאיפות לאקזיט… אלא לשתף במחשבות סביב אקזיט שקרה, אקזיט אמיתי, אקזיט ממשי – האקזיט של מוביט.

מוביט תמיד הייתה מקרה מעניין בעיני בכל הנוגע למידע, כסף והציבור. בדרך כלל חברות מרוויחות ממידע בשיטה הבאה: הן יוצרות פלטפורמה ומושכים אליה משתמשים; המשתמשים פועלים בפלטפורמה; נוצר מזה מידע; החברה אוספת את המידע, סוחרת בו, ומרוויחה. 

אבל במקרה של מוביט השיטה שונה לגמרי: קודם כל היה מידע ואחר כך נוצרה מוביט. מה שמעניין במיוחד הוא שהשירות שמוביט מספקת לנו מבוסס בחלקו המשמעותי על מידע ציבורי, לו"זים של קווים, זמני הגעה, מיקומי תחנות, שאותו אוספת המדינה ושאותו קיבלה מוביט בחינם.

מוביט התחילה את דרכה באיסוף מקורות מידע מרשויות ממשלתיות או מפעילות תחבורה ציבורית הממומנות בכסף ציבורי, ואז עיבדה אותם ועשתה להם סטנדרטיזציה וטיוב. בשלב מסוים אנשי מוביט כן שילבו גם קראוד-סורסינג (איסוף המונים) התנדבותי בסגנון ווייז במסגרתו אנשים תרמו מזמנם כדי למפות את התחבורה הציבורית באזור שלהם וכדי לשפר את זמינות המידע לנוסעים. עם זאת אני מעריך שהמאסה הגדולה של המידע שמספקת האפליקציה עדיין מגיע ממקורות רשמיים וממשלתיים או במימון ממשלתי.

ובמילים פשוטות מוביט הייתה כנראה אחרת, והרבה פחות ממה שהיא, בלי המידע הציבורי.

כסף, מידע ומה שביניהם (אנחנו)

אם עקבתם אחרי החדשות בזמן האחרון כנראה שנחשפתם לעסקת הענק המסתמנת של רכישת מוביט על ידי אינטל תמורת כמעט מיליארד דולר. סכום דמיוני לכל הדעות שאינטל מוכנה לשלם מכל מיני סיבות – על פי הדיווחים וההגיון, המרכזית מביניהם היא מכרה הזהב עליו יושבת מוביט: המידע של חברת התחבורה עשוי להיות עוד אבן דרך בדרכה של אינטל, האמא של מובילאיי, לנצחון במירוץ לרכב האוטונומי.

דה-מרקר (04.02.2020)

בחינת האירוע החדשותי הזה בזכוכית מגדלת מדגיש את התפקיד המעניין מאוד שמשחק המידע בתוך סיפור ההצלחה של מוביט. תפקיד שגם מסבך לגמרי את הדיון המוכר סביב מידע, כסף ואנחנו הציבור העומדים בתווך. 

יש לנו פה מקרה היברידי שבו מקורות מידע ציבוריים היו הכרחיים (ומצליחים) ביצירת ערך לחברה כשמוביט שילבה אותם עם כמות יפה של משתמשים. הסיפור של מוביט הוא סיפור על איך שלא רק שאפשר להפוך אותנו למוצר על ידי שימוש במידע עלינו, או לקחת מאגר ממשלתי ולעשות ממנו קצת כסף (כמו המאגר המשפטי של נבו שמרוויח מחוקי הכנסת הישראלית), אלא גם על איך שניתן להפוך מידע ציבורי לסחורה נחשקת ביותר. מה שצריך הוא לערבב היטב את המידע הציבורי, יחד איתנו, ועם המידע עלינו, עד שמקבלים את הקוקטייל הנכון. בארץ למשל, מוביט אוספת, מציגה ומשתמשת במגוון דרכים במידע שמספק משרד התחבורה על לוח זמני האוטובוסים, המתוכנן כמו גם הלוח בזמן האמת, ולטענתם יש להם בארץ הקודש כשני מיליון משתמשים.

במקרה ממש הסיפור הזה מתחבר לסגירת מעגל קטנה שקרתה לי לפני כחודשיים. לפתע בבוקר יום בהיר, קיבלתי מייל שמבשר שמרכז נתוני זמן האמת החדש של משרד התחבורה בדיוק עלה לאוויר. המעגל נסגר איפשהו באמצע מסמך התיעוד שצורף למייל, שם מופיעים כמה סעיפים שמדברים על פקודות חדשות שיתווספו לממשק שפתוח לציבור. בסעיפים תמימים אלה נאמר שבפקודה פשוטה אחת ניתן יהיה לקבל בזמן אמת את כל נסיעות התחבורה הציבורית שפעילות באותו רגע. תמים אך מהפכני: הפקודות עד היום מאפשרות רק לתשאל תחנה ספציפית ולקבל רק כמה אוטובוסים שבדרך אליה.

לפתע בבוקר יום בהיר קיבלתי מייל שמבשר שמרכז נתוני זמן האמת החדש עולה לאוויר

סעיף 7.15.1 – ניתן יהיה לקבל בזמן אמת את כל נסיעות התחבורה הציבורית שפעילות באותו רגע

זה נראה אולי כמו שינוי פעוט, טכני ויש יגידו קטנוני, אני יודע. אבל בזמנו הוא נראה לי חשוב עד כדי לעלות לירושלים לדיון בכנסת שעסק בנושא. ומי יודע, אולי בדיעבד אפילו מגיע לי קצת קרדיט על זה שהפיצ'רים האלה נכנסו?

ירושלים – הנה אני בא

"בדיוק על זה אנחנו רוצים לשאול. אין לאף אחד בארץ יכולת טובה לשאול על זה ואני יודע שגם אצלכם יש פערים בנושא הזה."

אז זה הייתי אני בדיון בכנסת שהתקיים אי-שם במרץ 2018. בקצרה, הסיפור הלך כך.

ועדת השקיפות של הכנסת שבראשה עמדה ח"כ סתיו שפיר החליטה לעסוק במאגר המידע של משרד התחבורה. מה שראיתי אז לנגד עיני כשניסיתי בתור אזרח מודאג לעבוד עם הנתונים, זה מידע שהוא לכאורה פתוח, אך הוא פתוח בצורה כה מורכבת כך שלמעשה הוא מציב רף כניסה שמשאיר בחוץ את רוב מי שמתעניין, ומאפשר גישה רחבה רק למי שיש לו הזמן והמשאבים לפתח מנגנון תשאול ואיסוף מורכב של המידע. לכן החלטתי לעלות ירושלימה, בגפי.

רציתי מאוד לומר לכנסת את שעל ליבי בנוגע לנתונים של משרד התחבורה. במיוחד רציתי להעיר לגבי הממשקים לציבור הלא מספיק טובים שבהם עיינתי מבעוד מועד בזכות זה שהם נכללו במה שהיה אז מכרז פתוח. אותו מכרז שהביא לנו היום את מרכז הנתונים החדש שאליו התוודעתי במייל.

באחד מסעיפי המכרז היה כתוב שהציבור ימשיך לקבל את המידע בצורת SIRI SM, כפי שהוא, ושרק יוסיפו מגבלות ומכסות על כמויות השאילתות. מה זה SIRI SM אתם שואלים? מדובר בפרוטוקול אחד ממשפחת הפרוטוקולים שבתקן SIRI האירופאי (Standard Interface for Real Time Information), שמספקים מגוון ממשקים למידע בזמן אמת על תחבורה ציבורית. SM הוא קיצור ל-Stop Monitoring, שכשמו כן הוא, מספק אפשרות לקבל מידע על תחנה. וליתר דיוק, בארץ הוא מאפשר לתשאל תחנה בעזרת המספר המזהה הפנימי שלה ולקבל מידע על מספר מוגבל של אוטובוסים שקרובים אליה. הפרוטוקול הזה בארץ נפתח עבור שימושים כמו שלטים אלקטרוניים שמציגים רק זמן הגעה מוערך. במשך מספר שנים זה המידע היחיד שסופק, עד שלפני כשלוש שנים הוסיפו גם קואורדינטות GPS, שלא אמורות להופיע בפרוטוקול המקורי. 

בדיון אמרתי שהמצב של נתוני זמן האמת לא טוב באופן כללי, ושאחד הדברים הראשונים שצריך זה לפתוח את SIRI VM לציבור ולאפשר גישה רחבה לנתונים באופן פשוט. SIRI VM, קיצור ל-Vehicle Monitoring, הוא פרוטוקול שמאפשר מעקב אחרי צי רכבים שלם. בניגוד ל-SIRI SM הוא מאפשר לקבל עדכונים מלאים על כל האוטובוסים הפעילים. 

במקומות אחרים בעולם, כמו ניו יורק לדוגמא, סיפקו כבר מההתחלה לציבור גישה לממשק VM בנוסף ל-SM וממשקים אחרים שמספקים מידע נוסף. כשמפתח מעוניין לקבל מידע על כל הנסיעות הפעילות ב-VM, כל מה שהוא צריך לעשות זה לשלוח שאילתא פשוטה אחת ללא פרמטרים, והוא יקבל חזרה רשימה של כל האוטובוסים כולל מיקום ופרטי GPS נוספים, מיקום יחסי במסלול, נמצא בתחנה או לא וכו'. ב-SM, כדי לקבל מידע על כל הנסיעות הפעילות, המפתח צריך לחקור את לו"ז התחבורה הציבורית (קובץ מורכב וגדול אחר), ולהוציא ממנו את כל המזהים הפנימיים של התחנות והקווים, ליצור כמות גדולה של שאילתות מורכבות שיביאו מידע על כל הקווים, ולהתגבר בעזרת יצירת שאילתות נוספות עם פרמטרים אחרים על המכסות של הממשק (עד 3 רכבים לכל קו). תהליך מורכב שגם אם צולחים אותו, קשה לדעת אם לא פספסנו תחנה, קו או נסיעה בדרך. המורכבות שפרוטוקול ה-SM הנוכחי כופה יצרה רף כניסה מאוד גבוה לעבודה עם הנתונים, גרמה להרבה בעיות וחסמה אפשרויות חשובות.

כולנו יודעים מה זה דיון בכנסת – הרבה אנשים, קצת בלאגן… לא לגמרי (או לגמרי לא) הבינו מי אני ומה אני רוצה עם כל ה-VM וה-SM הזה (כפי שניתן לראות בפרוטוקול הדיון). בדיעבד גיליתי שלמרות זאת, איכשהו זה הגיע לכותרת משנית בתקשורת. עוד יותר בדיעבד התברר לי בשיחות עם אנשים ממשרד התחבורה, שמעבר לבלאגן בדיון, נגרם גם בלאגן קטן עם המשך המכרז. אבל זה כבר סיפור אחר.

כולם יודעים מה זה דיון בכנסת, הרבה אנשים, קצת בלאגן… ועדת השקיפות (תמונה להמחשה מתוך אתר הכנסת)

מכל מקום, בסופו של דבר המים שקטו, המכרז עבר, ואפילו יחסי עם המשרד בכי טוב. אמנם לא קיבלנו גישה ל-VM עליו דיברתי, אבל בסופו של דבר, ושוב, אני לא יודע כמה קרדיט באמת מגיע לי על זה, כן קיבלנו לפחות על הנייר את הפונקציונליות החשובה, שמורידה את הרף והידע הנדרש כדי לקבל ישירות ובאופן מלא מידע על נסיעות. אני אגב ממש מקווה שזה יפתח הזדמנויות לעשות דברים טובים, ושנמשיך הלאה ונשפר בעיות בתוכן המידע עצמו וכמובן בנסיעות ובשירות לנוסעים.

מוביט – הראשונים לזהות

איך כל זה מתחבר לעסקת מוביט? מוביט הם בדיוק מהמעטים שהיו להם בשנים האחרונות המשאבים והרצון לתחזק מנגנוני תשאול, אגירה וניתוח של מידע מהסוג הזה. 

במקביל לשטויות שעשיתי בכנסת, בשנתיים האחרונות עבדתי גם יחד עם עוד מתנדבים אדירים ב"הסדנא לידע ציבורי" על יצירה של מנגנון ומאגר כזה, בקוד פתוח, שיהיה נגיש לכולם, דבר שדורש וממשיך לדרוש המון השקעה בפיתוח ותחזוקה. 

העניין הוא שהרבה מזה היה נחסך אם במשרד התחבורה היו מתייחסים למידע הזה כמו האוצר שהוא. מהמייל המדובר מסתמן שהם הבינו את זה בסוף, אבל איך אומרים… מאוחר מדי, לאט מדי. מוביט מצדם היו חדים והצליחו להבין את זה בזמן. וכאמור זה הביא אותם רחוק מאוד.

גם מבלי לנתח את השאיפות ארוכות הטווח של מוביט ושל אינטל ברכישה הזו, אפשר להניח בוודאות גמורה שטובת הציבור, וספיציפית הציבור בארץ, הן לא בראש מעייניהם. לא שאני טוען שהם מרושעים, אני פשוט אומר שככה זה עובד. 

מנגד, אני מאמין שזה בדיוק מה שאמור להימצא בראש מעייניו של משרד התחבורה. זו משימה לא פשוטה – נדרשת עבודה כדי להבין את הנושא, לחבר אותו לפוליטיקה, לעשות את הדברים ולנהל אותם. ספציפית יש עוד הרבה מה לשפר במרכז הנתונים החדש, אבל כבר עכשיו הוא אמור להקל על הגישה למידע – רשויות מקומיות חלשות, ועדי שכונות, עיתונאים, איגודי עובדים או 'סתם' אזרחים כמוני שרוצים להבין מה לעזאזל קורה בתחבורה הציבורית במדינה.

העניין הגדול יותר הוא התקווה שעסקת מוביט-אינטל תפיל סוף סוף אסימון ביחס לערך העצום שיש במידע ציבורי. בין אם העסקה היא טובה לציבור ובין אם היא לא, אני מקווה שהיא תעלה את המודעות לצורך לתעל את המידע לכיוונים שיועילו לציבור ויתנו לציבור חלק בו. 

זו משימה של משרד התחבורה, ושל המדינה, וכנראה שאנחנו נצטרך להמשיך ולהזכיר להם אותה.

האיש שחשב בתוך קופסאות

שימוש בטכנולוגיה כדי לעקוב אחר האזרחים? לפני המחשבים, אפילו לפני החשמל, היה מי שתכנן מדינת משטרה לתפארת

הפעם המאמר שלנו התפרסם ב"אלכסון" – מוזמנים!

המשטרה מובילה עגלה עמוסה עובדות בזנות, פריס 1745, ציור מאת אטיין ז'ורה. תצלום: The Yorck Project, ויקיפדיה

אפליה של אלגוריתמים – הכצעקתה?

יש חדש תחת השמש? ואם כן – מה?

בפוסט זה נעסוק בהטיה ואפליה של אלגוריתמים. רבות כבר נכתב על הנושא הזה (וגם אנחנו כבר כתבנו על אלגוריתם COMPAS). לפעמים נראה שמדובר בשיח של חרשים, משום שאפילו ההגדרות של שוויון אינן מוסכמות. ברצוני לגשת לבעיה הזאת מנקודת מבט קצת אחרת. ננסה לפצח האם אפליה של אלגוריתמים היא תופעה חדשה או תוצר אבולוציוני של אפליה שתמיד הייתה וגם תמיד תהיה. ואולי דווקא בימינו, נולדות דרכים חדשות להלחם באפליה.

מובן שאפליה כשלעצמה לא התחילה רק לפני כמאה שנה, כשטיורינג המציא את המחשב. אפליה על בסיס מין, גזע, לאום, נטייה מינית וכיו"ב, כבר הייתה קיימת מראשית האנושות. מכאן שהזעקות על "עולם חדש" (ולא "מופלא") של אפליה הן מוגזמות כנראה. ובכלל, שום אלגוריתם לא יקלל, יכה או יהרוג אותך רק בגלל היותך יהודי, זאת לעומת בני אדם שעשו זאת… לפיכך הדיון כאן לא בא לגמד את התופעה, אלא להכניס אותה למסגרת מוכרת יותר של המאבק באפליה.

יש הטוענים שקל יותר לטפל באפליה שגורם אלגוריתם מאשר באפליה שגורמים בני אדם. לא קל להוכיח אפליה הנוצרת בגלל אנשים. איסוף הנתונים יכול להיות יקר ולארוך זמן רב, וייתכן שאז כבר יהיה מאוחר מדי. לעומת זאת, את האלגוריתם אפשר להריץ בזמן קצר, ובעזרת ניתוח תיאורטי למצוא את האפליה. נדגים זאת בעזרת השוואה בין אפליה אנושית לאפליה של אלגוריתם בשוק העבודה.

קורות חיים של מועמדים פוטנציאליים

אדם ואלגוריתם באים להפלות

במחקר מפורסם שנערך ב-2003, שלחו החוקרים אלפי קורות חיים למעסיקים פוטנציאליים. קורות החיים נשלחו כמענה למודעות דרושים שפורסמו בעיתון. המחקר ניסה לענות על השאלה אם יש אפליה כלפי שחורים. החוקרים בחרו אקראית קורות חיים מתוך מאגר שהיה ברשותם, ושלחו שמות שהיו שמות של לבנים במובהק או שמות של שחורים במובהק (למשל, בחירה בשם Emily לעומת Lakisha). התוצאות היו חד-משמעיות. המעסיקים חזרו ל"מועמדים" הלבנים כ-50% יותר מאשר חזרו ל"מועמדים" השחורים. תוצאה זו הייתה יציבה עבור ערים שונות, מקצועות שונים ומין המועמדים.

גם אלגוריתם לגיוס עובדים של אמזון התגלה כמפלה נגד נשים. האלגוריתם חיפש באינטרנט קורות חיים, ושלח הצעות עבודה למועמדים שנראו מתאימים. התברר שאף שלאלגוריתם לא ניתן במפורש מין המועמד, האלגוריתם הצליח לזהות מילים מסוימות הקושרות את המועמד למינו. לדוגמה, המילה “executed” היא מילה נפוצה בקורות חיים של גברים, ואילו Women’s Collage (קולג' לנשים בלבד) יופיע כמובן רק אצל נשים. הסיבה שהאלגוריתם היה מפלה היא משום שהוא "אומן" על החלטות גיוס קודמות של אמזון.

בואו נשווה בין המקרים. כדי להגיע לתוצאות במחקר נדרש זמן רב, עבודה רבה ו"שפני ניסוי" רבים. במחקר שהזכרנו רק שלב איסוף הנתונים ארך שנה שלמה (!). לאלפי אנשים (אמנם וירטואלים) נגרם עוול, רק כדי שנוכל להגיד שקיימת בעיה. וזה עוד לפני שבכלל ניגשים לפתרונות.

בני אדם לא נוטים להשתכנע בקלות שרצוי שיפסיקו להיות גזעניים. נסה לשכנע מגייס, שדחה קורות חיים של אדם שחור, שהוא גזען. אנשים נוטים להתגונן ולא לשנות את התנהגותם.

לעומת זאת, את האפליה של האלגוריתם אפשר היה לאתר על ידי סימולציות בלבד. וברגע שמצאת את הבעיה, פשוט תתקן את הקוד, האלגוריתם לא יתגונן ולא יתלונן …

למרות כל זאת, ברור שלהטיה של אלגוריתמים סכנות משלה. היכולת המדהימה של למידת מכונה לתת אלפי תשובות בשנייה יכולה להיות בעוכרינו. ההשפעה שיכולה להיות לאלגוריתם, בהתחשב בתפוצה והאוטומטיות של התשובות, יכולה להיות עצומה. זהו בדיוק המקום שבו בא לידי ביטוי האופי ה"משתכפל" של הטכנולוגיה. אם האלגוריתם של אמזון היה מופץ גם לחברות אחרות, לדוגמה במסגרת שירותי הענן של אמזון, הוא היה גורם לאפליה בכל העולם! כמו כן אפילו במחקר שהצגנו, היו מגייסים שהפלו לטובה את השחורים דווקא, ואילו אם האלגוריתם של אמזון היה מופץ, ההטיה הייתה לכיוון אחד בלבד.

יתר על כן, אנשים מתייחסים לטכנולוגיה אחרת מאשר להחלטות של בני אדם. אנשים נוטים לייחס לטכנולוגיה אובייקטיביות שאין הם מייחסים לבני אדם. בכל ויכוח אנחנו מנסים "לפצח" את הכוונות הנסתרות של בן שיחנו. לדוגמה, תמיד תעלה התהייה אם מי שמתנגד לאפליה מתקנת הוא גזען בסתר. לעומת זאת, באובייקטיביות של החלטות אלגוריתם איננו מעזים לפקפק. משמציגים לפנינו מספרים וקוד, מיד נשתחווה אפיים ארצה ולא נחשוב על המתכנת ועל הדאטה המסתתרים מאחורי המודל. תופעה זו נפוצה גם בקרב אנשים חסרי גישה לטכנולוגיה וגם בקרב המתפרנסים מכתיבת קוד או מודלים.

נשמע מפחיד? אכן כן. עכשיו דמיינו שנצליח לפתור את האפליה באלגוריתם של אמזון. בבת אחת כל החסרונות שהצגנו הופכים ליתרונות. אמזון תפיץ לכל העולם את שירותי הגיוס השיוויניים שלה, מה שכנראה לא היה מעולם. אף גזען לא יעיז לפקפק בהחלטות של האלגוריתם. ימות המשיח ממש!

הדילמה: ריכוז לעומת ביזור

ריכוז לעומת ביזור

אם כן, ברור שאלגוריתם מפלה הוא בעיה, לאו דווקא חמורה יותר או פחות מאפליה אנושית, אלא שונה. אם תרצו, האלגוריתם עוטף את כל הבעיות הנמצאות בדאטה, ומגיש לנו אותן בבת אחת. אם רוצים לטפל בבעיות אלה, צריך לפתוח את העטיפה ולהבין מה קורה בפנים. לא תמיד הדבר קל, ולפעמים אף בלתי אפשרי, אבל לפחות יש מקום מסוים ויחיד שבו אפשר לחפש. זאת לעומת אפליה הנוצרת על ידי אלפי סוכנים המבצעים החלטות מפלות, כל אחד מסיבותיו הוא, ואולי אף בכיוונים שונים.

אני מניח שיהיו כאלה שיחשבו שעדיף לרכז הכול במקום אחד ולנסות להתמודד איתו שם. כך נוכל להקים רגולטור ייעודיי שיתמחה באפליה. הצוותים האלה יכללו כמובן מהנדסים וסטטיסטיקאים, אבל גם פילוסופים, פסיכולוגים, אנשי דת ואחרים. כך נוכל לפתור בעיות שאנחנו מתמודדים איתן במשך אלפי שנים. דמיינו עולם בלי אפליה, עולם שיש בו אחווה אנושית, עולם הכול חולקים עם הכול…

מן הצד השני, יש אנשים שעצם הרעיון הזה מעורר בהם חלחלה. הרעיון שיהיה רגולטור שיוכל להחליט מהי אפליה יכול בקלות לדרוס דעות ורעיונות. ריכוז הכוח בידי גוף אחד יגרום לכולם להיות מחויבים לעקרונות של אותו הגוף. למשל, אם תיאסר האפליה נגד כבדי משקל, גם חברות אבטחה לא יוכלו לסנן מועמדים כאלה, וזאת עוד טרם הדיון על אפליה מתקנת. לפי גישה זאת עדיפה אפליה מבוזרת, על פני "מניעתה" באופן ממוסד.

לסיכום, התמודדות עם אפליה של אלגוריתמים שונה מהתמודדות שגרתית עם אפליה. האלגוריתם מרכז את כל ההחלטות שעליהן אומן, גם הטובות וגם הרעות. התפוצה הרחבה יכולה להיות קטסטרופה או ברכה. מי ייתן שנצליח.

פועלי הדאטה – התאחדו!

"ארגון משתמשי הפייסבוק מודיע:
ממחר נשבית את כל שיתופי התמונות עד להודעה חדשה!"

כך צעקו כותרות העיתונים באותו בוקר יום א'. צוקרברג המשיך לשדר רוגע ואדישות, אבל מבפנים הוא היה די מוטרד. ואפשר להבין אותו…

עד לא מזמן הוא עוד חשב שיוכל להמשיך לתגמל את יצרני הדאטה בפרוטות. אבל עכשיו, לחץ! הם התאגדו ונמאס להם – השביתה כבר נותנת אותותיה ומניית פייסבוק צונחת בבורסה. בשקט בשקט, הנחה המיליארדר את באי כוחו לקבוע, עוד הלילה אם אפשר, פגישה עם ארגון המשתמשים. אולי זה ייתן קצת מרווח נשימה?

נשמע לכם כמו תרחיש מוזר? כן נכון. אבל יש כאלו שמבחינתם הדמיון הזה הוא תרחיש ורוד.

שני צעדים אחורה

בשני פוסטים קודמים (דאטה איפה ההורים שלך [1], [2]) עסקנו בכאב הראש שגורם לנו מושג ה'דאטה' – איך להגדיר אותו? למי הדאטה שייך: האם לי – כי זה הגיל/מקום המגורים/חברים/תמונות שלי?! או לחברה המסחרית – כי בלי עיבוד המידע שהיא מממנת מכיסה אין למידע שום ערך?

באותם פוסטים הצגנו את הרעיון להכריח את חברות הענק (גוגל, פייסבוק ושות') להפריש דיבידנדים מהרווחים שלהם ולהזרים אותם למשתמשים/בעלי הדאטה כתגמול על שיתוף הדאטה שלהם. כי אם הדאטה שלי שווה כסף – אני רוצה לראות ממנו זוזים! מהזווית הזו הדאטה נתפס כקניין אישי.

אחד המתנגדים לרעיון הזה הוא Glen Weyl. בפוסטים דאז עלה שמו על הדרך. כאן נרחיב בעניינו וברעיונות המוזרים אך מעוררי המחשבה שלו.

לגופו של אדם

Glen Weyl נראה כמו בחור ססגוני יחסית. הוא עובד במייקרוסופט במשרד שאת כותרתו אני ואחרים טרם הצלחנו לפצח (Microsoft Office of the CTO Political Economist and Social Technologist); הוא יועץ בענייני "הקשר בין הכלכלה הגלובאלית לעתיד הטכנולוגיה"; הוא פעיל חברתי-דמוקרטי-סוציאליסטי-מעריץ Ayn Rand, שילוב מעניין לכל הדעות; והוא גם הקים תנועה חברתית בשם RadicalxChange שמטרתה המוצהרת היא "לבנות אלטרנטיבה לקפיטליזם כדי לתקן אי-שוויון ופגיעה בערכים דמוקרטיים".

לגופו של עניין – Data Freedom Act

אחת היוזמות של Weyl ותנועתו מובאת בהצעה בשם: Data Freedom Act.

נקודת המוצא של היוזמה היא שלא נכון להתייחס לדאטה כקניין אישי אלא כאל טובין ציבורי. רוב הדאטה שלי נוצר מאינטראקציה עם אחרים שבעצמם מתקשרים עם אחרים, וכן הלאה. אם הדאטה שלי הוא תמונה – סיכוי טוב שמופיעים בו אחרים; כשאני עושה לייק למישהו, המערכת יודעת שאני אחד מאוהדיו של אותו בר מזל; כשאני מגלה ברשת מי הם הוריי, אחיי או ילדיי – היא לומדת גם עליהם. ויותר מזה – כל המידע שאני מייצר, גם אם הוא רב, לא שווה דבר עד שהוא מצטרף לכל המידע שאחרים מייצרים. במילים אחרות, הדאטה הוא דוגמה קלאסית לפרדוקס הערימה – כל גרגר בפני עצמו לא שווה דבר, ורק צירוף כל הגרגרים הוא שיוצר ערימה נראית לעין. כלומר, אין דאטה, ובמיוחד לא ערך לדאטה, ללא רשת שמחברת בין רסיסיו.

ה-Data Freedom Act טוען שההסתכלות הקניינית-אינדיבידואלית יוצרת שתי מכשלות נוספות. הראשונה היא כלכלית – החברות הגדולות עושות רווח עצום בזמן שהקהילה רואה פרוטות. ובעית שליטה – כשהמידע עובר לידיים זרות, הקהילה מאבדת כל אפשרות להחליט בידי מי הוא יהיה ומה ייעשה בו ("אנחנו לא רוצים שהדאטה שלנו ישמש לבניית מאגר זיהוי פנים!"… "אהם, כן בסדר, שמענו אתכם").

דאטה כעמל – Data as Labor

לכן קוראים Weyl וחבריו לשינוי פרדיגמה. אם הדאטה הוא תוצר-של-קהילה, למה לא לעשות צעד נוסף ולהקים ארגון שינהל אותו באופן קולקטיבי?

במקום להתייחס לעצמנו כאל יחידים המפיקים דאטה וירטואלי כל אחד בד' אמותיו, הם מציעים להתכנס לכדי קהילה מאורגנת של יוצרי דאטה. "השיטוט הוירטואלי הוא עבודה לכל דבר ועניין!", הם אומרים. אנחנו משקיעים זמן ומאמצים, ובצד השני של פס הייצור מופק דאטה בעל ערך – על זה מגיע לקהילה שלנו תגמול!

כחלק מהמהלך הזה הם מבקשים לאזן מחדש את היחסים בין 'יצרני הדאטה' (Data Producers) לבין 'רוכשי הדאטה' (Data Buyers). עד היום היינו אנחנו, משתמשי הרשתות החברתיות, עומדים לבד, חלשים ומדוכאים מול כל הטריקים והשטיקים של ענקיות האינטרנט: חוזי השימוש, אותיות הקטנות, והכל בתיבול קצת תרגילי כלכלה התנהגותית – וכך העדר ממשיך להשתמש בשירותי החברות, ועוד מרגיש שעושים לו טובה עם גישה חינמית. אם רק נדע לאגד את פועלי הדאטה בארגוני גג, בהסתדרויות עובדים, נוכל להילחם בשרירות ליבן של החברות.

מטרת ההסתדרויות היא לעשות לפייסבוק ודומותיה צרות. הענקית תיאלץ לסור לשולחן הדיונים, לנהל משא ומתן, להיענות לדרישות, ולהתחייב לתנאים טובים יותר. בתרשים זה נראה כך:

בני הקהילה מאצילים את הדאטה שלהם לשליטת קואופרטיב דאטה. הוא בתורו מתמקח על זכות השימוש בדאטה מול צרכני הדאטה ומוודא שהם מתנהלים כראוי. הצרכנים מעבירים תמורה לבני הקהילה, שחלקה גם בשירותים טובים יותר או נטולי פרסומת.

בהמשך עשויה להיווצר רשת של ארגונים בעלי מדיניות שונה – חלקם יחרתו על דגלם את השמירה על הפרטיות, ואחרים יציעו למקסם רווח על חשבון הפרטיות.

בשלב זה קיים סיכון של מירוץ לתחתית: כדי למשוך יותר משתמשים ולגזור קופון מוגדל יציע ארגון אחד את הדאטה שלו במחירי רצפה.

אבל… בעיה! כמו שהסברנו למעלה, דאטה הוא תמיד משותף. מכירה במחיר נמוך מדי עשויה למנוע מאחרים, שמידע עליהם זמין בתוך המאגר של הארגון ה'סורר', להשיג מחיר טוב. לכך מוצעים פתרונות שונים: כגון להגדיר כלל הכרעה דמוקרטי על פיו במקרה שבו דאטה הוא משותף ושני ארגונים רוצים למכור במחירים שונים, הרוב יקבע.

זה רק טפח מרעיון שרק הולך ומסתבך. אמת – זה לא כל כך קל לנהל משאב משותף למיליארדים…

הצטרפו עוד היום…

צריך להגיד שהרעיון של Weyl לא נפל על אזניים ערלות, ויש ברחבי האינטרנט כמה כוכבים שמעוניינים מאוד שתצטרפו לארגוני הדאטה שלהם.

Bas Van der Gaag, מורה למתמטיקה מהולנד, הקים את ה-Data Union ואף זכה לתמיכה פוליטית מסוימת. התאגדות אחרת נקראת Data Workers Union, ושולחת מסרים מילטנטים למדי: "אנחנו 7.6 מיליארד עובדים, שמייצרים 2.9 אקסה-בייט של דאטה ביום, 24 שעות ביום; צריך להתנגד לגוגל-פייסבוק; להילחם על הפרטיות; הדאטה הוא של הכלל ולא של הפרט!". והכי נועז: הצטרפות לארגון דאטה היא דרך להילחם ב'קולוניאליזם הדיגיטאלי' של מדינות המערב הבולעות את גולשי המדינות החלשות אל תוך שורות משתמשיהם, ועוד תחת מעטה של 'טכנולוגיה הומניטארית'!

Data Workers Union
7.6 מיליארד פועלים, 2.9 אקסה-בייט של דאטה ביום, 24 שעות ביממה.
צריך להפוך הכל לתגמול על עבודה.

התרופה חמורה מן המחלה!

חדי העין מביניכם זיהו אולי את הנימה המעט-משועשעת של הפוסט הזה. זה לא מתוך זלזול ברעיון, שהוא לכל הפחות מקורי ומעורר מחשבה.

העניין הוא שיש לי תחושה שחסרונות השיטה המוצעת עולים בהרבה על הבעיה שהיא מתכוונת לפתור – ובפרפראזה על טראמפ על הקורונה:"The cure is worse than the disease".

הרצון התמים לפתור את הבעיה המורכבת של הדאטה, הביאה במקרה שהוצג כאן למנגנון מסובך מדי. אני שם בצד את ההיבט המיליטנטי והאנטי-קפיטליסטי, שהוא גם עניין של טעם ודעה. אבל המשמעות של בליל של ארגוני דאטה חדשים היא היווצרות קבוצות אינטרס חדשות, מתחרות ומסוכסכות. במחלוקות צריך להכריע, כדי להכריע צריך מכריעים עם לגיטימיות, ולגיטימציה זה תמיד עילה לפוליטיקה מלוכלכלת. כמובן שיהיו גם ארגונים סוררים, שעליהם נרצה לאכוף את ההחלטות – מי יאכוף? איך יאכוף? הכל יהפוך לסלט אחד גדול, לית דין ולית דיין, וזה עוד מבלי לקחת בחשבון את ההפרד ומשול שהחברות הגדולות ינסו לעשות.

וגם – כיצד משכנעים אנשים רגילים להצטרף לרעיון הזה? איך פונים ל"משתמשי הפייסבוק" – זו קבוצה ערטילאית לגמרי, ללא זהות מובחנת, לא ריכוזית בעליל. חוץ מכמה משוגעים לדבר שמסוגלים לדמיין מה זה דאטה, ולעשות עם זה משהו – אני לא רואה איך מגייסים המונים לעניין.

הנקודה השלישית היא הרעיון על פיו יצירת דאטה=עבודה. בהיבט הזה אני חושב ש-Weyl וה-Data Freedom Act פישלו לגמרי. אני מדמיין את התהליך המחשבתי שלהם ככזה:"אההםםם דאטה זה מושג מסובך, צריך להחזיר את השליטה עליו… איך נמשיג את זה? עבודה! כן, זה לא רע!". לעניות דעתי הם לא חשב על ההשלכות הערכיות העמוקות של הדבר הזה. האם בני אדם ירוויחו מהתייחסות לכל שימוש שלהם באינטרנט כאילו זו עבודת כפיים? אני חושב שלא.

הפיכת ייצור הדאטה לעבודה היא עוד צעד בערבוב המוגזם בין עבודה לפנאי, בין הפומבי לאישי, בין אינטימיות לבין חשיפה – עוד שלב בהפיכת "הכל" למסחרי וממוסחר. כי אם הכל עבודה, אז איפה המרחב ה"נקי" הניטרלי (יחסית) שלי? איפה המרחב שבו אני לא נתפס, ולא תופס את עצמי, כיצרן של משהו אלא פשוט כאדם פשוט?

אמנם, נכון הדבר, אנחנו חיים בעולם מטושטש – אני יכול להשכיר פינת חדר ב-Airbnb להציע את הרכב ל-Carpool מניב, ולהציע שירותים לפי שעה כ-Gig Worker. אבל בסופו של דבר אנחנו עדיין נהנים ומאמינים בהפרדה היסודית בין עבודה לבין כל השאר.

עבודה היא המקום בו אנחנו עובדים בשביל להרוויח כסף/ליצור/להעצים את יכולותינו (מחקו את המיותר). השאר, בניגוד לכך, הוא הזמן לבילוי/מרגוע/בניית זהות/התקפלות… יצירת דאטה היא רק תוצר לוואי של העבודה או של גלישה ופעולת שיתוף מידע ברשת – במקומות האלו אני ממש לא רוצה לשמוע על "יצירה" ו"עבודה". Data As Labor מערער על היסודות ההפרדה הזו: אם יצירת דאטה היא עבודה לכל דבר ועניין – אז כל מה שאני עושה יום וליל (חוץ משעות השינה שם אני מייצר בעיקר נחירות שגם אותן אפשר לנצל) – הוא בעצם עבודה (תסתכלו שוב  על התמונה למעלה >>> 24 שעות ביממה!).

אם יצירת דאטה היא עבודה לכל ודבר ועניין – אז כל מה שאני עושה יום וליל הוא בעצם עבודה.
(חוץ משעות השינה שם אני מייצר בעיקר נחירות, שגם אותן אפשר לנצל.)

קראו לי תמים שרוצה להתעלם מזה שצפיית הנטפליקס שלי היא עוד יצירת דאטה שמנוצלת בידי החזקים. אבל בעיני Data as Labor הוא דוגמה לקריאת שחרור ושוויון מלאת רצון טוב שבמקום להעצים את החברה האנושית, מסכנת את האנושיות הפשוטה של האדם.