מאמר אורח: מחשבות על אקזיט

על עסקת המיליארדים של מוביט, מידע ציבורי, ואיך כל זה מתחבר לקפיצה קטנה שעשיתי לכנסת במרץ 2018 הרחוקה

במאמר זה אנחנו שמחים לארח את דן ברקת, מדען נתונים, חוקר NLP, חובב תחבורה ציבורית מושבע, מוביל פרוייקט "תחבורה ציבורית פתוחה" בסדנא לידע ציבורי.

המאמר של דן מצטרף למאמרים קודמים שהתפרסמו בבלוג בנושא דאטה: פועלי הדאטה – התאחדו! ו-דאטה, מי ההורים שלך?

לא, ברשומה הבאה אני לא הולך לספר לכם על שאיפות לאקזיט… אלא לשתף במחשבות סביב אקזיט שקרה, אקזיט אמיתי, אקזיט ממשי – האקזיט של מוביט.

מוביט תמיד הייתה מקרה מעניין בעיני בכל הנוגע למידע, כסף והציבור. בדרך כלל חברות מרוויחות ממידע בשיטה הבאה: הן יוצרות פלטפורמה ומושכים אליה משתמשים; המשתמשים פועלים בפלטפורמה; נוצר מזה מידע; החברה אוספת את המידע, סוחרת בו, ומרוויחה. 

אבל במקרה של מוביט השיטה שונה לגמרי: קודם כל היה מידע ואחר כך נוצרה מוביט. מה שמעניין במיוחד הוא שהשירות שמוביט מספקת לנו מבוסס בחלקו המשמעותי על מידע ציבורי, לו"זים של קווים, זמני הגעה, מיקומי תחנות, שאותו אוספת המדינה ושאותו קיבלה מוביט בחינם.

מוביט התחילה את דרכה באיסוף מקורות מידע מרשויות ממשלתיות או מפעילות תחבורה ציבורית הממומנות בכסף ציבורי, ואז עיבדה אותם ועשתה להם סטנדרטיזציה וטיוב. בשלב מסוים אנשי מוביט כן שילבו גם קראוד-סורסינג (איסוף המונים) התנדבותי בסגנון ווייז במסגרתו אנשים תרמו מזמנם כדי למפות את התחבורה הציבורית באזור שלהם וכדי לשפר את זמינות המידע לנוסעים. עם זאת אני מעריך שהמאסה הגדולה של המידע שמספקת האפליקציה עדיין מגיע ממקורות רשמיים וממשלתיים או במימון ממשלתי.

ובמילים פשוטות מוביט הייתה כנראה אחרת, והרבה פחות ממה שהיא, בלי המידע הציבורי.

כסף, מידע ומה שביניהם (אנחנו)

אם עקבתם אחרי החדשות בזמן האחרון כנראה שנחשפתם לעסקת הענק המסתמנת של רכישת מוביט על ידי אינטל תמורת כמעט מיליארד דולר. סכום דמיוני לכל הדעות שאינטל מוכנה לשלם מכל מיני סיבות – על פי הדיווחים וההגיון, המרכזית מביניהם היא מכרה הזהב עליו יושבת מוביט: המידע של חברת התחבורה עשוי להיות עוד אבן דרך בדרכה של אינטל, האמא של מובילאיי, לנצחון במירוץ לרכב האוטונומי.

דה-מרקר (04.02.2020)

בחינת האירוע החדשותי הזה בזכוכית מגדלת מדגיש את התפקיד המעניין מאוד שמשחק המידע בתוך סיפור ההצלחה של מוביט. תפקיד שגם מסבך לגמרי את הדיון המוכר סביב מידע, כסף ואנחנו הציבור העומדים בתווך. 

יש לנו פה מקרה היברידי שבו מקורות מידע ציבוריים היו הכרחיים (ומצליחים) ביצירת ערך לחברה כשמוביט שילבה אותם עם כמות יפה של משתמשים. הסיפור של מוביט הוא סיפור על איך שלא רק שאפשר להפוך אותנו למוצר על ידי שימוש במידע עלינו, או לקחת מאגר ממשלתי ולעשות ממנו קצת כסף (כמו המאגר המשפטי של נבו שמרוויח מחוקי הכנסת הישראלית), אלא גם על איך שניתן להפוך מידע ציבורי לסחורה נחשקת ביותר. מה שצריך הוא לערבב היטב את המידע הציבורי, יחד איתנו, ועם המידע עלינו, עד שמקבלים את הקוקטייל הנכון. בארץ למשל, מוביט אוספת, מציגה ומשתמשת במגוון דרכים במידע שמספק משרד התחבורה על לוח זמני האוטובוסים, המתוכנן כמו גם הלוח בזמן האמת, ולטענתם יש להם בארץ הקודש כשני מיליון משתמשים.

במקרה ממש הסיפור הזה מתחבר לסגירת מעגל קטנה שקרתה לי לפני כחודשיים. לפתע בבוקר יום בהיר, קיבלתי מייל שמבשר שמרכז נתוני זמן האמת החדש של משרד התחבורה בדיוק עלה לאוויר. המעגל נסגר איפשהו באמצע מסמך התיעוד שצורף למייל, שם מופיעים כמה סעיפים שמדברים על פקודות חדשות שיתווספו לממשק שפתוח לציבור. בסעיפים תמימים אלה נאמר שבפקודה פשוטה אחת ניתן יהיה לקבל בזמן אמת את כל נסיעות התחבורה הציבורית שפעילות באותו רגע. תמים אך מהפכני: הפקודות עד היום מאפשרות רק לתשאל תחנה ספציפית ולקבל רק כמה אוטובוסים שבדרך אליה.

לפתע בבוקר יום בהיר קיבלתי מייל שמבשר שמרכז נתוני זמן האמת החדש עולה לאוויר

סעיף 7.15.1 – ניתן יהיה לקבל בזמן אמת את כל נסיעות התחבורה הציבורית שפעילות באותו רגע

זה נראה אולי כמו שינוי פעוט, טכני ויש יגידו קטנוני, אני יודע. אבל בזמנו הוא נראה לי חשוב עד כדי לעלות לירושלים לדיון בכנסת שעסק בנושא. ומי יודע, אולי בדיעבד אפילו מגיע לי קצת קרדיט על זה שהפיצ'רים האלה נכנסו?

ירושלים – הנה אני בא

"בדיוק על זה אנחנו רוצים לשאול. אין לאף אחד בארץ יכולת טובה לשאול על זה ואני יודע שגם אצלכם יש פערים בנושא הזה."

אז זה הייתי אני בדיון בכנסת שהתקיים אי-שם במרץ 2018. בקצרה, הסיפור הלך כך.

ועדת השקיפות של הכנסת שבראשה עמדה ח"כ סתיו שפיר החליטה לעסוק במאגר המידע של משרד התחבורה. מה שראיתי אז לנגד עיני כשניסיתי בתור אזרח מודאג לעבוד עם הנתונים, זה מידע שהוא לכאורה פתוח, אך הוא פתוח בצורה כה מורכבת כך שלמעשה הוא מציב רף כניסה שמשאיר בחוץ את רוב מי שמתעניין, ומאפשר גישה רחבה רק למי שיש לו הזמן והמשאבים לפתח מנגנון תשאול ואיסוף מורכב של המידע. לכן החלטתי לעלות ירושלימה, בגפי.

רציתי מאוד לומר לכנסת את שעל ליבי בנוגע לנתונים של משרד התחבורה. במיוחד רציתי להעיר לגבי הממשקים לציבור הלא מספיק טובים שבהם עיינתי מבעוד מועד בזכות זה שהם נכללו במה שהיה אז מכרז פתוח. אותו מכרז שהביא לנו היום את מרכז הנתונים החדש שאליו התוודעתי במייל.

באחד מסעיפי המכרז היה כתוב שהציבור ימשיך לקבל את המידע בצורת SIRI SM, כפי שהוא, ושרק יוסיפו מגבלות ומכסות על כמויות השאילתות. מה זה SIRI SM אתם שואלים? מדובר בפרוטוקול אחד ממשפחת הפרוטוקולים שבתקן SIRI האירופאי (Standard Interface for Real Time Information), שמספקים מגוון ממשקים למידע בזמן אמת על תחבורה ציבורית. SM הוא קיצור ל-Stop Monitoring, שכשמו כן הוא, מספק אפשרות לקבל מידע על תחנה. וליתר דיוק, בארץ הוא מאפשר לתשאל תחנה בעזרת המספר המזהה הפנימי שלה ולקבל מידע על מספר מוגבל של אוטובוסים שקרובים אליה. הפרוטוקול הזה בארץ נפתח עבור שימושים כמו שלטים אלקטרוניים שמציגים רק זמן הגעה מוערך. במשך מספר שנים זה המידע היחיד שסופק, עד שלפני כשלוש שנים הוסיפו גם קואורדינטות GPS, שלא אמורות להופיע בפרוטוקול המקורי. 

בדיון אמרתי שהמצב של נתוני זמן האמת לא טוב באופן כללי, ושאחד הדברים הראשונים שצריך זה לפתוח את SIRI VM לציבור ולאפשר גישה רחבה לנתונים באופן פשוט. SIRI VM, קיצור ל-Vehicle Monitoring, הוא פרוטוקול שמאפשר מעקב אחרי צי רכבים שלם. בניגוד ל-SIRI SM הוא מאפשר לקבל עדכונים מלאים על כל האוטובוסים הפעילים. 

במקומות אחרים בעולם, כמו ניו יורק לדוגמא, סיפקו כבר מההתחלה לציבור גישה לממשק VM בנוסף ל-SM וממשקים אחרים שמספקים מידע נוסף. כשמפתח מעוניין לקבל מידע על כל הנסיעות הפעילות ב-VM, כל מה שהוא צריך לעשות זה לשלוח שאילתא פשוטה אחת ללא פרמטרים, והוא יקבל חזרה רשימה של כל האוטובוסים כולל מיקום ופרטי GPS נוספים, מיקום יחסי במסלול, נמצא בתחנה או לא וכו'. ב-SM, כדי לקבל מידע על כל הנסיעות הפעילות, המפתח צריך לחקור את לו"ז התחבורה הציבורית (קובץ מורכב וגדול אחר), ולהוציא ממנו את כל המזהים הפנימיים של התחנות והקווים, ליצור כמות גדולה של שאילתות מורכבות שיביאו מידע על כל הקווים, ולהתגבר בעזרת יצירת שאילתות נוספות עם פרמטרים אחרים על המכסות של הממשק (עד 3 רכבים לכל קו). תהליך מורכב שגם אם צולחים אותו, קשה לדעת אם לא פספסנו תחנה, קו או נסיעה בדרך. המורכבות שפרוטוקול ה-SM הנוכחי כופה יצרה רף כניסה מאוד גבוה לעבודה עם הנתונים, גרמה להרבה בעיות וחסמה אפשרויות חשובות.

כולנו יודעים מה זה דיון בכנסת – הרבה אנשים, קצת בלאגן… לא לגמרי (או לגמרי לא) הבינו מי אני ומה אני רוצה עם כל ה-VM וה-SM הזה (כפי שניתן לראות בפרוטוקול הדיון). בדיעבד גיליתי שלמרות זאת, איכשהו זה הגיע לכותרת משנית בתקשורת. עוד יותר בדיעבד התברר לי בשיחות עם אנשים ממשרד התחבורה, שמעבר לבלאגן בדיון, נגרם גם בלאגן קטן עם המשך המכרז. אבל זה כבר סיפור אחר.

כולם יודעים מה זה דיון בכנסת, הרבה אנשים, קצת בלאגן… ועדת השקיפות (תמונה להמחשה מתוך אתר הכנסת)

מכל מקום, בסופו של דבר המים שקטו, המכרז עבר, ואפילו יחסי עם המשרד בכי טוב. אמנם לא קיבלנו גישה ל-VM עליו דיברתי, אבל בסופו של דבר, ושוב, אני לא יודע כמה קרדיט באמת מגיע לי על זה, כן קיבלנו לפחות על הנייר את הפונקציונליות החשובה, שמורידה את הרף והידע הנדרש כדי לקבל ישירות ובאופן מלא מידע על נסיעות. אני אגב ממש מקווה שזה יפתח הזדמנויות לעשות דברים טובים, ושנמשיך הלאה ונשפר בעיות בתוכן המידע עצמו וכמובן בנסיעות ובשירות לנוסעים.

מוביט – הראשונים לזהות

איך כל זה מתחבר לעסקת מוביט? מוביט הם בדיוק מהמעטים שהיו להם בשנים האחרונות המשאבים והרצון לתחזק מנגנוני תשאול, אגירה וניתוח של מידע מהסוג הזה. 

במקביל לשטויות שעשיתי בכנסת, בשנתיים האחרונות עבדתי גם יחד עם עוד מתנדבים אדירים ב"הסדנא לידע ציבורי" על יצירה של מנגנון ומאגר כזה, בקוד פתוח, שיהיה נגיש לכולם, דבר שדורש וממשיך לדרוש המון השקעה בפיתוח ותחזוקה. 

העניין הוא שהרבה מזה היה נחסך אם במשרד התחבורה היו מתייחסים למידע הזה כמו האוצר שהוא. מהמייל המדובר מסתמן שהם הבינו את זה בסוף, אבל איך אומרים… מאוחר מדי, לאט מדי. מוביט מצדם היו חדים והצליחו להבין את זה בזמן. וכאמור זה הביא אותם רחוק מאוד.

גם מבלי לנתח את השאיפות ארוכות הטווח של מוביט ושל אינטל ברכישה הזו, אפשר להניח בוודאות גמורה שטובת הציבור, וספיציפית הציבור בארץ, הן לא בראש מעייניהם. לא שאני טוען שהם מרושעים, אני פשוט אומר שככה זה עובד. 

מנגד, אני מאמין שזה בדיוק מה שאמור להימצא בראש מעייניו של משרד התחבורה. זו משימה לא פשוטה – נדרשת עבודה כדי להבין את הנושא, לחבר אותו לפוליטיקה, לעשות את הדברים ולנהל אותם. ספציפית יש עוד הרבה מה לשפר במרכז הנתונים החדש, אבל כבר עכשיו הוא אמור להקל על הגישה למידע – רשויות מקומיות חלשות, ועדי שכונות, עיתונאים, איגודי עובדים או 'סתם' אזרחים כמוני שרוצים להבין מה לעזאזל קורה בתחבורה הציבורית במדינה.

העניין הגדול יותר הוא התקווה שעסקת מוביט-אינטל תפיל סוף סוף אסימון ביחס לערך העצום שיש במידע ציבורי. בין אם העסקה היא טובה לציבור ובין אם היא לא, אני מקווה שהיא תעלה את המודעות לצורך לתעל את המידע לכיוונים שיועילו לציבור ויתנו לציבור חלק בו. 

זו משימה של משרד התחבורה, ושל המדינה, וכנראה שאנחנו נצטרך להמשיך ולהזכיר להם אותה.

פועלי הדאטה – התאחדו!

"ארגון משתמשי הפייסבוק מודיע:
ממחר נשבית את כל שיתופי התמונות עד להודעה חדשה!"

כך צעקו כותרות העיתונים באותו בוקר יום א'. צוקרברג המשיך לשדר רוגע ואדישות, אבל מבפנים הוא היה די מוטרד. ואפשר להבין אותו…

עד לא מזמן הוא עוד חשב שיוכל להמשיך לתגמל את יצרני הדאטה בפרוטות. אבל עכשיו, לחץ! הם התאגדו ונמאס להם – השביתה כבר נותנת אותותיה ומניית פייסבוק צונחת בבורסה. בשקט בשקט, הנחה המיליארדר את באי כוחו לקבוע, עוד הלילה אם אפשר, פגישה עם ארגון המשתמשים. אולי זה ייתן קצת מרווח נשימה?

נשמע לכם כמו תרחיש מוזר? כן נכון. אבל יש כאלו שמבחינתם הדמיון הזה הוא תרחיש ורוד.

שני צעדים אחורה

בשני פוסטים קודמים (דאטה איפה ההורים שלך [1], [2]) עסקנו בכאב הראש שגורם לנו מושג ה'דאטה' – איך להגדיר אותו? למי הדאטה שייך: האם לי – כי זה הגיל/מקום המגורים/חברים/תמונות שלי?! או לחברה המסחרית – כי בלי עיבוד המידע שהיא מממנת מכיסה אין למידע שום ערך?

באותם פוסטים הצגנו את הרעיון להכריח את חברות הענק (גוגל, פייסבוק ושות') להפריש דיבידנדים מהרווחים שלהם ולהזרים אותם למשתמשים/בעלי הדאטה כתגמול על שיתוף הדאטה שלהם. כי אם הדאטה שלי שווה כסף – אני רוצה לראות ממנו זוזים! מהזווית הזו הדאטה נתפס כקניין אישי.

אחד המתנגדים לרעיון הזה הוא Glen Weyl. בפוסטים דאז עלה שמו על הדרך. כאן נרחיב בעניינו וברעיונות המוזרים אך מעוררי המחשבה שלו.

לגופו של אדם

Glen Weyl נראה כמו בחור ססגוני יחסית. הוא עובד במייקרוסופט במשרד שאת כותרתו אני ואחרים טרם הצלחנו לפצח (Microsoft Office of the CTO Political Economist and Social Technologist); הוא יועץ בענייני "הקשר בין הכלכלה הגלובאלית לעתיד הטכנולוגיה"; הוא פעיל חברתי-דמוקרטי-סוציאליסטי-מעריץ Ayn Rand, שילוב מעניין לכל הדעות; והוא גם הקים תנועה חברתית בשם RadicalxChange שמטרתה המוצהרת היא "לבנות אלטרנטיבה לקפיטליזם כדי לתקן אי-שוויון ופגיעה בערכים דמוקרטיים".

לגופו של עניין – Data Freedom Act

אחת היוזמות של Weyl ותנועתו מובאת בהצעה בשם: Data Freedom Act.

נקודת המוצא של היוזמה היא שלא נכון להתייחס לדאטה כקניין אישי אלא כאל טובין ציבורי. רוב הדאטה שלי נוצר מאינטראקציה עם אחרים שבעצמם מתקשרים עם אחרים, וכן הלאה. אם הדאטה שלי הוא תמונה – סיכוי טוב שמופיעים בו אחרים; כשאני עושה לייק למישהו, המערכת יודעת שאני אחד מאוהדיו של אותו בר מזל; כשאני מגלה ברשת מי הם הוריי, אחיי או ילדיי – היא לומדת גם עליהם. ויותר מזה – כל המידע שאני מייצר, גם אם הוא רב, לא שווה דבר עד שהוא מצטרף לכל המידע שאחרים מייצרים. במילים אחרות, הדאטה הוא דוגמה קלאסית לפרדוקס הערימה – כל גרגר בפני עצמו לא שווה דבר, ורק צירוף כל הגרגרים הוא שיוצר ערימה נראית לעין. כלומר, אין דאטה, ובמיוחד לא ערך לדאטה, ללא רשת שמחברת בין רסיסיו.

ה-Data Freedom Act טוען שההסתכלות הקניינית-אינדיבידואלית יוצרת שתי מכשלות נוספות. הראשונה היא כלכלית – החברות הגדולות עושות רווח עצום בזמן שהקהילה רואה פרוטות. ובעית שליטה – כשהמידע עובר לידיים זרות, הקהילה מאבדת כל אפשרות להחליט בידי מי הוא יהיה ומה ייעשה בו ("אנחנו לא רוצים שהדאטה שלנו ישמש לבניית מאגר זיהוי פנים!"… "אהם, כן בסדר, שמענו אתכם").

דאטה כעמל – Data as Labor

לכן קוראים Weyl וחבריו לשינוי פרדיגמה. אם הדאטה הוא תוצר-של-קהילה, למה לא לעשות צעד נוסף ולהקים ארגון שינהל אותו באופן קולקטיבי?

במקום להתייחס לעצמנו כאל יחידים המפיקים דאטה וירטואלי כל אחד בד' אמותיו, הם מציעים להתכנס לכדי קהילה מאורגנת של יוצרי דאטה. "השיטוט הוירטואלי הוא עבודה לכל דבר ועניין!", הם אומרים. אנחנו משקיעים זמן ומאמצים, ובצד השני של פס הייצור מופק דאטה בעל ערך – על זה מגיע לקהילה שלנו תגמול!

כחלק מהמהלך הזה הם מבקשים לאזן מחדש את היחסים בין 'יצרני הדאטה' (Data Producers) לבין 'רוכשי הדאטה' (Data Buyers). עד היום היינו אנחנו, משתמשי הרשתות החברתיות, עומדים לבד, חלשים ומדוכאים מול כל הטריקים והשטיקים של ענקיות האינטרנט: חוזי השימוש, אותיות הקטנות, והכל בתיבול קצת תרגילי כלכלה התנהגותית – וכך העדר ממשיך להשתמש בשירותי החברות, ועוד מרגיש שעושים לו טובה עם גישה חינמית. אם רק נדע לאגד את פועלי הדאטה בארגוני גג, בהסתדרויות עובדים, נוכל להילחם בשרירות ליבן של החברות.

מטרת ההסתדרויות היא לעשות לפייסבוק ודומותיה צרות. הענקית תיאלץ לסור לשולחן הדיונים, לנהל משא ומתן, להיענות לדרישות, ולהתחייב לתנאים טובים יותר. בתרשים זה נראה כך:

בני הקהילה מאצילים את הדאטה שלהם לשליטת קואופרטיב דאטה. הוא בתורו מתמקח על זכות השימוש בדאטה מול צרכני הדאטה ומוודא שהם מתנהלים כראוי. הצרכנים מעבירים תמורה לבני הקהילה, שחלקה גם בשירותים טובים יותר או נטולי פרסומת.

בהמשך עשויה להיווצר רשת של ארגונים בעלי מדיניות שונה – חלקם יחרתו על דגלם את השמירה על הפרטיות, ואחרים יציעו למקסם רווח על חשבון הפרטיות.

בשלב זה קיים סיכון של מירוץ לתחתית: כדי למשוך יותר משתמשים ולגזור קופון מוגדל יציע ארגון אחד את הדאטה שלו במחירי רצפה.

אבל… בעיה! כמו שהסברנו למעלה, דאטה הוא תמיד משותף. מכירה במחיר נמוך מדי עשויה למנוע מאחרים, שמידע עליהם זמין בתוך המאגר של הארגון ה'סורר', להשיג מחיר טוב. לכך מוצעים פתרונות שונים: כגון להגדיר כלל הכרעה דמוקרטי על פיו במקרה שבו דאטה הוא משותף ושני ארגונים רוצים למכור במחירים שונים, הרוב יקבע.

זה רק טפח מרעיון שרק הולך ומסתבך. אמת – זה לא כל כך קל לנהל משאב משותף למיליארדים…

הצטרפו עוד היום…

צריך להגיד שהרעיון של Weyl לא נפל על אזניים ערלות, ויש ברחבי האינטרנט כמה כוכבים שמעוניינים מאוד שתצטרפו לארגוני הדאטה שלהם.

Bas Van der Gaag, מורה למתמטיקה מהולנד, הקים את ה-Data Union ואף זכה לתמיכה פוליטית מסוימת. התאגדות אחרת נקראת Data Workers Union, ושולחת מסרים מילטנטים למדי: "אנחנו 7.6 מיליארד עובדים, שמייצרים 2.9 אקסה-בייט של דאטה ביום, 24 שעות ביום; צריך להתנגד לגוגל-פייסבוק; להילחם על הפרטיות; הדאטה הוא של הכלל ולא של הפרט!". והכי נועז: הצטרפות לארגון דאטה היא דרך להילחם ב'קולוניאליזם הדיגיטאלי' של מדינות המערב הבולעות את גולשי המדינות החלשות אל תוך שורות משתמשיהם, ועוד תחת מעטה של 'טכנולוגיה הומניטארית'!

Data Workers Union
7.6 מיליארד פועלים, 2.9 אקסה-בייט של דאטה ביום, 24 שעות ביממה.
צריך להפוך הכל לתגמול על עבודה.

התרופה חמורה מן המחלה!

חדי העין מביניכם זיהו אולי את הנימה המעט-משועשעת של הפוסט הזה. זה לא מתוך זלזול ברעיון, שהוא לכל הפחות מקורי ומעורר מחשבה.

העניין הוא שיש לי תחושה שחסרונות השיטה המוצעת עולים בהרבה על הבעיה שהיא מתכוונת לפתור – ובפרפראזה על טראמפ על הקורונה:"The cure is worse than the disease".

הרצון התמים לפתור את הבעיה המורכבת של הדאטה, הביאה במקרה שהוצג כאן למנגנון מסובך מדי. אני שם בצד את ההיבט המיליטנטי והאנטי-קפיטליסטי, שהוא גם עניין של טעם ודעה. אבל המשמעות של בליל של ארגוני דאטה חדשים היא היווצרות קבוצות אינטרס חדשות, מתחרות ומסוכסכות. במחלוקות צריך להכריע, כדי להכריע צריך מכריעים עם לגיטימיות, ולגיטימציה זה תמיד עילה לפוליטיקה מלוכלכלת. כמובן שיהיו גם ארגונים סוררים, שעליהם נרצה לאכוף את ההחלטות – מי יאכוף? איך יאכוף? הכל יהפוך לסלט אחד גדול, לית דין ולית דיין, וזה עוד מבלי לקחת בחשבון את ההפרד ומשול שהחברות הגדולות ינסו לעשות.

וגם – כיצד משכנעים אנשים רגילים להצטרף לרעיון הזה? איך פונים ל"משתמשי הפייסבוק" – זו קבוצה ערטילאית לגמרי, ללא זהות מובחנת, לא ריכוזית בעליל. חוץ מכמה משוגעים לדבר שמסוגלים לדמיין מה זה דאטה, ולעשות עם זה משהו – אני לא רואה איך מגייסים המונים לעניין.

הנקודה השלישית היא הרעיון על פיו יצירת דאטה=עבודה. בהיבט הזה אני חושב ש-Weyl וה-Data Freedom Act פישלו לגמרי. אני מדמיין את התהליך המחשבתי שלהם ככזה:"אההםםם דאטה זה מושג מסובך, צריך להחזיר את השליטה עליו… איך נמשיג את זה? עבודה! כן, זה לא רע!". לעניות דעתי הם לא חשב על ההשלכות הערכיות העמוקות של הדבר הזה. האם בני אדם ירוויחו מהתייחסות לכל שימוש שלהם באינטרנט כאילו זו עבודת כפיים? אני חושב שלא.

הפיכת ייצור הדאטה לעבודה היא עוד צעד בערבוב המוגזם בין עבודה לפנאי, בין הפומבי לאישי, בין אינטימיות לבין חשיפה – עוד שלב בהפיכת "הכל" למסחרי וממוסחר. כי אם הכל עבודה, אז איפה המרחב ה"נקי" הניטרלי (יחסית) שלי? איפה המרחב שבו אני לא נתפס, ולא תופס את עצמי, כיצרן של משהו אלא פשוט כאדם פשוט?

אמנם, נכון הדבר, אנחנו חיים בעולם מטושטש – אני יכול להשכיר פינת חדר ב-Airbnb להציע את הרכב ל-Carpool מניב, ולהציע שירותים לפי שעה כ-Gig Worker. אבל בסופו של דבר אנחנו עדיין נהנים ומאמינים בהפרדה היסודית בין עבודה לבין כל השאר.

עבודה היא המקום בו אנחנו עובדים בשביל להרוויח כסף/ליצור/להעצים את יכולותינו (מחקו את המיותר). השאר, בניגוד לכך, הוא הזמן לבילוי/מרגוע/בניית זהות/התקפלות… יצירת דאטה היא רק תוצר לוואי של העבודה או של גלישה ופעולת שיתוף מידע ברשת – במקומות האלו אני ממש לא רוצה לשמוע על "יצירה" ו"עבודה". Data As Labor מערער על היסודות ההפרדה הזו: אם יצירת דאטה היא עבודה לכל דבר ועניין – אז כל מה שאני עושה יום וליל (חוץ משעות השינה שם אני מייצר בעיקר נחירות שגם אותן אפשר לנצל) – הוא בעצם עבודה (תסתכלו שוב  על התמונה למעלה >>> 24 שעות ביממה!).

אם יצירת דאטה היא עבודה לכל ודבר ועניין – אז כל מה שאני עושה יום וליל הוא בעצם עבודה.
(חוץ משעות השינה שם אני מייצר בעיקר נחירות, שגם אותן אפשר לנצל.)

קראו לי תמים שרוצה להתעלם מזה שצפיית הנטפליקס שלי היא עוד יצירת דאטה שמנוצלת בידי החזקים. אבל בעיני Data as Labor הוא דוגמה לקריאת שחרור ושוויון מלאת רצון טוב שבמקום להעצים את החברה האנושית, מסכנת את האנושיות הפשוטה של האדם.

דאטה – מי ההורים שלך? [2]

מסקנת הפרק הקודם הייתה שראוי שלפחות חלק מן המידע על אדם יהיה סחיר. הפוסט הזה מאיר היבטים ישומיים של הרעיון הזה.

בפוסט הקודם הצגתי את היוזמה של מושל קליפורניה להנהיג Data Dividend, חלוקת רווחים למשתמשים על סחר בדאטה שלהם. ראינו שברמה התפיסתית הבסיסית לא ברור למי נתונים שייכים ומי צריך להרוויח מהם. לבסוף עלתה הסברה שראוי מאוד שדאטה, לפחות בחלקו, אכן יהיה משאב סחיר. נמשיך עם ההנחה הזו וננסה להתחקות אחר שיטות אפקטיביות לחלוקת רווחים בגין סחר בדאטה.

כמה זה שווה?

בואו נחשב, בממוצע ובחישוב הכי גס שיש, כמה משתמש עשוי להרוויח מדיבידנד מפייסבוק? Steven Hill מגחיך את כל הסיפור ומחשב כי אם נחלק את רווחי פייסבוק בין 2 מיליארד המשתמשים החודשיים של החברה נגיע למספר המדהים של… 7.35$ למשתמש; ובטוויטר – 2.83$. אה וגם צריך לציין שהחישובים הנ"ל משאירים את החברות בלי הכנסות, בעיה…

זה חישוב פשטני מאוד אני מודה אבל הוא משקף בעייתיות מסוימת – הליך החלוקה של הרווחים הוא מסורבל מאוד (חקיקית, אכיפתית, מנגנונית) והרווח בקצה לכל משתמש עלול להיות נמוך ביותר. ולאור זאת אפשר באמת לשאול – על מה ולמה כל הרעש?

אחרים הציעו שיטות קצת יותר מתוחכמות.

ערך שפלי ואיגודי עובדים – שני כיוונים מעניינים לחלוקת רווחים

Eric Bax במאמרו "Computing a Data Dividend" מציע להשתמש בכלי מוכר מתורת המשחקים הלא הוא- ערך Shapely.

ערך שפלי פותח על ידי… שפלי בשנות החמישים והוא משמש כפתרון לסיטואציות בהן נדרש לחלק רווחים בין שחקנים בתוך קואליציה מורכבת. כך למשל בחישוב כוחן של מפלגות בפרלמנט. או אז עולה השאלה – כיצד מחלקים את הרווחים באופן אשר משקף את התרומה של כל אחד לקבוצה מבלי לפגוע בתמריצים להצטרף לקבוצה? (אתנחתא פוליטית – מה צריך להיות התגמול של מפלגת מאזניים ישראלית שמשפיעה בחוסר פרופורציה לכמות המנדטים שלה?)

האתגר הגדול הוא שבכל קבוצה ישנם כאלו שמביאים יותר ערך לקבוצה מאחרים. נוסף על כך, אם נחלק את הרווחים לפי סדר ההצטרפות לקואליציה אנחנו עלולים להיתקע. דמיינו למשל דינאמיקה של 'הכל או כלום' שבה קואליציה מייצרת ערך רק כשהאחרון מצטרף אליה. לכאורה אותו האחרון צריך לקבל יותר, שהרי בזכותו הדיל נסגר. אך אם נפעל כך, כל אחד מהשחקנים ירצה להיות אותו האחרון בר המזל, מה שיתקע את תהליך ההצטרפות. כדי להתגבר על כך, ערך שפלי מחשב לכל שחקן ושחקן את הערך שלו תוך מיצוע כל האופציות האפשריות של סדר ההצטרפות של השחקן ובכך משמר הליך הצטרפות אובייקטיבי שאינו תלוי מיקוח בין השחקנים.

זו הצעה מעניינת כיוון שהיא מאפשרת לבחון את הערך של כל אחד ממשתפי הדאטה ולבחון מה הרווח, מתוך הסך הכולל, שצריך כל אחד ואחד להפיק מהסחר בדאטה. זה יכול להועיל כיוון שאם הנתונים שלי תורמים יותר לפלטפורמה מסוימת מאשר של חברי – מטעמי הוגנות נכון שאקבל יותר דיבידנד. יש לציין ש-Bax איננו מתיימר לפתור את כל הבעיה ומעלה בסיכום המאמר מורכבויות נוספות ומעניינות מאוד (למעוניינים, יש במאמר חישובים ונוסחאות וכן פרק Discussion מעניין).

אחרים כגון Glen Weyl הציעו להקים "Data Labour Unions". המשתמשים יתאגדו למעין איגודי עובדי-דאטה וכך כוח המיקוח שלהם יתעצם מול חברות המחזיקות במידע. הרעיון שבבסיס השיטה של Weyl הוא שהמשתמשים הפכו להיות שלא במודע עובדים (עבדים?) של הפלטפורמה. כיוון שרק בזכות המשתמשים-עובדים ומידע העתק שלהם המודל של החברות מרוויח הון, מן הראוי שהם יזכו בנתח מכובד ממנו. על פי Weyl אחד ההישגים של התאגדות יכול להיות מעבר מגלישה ה'חינמית' ברשתות החברתיות שהוא למעשה רווי פרסומות, לגלישה נקייה – והכל באמצעות מו"מ ויחסי כוחות שווים.

[[למי שעולות אסוציאציות קומוניסטיות-מהפכניות, בעלי הון-פרולטריון, זה לא סתם – אבל בזה נעמיק יותר בפעם אחרת.]]

תנו כבוד לפועל אמיתי, בחור לעניין, לא כמו פועלי-הדאטה הבוהים במסכים

סוג של סיכום – כסף תמורת פרטיות?

בפוסט הזה ובקודם לו נגענו בקצה קצהן של שאלות "האם סחירות של דאטה?" ו"איך סחירות של דאטה?" גם יחד והארנו את מורכבויות הרעיון. לסיכום שני הפוסטים אני רוצה להתעכב על הרעיון על פיו אדם יפיק הכנסה ממכירת דאטה שלו ולציין את הסיבות שבגללן לא לגמרי נוח לי איתו.

הרבה מהחברות אנושית, המודרניות יותר והפחות, עסקו בניסיון להגדיר את היחס שבין אדם לקניינו ובסימון גבולות ומגבלות על סחירות וזכויות קנייניות. דוגמאות: אסור לי למכור את איברי הגוף שלי מבחינה חוקית, על זכויות קנייניות ביחס לנכסים מסוימים חלות מגבלות, כגון סחירותה המוגבלת של חלקת קבר. כלומר – גם כשמשהו שייך לך לכאורה, מוטלות הגבלות על היכולת לסחור בו מכל מיני סיבות ("ערכיות" למשל). מטבע הדברים זו שאלה רלוונטית גם בעניין הדאטה.

תחושתי היא ששוק שבו הכל אפשרי, כל הדאטה סחיר ותלוי אך ורק בביקוש-היצע, הוא בעייתי. האם ראוי שבני אדם ימכרו נתונים אודות נטיותיהם המיניות, מגדרם או שייכותם האתנית לכל המרבה במחיר? יש את בעיית ההסכמה – גם אדם אשר מסכים מרצונו החופשי למכירת פרטים אינטימיים נמצא תמיד בפער ביחס להשלכות שליליות פוטנציאליות של הסכמתו. נוסף על כך, הגם שלאדם X זה לא מפריע, מציאות כזו משנה יסודות חברתיים עמוקים, למשל בגבולות הפרטיות, ועשויה להשפיע לרעה גם על אינדיבידואל Y, ולו רק בשל הרף הקלוקל החדש שהוצב. לנו כחברה אנושית יש מקום להציב אידיאל מסוים של פרטיות, של מותר-אסור, לפעמים גם במחיר של פטרנליזם מה. לכל מי שעשוי להתקומם מול הרעיון הזה, אענה שיש מספיק דוגמאות מכל תחומי הקיום שלנו שמוסדרים או מוגבלים בדרכים כאלו ואחרות, ולכן זה לא רעיון זר או מופרך לטעמי.

ויקטור הוגו. פנטין, דמות מ"עלובי החיים", מכרה שיניים ושיער בעת צרה. מקור: ויקיפדיה

במובן מסוים ובהפוך על הפוך ייתכן שחלוקת Data Dividend תתברר ככדאית דווקא לחברות הענק, בהגבירה את הלגיטימציה של השיח הממוני על פני שיח הפרטיות. החברות יוכלו לטעון כי המשתמש הוא שויתר מרצונו החופשי, ועוד תמורת תגמול (!), על נתוניו הפרטיים.

כן! אנשים צריכים לדעת טוב יותר מי משתמש בדאטה עליהם, איך, למי הוא נמכר, ועוד. אך האם Data Dividend הוא הפיתרון הנכון? החשש שלי הוא שייווצר שוק ללא אמות מידה של ראוי ורצוי, שבו אנשים יתחילו 'למכור את עצמם'. נגלה שהזכות לפרטיות, המוכרת כזכות יסוד חוקתית בעולם המערבי, תתערער ותוחלף בשיטה שבה פרטיות תימכר כמוצר תמורת הכנסה. זה יפגע גם בקבוצות מוחלשות שבמרדף אחר מקורות הכנסה נוספים תהיינה מוכנות לוותר על הרבה פרטיות. ושוב, מצטער על הפטרנליזם שבטח מפריע לחלק מהקוראים, אבל כללים כלשהם כן צריכים להישמר בתחום הזה.

אני לא נגד לחשב את הערך של המידע שאני מפזר ואפילו שתהיה אפשרות לסחור בו ואכן צריך להיזהר ממהלכים הפוגעים בחירות, בקידמה ובחדשנות. אבל אני חושב שלא משנה לאן הרעיון של  Data Dividend יתגלגל לו, נדרש יהיה לבחון מה אמות המידה והמגבלות הנכונות.

דאטה – מי ההורים שלך? [1]

או – למי שייך הדאטה עלינו והאם ראוי שנרוויח ממנו?

בפברואר 2019, לפני כשנה, מושל קליפורניה Gavin Newsom קרא להחזרת השליטה למשתמשים על הדאטה שלהם. כצעד ראשון הודיע Newsom על כוונתו לקדם רפורמה שתחייב חברות, ובראשן גוגל ופייסבוק, לתגמל את המשתמשים בעבור סחר בדאטה שלהם עם צדדים שלישיים. ההצדקה למהלך הזה, לשיטתו, היא שאין סיבה שהחברות ישגשגו מבלי שהמשתמשים – הלא הם המקור לנתונים – יזכו לנתח מההון. כך עלה לו לקדמת הבמה המושג – 'Data Dividend' על פיו יופרש דיבידנד כספי לאדם מן הערך שנוצר משימוש במידע שלו או ממכירה שלו לצד ג'. המשמעות היא למשל שגלישה בפייסבוק שבמהלכה החברה אוספת על כולנו מידע אולי תהפוך למקור הכנסה. נשמע טוב?

Gavin Newsom מושל קליפורניה

כרקע למהלך הזה צריך לציין שכבר נעשה ניסיון דומה ב-2017 במדינת וושינגטון שלא התגבש לכדי חוק. ההצעה שם הייתה להטיל מס של 3.3 אחוז על מכירת דאטה. התומכים בהסדרים ברוח זו מתארים את המהלך כאמצעי להקטנת האי-שיוויון, מעין מעשה רובין הודי – לקחת קצת מהעשירים ולתת לעניים. עניינם הוא לשקם את היחסים הלא שוויוניים בין המשתמשים החלשים לבין חברות הענק  על ידי חיזוק כוח המיקוח של המשתמשים מול הארגונים. כפועל יוצא יוכלו המשתמשים לשלוט טוב יותר במידע האגור במערות השרתים של ענקיות האינטרנט.

במבט ראשון – זהו מהלך מעניין ואולי הגיוני, במיוחד בעידן בו המשתמש הפך להיות המוצר.

בפועל – זו סוגיה מורכבת המעלה תהיות מגוונות:

  1. מה המעמד של דאטה? למי הוא שייך ומי זכאי לשלשל לכיסו רווחים מסחר בו?
  2. סוגית הישימות – האם הפרשת דיבידנד מדאטה היא דבר ישים? האם היקף הרווחים הצפויים מצדיק מהלך סבוך שכזה?
  3. ולבסוף, מבחינה נורמטיבית-חברתית, האם נכון לחזק את מגמת הסחר-מכר בנתונים אישיים?

בפוסט הזה אגע רק בשאלה הראשונה. השאר ימתין בסבלנות לפוסט הבא.

הנפט החדש?! – אהם… האמנם?

יש הרואים את הדאטה כ"נפט החדש" ("The New Oil"). לנפט שני מצבי צבירה: בתוך האדמה, שם הוא לא שווה דבר; לאחר הפקתו מקרבי כדור הארץ לתוך חביות – אז הוא מתחיל לקבל ערך. כך גם דאטה אינו שווה דבר עד שיחולץ מן המשתמשים וייאגר בתוך בנק נתונים רחב. המתנגדים לגישה זו מדגישים את ההבדלים המהותיים בין השניים: חבית נפט היא מוצר פיזי טהור ואפשר לתאר אותה על ידי נוסחה כימית פשוטה. היא ניתנת לשכפול ומהווה משאב פיזי עם שייכות גיאוגרפית ובעלות מוגדרת. הדאטה לעומת זאת הוא אמורפי ונזיל, לא-פיזי – ועוד לא מצאנו את הרכבו הכימי…

אין לי עניין להכריע במחלוקת סביב המשל הזה פה, אני מביא אותו רק כי הוא מדגיש את הצדדים השונים בשאלה לדיון – איך נכון להסתכל על הדבר הערטילאי הזה שנקרא 'דאטה'? למי הוא שייך, אם בכלל? ומי בעל הזכות לקבל עליו גמול?

בתמונה – משאבת דאטה, סליחה – נפט

נתוניו של אדם הם כגופו

אפשרות אחת היא לגרוס כי נתוניו של אדם הם כגופו. כשם שיש לאדם ידיים, גפיים, רצונות ושאיפות – כך גם יש לו מאפיינים, שעל אף הערטילאיות שלהם מהווים חלק ממנו. הדאטה אינו דבר חיצוני לאדם, המתלבש עליו, או מרחף מעליו – אלא פנימי ומרכיב בעצמותו. ברמה הפרקטית תפיסה כזו תצמצם מיניה וביה את הנכונות לאפשר לסחור במידע – שהרי סוחרים בקניין ולא בנשמות של בני אדם (חוץ מניקולאי גוגול – קריאה מומלצת). יתרה מכך, ייתכן שעל בסיס תפיסה כזו אף יוטלו מגבלות על יכולתו של אדם לסחור בדאטה, כמו שקשה לנו עם האפשרות שאדם יסחר באבריו. ועוד, על בסיס עיקרון שדאטה הוא כגופו של אדם, סביר להניח שנכון יותר יהיה לדבר על דאטה במושגים של פרטיות מאשר של קניין, סחירות והעברת זכויות.

ובחזרה למשל הנפט – על פי גישה זו הקשר בין נפט, משאב טבע סחיר, לבין דאטה הוא מקרי בהחלט וכמו שאמר מישהו – "Data is about as likely a digital twin of oil, as a toaster is a mechanical twin of a quantum computer"… הנפט הוא סחיר, אך הדאטה של אדם, שהוא למעשה גופו – לא! לפי הגישה הזו, דאטה דיבידנד הוא מושג מטעה ושגוי, ואפשר בגדול לסגור את הדיון.

אבל זו גישה מעט קיצונית – דאטה הוא באמת דבר בלתי סחיר לגמרי?! אדם לא יכול למכור דאטה שלו תמורת כסף? לכן אפשר להציע אולי איזשהו ריכוך על ידי הבחנה בין סוגים שונים של דאטה. כיוון שיש סוגי מידע פנימיים-אינטימיים יותר ויש כאלו פחות, הסחירות של המידע יכולה להשתנות בהתאם.

את הדאטה אפשר לסדר אולי על 'ספקטרום של קרבה': בצד אחד (נגיד מימין) יש את המידע הרפואי על אדם או נטייתו המינית – נתונים רגישים ו'קרובים יותר' לאדם ולכן פחות סחירים. ככל שנזרום שמאלה בציר נפגוש נתונים כגון גובה וגיל, סכום העובר ושב שלו. בקיצון השמאלי יוצבו הנתונים האינטימיים פחות – סוגי המכוניות שברשותו, העדפות קולינריות וכדומה.

העובדה שיש דאטה שבו כן ראוי לסחור מובילה אותנו לשלב הבא.

תודה לפייסבוק שהביאני עד הלום

אז נניח שדאטה, לפחות בחלקו, הוא משאב סחיר ונמשיך עם ההבנה שמדגישה שנתונים מסוימים של אדם הם כמו נפט היושב בעומק המדבר העיראקי. עד שלא תבוא חברת ענק ותפיק את הנפט ממעמקי האדמה – הוא פשוט לא שווה כלום. באותה מידה, לדאטה על מישהו אין ערך כל עוד הוא לא נאסף, נבדק וצורף למיליון נתונים אחרים על ידי פלטפורמת אינטרנט גדולה. שיטה זו אינה מבטלת כמובן את האמורפיות והערטילאיות של הנתונים, מבחינה זו הם שונים מנפט, אבל עומדת בעיקר על היותם 'חבויים' עד כדי לא קיימים, עד אשר מגיע גוף מקצועי ומיומן המפיק את הדאטה ממחצביו. במובן הזה, כן!, דאטה הוא כמו נפט.

מה מסתבר? שאנחנו חייבים את פייסבוק כדי לעשות משהו מהדאטה שלנו! כיוון כזה מעורר את הדיון סביב חלוקת הרווחים – איפה עובר הגבול בין מה שאני חייב לפייסבוק על ההפקה, לבין מה שהיא חייבת לי על המשאב? איך נחלק את ההכנסות?

נעצור כאן לעת עתה, כיוון שזו בדיוק נקודת הפתיחה המתאימה לפוסט הבא… זה הזמן להפעיל את הנוירונים ולנסות לחשוב על מנגנונים חכמים לחלוקת רווחים מדאטה.

נ.ב:

לצורך כתיבת הפוסט שמנו בצד את האפשרות הסבירה שמדובר במהלך פופוליסטי ותו לא, כי בכל מקרה השאלה העקרונית מעניינת בפני עצמה. ואכן יכולה להיות תחושה ששיח ה-Data Dividend נגוע בפופוליזם-מה כאילו רובין הוד של קליפורניה לוקח מהעשירים ונותן לעניים.

ולראיה, ראו (באדיבות גוגל) איזה באז נוצר סביב המושג בתקופה שלאחר הנאום של Newsom (בפברואר 19'), ואיזה שיממון לפני ואחרי… מחשיד קצת, לא?