מאמר אורח: מחשבות על אקזיט

על עסקת המיליארדים של מוביט, מידע ציבורי, ואיך כל זה מתחבר לקפיצה קטנה שעשיתי לכנסת במרץ 2018 הרחוקה

במאמר זה אנחנו שמחים לארח את דן ברקת, מדען נתונים, חוקר NLP, חובב תחבורה ציבורית מושבע, מוביל פרוייקט "תחבורה ציבורית פתוחה" בסדנא לידע ציבורי.

המאמר של דן מצטרף למאמרים קודמים שהתפרסמו בבלוג בנושא דאטה: פועלי הדאטה – התאחדו! ו-דאטה, מי ההורים שלך?

לא, ברשומה הבאה אני לא הולך לספר לכם על שאיפות לאקזיט… אלא לשתף במחשבות סביב אקזיט שקרה, אקזיט אמיתי, אקזיט ממשי – האקזיט של מוביט.

מוביט תמיד הייתה מקרה מעניין בעיני בכל הנוגע למידע, כסף והציבור. בדרך כלל חברות מרוויחות ממידע בשיטה הבאה: הן יוצרות פלטפורמה ומושכים אליה משתמשים; המשתמשים פועלים בפלטפורמה; נוצר מזה מידע; החברה אוספת את המידע, סוחרת בו, ומרוויחה. 

אבל במקרה של מוביט השיטה שונה לגמרי: קודם כל היה מידע ואחר כך נוצרה מוביט. מה שמעניין במיוחד הוא שהשירות שמוביט מספקת לנו מבוסס בחלקו המשמעותי על מידע ציבורי, לו"זים של קווים, זמני הגעה, מיקומי תחנות, שאותו אוספת המדינה ושאותו קיבלה מוביט בחינם.

מוביט התחילה את דרכה באיסוף מקורות מידע מרשויות ממשלתיות או מפעילות תחבורה ציבורית הממומנות בכסף ציבורי, ואז עיבדה אותם ועשתה להם סטנדרטיזציה וטיוב. בשלב מסוים אנשי מוביט כן שילבו גם קראוד-סורסינג (איסוף המונים) התנדבותי בסגנון ווייז במסגרתו אנשים תרמו מזמנם כדי למפות את התחבורה הציבורית באזור שלהם וכדי לשפר את זמינות המידע לנוסעים. עם זאת אני מעריך שהמאסה הגדולה של המידע שמספקת האפליקציה עדיין מגיע ממקורות רשמיים וממשלתיים או במימון ממשלתי.

ובמילים פשוטות מוביט הייתה כנראה אחרת, והרבה פחות ממה שהיא, בלי המידע הציבורי.

כסף, מידע ומה שביניהם (אנחנו)

אם עקבתם אחרי החדשות בזמן האחרון כנראה שנחשפתם לעסקת הענק המסתמנת של רכישת מוביט על ידי אינטל תמורת כמעט מיליארד דולר. סכום דמיוני לכל הדעות שאינטל מוכנה לשלם מכל מיני סיבות – על פי הדיווחים וההגיון, המרכזית מביניהם היא מכרה הזהב עליו יושבת מוביט: המידע של חברת התחבורה עשוי להיות עוד אבן דרך בדרכה של אינטל, האמא של מובילאיי, לנצחון במירוץ לרכב האוטונומי.

דה-מרקר (04.02.2020)

בחינת האירוע החדשותי הזה בזכוכית מגדלת מדגיש את התפקיד המעניין מאוד שמשחק המידע בתוך סיפור ההצלחה של מוביט. תפקיד שגם מסבך לגמרי את הדיון המוכר סביב מידע, כסף ואנחנו הציבור העומדים בתווך. 

יש לנו פה מקרה היברידי שבו מקורות מידע ציבוריים היו הכרחיים (ומצליחים) ביצירת ערך לחברה כשמוביט שילבה אותם עם כמות יפה של משתמשים. הסיפור של מוביט הוא סיפור על איך שלא רק שאפשר להפוך אותנו למוצר על ידי שימוש במידע עלינו, או לקחת מאגר ממשלתי ולעשות ממנו קצת כסף (כמו המאגר המשפטי של נבו שמרוויח מחוקי הכנסת הישראלית), אלא גם על איך שניתן להפוך מידע ציבורי לסחורה נחשקת ביותר. מה שצריך הוא לערבב היטב את המידע הציבורי, יחד איתנו, ועם המידע עלינו, עד שמקבלים את הקוקטייל הנכון. בארץ למשל, מוביט אוספת, מציגה ומשתמשת במגוון דרכים במידע שמספק משרד התחבורה על לוח זמני האוטובוסים, המתוכנן כמו גם הלוח בזמן האמת, ולטענתם יש להם בארץ הקודש כשני מיליון משתמשים.

במקרה ממש הסיפור הזה מתחבר לסגירת מעגל קטנה שקרתה לי לפני כחודשיים. לפתע בבוקר יום בהיר, קיבלתי מייל שמבשר שמרכז נתוני זמן האמת החדש של משרד התחבורה בדיוק עלה לאוויר. המעגל נסגר איפשהו באמצע מסמך התיעוד שצורף למייל, שם מופיעים כמה סעיפים שמדברים על פקודות חדשות שיתווספו לממשק שפתוח לציבור. בסעיפים תמימים אלה נאמר שבפקודה פשוטה אחת ניתן יהיה לקבל בזמן אמת את כל נסיעות התחבורה הציבורית שפעילות באותו רגע. תמים אך מהפכני: הפקודות עד היום מאפשרות רק לתשאל תחנה ספציפית ולקבל רק כמה אוטובוסים שבדרך אליה.

לפתע בבוקר יום בהיר קיבלתי מייל שמבשר שמרכז נתוני זמן האמת החדש עולה לאוויר

סעיף 7.15.1 – ניתן יהיה לקבל בזמן אמת את כל נסיעות התחבורה הציבורית שפעילות באותו רגע

זה נראה אולי כמו שינוי פעוט, טכני ויש יגידו קטנוני, אני יודע. אבל בזמנו הוא נראה לי חשוב עד כדי לעלות לירושלים לדיון בכנסת שעסק בנושא. ומי יודע, אולי בדיעבד אפילו מגיע לי קצת קרדיט על זה שהפיצ'רים האלה נכנסו?

ירושלים – הנה אני בא

"בדיוק על זה אנחנו רוצים לשאול. אין לאף אחד בארץ יכולת טובה לשאול על זה ואני יודע שגם אצלכם יש פערים בנושא הזה."

אז זה הייתי אני בדיון בכנסת שהתקיים אי-שם במרץ 2018. בקצרה, הסיפור הלך כך.

ועדת השקיפות של הכנסת שבראשה עמדה ח"כ סתיו שפיר החליטה לעסוק במאגר המידע של משרד התחבורה. מה שראיתי אז לנגד עיני כשניסיתי בתור אזרח מודאג לעבוד עם הנתונים, זה מידע שהוא לכאורה פתוח, אך הוא פתוח בצורה כה מורכבת כך שלמעשה הוא מציב רף כניסה שמשאיר בחוץ את רוב מי שמתעניין, ומאפשר גישה רחבה רק למי שיש לו הזמן והמשאבים לפתח מנגנון תשאול ואיסוף מורכב של המידע. לכן החלטתי לעלות ירושלימה, בגפי.

רציתי מאוד לומר לכנסת את שעל ליבי בנוגע לנתונים של משרד התחבורה. במיוחד רציתי להעיר לגבי הממשקים לציבור הלא מספיק טובים שבהם עיינתי מבעוד מועד בזכות זה שהם נכללו במה שהיה אז מכרז פתוח. אותו מכרז שהביא לנו היום את מרכז הנתונים החדש שאליו התוודעתי במייל.

באחד מסעיפי המכרז היה כתוב שהציבור ימשיך לקבל את המידע בצורת SIRI SM, כפי שהוא, ושרק יוסיפו מגבלות ומכסות על כמויות השאילתות. מה זה SIRI SM אתם שואלים? מדובר בפרוטוקול אחד ממשפחת הפרוטוקולים שבתקן SIRI האירופאי (Standard Interface for Real Time Information), שמספקים מגוון ממשקים למידע בזמן אמת על תחבורה ציבורית. SM הוא קיצור ל-Stop Monitoring, שכשמו כן הוא, מספק אפשרות לקבל מידע על תחנה. וליתר דיוק, בארץ הוא מאפשר לתשאל תחנה בעזרת המספר המזהה הפנימי שלה ולקבל מידע על מספר מוגבל של אוטובוסים שקרובים אליה. הפרוטוקול הזה בארץ נפתח עבור שימושים כמו שלטים אלקטרוניים שמציגים רק זמן הגעה מוערך. במשך מספר שנים זה המידע היחיד שסופק, עד שלפני כשלוש שנים הוסיפו גם קואורדינטות GPS, שלא אמורות להופיע בפרוטוקול המקורי. 

בדיון אמרתי שהמצב של נתוני זמן האמת לא טוב באופן כללי, ושאחד הדברים הראשונים שצריך זה לפתוח את SIRI VM לציבור ולאפשר גישה רחבה לנתונים באופן פשוט. SIRI VM, קיצור ל-Vehicle Monitoring, הוא פרוטוקול שמאפשר מעקב אחרי צי רכבים שלם. בניגוד ל-SIRI SM הוא מאפשר לקבל עדכונים מלאים על כל האוטובוסים הפעילים. 

במקומות אחרים בעולם, כמו ניו יורק לדוגמא, סיפקו כבר מההתחלה לציבור גישה לממשק VM בנוסף ל-SM וממשקים אחרים שמספקים מידע נוסף. כשמפתח מעוניין לקבל מידע על כל הנסיעות הפעילות ב-VM, כל מה שהוא צריך לעשות זה לשלוח שאילתא פשוטה אחת ללא פרמטרים, והוא יקבל חזרה רשימה של כל האוטובוסים כולל מיקום ופרטי GPS נוספים, מיקום יחסי במסלול, נמצא בתחנה או לא וכו'. ב-SM, כדי לקבל מידע על כל הנסיעות הפעילות, המפתח צריך לחקור את לו"ז התחבורה הציבורית (קובץ מורכב וגדול אחר), ולהוציא ממנו את כל המזהים הפנימיים של התחנות והקווים, ליצור כמות גדולה של שאילתות מורכבות שיביאו מידע על כל הקווים, ולהתגבר בעזרת יצירת שאילתות נוספות עם פרמטרים אחרים על המכסות של הממשק (עד 3 רכבים לכל קו). תהליך מורכב שגם אם צולחים אותו, קשה לדעת אם לא פספסנו תחנה, קו או נסיעה בדרך. המורכבות שפרוטוקול ה-SM הנוכחי כופה יצרה רף כניסה מאוד גבוה לעבודה עם הנתונים, גרמה להרבה בעיות וחסמה אפשרויות חשובות.

כולנו יודעים מה זה דיון בכנסת – הרבה אנשים, קצת בלאגן… לא לגמרי (או לגמרי לא) הבינו מי אני ומה אני רוצה עם כל ה-VM וה-SM הזה (כפי שניתן לראות בפרוטוקול הדיון). בדיעבד גיליתי שלמרות זאת, איכשהו זה הגיע לכותרת משנית בתקשורת. עוד יותר בדיעבד התברר לי בשיחות עם אנשים ממשרד התחבורה, שמעבר לבלאגן בדיון, נגרם גם בלאגן קטן עם המשך המכרז. אבל זה כבר סיפור אחר.

כולם יודעים מה זה דיון בכנסת, הרבה אנשים, קצת בלאגן… ועדת השקיפות (תמונה להמחשה מתוך אתר הכנסת)

מכל מקום, בסופו של דבר המים שקטו, המכרז עבר, ואפילו יחסי עם המשרד בכי טוב. אמנם לא קיבלנו גישה ל-VM עליו דיברתי, אבל בסופו של דבר, ושוב, אני לא יודע כמה קרדיט באמת מגיע לי על זה, כן קיבלנו לפחות על הנייר את הפונקציונליות החשובה, שמורידה את הרף והידע הנדרש כדי לקבל ישירות ובאופן מלא מידע על נסיעות. אני אגב ממש מקווה שזה יפתח הזדמנויות לעשות דברים טובים, ושנמשיך הלאה ונשפר בעיות בתוכן המידע עצמו וכמובן בנסיעות ובשירות לנוסעים.

מוביט – הראשונים לזהות

איך כל זה מתחבר לעסקת מוביט? מוביט הם בדיוק מהמעטים שהיו להם בשנים האחרונות המשאבים והרצון לתחזק מנגנוני תשאול, אגירה וניתוח של מידע מהסוג הזה. 

במקביל לשטויות שעשיתי בכנסת, בשנתיים האחרונות עבדתי גם יחד עם עוד מתנדבים אדירים ב"הסדנא לידע ציבורי" על יצירה של מנגנון ומאגר כזה, בקוד פתוח, שיהיה נגיש לכולם, דבר שדורש וממשיך לדרוש המון השקעה בפיתוח ותחזוקה. 

העניין הוא שהרבה מזה היה נחסך אם במשרד התחבורה היו מתייחסים למידע הזה כמו האוצר שהוא. מהמייל המדובר מסתמן שהם הבינו את זה בסוף, אבל איך אומרים… מאוחר מדי, לאט מדי. מוביט מצדם היו חדים והצליחו להבין את זה בזמן. וכאמור זה הביא אותם רחוק מאוד.

גם מבלי לנתח את השאיפות ארוכות הטווח של מוביט ושל אינטל ברכישה הזו, אפשר להניח בוודאות גמורה שטובת הציבור, וספיציפית הציבור בארץ, הן לא בראש מעייניהם. לא שאני טוען שהם מרושעים, אני פשוט אומר שככה זה עובד. 

מנגד, אני מאמין שזה בדיוק מה שאמור להימצא בראש מעייניו של משרד התחבורה. זו משימה לא פשוטה – נדרשת עבודה כדי להבין את הנושא, לחבר אותו לפוליטיקה, לעשות את הדברים ולנהל אותם. ספציפית יש עוד הרבה מה לשפר במרכז הנתונים החדש, אבל כבר עכשיו הוא אמור להקל על הגישה למידע – רשויות מקומיות חלשות, ועדי שכונות, עיתונאים, איגודי עובדים או 'סתם' אזרחים כמוני שרוצים להבין מה לעזאזל קורה בתחבורה הציבורית במדינה.

העניין הגדול יותר הוא התקווה שעסקת מוביט-אינטל תפיל סוף סוף אסימון ביחס לערך העצום שיש במידע ציבורי. בין אם העסקה היא טובה לציבור ובין אם היא לא, אני מקווה שהיא תעלה את המודעות לצורך לתעל את המידע לכיוונים שיועילו לציבור ויתנו לציבור חלק בו. 

זו משימה של משרד התחבורה, ושל המדינה, וכנראה שאנחנו נצטרך להמשיך ולהזכיר להם אותה.

האיש שחשב בתוך קופסאות

שימוש בטכנולוגיה כדי לעקוב אחר האזרחים? לפני המחשבים, אפילו לפני החשמל, היה מי שתכנן מדינת משטרה לתפארת

הפעם המאמר שלנו התפרסם ב"אלכסון" – מוזמנים!

המשטרה מובילה עגלה עמוסה עובדות בזנות, פריס 1745, ציור מאת אטיין ז'ורה. תצלום: The Yorck Project, ויקיפדיה