מוזיאון של שטויות: על ארכיון האינטרנט

יום אחד מצא את עצמו האינטרנט כלוא בתוך כונן קשיח ומאז הוא מתחבט לגבי הזהות של עצמו.

בקהיר, בירת מצרים, ניצב לו מבנה. במבנה זה, שאינו אלא בית כנסת, נמצאת עליית גג. אם תעלו אליה, תמצאו אוצר: רבבות רבבות עמודים של כתבי יד עתיקים ונדירים ביותר שוכבים להם שם כבר מאות בשנים. זוהי 'גניזת קהיר'. היא התגלתה לגמרי במקרה בשנות ה-1860 והפכה מאז למקור בלתי נדלה של כתבי יד נשכחים: יהודים, נוצרים ומוסלמים כאחד חשפו בה תגליות מרתקות.

אל גניזה משליכים ספרים כלאחר יד. ההלכה היהודית מבקשת שספרים הנושאים שמות קדושים יכובדו ושבמקום להיזרק אל הלא נודע, הם יזכו לאכסניה ראויה. אם תרצו – הגניזה אינה אלא פח אשפה מכובד אליו משליכים בני אדם אוצרות בחוסר מודעות מוחלטת. וראו זה פלא – דווקא מפח אשפה זה, צמחו להם גילויים כה חשובים.

לא הרבה יותר ממאה שמונים קילומטרים משם נח לו מאגר עצום מסוג אחר. ב-"Bibliotheca Alexandrina" שבמרכז אלכסנדריה, אוגר מאז 2002 ה-Internet Archive, "ארכיון האינטרנט", את בסיס הנתונים העצום שלו. בתחילה ביקש הארכיון האמריקאי מהמצרים לשמור אצלם 1 פטה-בייט (1000 טרה-בייט) שהחזיקו את כל האינטרנט מהשנים 1996-2001. אך מהר מאוד צר היה המקום מלהכיל. הקפיצה הראשונה הייתה ל-1.5 פטה-בייט. היום יש בספריה כבר 4.9 פטה-בייט, קפיצה של כמעט 500 אחוזים, מספר דמיוני שמהווה רק נתח מסוים מתוך הארכיון, המגיע לכדי 45 פ"ב בסך הכל.

ה-Bibliotheca Alexandrina – אוגרת את האינטרנט מאז 2002 (מקור: Carsten Whimster)

אגרנים ללא מעצורים

מכירים את האנשים האלו שיעדיפו לאגור הכל בארגזים חתומים בעליות גג, העיקר לא לזרוק לפח?

יש סיכוי לא רע ש-Brewster Kahle הוא אחד מאלו. קייל, חוקר ב-M.I.T, הקים לפני כעשרים שנה את ארכיון האינטרנט ומאז הוא עומד בראשו. הרעיון שלו היה פשוט – האינטרנט הוא יצירה אנושית, ובתור שכזה צריך להנציחו, לטובתנו ולטובת הדורות הבאים.

רעיון קטן לקייל, משמעות גרנדיוזית לארכיון. המשמעות של לשמור-את-האינטרנט-כולו היא שהיום הארכיון מחזיק בשרתים שלו לא פחות מ-400 מיליארד פריטי מידע – דפי אינטרנט, סרטים, ספרים, שהם בערך 1000 פעמים ספריית הקונגרס האמריקאי, הספרייה הגדולה בעולם, שאליה נחזור גם בהמשך.

שמירת האינטרנט היא שיטה לא רעה להתמודדות עם התזזיתיות של המדיום: אתרים עולים, אחרים יורדים; קישורים משתנים ומתיישנים. ממש כמו פרח שפורח רגע אחד ונובל בחטף. חוקרים מלוס אלמוס, ניו מקסיקו, שהתעניינו בתופעה הזו בחנו 3.5 מיליון מחקרים אקדמיים במדע, טכנולוגיה ורפואה מהשנים 1997-2012. מסקנתם הייתה שחמישית מהקישורים המובאים בהערות שוליים במאמרים אקדמיים מובילים לשומקום, פשוט אבד עליהם הכלך. כן כן, אותן הערות השוליים שאמורות לבסס את המחקר, להושיב את החוקר על כתפי ענקים ולהפוך את המאמר לאמין – מסתבר שהן תזזיתיות בעצמן. ויש לזה אפילו שם – The Reference Rot ('ריקבון הקישור').

איך זה עובד? היכונו למסע בזמן

באינטרנט מסתובבים להם זחלנים (Web Crawlers). הזחלן הוא בוט הסורק בהתמדה את הרשת ואוגר עותקים של דפים באופן שיטתי. כשהוא מגיע לדף הבית של אתר מסוים, הוא קודם כל ישמור אותו, ולאחר מכן הוא יגלוש דרך כל הקישורים שנמצאים בדף. וכך הלאה – בכל דף הוא יאתר את הקישורים, יזדחל דרכם עד שיגיע לרמת העומק שהוגדרה לו, כלומר, דרך כמה דפים עליו לעבור עד שהוא צריך לעצור.

כדי לאפשר שימוש נוח במידע שנאגר, נבנתה ברבות הימים "מכונת הזמן" (Wayback Machine). הגשמת חלום ישן – בחרו אתר, בחרו תקופה, וצאו למסע לעבר. בדרך תראו אולי נופים מרתקים – החל מה-gif של אתרים שב-"under construction" שהיה כה אהוב בשנים הראשונות לאינטרנט, מוני המבקרים בספרות הירוקות המכוערות, הפורומים של שנות ה-2000, ועד ה-Web 3.0 הבוגר אותו אנו מכירים.

עידן התמימות: פייסבוק מחברת בין בתי ספר, על החתום מ. צוקרברג (פייסבוק ב-12.12.2005, מכונת הזמן)

דילמת הארכיונאי

כשאתם מסדרים את הארון ומחליטים מה לשמור ומה לזרוק, אתם מקבלים החלטה. החלטה קלה אולי, חסרת משמעות לכאורה, אבל החלטה. השאלה שעולה ביחס למאגרי מידע, בהיסטוריה הקלאסית כמו גם בדיגיטלית, היא בדיוק אותה השאלה: כיצד לנצל את המשאבים המוגבלים? מה לשמור ועל מה לוותר? על מה יתבזבזו משאבי הזחלן והשרתים?זוהי דילמת הארכיונאי.

מבחינה טכנית נפתרת הדילמה בכמה דרכים. לא כל האתרים נדגמים באותה תדירות, ולמען האמת בנתחים משמעותיים מהרשת הרובוט מבקר רק לעיתים רחוקות. המנהג שלו הוא לבקר כל חודשיים ולפעמים יותר כך שנוצרים מרווחי זמן ריקים וחוסר המשכיות. לרובוט יש טריק נוסף כדי לחסוך בזיכרון: כשהוא מזהה שאובייקט כבד משקל לא השתנה בין הביקורים, כגון תמונות, הוא ישמור את הדף מבלי לעדכן את התמונה. על פי הדיווחים זה מביא לתקלות לעיתים, כמו אתר שנשמר עם תמונה לא מתאימה בשל טעות בזיהוי. ולבסוף, כאמור, לרובוט מגבילים גם את עומק החיפוש באתר, אז ייתכן מאוד שדפים בעומק שלישי או רביעי של האתר לא  ישמרו.

להחלטות טכניות יש תמיד השלכות אנושיות וערכיות, החורגות מהטכניות הצרה. צריך רק לפקוח עיניים כדי לזהות אותן. בהקשר הארכיון אחת ההשלכות היא שאם אי פעם תרצו לחקור את התפתחותו של האינטרנט בעזרת מכונת הזמן – תצטרכו לזכור שאתם לא פוגשים את האינטרנט כפי שהיה. מה שנמצא אל מול עיניכם אינו אלא בבואה של האינטרנט ברגע נתון. צילום מסך.

כלומר, הגם שהארכיון מאוד היה רוצה להנציח את האינטרנט בשלמותו ומושלמותו, זה לא לגמרי זה. וכפי שנראה, מכאן, זה רק הולך ומסתבך.

הפוליטיקה של הזיכרון

ככל שדיון ברשת מתארך, הסבירות שמישהו יעשה השוואה לנאצים עולה – כך על פי חוק גודווין. לאחרונה מתפתח חוק אוניברסלי קצת אחר: בסוף כל משפט שאתם אומרים ברשת, יושב טראמפ עם נרגילה. הנשיא מעורר המחלוקת נוטה לשמש כדוגמה האולטימטיבית, או כאנטי-דוגמה, בהרבה מאוד דיונים. גם אנחנו ניכנע לטרנד, ולו רק לרגע קט.

ביולי 2016 הצהיר טראמפ בראיון: "אין לי שום קשר לפוטין… נראה לי שמעולם לא פגשתי אותו". המראיין העמיד אותו מיד על כך שבעבר הוא דווקא כן הודה בקשרים עם השליט הרוסי. מזל שאחד השותפים של ארכיון האינטרנט, Political TV Archive, איפשר בדיקת עובדות מהירה שהפריכה גם היא את ההכחשה של טראמפ. דוגמה ראשונה לאתגור של הנשיא ההסגוני מצד הארכיון.

בנובמבר באותה השנה הכריע טראמפ את הילארי. מיד הודיע קייל, מייסד הארכיון, שהוא פועל בנמרצות ליצירת העתק של הארכיון בקנדה. קייל חשש, באמת ובתמים כנראה, שממשל טראמפ יטיל מגבלות שונות ומשונות על הארכיון והכין תכנית מילוט.

לא עברו חודשיים והודיע הארכיון על הקמת "ארכיון טראמפ". לא… אין מדובר בשגעון גדלות של הנשיא האמריקאי, אלא להיפך, על מאגר מידע שיזם ארכיון האינטרנט שמתמקד אך ורק בדונאלד טראמפ. בהודעה על ההקמה השתדלו מאוד אנשי הארכיון להביא הצדקות לכאורה-ניטרליות לחשיבות של ארכיון טראמפ – "חשוב לבדוק עובדות", "בהמשך נקים עוד כאלו"… אך כפי שנאמר יפה באחת התגובות: "שמתי לב שהמאמר הזה לא כלל קישור לארכיון אובמה… ארכיון האינטרנט מאבד מאמינותו ופוגע בתדמיתו כמאגר ציבורי המשרת את הציבור מבלי לנקוט בעמדה פוליטית".

"שמתי לב שהמאמר הזה לא כלל קישור לארכיון אובמה… " – טוקבקיסט עוקצני על ארכיון טראמפ

כן, זה סופו של כל בלון. אמנם, אנחנו בעידן של 'פוסט-אמת' שבו השימוש ב'בודקי עובדות' מאפשר להתמודד עם מי שמביא את עיוות האמת לדרגת אומנות. אך לא ניתן להתעלם מכך שבימינו, לבדוק עובדות נגד טראמפ זה גם לנקוט בעמדה פוליטית. המעורבות של הארכיון בענייני פוליטיקה, גם אם בכובע של 'בודקי-עובדות', מראה שוב איך ליקוט ההיסטוריה, במקרה הזה על ידי זחלן ניטרלי שאוסף מידע ברשת, ומכונת זמן ללא תודעה פוליטית, איננו-וגם-לא-יכול-להיות יוזמה ניטרלית באמת. מי שמחזיק במאגר כה עצום, מי שבוחר ביחס למי למקד משאבים, וביחס למי לא, נוקט עמדה בתוך המשחק הפוליטי.

פח הזבל של האנושות

ב-2010 הכריזה ספריית הקונגרס האמריקאי שהיא תרכוש מטוויטר את כל הציוצים מאז 2006. היוזמה הזו שימחה אחדים, במיוחד היסטוריונים, אך הצחיקה אחרים שנטו לזלזל בה, עד כדי טענה שמדובר בהקמת "מוזיאון של שטויות" שלא ראויות להיכלל בפנתיאון הספרותי הלאומי (כאן).

האגירה הכוללנית נמשכה רק עד 2017, אז הספרייה הודיעה על מפנה במדיניות – מעכשיו היא תסנן חלקים מספריית הטוויטר ותתמקד בציוצים הנוגעים לאירועים שיש בהם אינטרס לאומי. ב'ווייט פייפר' בנושא הסבירה ספריית הקונגרס שטוויטר השתנתה עם השנים, ושלספרייה די בכל הציוצים שכבר ברשותה ואשר מתעדים את תקופת עליית הרשת החברתית. יתרה מזאת, היא הוסיפה, אין מה להיות מופתעים מהמהלך – מדיניות הארכוב של הספרייה תמיד הייתה סלקטיבית. גם כאן, חלק ראו את המפנה כמהלך מושכל, ואחרים כינו אותו "כישלון ברמה היסטורית".

ובאמת, ישאל השואל – איזה ערך יש בשימור הטוויטר, או כל רשת חברתית חברתית אחרת? מה חשיבות כל ערימת ההבלים המצויה שם, הבוטים, הפייקים, הציוצים הפוליטיים, שיתופי מנות המסעדות, כמות הלייקים בפוסטים חולפים ומתחלפים, תגובות שטניות, העמדת פנים לסלפי איקס, פוטושופ לסלפי וואי, מידע חסר חשיבות על היום שעבר עלי או על ההוא שמחפש דירה בנסיבות משמחות. כפי שהצהיר האינטלקטואל הצרפתי אלן פינקלקראוט – מה שהולך באינטרנט "זה פח זבל" ("c'est une poubelle"). ואם אכן זה פח אשפה – מה העניין בלהנציח את זה?

האינטרנט הוא פח זבל (מקור: Pawel Czerwinski, Unsplash)

האינטרנט הוא פח זבל. אבל האם אין מה להרוויח מפחי זבל? זה הזמן לזכור שתגליות ארכיולוגיות והיסטוריות חשובות התגלו דווקא בזכות פחי זבל: שאריות האוכל והגללים שהשאירו בני אדם לפני כמה אלפי שנים בנונשלנטיות הם שיעור מאלף לחוקר, ממש בית ספר לאדם. הם לפעמים מלמדים יותר מכל דבר אחר לגבי הרגלי תזונה, חקלאות, ציביליזציה.

מאיפה לנו לדעת מה יועיל למחקר של העתיד ומה לא? קחו למשל את אבן רוזטה שבזכותה פוענח כתב החרטומים המצרי. זוהי כתובת אבן שנחקקה לשעתה – למחוקק, במובן הפשוט של המילה, לא הייתה קמצוץ כוונה שהיא תמלא תפקיד היסטורי. כך גם גניזת קהיר, שאיתה פתחנו את המאמר, ועוד רבים וטובים.

ובמילים אחרות – באיזו זכות נוכל להחליט מה שווה ומה לא? אולי הזבל של היום הוא האוצר של המחר? רק ההיסטוריה יודעת לשפוט.

כונן קשיח מחפש זהות

בהתחלה נאגר האינטרנט כדי להנציח יצירה אנושית בשלמותה. אך אט אט החלו הזדחלו להן שאלות בדבר הניטרליות של הכונן הזה, ותהיות לגבי זהותו.

האם האינטרנט צריך להישמר כפח זבל אחד גדול, מאגר מבולגן וניטרלי שבו מקסימום מידע מהרשת ללא הבדל מקור/חשיבות/רלוונטיות, ושמשאיר לדורות הבאים את החירות לסנן ולהחליט מה מעניין ומה לא?

או שמא יש מקום לעיבוד מסוים: כמו גניזה שבה נשמרים רק החלקים הראויים לכבוד או כמו ספריית הקונגרס האמריקאי ששומרת עכשיו רק את הציוצים בעלי הערך, קרי – אלו שבני האדם של היום החליטו שיהיה להם ערך בראי ההיסטוריה של המחר?

ואולי הארכיון צריך להפוך במרוצת הזמן למוזיאון? קומה ראשונה – תערוכת "נשיאים מהעבר" – קצת טראמפ, קצת אובמה. במתחלפות – תצוגת "קורונה – המגפה (שלא) הייתה". ובאגף הנוער תמצאו את "להיות מילניאל" – מבחר סרטוני טיק-טוק משנות ה-2010. הכל מסודר לביקור, עכשיו רק תבחר.

זו שאלה להיסטוריון שבקהל – מה היית מעדיף אי-שם ב-2050 או 2070 בתור חוקר היסטוריה אינטרנטית? שיעשו לך חצי עבודה ויסדרו לך את עיקרי הדברים יפה יפה, או שישאירו לך את החדר מבולגן, ואתה כבר תדאג לעשות בו סדר? שהארכיונאי העכשווי יהיה איש חמור סבר שמזלזל במה שנחזה כשטויות ברשת, או שייתן את החופש לשמר הכל – כי מי יודע, אולי זה יעניין מישהו מהעתיד?

וזו כמובן גם שאלה לכולנו – איך אנחנו רוצים שיזכרו אותנו? אנחנו מעדיפים להיחקק יחד עם כל האוצרות והשטויות שיודע האינטרנט להציע? או שטוב לנו לזקק את שעותינו היפות, במחיר יומרנות מסוימת כאילו אנחנו יודעים מה טוב ומה רע, מה נכון לשמור, ומה לא?

ולסיום, זחלן אם אתה שומע אותי, ארכב נא את הפוסט הזה – יש בי עוד תקווה שהוא יעניין את דורות העתיד.

(תמונת שער: Anna Shvets, Pexels)