הצצה לעתיד: כך יאוחסן כל המידע באינטרנט במבחנה קטנה

תשכחו משבבי סיליקון ומדיסקים קשיחים; הדור הבא של אחסון המידע מגיע מהביולוגיה ■ כך לפחות טוענים שני חוקרים שהצליחו לקודד ספר בן 300 עמודים בתוך מולקולת דנ"א

כשני מיליון כותרים שונים מתפרסמים מדי שנה בעולם. מנתוני הספרייה הלאומית, למשל, עולה כי בשנת 2011 לבדה ראו אור בישראל יותר מ-6,000 ספרים; שלא לדבר על אתרי אינטרנט, בלוגים, סרטים, מוזיקה, מסמכים, תוכנות ועל עוד הררי מידע שמכניסים את כולנו למצב מתסכל של דאבל-פרקינג תוכני.

אותה טכנולוגיה שמציפה אותנו במידע גם מצאה לנו פתרונות אחסון עבורו: למשל, הקינדל של אמזון - הספר האלקטרוני שמסוגל לאחסן כ-3,500 ספרים. אבל בעידן שבו קצב גידול המידע מכפיל את עצמו בכל כמה שנים, ישנם כאלה שאינם מסתפקים בפתרונות האחסון הקיימים; כמו פרופ' ג'ורג' מ' צ'רץ' מאוניברסיטת הרווארד, שבחר להשיק את ספרו החדש Regenesis בדרך מקורית: הוא קודד אותו על סליל דנ"א שנשמר על רקמה חיה בתוך מבחנה קטנה.

"לדנ"א יש יתרונות רבים כמדיום נצחי לאחסון מידע", הוא מתגאה בראיון ל-G. "האחסון באמצעות דנ"א מאוד דחוס, כך שניתן לאחסן בו כמויות אדירות של מידע".

כמה דחוס? הנה קנה מידה: כיום טאבלט ממוצע יכול לאחסן עד 64 גיגבייט של מידע; במיליגרם אחד של דנ"א אפשר לאחסן כאלף טרבייט, שהם קצת יותר ממיליון גיגבייט. או בתרגום לעברית: על רקמה בגודל ציפורן אנושית אפשר לאחסן מידע השווה ל-15 אלף אייפדים.

"וזה לא סתם אחסון", מצטרף לשיחה ד"ר סריראם קוסורי, שותפו של צ'רץ' למחקר. "הדנ"א בנוי כמולקולה תלת-ממדית, שניתן לאחסן בה הרבה יותר מידע בהשוואה לטכנולוגיות אחסון אחרות שיושבות על מיקרו-צ'יפים ועל ננו-צ'יפים, שהם כידוע שטוחים".

קוסורי גם מדגיש כי דנ"א הוא חומר מאוד יציב, בעל יכולת לשרוד אלפי שנים בצורתו המקורית, בניגוד לדיסקים קשיחים למיניהם. גם הגורם הכלכלי הוא שיקול: "קיימת ירידה משמעותית בעלויות כתיבה וקריאה של דנ"א, ויש סיבות רבות להאמין כי אחסון באמצעות דנ"א ישתלם הרבה יותר מאשר השיטות המקובלות כיום".

- נשמע טוב מכדי להיות אמיתי.

"ישנם גם חסרונות. למשל, האחסון בדנ"א אינו מאפשר כתיבה מחדש, כמו שאפשר לעשות בדיסקים קשיחים; כלומר, אי-אפשר להוסיף עליו עוד ועוד חלקים. נוסף על כך, אי-אפשר לגשת למקום מסוים, אקראי, ברצף; צריך לקרוא את כל המידע, את הרצף כולו".

- אז למה זה טוב, בעצם?

"כרגע, בעיקר לשימוש ארכיוני. אבל אנחנו ממש לא יודעים לאן אפשר להגיע עם הטכנולוגיה הזאת, כך שעוד חזון למועד".

- יש בכלל מכשירים שמאפשרים לקרוא את המידע המקודד? נניח, כמו נגן דנ"א?

"זה מסובך. בקרב החוקרים כבר מצויות מכונות קריאה שכאלה, המשמשות לאבחון של מידע דנ"א למטרות ביולוגיות. אחת מהן היא המערכת המתקדמת Illumina HiSeq, שמאפשרת לפענח את רצף הדנ"א.

- לא בדיוק מערכת שיש לכל אחד בסלון.

"הכול תלוי באופן שבו המערכות האלה יתפתחו בעתיד", משיב קוסורי באופטימיות זהירה. "אוקספורד ננופור למשל (חברת טכנולוגיה העוסקת באנליזה של מולקולות בודדות) הודיעה כי היא מתעתדת לשווק דיסק USB נייד המאפשר פענוח רצפי דנ"א כבר בשנה הבאה".

למרבה הצער, אין טעם לארוב לדיל אקסטרים כדי להיות הראשונים עם מערכת פענוח רצפי דנ"א בבית. "בשלב הזה העלויות של המערכת מאוד גבוהות", אומר קוסורי. "למרות זאת, אפשר יהיה להשתמש בה לצרכים מיוחדים של אחסון מידע לתקופות ארוכות מאוד ולא לשימוש פרטי. אני מתנחם בכך שקיימת צניחה משמעותית בעלויות במהלך העשור האחרון, משמעותית הרבה יותר מהירידה במחירי האחסון האלקטרוני, ואין שום סיבה עקרונית שירידה זו לא תימשך גם בעתיד".

כמו הציור המפורסם של מ' ס' אשר, של הידיים המציירות את עצמן, הספר שצ'רץ' קודד אל תוך מולקולת הדנ"א הקטנה עוסק בדיוק בתחום הזה: ביולוגיה סינתטית. מדובר בתחום חדש ופורץ דרך בביוטכנולוגיה. למעשה, המדע הזה לוקח בחזרה את מה שהמכונות לקחו מבעלי החיים ומכוון זאת לאפיקים חדשים ומרתקים. למה הכוונה? לעיקרון הבסיסי של הביולוגיה הסינתטית: תאים חיים יכולים לעשות הרבה יותר ממה שהמכונה הכי מתקדמת מסוגלת.

לכן, המאמצים הרבים בתחום הזה כיום מנסים לייצר תאים ורקמות שיבצעו פעולות שעד היום בוצעו על-ידי מכונות, כמו למשל אחסון מידע. אבל זאת רק השאיפה המיידית. בטווח הרחוק, מטרת התחום היא לשחק את אלוהים, פשוטו כמשמעו: לייצר תאים, רקמות ואולי אפילו יצורים שפשוט אינם קיימים בטבע - לצורכי הקדמה האנושית. מן הסתם, הדבר הזה מעלה שאלות אתיות ופילוסופיות רבות, שהיריעה קצרה מלהרחיב לגביהן.

גם צ'רץ' מדבר במונחים של אדם מול הטבע. באופן סמלי, בהתחלה הוא בכלל חשב לקודד את "מובי דיק", ספרו המופתי של הרמן מלוויל, במקום את ספרו שלו. "זה הלווייתן הלבן שלי", הוא צוחק, "יש לי אובססיה לכתיבה ולקריאה של דנ"א".

- למה ויתרת בסוף?

"מסיבות טכניות בעיקר. רצינו לקודד לא רק טקסט אלא גם סוגי מדיה חדשים שקיימים בספר שלי, כמו תמונות ומדיה אינטראקטיבית; ויש גם את העניין הפעוט של זכויות היוצרים".

העובדה שהפרויקט התחיל בשנת 2001 באמצעות מלגה של DARPA רק הופכת את כל השאלות האתיות סביב הביולוגיה הסינתטית למהותיות יותר. למי שעדיין לא הספיק להכיר את DARPA, הסוכנות המיוחדת של הפנטגון למימון מחקרים צבאיים, מדובר במחלקה שאחראית בין היתר להמצאות כמו מכוניות מעופפות, רובוטים חיילים, חרקי ריגול, ברקים מלאכותיים ואמצעים נוספים כיד הדמיון.

מטרת הפרויקט של צ'רץ' הייתה למצוא דרך חדשה לאחסן את המידע שאנחנו מייצרים ללא הרף. "אחסון מידע הוא בעיה משמעותית כיוון שאנו מייצרים הרבה יותר ממה שאנחנו מסוגלים לאחסן", הוא מסביר. "הגענו לניצול מקסימלי של כל המאגרים המקובלים, ובשנת 2011 כמות המידע שאוחסן עמדה על 1.8 מיליארד טרבייט, והיא רק הולכת וגדלה. בשנת 2020 כמות המידע צפויה להכפיל את עצמה פי חמישים. מדובר במספר מדהים".

- אתגר רציני בהחלט. בגלל זה ארך לכם 12 שנים עד שהצלחתם לקודד ספר של 300 עמודים?

"כן. פיתוח שיטות המעבדה והתאמת המחשבים ארכו שנים ארוכות, אך כשהגיע הזמן לעסוק בקידוד עצמו, זה היה רק עניין של ימים עד שהניסוי הושלם. סינתזה של מידע דיגיטלי עם דנ"א התחילה לפני לא מעט זמן והוביל אותה ג'ו דיוויס ב-1986. העבודה שלי עסקה בעצם בהפחתת העלויות של קריאה ושל כתיבה באמצעות דנ"א. ורגע האאוריקה שלי היה כשהבנתי שמולטי-פלקסינג (שליחה בו-זמנית של אותות שונים בערוץ תקשורת אחד) אפשר לבצע גם בדרך מולקולרית-ביולוגית, ולא רק באופן אופטי-טכנולוגי".

כדי להבין איך בעצם עובד עקרון האחסון, צריך לחזור ליסודות הדנ"א, אבני הבנייה של כל החיים על פני כדור הארץ. דנ"א הוא בעצם מולקולה המורכבת מארבעה נוקליאוטידים (נוקליאוטיד - "גרעין" בלטינית - הוא תרכובת אורגנית המופיעה בכל היצורים החיים).

ארבעת הנוקליאוטידים שמרכיבים את רצף הדנ"א, כמו שרובנו למדנו בשיעור ביולוגיה, הם אדנין (A), תימין (T), גואנין (G) וציטוזין (C). על קצה המזלג, מה שעשו החוקרים הוא בעצם לתרגם כל אות כזאת לקוד בינארי (למשל, הנוקליאוטיד הראשון של T ברצף תורגם ל-01, הנוקליאוטיד הראשון של A תורגם ל-010, וכן הלאה). כיוון שמספר הנוקליאוטידים שברצף אחד הוא אדיר, אפשר לקודד בתוכו מספר עצום של קודים בינאריים.

"קידוד של אינפורמציה על בסיס דנ"א כבר נעשה בעבר, אבל לא בסדר גודל כזה", מסביר קוסורי. "הבעיה בגישת הקידוד הקודמת הייתה בהבניית הרצף; בשיטות הקודמות היה קשה מאוד להפיק פיסה ארוכה ומושלמת של דנ"א".

כדי להתגבר על המכשול של ייצור פיסת דנ"א ארוכה, החליטו החוקרים לעשות את המתבקש - לייצר פיסות דנ"א זעירות ולחברן מאוחר יותר: "כל פיסה כזאת אחסנה גם 'כתובת' - מידע בנוגע למיקום החלק ברצף הארוך של הדנ"א", מספר קוסורי.

על אף מה שנראה כרגע כמו שימוש מוגבל, העתיד הרחוק, כך צ'רץ' וקוסורי, צפוי להביא לפריחה בתחום האחסון באמצעות דנ"א, והחזון הבא שלהם כולל את רתימת הדנ"א להקלטות וידאו בקנה מידה גדול. את הספר המקודד שלו, אגב, אפשר יהיה לקרוא באוקטובר הקרוב על גבי נייר.