מדעני ג'נום מגייסים כלי תוכנת מחשב לטיפול בשטף הנתונים הגולמיים מפרויקט הגנום האנושי ומאמצים קשורים

מדעני ג'נום מגייסים כלי תוכנת מחשב לטיפול בשטף הנתונים הגולמיים מפרויקט הגנום האנושי ומאמצים קשורים
מדעני ג'נום מגייסים כלי תוכנת מחשב לטיפול בשטף הנתונים הגולמיים מפרויקט הגנום האנושי ומאמצים קשורים
Anonim

WASHINGTON, D. C. - דיסציפלינה חדשה צמחה בצומת של מדעי המחשב וביוטכנולוגיה, והביאה את הכוח של טכניקות חישוב מתקדמות להשפיע על בעיות מורכבות בביולוגיה מולקולרית. תחום חדש זה, הנקרא ביואינפורמטיקה או ביולוגיה חישובית, מספק כלים חיוניים למדענים בחזית המחקר בגנטיקה ובתחומים בסיסיים אחרים בביולוגיה.

מאמצי רצף גנים כמו פרויקט הגנום האנושי, בשילוב עם טכניקות חדשות לחקר פעילות הגנים בתאים חיים, מייצרים כמויות אדירות של נתונים גולמיים. נתונים אלו מצטברים בקצב מואץ במהירות במגוון מאגרי מידע ציבוריים ממוחשבים, כגון אלו המתוחזקים על ידי המרכז הלאומי למידע ביוטכנולוגיה במכוני הבריאות הלאומיים.

"הכוח המניע מאחורי ביואינפורמטיקה הוא הזמינות של מסדי נתונים גדולים אלה והצורך להמציא מודלים ממוחשבים מתוחכמים להפקת מידע שימושי מהם", אמר דיוויד האוסלר, פרופסור למדעי המחשב באוניברסיטת קליפורניה, סנטה קרוז.

האוסלר דנה בשימוש בטכניקות חישוביות לניתוח נתונים גנטיים בהרצאה ביום שבת (19 בפברואר) במפגש השנתי של האגודה האמריקאית לקידום המדע בוושינגטון די.סי.

האוסלר, המנהל את המרכז להנדסה ביו-מולקולרית של UCSC, הצטרף לאחרונה לצוות הביואינפורמטיקה של פרויקט הגנום האנושי.ביואינפורמטיקה משחקת תפקיד חשוב יותר ויותר בפרויקט, מאמץ בינלאומי לזהות ולהבין את כל כ-100,000 הגנים האנושיים.

"ניתוח מחשב יהיה חלק בלתי נפרד מזיהוי גנים והבנת תפקידיהם", אמר האוסלר.

מערך ההוראות הגנטיות לייצור אורגניזם - הגנום שלו - כלול במולקולות DNA ארוכות דמויות חוט ארוזות בקפידה לתוך כרומוזומים בתוך הגרעין של כל תא. רצף היחידות הכימיות ב-DNA הוא מעין קוד המפרט את המבנים של מולקולות חלבון, הממלאות את רוב הפונקציות של תאים חיים.

רצף ה-DNA המלא של הגנום האנושי, אם יורכב בספרים, ימלא 200 כרכים בגודל של ספר הטלפונים של מנהטן. מדעני פרויקט הגנום האנושי קרובים לקבל טיוטה גסה של הרצף הזה, אבל זה יהיה רק צעד ראשון. בתוך רצף הגנום קבורים הגנים - רצפי DNA המקודדים לחלבונים ספציפיים - שקובעים בסופו של דבר את כל המאפיינים העוברים בתורשה של בני אדם.

איתור גנים בתוך רצפי DNA גנומי היא אחת המשימות הראשונות שבגינן פנו מדענים לביואינפורמטיקה. פחות מ-10 אחוזים מהגנום האנושי נחשבים כמרכיבים רצפי גנים מקודדי חלבון. בין הגנים משולבים רצפי בקרה, המווסתים את פעילות הגנים, ו"אזורים לא מקודדים" אחרים שתפקידיהם לא ברורים.

האוסלר ועמיתיו לעבודה ב-UC Santa Cruz פיתחו כמה מהטכניקות החישוביות היעילות ביותר למציאת גנים ברצפי DNA. הם הציגו שיטה סטטיסטית בשימוש נרחב בשם Hidden Markov modeling כדי לתקוף את הבעיה הזו.

כדי לנתח את הטיוטה הגסה של רצף הגנום האנושי, האוסלר עובד בשיתוף פעולה הדוק עם חוקרים במכון Whitehead של המכון הטכנולוגי של מסצ'וסטס. מכון ווייטהד הוא אחד מחמישה אתרי רצף מרכזיים המעורבים בפרויקט הגנום האנושי.

עם זאת, עבודה עם הטיוטה הגסה תהיה משימה קשה במיוחד, אמר האוסלר."הבעיה היא שהטיוטה הגסה אינה מספקת רצף DNA רציף על פני כל כרומוזום - אזורים רבים של הגנום מכוסים רק על ידי חתיכות קטנות", אמר.

המשימה הראשונה שהאוסלר וקבוצת ווייטהד מתמודדים עם היא לסדר את כל מקטעי הגנום האנושי שנרשמו עד כה בסדר ובכיוונים הנכונים שלהם לאורך הכרומוזומים. השלב הבא יהיה איתור גנים בתוך רצף הגנום. זה ייעשה בשיתוף פעולה עם Neomorphic, חברת גנומיקה מבוססת ברקלי, באמצעות תוכנת מחשב בשם Genie.

Genie פותחה בתחילה על ידי קבוצתו של האוסלר וחוקרים במעבדה הלאומית של לורנס ברקלי (LBNL). הוא קיבל רישיון בלעדי ופותח עוד יותר על ידי Neomorphic, אשר נוסדה על ידי קבוצת מדענים מ-LBNL, UC Berkeley ו-UCSC. לאחרונה נעשה שימוש ב-Genie לזיהוי גנים בגנום של זבוב הפירות, Drosophila melanogaster, שנרשם בשנה שעברה. Neomorphic מפתחת כעת גרסה חדשה של Genie המותאמת לטיוטה הגסה של רצף הגנום האנושי.

מחקר על הגנטיקה של אורגניזמים כמו תסיסנית, שמרים ותולעת עגול Caenorhabditis elegans סייעו בהנחת היסוד לחקר הגנום המורכב הרבה יותר של בני אדם. גנים אנושיים רבים קשורים קשר הדוק לגנים המצויים באורגניזמים הפשוטים יותר הללו, הנמצאים בשימוש נרחב כמערכות מודל למחקר בגנטיקה ובביולוגיה מולקולרית. מחקרים על אורגניזמים מודל אלה כבר הניבו תובנות רבות ערך לגבי תפקודי גנים, ויסות גנים תקין, מחלות גנטיות ותהליכים אבולוציוניים.

לפי האוסלר, התפקיד של ביואינפורמטיקה בסוג זה של מחקר גדל בהתמדה ככל ששיטות הניסוי נעשות מתוחכמות ומורכבות יותר. מיקרו-מערכי DNA או "שבבי גנים", למשל, מספקים מידע רב ערך על ביטוי גנים - מתי, היכן ובאיזו מידה גנים ספציפיים פעילים.מידע זה הוא קריטי להבנת התפקוד הביולוגי של הגן. אבל שבבי גנים, כמו טכנולוגיית רצף גנומי, מייצרים כמויות אדירות של נתונים שניתן לנתח ולהבין רק באמצעות גישות חישוביות מתוחכמות.

"יש מידע רב הנוגע לתפקוד גנים שהופך זמין כתוצאה מניסויים בקנה מידה גדול באמצעות שבבי גנים ושיטות אחרות, היוצרים מערכי נתונים מסיביים הקשורים לתפקודם של אלפי גנים," האוסלר אמר.

כדי לנתח מערכי נתונים מורכבים אלה, האוסלר היא חלוצה בשימוש בשיטה סטטיסטית חדשה המבוססת על התיאוריה של מכונות וקטור תמיכה (SVMs). מערכות SVM מסוגלות להתמודד עם מערכי נתונים בעלי ממדים גבוהים שבהם לכל נקודת נתונים יש תכונות או תכונות רבות.

"קשה לדמיין כי אנחנו חיים בעולם תלת מימדי, ואנחנו מדברים על ניתוח מערכי נתונים בעשרת אלפים ממדים או יותר. אבל אנחנו מוצאים את ה-SVMs שימושיים ביותר עבור נתוני שבב גנים," האוסלר אמר.

ריצוף גנומי ושבבי גנים מייצגים את מה שהאוסלר מכנה "טכנולוגיות גנומיות בעלות תפוקה גבוהה", טכניקות חדשות ועוצמתיות להבנת ביולוגיה מולקולרית. השימוש בטכניקות אלו הולך וגובר, וכולן מציגות אתגרים חישוביים משמעותיים. אחת ממטרותיו של האוסלר היא לפתח שיטות סטטיסטיות ואלגוריתמיות חדשות לשילוב סוגי נתונים גנומיים מגוונים אלה.

לרגע זה, ניתוח הטיוטה הגסה של רצף הגנום האנושי הוא המוקד של מאמציו של האוסלר. אבל בטווח הארוך, הוא צופה עתיד מאושר ומשגשג לנישואים של מדעי המחשב וביולוגיה מולקולרית. היישום של גנומיקה אנושית לתחומים כמו גילוי תרופות ואבחון קליני, למשל, ידרוש ללא ספק מתודולוגיות חישוביות חדשות, הוא אמר.

"החזון שלנו לביואינפורמטיקה משתרע על קשת רחבה, מביולוגיה מולקולרית בסיסית ועד לאבחון קליני", אמר האוסלר.

מידע נוסף על תוכנית המחקר של האוסלר זמין באינטרנט בכתובת

נושא פופולרי