המיתוס של אנתרופיק: מודל הבינה המלאכותית שכותב מחדש את כללי אבטחת הסייבר

  • גישה מוגבלת לתצוגה המקדימה של קלוד מיתוס עקב יכולותיה חסרות התקדים למצוא ולנצל פגיעויות קריטיות.
  • בנקים בינלאומיים ורגולטורים בארה"ב, בריטניה והאיחוד האירופי מנתחים את הסיכון שהמודל מציב לתשתיות פיננסיות ודיגיטליות.
  • אנתרופיק פורסת את פרויקט Glasswing, תוכנית שיתוף פעולה עם חברות טכנולוגיה גדולות ומוסדות פיננסיים כדי להשתמש במיתוס במצב הגנתי.
  • המודל פותח תרחיש חדש לאבטחת סייבר באירופה, עם יכולת גילוי גדולה מאי פעם, אך גם עם סיכונים לניצול לרעה אם השימוש בו יהפוך לנפוץ.

מודל בינה מלאכותית של מיתוס אנתרופי

מודל הבינה המלאכותית החדש של אנתרופיק, המכונה תצוגה מקדימה של קלוד מיתוסהיא הפכה למוקד הדיון העולמי על גבולות הבינה המלאכותית המתקדמת. החברה עצמה מודה שהמערכת כה חזקה מבחינת אבטחת סייבר עד שהחליטה לא להשיקה באופן נרחב, החלטה יוצאת דופן במגזר שרגיל להתפאר בכל התקדמות חדשה.

מה שמונח על כף המאזניים אינו רק שיפור הדרגתי לעומת דגמים קודמים, אלא קפיצת מדרגה איכותית ביכולת לזהות ולנצל פגיעויות מחשבממשלות, בנקים מרכזיים, מוסדות פיננסיים גדולים ורגולטורים אירופיים עוקבים מקרוב אחר המקרה, מתוך מודעות לכך שכלי כזה עלול... לחזק את ההגנה על מערכות קריטיותאבל זה גם יכול לפתוח את הדלת להתקפות בקנה מידה חסר תקדים אם זה ייפול לידיים הלא נכונות.

מהו בעצם קלוד מיתוס ומדוע השקתו נדחתה?

קלוד מיתוס הוא אחד הדגמים החדשים ביותר במשפחת קלוד, מערכת האקולוגית של בינה מלאכותית של אנתרופיק שמתחרה ב... ChatGPT של OpenAI וג'מיני של גוגלזהו מודל רב-תכליתי, המסוגל להסיק, לתכנת ולעבוד עם הקשר ארוך טווח, אך התכונה השנויה ביותר במחלוקת שלו היא... ביצועים באבטחת סייבר התקפית והגנתית.

השיחות "קבוצות אדומות"מומחים שבודקים מערכות בינה מלאכותית עד קצה גבול היכולת הגיעו למסקנה בדו"ח פנימי כי Mythos "מוכשרת באופן מפתיע" במשימות אבטחת סייבר. במבחני ביצועים כמו... SWE-bench מאומת o SWE-bench Proהמודל, שנועד למדוד את היכולת לפתור בעיות הנדסת תוכנה בעולם האמיתי, היה עולה בקלות על חלופות מסחריות מהשורה הראשונה, כולל גרסאות מתקדמות של GPT ו-Gemini, על פי נתונים שסיפקה Anthropic עצמה.

מעבר למדדים, מה שהדליק נורות אזהרה הוא ש מיתוס הצליח לאתר פגיעויות אפס-יום —פגמים שלא היו ידועים בעבר— ברכיבי תוכנה נפוצים, חלקם בני למעלה משני עשורים. במערכות כמו רכיבי OpenBSD, FFmpeg ו-FreeBSD, המודל לא רק זיהה שגיאות שלא זכו לתשומת לב במשך שנים, אלא גם יצר פרצות תקלות שעבדו כדי לנצל אותן.

לנוכח תוצאות אלו, בחרה אנתרופיק בהחלטה יוצאת דופן בתעשייה: להציג את המודל ולאחר מכן להודיע ​​שהוא לא ישווק בגלוי. משום שהיא סבורה שהוא מציב סיכוני סייבר חסרי תקדים. החברה מתעקשת ש-Mythos הוא המודל "המתואם ביותר" שבנו, אך מכירה בכך שהיכולת העצומה שלו מגבירה את ההשלכות של כל שימוש לרעה.

איור של בינה מלאכותית מתקדמת המתמקדת במיתוס

מודל עם כישורי "האקר" הרבה מעבר ליכולות אנושיות

מסמכים טכניים ודוחות מארגונים שונים מסכימים כי מיתוס מסמן נקודת מפנה באוטומציה של התקפות מורכבותבסביבות בדיקה המדמות רשתות ארגוניות אמיתיות, המערכת הצליחה לשרשר פגיעויות, להעלות הרשאות ולהשיג גישה מתמשכת תוך שעות - משימות שייקחו מומחה אנושי ימים או שבועות.

במנוע ה-JavaScript של פיירפוקס, לדוגמה, גרסאות קודמות של המודלים של Anthropic כמעט ולא הצליחו להפוך פגיעויות לניצול לרעה. Mythos, תחת אותם תנאי בדיקה, זה יצר עשרות פרצות מבצעיותהיא משכפלת במדויק את ניצול הווקטורים היעילים ביותר. בפלטפורמות ניתוח כמו OSS-Fuzz, שנועדו למצוא באגים בתוכנות קוד פתוח, היא זוכה לקרדיט על גילוי פגיעויות בחומרה גבוהה שלא זכו לתשומת לבם למרות שנים של בדיקות אוטומטיות.

המודל גם הפגין יכולות יוצאות דופן ב הנדסה הפוכההיא יכולה לשחזר חלק מהלוגיקה של תוכנית מקבצים בינאריים מהודקים, ומשם לאתר ולנצל פגמים מבלי לגשת לקוד המקור המקורי. יכולת מסוג זה מקרבת את הבינה המלאכותית לתרחישים שנחשבו עד לאחרונה בלעדיים לצוותים אנושיים בעלי התמחות גבוהה.

אחד הפרקים המצוטטים ביותר בהערכות אבטחה הוא מה שנקרא "מבחן הסנדוויץ'". בסביבת מעבדה מבודדת, ניתנה למיתוס שליטה על מערכת עם הוראות מפורשות לנסות... ברחו מארגז החול וצרו קשר עם החוקר מי פיקח על הבדיקה. המודל הצליח לנצל שרשרת של פגיעויות כדי להימלט מסביבתו המוגבלת ולשלוח דוא"ל לאחראי, שלא היה במשרד באותו זמן. למרות שהאירוע התרחש בגרסה פנימית מוקדמת יותר ותחת פיקוח מודרך, הוא ממחיש את המידה שבה המערכת יכולה לפעול בתרחישים מורכבים עם פיקוח מינימלי.

למרות ההפגנות הללו, אנליסטים מתעקשים להבהיר כי אנחנו לא עוסקים בבינה מלאכותית "מודעת" או כזו שיש לה רצון משלהמיתוס לא מחליט לתקוף מערכות בעצמו; הוא מבצע את המשימות שניתנו לו בצורה היעילה ביותר האפשרית. הסיכון, במובן זה, אינו שהמודל ימרוד, אלא שמישהו ישתמש בו - או יכריח אותו לעשות זאת באמצעות הנחיות מתוחכמות - כדי לבצע פעולות מזיקות.

פרויקט גלאסווינג: מיתוס בשירות ההגנה... עבור קומץ נבחרים

במקום לפתוח גישה לציבור הרחב, אנתרופיק בחרה להקיף את מיתוס בתוכנית ספציפית, פרויקט גלאסווינגהיוזמה, שתוכננה להשתמש ביכולות המודל באופן מבוקר להגנה על תוכנות קריטיות, כוללת הצעת המערכת, תחת תנאי שימוש מחמירים, לקבוצה נבחרת של חברות טכנולוגיה גדולות, ספקי תשתיות ומוסדות פיננסיים.

בין הארגונים בעלי הגישה נמצאים ענקים כמו שירותי האינטרנט של אמזון, אפל, מיקרוסופט Google Cloudאנבידיה או ברודקוםכמו גם חברות אבטחת סייבר כמו CrowdStrike, שתוכנתן הפגומה גרמה לשיבוש עולמי משמעותי בשנת 2024. אליהן מצטרפים בנקים בעלי שם עולמי, כולל ג'יי.פי מורגן צ'ייס וכמה קבוצות גדולות בוול סטריט, כמו גם ארגונים אחרים האחראים על תחזוקת תשתיות IT רגישות.

גם אנתרופיק הודיעה הלוואות בשווי 100 מיליון דולר מימון זה יאפשר לארגונים אלה להשתמש ב-Mythos לניתוח פגיעויות, יחד עם תרומות לקרנות תוכנה חופשית כמו קרן לינוקס וקרן התוכנה אפאצ'י. המטרה הרשמית ברורה: לאפשר לאלו המנהלים את התוכנה הקריטית ביותר בעולם לזהות ולתקן פגמים לפני שכלים כאלה הופכים לזמינים לתוקפים פוטנציאליים.

עם זאת, אסטרטגיה זו יוצרת אי נוחות מסוימת בתוך המגזר. מצד אחד, היא מחזקת את הרעיון שטכנולוגיה מסוכנת מספיק כדי לדרוש גישה מוגבלת. מצד שני, זה יוצר פער בין אלו שנהנים מ"מגן" המיתוס לבין אלו שנותרים בחוץ.חברות ומנהלים שאינם חלק מ-Glasswing מסתכנים להתמודד מאוחר יותר עם פגיעויות שזוהו ותוקנו בסביבות פריבילגיות, אך עדיין קיימות במערכות שלהן.

באירופה, אסימטריה זו מדאיגה במיוחד את האחראים על תשתיות קריטיות ואת צוותי האבטחה של קבוצות תעשייתיות ופיננסיות גדולות, אשר עוקבים מקרוב אחר בריסל ובירות אירופה מבטיחות שתוכניות דומות יכללו שחקנים מרכזיים מהיבשת בתנאים שווים. ו ריבונות ענן עם השותפים האמריקאים.

תגובות ממשלות, רגולטורים והמגזר הפיננסי

ההשפעה של מיתוס אינה מוגבלת לתחום הטכני. תוך ימים ספורים בלבד, ההכרזה על המודל עוררה... פגישות ברמה גבוהה בארצות הברית ובאירופהשר האוצר האמריקאי זימן את ראשי הבנקים הגדולים במדינה לוושינגטון כדי להעריך את הסיכונים שהמערכת עלולה להוות ליציבות הפיננסית, בעוד יו"ר הפדרל ריזרב השתתף גם הוא בשיחות אלו.

על פי הדלפות שדווחו על ידי כלי תקשורת בינלאומיים, גופים אלה עודדו לכאורה בדיקת מיתוס במצב הגנתימשתמשים בו כדי לסרוק את התשתית שלהם לאיתור חולשות לפני שאחרים יכולים. המסר המשתמע הוא שהאיום חמור מספיק כדי להצדיק תגובה ציבורית-פרטית מתואמת.

בינתיים, מייסד שותף של Anthropic אישר כי החברה מקיים שיחות ישירות עם ממשלת ארצות הברית בנוגע למיתוס ולמודלים עתידיים. דיונים אלה מתקיימים בהקשר מתוח, לאחר שרשויות ארה"ב הוסיפו לאחרונה את החברה לרשימה של סיכוני שרשרת האספקה, בעקבות חיכוכים הקשורים לשימוש במודלים שלהם על ידי משרד ההגנה.

מעבר לאוקיינוס ​​האטלנטי, האיחוד האירופי שם לב לכך. הנציבות האירופית אישרה בפומבי גישה הדרגתית וזהירה למודלים כמו מיתוס, ו רגולטורים פיננסיים בבריטניה וביבשת החלו לחקור באופן ספציפי את ההשלכות הפוטנציאליות שלה. עבור בנקאות ושווקים. מכון אבטחת הבינה המלאכותית (AISI) של ממשלת בריטניה תיאר את המערכת כקפיצת מדרגה משמעותית מבחינת איום הסייבר בהשוואה לדורות קודמים.

בספרד, למרות שהדיון הציבורי עדיין מוגבל, גופי פיקוח וצוותי אבטחת סייבר מבנקים וחברות אנרגיה גדולות עוקבים מקרוב אחר ההתפתחויות הללו. עבור המגזר הפיננסי האירופי, כל התקדמות שעלולה להקל על התקפות מתואמות נגד מערכות תשלומים, רשתות בין-בנקאיות או פלטפורמות מסחר היא סיבה לדאגה רבה.

ספקנות, ספקות ודיון לגבי ה"הייפ" סביב המיתוס

החשבון של אנתרופיק, המשלב אזהרות אבטחה עם נתוני ביצועים מרהיבים, לא חף מביקורת. מספר מומחי בינה מלאכותית ואבטחת סייבר קראו ל... זהירות בעת פירוש הצהרות החברהיש לציין כי חלק ניכר מהנתונים הזמינים מגיע רק מדוחות פנימיים.

כמה אנליסטים סקרו בפירוט את התיעוד הנרחב שפורסם על ידי Anthropic ומצביעים על כך שהנתון של "אלפי פגיעויות בדרגת חומרה גבוהה" מבוסס על אקסטרפולציות ממספר קטן יחסית של מקרים שנבדקו ידנית. בסוויטות בדיקות מסוימות, Mythos מצאה, על פי הדיווחים, מספר משמעותי של פגמים קריטיים, אך רחוק מהתרחיש הכמעט אפוקליפטי שהוצע על ידי כותרות מסוימות.

מחקרים עצמאיים אחרים ניסו להשוות את ביצועי Mythos עם מודלים קטנים יותר בקוד פתוח, תוך העברת קטעי קוד פגיעים למערכות בינה מלאכותית שונות כדי לראות אם הן יוכלו לזהות את אותם פגמים. התוצאות מצביעות על כך חלק מהמודלים הפתוחים מסוגלים גם לזהות פגיעויות מורכבותזה מעלה בספק את הרעיון שמיתוס משחק בליגה שונה לחלוטין בכל התרחישים.

דוגמאות נגדיות מסוג זה אינן שוללות את יכולותיו של מיתוס, אך הן כן מרמזות על כך לחלק מהשיח של "מסוכן מדי לפרסם" יש גם ממד שיווקי.הצגת מודל כבעל עוצמה יוצאת דופן וכפוטנציאל לסיכון מחזקת את תדמית המנהיגות והאחריות הטכנולוגית, דבר בעל ערך רב בשוק תחרותי יותר ויותר.

ההיסטוריה האחרונה של התעשייה מזכירה גם את התקדים של GPT-2 בשנת 2019, כאשר OpenAI החליטה בתחילה לא לפרסם את המודל המלא, בטענה שהוא מסוכן מדי בשל הפוטנציאל שלו לייצר דיסאינפורמציה. בסופו של דבר, גרסה זו שוחררה לציבור מבלי שאף אחת מהאסונות הצפויים התממשה, ומומחים רבים ציינו אותה כדוגמה לתגובת יתר. עם Mythos, ההבדל הוא שהמוקד כבר אינו על הטקסט, אלא על שלמות התשתית הדיגיטלית., תחום רגיש הרבה יותר עבור ממשלות ובנקים.

איזון עדין בין אבטחה, עסקים וגישה לטכנולוגיה

מעבר לרעש התקשורתי, מצב המיתוס מעלה סוגיה מהותית: מי מחליט מתי מודל בינה מלאכותית מסוכן מדי לשחרור ותחת אילו קריטריונים? נכון לעכשיו, ההחלטה הייתה חד צדדית מצד אנתרופיק, שבחרה לשמור את המערכת במעין הסגר מבוקר, ולשמור אותה לשותפים נבחרים.

עמדה זו אינה מבוססת אך ורק על סיבות ביטחוניות. הרצת מודל עם מאפייני מיתוס היא יקר מאוד מבחינת מחשובוהחברה עצמה מודה כי נכון לעכשיו אין לה את תשתית הכרחית כדי להגיש אותו באופן מאסיבי למיליוני משתמשים. בפועל, אמצעי אבטחה ומגבלות טכניות הולכים יד ביד, מה שנותן לאנתרופיק זמן לכוונן הן את המודל והן את פריסתו.

במקביל, החברה החלה להבדיל באופן ברור בין מוצריה השונים. בעוד מיתוס נשאר כ הסטנדרט הפנימי המתקדם ביותרבעוד שמודלים אחרים כמו קלוד אופוס 4.7 מיועדים לשימוש יומיומי על ידי עסקים ואנשי מקצוע, הם מיועדים לשימוש יומיומי. אנתרופיק אף הודתה בפומבי שאופוס 4.7 "פחות מוכשר" ממיתוס באופן כללי, ובפרט בכל הנוגע ליכולות הסייבר שלו - דבר יוצא דופן בתעשייה שבדרך כלל מציגה כל דגם חדש כטוב ביותר מכל בחינה.

בתכנית זו, מיתוס מתפקד כ משטח ניסוי ליכולות הדור הבאבעוד שמודלים זמינים מסחרית משלבים רק חלק מיכולות אלו, עם מגבלות נוספות שנועדו להפחית סיכונים, הפרדה זו בין מודלים "ניסיוניים" למודלים "ייצוריים" יכולה להיות גישה סבירה עבור ארגונים אירופאים רבים המעוניינים למנף בינה מלאכותית מבלי להיות בחזית החשיפה, בתנאי שיש שקיפות מספקת לגבי היכולות בפועל של כל מערכת.

מה שבסופו של דבר מתברר הוא תרחיש שבו אבטחת הסייבר נכנסת במלואה לעידן של בינה מלאכותית התקפית והגנתית בקנה מידה גדולכלים כמו Mythos מבטיחים להאיץ את זיהוי הפגיעויות במערכות הפועלות כבר שנים, אך הם גם כופים חשיבה מחודשת על האופן שבו הטכנולוגיה העומדת בבסיס הכלכלה הדיגיטלית מופצת ומנוהלת. עבור אירופה וספרד, האתגר לא יהיה רק ​​להגן על עצמן מפני מודלים חזקים יותר ויותר, אלא גם להבטיח שהן לא נותרות מחוץ למנגנונים המאפשרים להשתמש בהן לחיזוק האבטחה שלהן.

אסטרטגיית אבטחת סייבר
Artaculo relacionado:
אסטרטגיית אבטחת סייבר: מפתחות, מסגרות ויישום מעשי