פרויקט ג'יני, אב טיפוס הבינה המלאכותית של גוגל ליצירת עולמות אינטראקטיביים

  • פרויקט ג'יני משלב את ג'יני 3, ננו בננה פרו וג'מיני כדי ליצור עולמות וירטואליים אינטראקטיביים מטקסט או תמונות.
  • הגישה מוגבלת למנויי Google AI Ultra בארצות הברית, עם סשנים של עד 60 שניות ורזולוציה של כ-720p.
  • הכלי מאפשר לך לשרטט, לחקור ולערבב עולמות בזמן אמת, אך הוא סובל מבעיות ריאליזם, בעיות השהייה ושליטה לקויה בדמויות.
  • יכולתו לחקות משחקים ידועים פותחת דיונים על זכויות יוצרים ומדאיגה חלק מתעשיית משחקי הווידאו.

פרויקט בינה מלאכותית ליצירת עולמות אינטראקטיביים

גוגל נקטה צעד חדש במתקפה שלה בינה מלאכותית מיושמת במשחקי וידאו ו עולמות וירטואליים עם השקת פרויקט ג'יני, אב טיפוס המאפשר למשתמשים ליצור ולנווט בסביבות אינטראקטיביות המבוססות על מספר הנחיות טקסט או תמונה, החברה מציגה את הכלי כניסוי שעדיין נמצא בבדיקה. עם זאת, ההדגמות הראשוניות שלו עוררו התרגשות וספקות בתעשייה.

נכון לעכשיו, הגישה מוגבלת ל מנויי תוכנית Google AI Ultra בארצות הבריתעם מפגשים קצרים וביצועים המסומנים בבירור באופי הניסיוני של המערכת. למרות זאת, הפרויקט מצביע על עתיד שבו כל משתמש יוכל צור "עולם קטן שניתן לשחק בו" תוך שניות ספורות, מבלי לדעת לתכנת או לטפל במנועי גרפיקה.

מהו פרויקט ג'יני ואילו טכנולוגיות הוא משלב?

מחולל עולם עם בינה מלאכותית

פרויקט ג'יני הוא אב טיפוס מחקרי שפותח על ידי גוגל דיפ מיינד וגוגל בינה מלאכותית אשר מתפקד כמחולל עולמות אינטראקטיבי. הבסיס הטכני שלו נשען על שלושה עמודי תווך: מודל Genie 3, המתמחה בסימולציה של סביבות דינמיות; Nano Banana Pro, האחראי על ההיבטים הוויזואליים והסקיצות; ו-Gemini, מודל רב-מודאלי המפרש הוראות משתמש ופועל כעוזר במהלך היצירה.

לב המערכת הוא ג'יני 3, מודל "עולם" המסוגל לחזות פריים אחר פריים מה קורה על המסךבניגוד לטכנולוגיות קודמות שיצרו רק סצנות תלת-ממדיות סטטיות, גישה זו מאפשרת לסביבה להגיב לתנועות השחקן בזמן אמת, עם רזולוציה משוערת של 720p וכמה דקות של קוהרנטיות חזותית על פי הניסויים הפנימיים של DeepMind.

זה משולב על בסיס זה Nano Banana Pro, אחראי על יצירת התמונה הראשונית של הבמה החל מטקסט תיאורי או תמונת עזר, תצוגה ראשונית זו משמשת כסקיצה להחליט על הסגנון הגרפי, קומפוזיציית העולם ומראה הדמות שישלטו במהלך החקירה.

לבסוף, ג'מיני משמש כשכבת תזמור ועוזרתהוא מפרש הוראות בשפה טבעית, מסייע להתאים את העולם תוך כדי תנועה, ומקל על משימות כגון שינוי פרספקטיבה (גוף ראשון או שלישי), שילוב מחדש של סביבה שכבר נוצרה, או שילוב של מספר רעיונות לתרחיש משחקי יחיד.

כיצד נוצרים ונחקרים עולמות וירטואליים

עולמות אינטראקטיביים שנוצרו על ידי בינה מלאכותית

הפעילות של פרויקט ג'יני בנויה סביב תהליך הדרגתי בשלושה שלבים גוגל מסכמת זאת כסקיצה, חקירה ומיזוג עולמות. המטרה היא שכל אחד יוכל לעבור מרעיון לחוויה אינטראקטיבית קטנה ללא כלים נוספים.

בשלב הראשון, המשתמש כותב תיאור של העולם שהוא רוצה ליצור או מעלה תמונת ייחוס. מהקלט הזה, Nano Banana Pro יוצר תצוגה מקדימה סטטית התפאורה יכולה להיות יער בסגנון low-poly, סביבה עירונית עתידנית, נוף היסטורי, או כל דבר אחר המתואר בטקסט. בשלב זה מוגדרים גם סוג הדמות, מצב המצלמה וכמה פרמטרי תנועה בסיסיים.

לאחר שהסקיצה מתקבלת, ג'יני 3 נכנס לפעולה כדי לאפשר לשחקן חקור את הסביבה בחופשיות, באמצעות פקדי מחשב אופייניים כגון מקשי W, A, S ו-Dהמודל מייצר תוך כדי תנועה את מה שמופיע מול הדמות, מנבא כל פריים על סמך הקודמים ושומר על עקביות מסוימת כאשר המצלמה מסובבת או חוזרת לאזור שכבר ביקרתם בו.

היכולת המרכזית השלישית היא שילוב ורמיקס של עולמותהמערכת מאפשרת למשתמשים לחזור ולבקר בתרחישים שנוצרו בעבר, לשנות אותם עם פרמטרים חדשים, למזג אותם יחד, או אפילו להשתמש בעולמות שנוצרו מראש על ידי גוגל כבסיס לבניית וריאציות. בנוסף, ניתן לשתף סרטונים של המפגשים כדי שמשתמשים אחרים יוכלו לצפות בהם או להשתמש בהם כהשראה.

כל זה מופעל מאפליקציית אינטרנט בדומה לשירותי בינה מלאכותית אחרים של גוגל, כך ש אין צורך להתקין תוכנות נוספות, וגם לא נדרש ידע טכני מתקדם.פשוט גשו לכלי, הזינו את ההוראה והתחלו לבדוק שילובים עד שתמצאו תוצאה מעניינת.

מגבלות טכניות: זמן, ביצועים וריאליזם

מגבלות של אב טיפוס של בינה מלאכותית לעולמות וירטואליים

גוגל מתעקשת להגדיר את פרויקט ג'יני כ- אב טיפוס מחקרי בעל אופי ניסיוני מובהקתווית זו אינה רק פורמליות: הניסיון הנוכחי מציג מספר מגבלות ברורות המתנות את השימוש המעשי בכלי מעבר לסקרנות הראשונית.

הברור ביותר הוא ה- מגבלה של 60 שניות לכל דור וסישן חקירהלאחר דקה זו, העולם נסגר וחוויה חדשה חייבת להתחיל. החברה מסבירה כי הגבלה זו מאפשרת פיזור טוב יותר של משאבי המחשוב, שכן כל סשן שומר שבב ייעודי למשתמש שמשחק.

מבחינת ביצועים, בדיקות ציבוריות מתארות רזולוציה קרובה ל-720p ותדירות של בין 20 ל-24 פריימים לשנייהתכונות אלו מלוות בהשהיית קלט מורגשת בעת הזזת הדמות או החלפת המצלמה. לדברי כמה בודקים מוקדמים, החוויה מרגישה יותר כמו וידאו אינטראקטיבי מאשר משחק וידאו מסורתי וזורם לחלוטין.

כמו כן יש לציין שג'יני 3 זה לא מנוע גרפיקה קלאסי, אלא מודל שחוזה את הפריים הבא. בהתבסס על האמור לעיל. התוצאה היא התנהגויות מוזרות: נתיבים שמשנים מרקם ללא סיבה נראית לעין, אלמנטים שנעלמים, פיזיקה בלתי סבירה, או אנימציות שמתעוותות באופן אקראי.

גוגל עצמה מזהירה שהעולמות שנוצרו "ייתכן שהם לא נראים אמיתיים לחלוטין או תמיד תואמים את האינדיקציות או חוקי הפיזיקה."ובקרות הדמויות יכולות להיות לא מדויקות. במילים אחרות, הטכנולוגיה מראה פוטנציאל, אך היא עדיין רחוקה מלהציע חוויית משחק מלוטשת מבחינת משחקיות ויציבות ויזואלית.

גישה מוגבלת ומפת דרכים בינלאומית

גישה מוגבלת לאב טיפוס של בינה מלאכותית

בשלב ראשון זה, פרויקט ג'יני זמין רק עבור לקוחות גוגל AI Ultra בארצות הבריתתוכנית המנוי המתקדמת ביותר של החברה מכוונת לעסקים וליוצרים הזקוקים ליכולות בינה מלאכותית בעלות ביצועים גבוהים. זהו שירות פרימיום, המגביל את מספר המשתמשים בעלי גישה לניסוי.

ההחלטה להגביל את הבדיקות מוסברת הן על ידי עלות חישובית של כל מפגש זאת בשל העניין של גוגל באיסוף משוב מפורט לפני פריסה רחבה יותר. מנהל המחקר של DeepMind, שלומי פרוטשר, הדגיש כי "מרגש" להיות מסוגלים לפתוח את הכלים הללו לאנשים רבים יותר כדי לאסוף חוות דעת על השימוש שלהם בעולם האמיתי, אך נכון לעכשיו אין תאריך ספציפי להגעתם לאירופה או לשווקים אחרים.

מנקודת מבטם של משתמשים ומחקרים ספרדים ואירופאים, זה מתורגם לעובדה שלפחות בטווח הקצר, התפקיד הריאלי ביותר יהיה זה של צופהלעקוב מקרוב אחר הבדיקות, לנתח את הסרטונים שכבר מופצים ברשתות החברתיות ולהעריך באיזו מידה ניתן לשלב טכנולוגיה זו בתהליכי עבודה של עיצוב רמות, יצירת אב טיפוס מהירה או ויזואליזציה של רעיונות.

גוגל הודיעה על כוונתה להרחיב את הגישה בהדרגה בתנאי שהביצועים, העלויות והבעיות המשפטיות יאפשרו זאת. עם זאת, קצב ההתרחבות יהיה תלוי גם בתגובת הקהילה ובאופן שבו יתפתחו הדיונים סביב זכויות יוצרים ושימוש אחראי בתוכן של צד שלישי.

יכולת לחקות משחקים ידועים ודיון על זכויות יוצרים

אחת הנקודות העדינות ביותר של פרויקט ג'יני הייתה היכולת לשחזר, בדרגות שונות של הצלחה, עולמות בהשראת משחקי וידאו קיימיםכמה עיתונאים מומחים הצליחו ליצור תרחישים שדמו בבירור לכותרים כמו סופר מריו 64, מטרויד פריים או אגדת זלדה: נשימת הטבע.

במקרה של זלדה, הם אפילו נראו דמויות שפורסמות מצנח רחיפה בעת קפיצהמחווה זו קשורה קשר הדוק למשחק נינטנדו. צירופי מקרים אלה מצביעים על כך שהמודל אומן באמצעות מספר רב של סרטוני משחק הזמינים לציבור, דבר שמעלה שאלות לגבי הטיפול בקניין רוחני באימון בינה מלאכותית.

לאחר מספר ניסויים בהם נוצרו מחדש עולמות בהשראת זיכיונות מוכרים מאוד, גוגל החלה ל- חסימת יצירת תרחישים ודמויות מסוימיםבמיוחד כאשר מוזכרים שמות או סימנים מסחריים ספציפיים. במקרים מסוימים, הכלי מונע ישירות את יצירתם של עולמות המבוססים על סאגות מסוימות, תוך ציטוט "אינטרסים של ספקי תוכן חיצוניים".

החברה מסבירה שפרויקט ג'יני הוא "אומן בעיקר עם נתוני אינטרנט זמינים לציבור"אך זכרו שתוכן זה עדיין כפוף לחוקי זכויות יוצרים. התוצאה היא מערכת ניהול שעדיין נמצאת בבנייה, שבה ניסיונות מסוימים לשכפל יצירות המוגנות בזכויות יוצרים חסומים במפורש, בעוד שאחרים חומקים כל עוד נמנעים מהפניות ישירות מדי.

התנהגות לא תקינה זו מלבה את הוויכוח על באיזו מידה יכולה או צריכה להיות השראה של בינה מלאכותית ממשחקים קיימים? והיכן עובר הגבול בין מחווה, חיקוי והעתקה? ויכוח שסביר להניח שיהיה רלוונטי במיוחד באזורים כמו האיחוד האירופי, שם עדיין מוגדרות מסגרות רגולטוריות לגבי נתוני הדרכה וזכויות יוצרים בבינה מלאכותית.

השפעה פוטנציאלית על תעשיית משחקי הווידאו

מעבר למשיכה התקשורתית של הצפייה עולמות "כמו מריו" או "כמו זלדה" שנוצרו תוך שניותפרויקט ג'יני הוא חלק ממרוץ רחב יותר בין חברות טכנולוגיה גדולות ליישם בינה מלאכותית גנרטיבית בפיתוח משחקים. מיקרוסופט, לדוגמה, חשפה פרויקטים כמו Muse כדי להפוך חלקים מתהליך העיצוב והייצור לאוטומטיים, וחברות אחרות בוחנות פתרונות דומים כדי להפחית עלויות ולהאיץ את הפיתוח.

בהקשר זה, הצעתה של גוגל שואפת להפוך כלי לבניית אב טיפוס וניסויים מהירים זה יכול לעניין הן אולפנים עצמאיים והן מו"לים גדולים. היכולת לבנות תרחיש שניתן לשחק בו מסקיצה או מפסקת טקסט יכולה להקל על אימות מוקדם של רעיונות, יצירת הדגמות פנימיות או בדיקת מכניקות מבלי להשקיע חודשים של עבודה.

עם זאת, עלייתם של פתרונות מסוג זה מעוררת דאגה בקרב חלק מהמגזר. מצד אחד, קיים חשש לגבי ההשפעה הפוטנציאלית על פרופילים מקצועיים מסוימים. אם חלק מהתוכן נוצר באופן אוטומטי. מצד שני, מפתחים רבים חוששים ממודלים עסקיים שבהם בינה מלאכותית מאומנת על עבודות שכבר פורסמו ללא פיצוי ברור לכותביהן.

בשווקים האירופיים והספרדיים, שבהם הוויכוח על הגנת היצירה התרבותית הוא אינטנסיבי במיוחד, יהיה קריטי לראות כיצד כלים כמו Project Genie משתלבים בתקנות עתידיות. היבטים כמו שקיפות בנוגע לנתוני הדרכה, מערכות ביטול הצטרפות לבעלי זכויות וייחוס של תוכן שנוצר יכולים לעשות את ההבדל בין אימוץ זהיר לבין סכסוך מתמשך עם מפתחים ומוציאים לאור.

נכון לעכשיו, פרויקט ג'יני נמצא בשלב מוקדם שבו זה מתפקד יותר כמעבדה ציבורית מאשר כמוצר מוגמר.התפתחותו, והאופן שבו גוגל מתמודדת עם הסוגיות המשפטיות והאתיות הנלוות, יקבעו האם הוא ישולב בסופו של דבר בזרימות עבודה של אולפנים או יישאר ניסוי ראוותני אך מוגבל.

עם זאת, מראהו של אב טיפוס זה מבהיר שחברות טכנולוגיה גדולות רואות ב- יצירה אוטומטית של עולמות אינטראקטיביים שטח אסטרטגי מהמעלה הראשונה. למרות שהשימוש בו בפועל כיום מוגבל ורווי פגמים טכניים, כיוון התנועה ברור: מודלים המסוגלים יותר ויותר להפוך טקסט ותמונות לחוויות משחקיות, ותעשייה שתצטרך להחליט כיצד היא רוצה להתקיים יחד עם הכלים החדשים הללו.

Artaculo relacionado:
הגדרת מציאות מדומה מה שכדאי לדעת!