מעניין

רשתות יריבות גנריות: הטכנולוגיה מאחורי DeepFake ו- FaceApp

רשתות יריבות גנריות: הטכנולוגיה מאחורי DeepFake ו- FaceApp

בשנים האחרונות רשתות יריבות גנריות או GAN נדונו יותר ויותר. אם תחזור 10 שנים אחורה, לא תמצא שום זכר לנושא כזה. אז מה גרם לרשתות יריבות גנריות להגיע לחזית ולמה אכפת לך? בוא נדון.

בכל פעם שמתקיים דיון על רשתות יריבות גנריות או GAN, זה תמיד בהקשר של AI, למידת מכונה או למידה עמוקה. נושא זה אמנם נרחב למדי, אך מאמר זה נועד לעזור לך להבין אותו במונחים פשוטים.

נתחיל במונח עצמו - רשתות יריבות גנריות.

קשורים: מערכת AI חדשה זו יכולה לראות מה אתה חושב

GANs הם ביסודם גישה למודלים גנרטיים תוך שימוש בשיטות לימוד עמוקות. המילה "Generative" במונח מצביעה על המאפיין של ה- GAN כדי ליצור משהו משלו.

איך לתוכנית יכולה להיות יצירתיות ליצור משהו משלה? אנו נותנים לו את הכוח של למידת מכונה במקום בו הוא יכול ללמוד מנתוני העבר.

לכן, אם הייתם מאכילים GAN עם טונות של תמונות, זה יכול ליצור תמונה ייחודית משל עצמה. הדבר נכון לגבי כל קבוצת נתונים.

בהתחשב בהגדרה זו, אנו נתקלים בבעיה שבה אין מסנן לבדיקת פלט הגנרטור לאמיתותו. הגנרטור יכול ליצור כל מה שקשור למערכת נתוני ההתייחסות שלו מבלי לדעת היכן זה מקובל עלינו או לא.

כדי לפתור בעיה זו, רשתות GAN מגיעות עם רשת מפלה שבודקת את הנתונים שנוצרו עם הנתונים האמיתיים. זהו החלק היריב של רשת יריבים גנרית. אנו למעשה מעריכים זה את זה את הרשת הגנראית ואת הרפייה המפלה ויוצרים יריבים זה עם זה.

רשת מפלה או מפלה משמשים בכדי לשמור על הערכים הנוצרים של המחולל. ומשימת הגנרטור היא להטעות את המפלה לחשוב שערכים שנוצרו הם למעשה אמיתיים ולא מיוצרים על ידי מחשב.

זהו המושג הבסיסי של GAN.

הסברים על GAN מוסברים בפירוט רב יותר בעיתון על ידי איאן גודפלו וחוקרים אחרים מאוניברסיטת מונטריאול שכותרתם כראוי רשתות אדברסריות.

בעיתון הם ציינו בבירור שכל מטרתה של הרשת הגנרטיבית היא לדחוף את הרשת המפלה לטעות. והרשת המפלה תעשה טעות רק כאשר היא לא יכולה להבדיל בין נתונים שנוצרו על ידי מכונה לבין נתוני הדרכה.

הדרך הטובה ביותר להכשיר GAN היא באמצעות מסד נתונים MNIST (מאגר המכון הלאומי לתקנים וטכנולוגיה שונה).

המאגר מורכב ממערך אימונים של 60,000 דוגמאות ומערכת מבחנים של 10,000 דוגמאות. אימון MNIST משתמש בערכים מספריים בכתב יד.

הם התחלה נהדרת עבור כל מי שמחפש משאבים להכשרת רשתות. זהו סט נתונים ששימש לאילוף המודל על ידי איאן וצוותו.

מנתונים אלה, האנלוגיה הטובה ביותר שנוכל להשתמש בה ל- GAN היא שמדובר במשחק שני שחקנים בו כל שחקן מנסה בכל כוחו לנצח זה את זה.

אולי אתה עדיין זוכר את גל החדשות שהגיע בסוף דצמבר 2018 על תמונות למראה מציאותי שנוצרו על ידי AI. ובכן, זה היה GAN!

אם אתה סוקר את התמונות האלה, קל להבין מדוע זה היה סיפור כל כך גדול. לא ניתן היה להבדיל בין התמונות לתמונות של פנים אנושיות.

האנשים שעומדים מאחורי הפרויקט היו NVidia, מפתחת חומרת הגרפיקה והתוכנה הפופולרית. החוקרים שעומדים מאחורי הפרויקט הכינו מאמר על פיתוחו ותוצאותיהם שכותרתו ארכיטקטורת גנרטורים מבוססת-סגנון לרשתות גנטוריות גנריות.

החוקרים ב- NVidia בילו 8 שבועות באימון הרשתות, והשתמשו בשמונה ממגוון הכרטיסים הגרפיים שלהם בטסלה.

זה בהחלט מעלה כמה שאלות כיצד נוכל לסמוך על נתונים ציוריים יותר. כמו כן, אם אנו מצליחים ליצור פרצופים אנושיים מתמונות הפניה, לא ייקח הרבה זמן לפני שנוכל ליצור פנים מושלמות, מה שגורם למודלים לצאת מהעבודה!

רבים מעלים חשש בנוגע לשימוש בנתונים ציוריים במערכת המשפט אם התוכנה יכולה לשנות תמונות בצורה יעילה כל כך. זה בהחלט משהו לחשוב עליו!

בחזרה לנושא כמה רחוק פיתוח ה- GAN, שום דבר לא מתאר תמונה ברורה יותר של הטכנולוגיה מאשר הניסוי של NVidia. אנו מסוגלים ליצור פרצופים נראים מציאותיים שאינם אמינים בלבד, אלא הניתנים להתאמה אישית על ידי המחשב.

המחקר עדיין מתבצע כדי להפוך את רשתות ה- GAN לחזקות יותר ליצירת נתונים מציאותיים ועם דרישות פחות כוחניות.

ניתן להשתמש ב- GAN במגוון יישומים, בעיקר הקשורים לתמונות, אך זה בהחלט ישתנה. נכון לעכשיו, משתמשים ב- GAN ב:

יצירת תוכן חדש (תמונות): ניתן להשתמש ב- GAN ליצירת תמונות בחיים מתוך קבוצה של תמונות מקור. השימוש במערכת כזו נועד אך ורק להבנת יכולות ה- GAN.

יש הטוענים כי ניתן להשתמש בטכנולוגיה זו כדי לקבוע את מראה התינוק מתוך תמונות הוריו.

הזדקנות או התיישנות: עם קבוצה חזקה של תמונות לדוגמא, רשתות GAN יכולות להזדקן או להתבגר בהצלחה בפנים אנושיות. הפופולריות האחרונה של אפליקציה בשם FaceApp מראה כיצד טכנולוגיה כזו פופולרית מאוד בקרב ההמונים.

אם אתה תוהה לגבי הטכנולוגיה שמאחורי FaceApp, ה- GAN שלה.

צביעה בתמונות שחור-לבן: כאשר GAN מאומן מספיק, הוא יכול לצבוע תמונות ולעשות זאת בצורה יוצאת מהכלל. טכנולוגיה זו אכן יכולה להביא חיים לתמונות ישנות ולתת לנו הצצה לתקופה ההיא בצבע.

שיפור ברזולוציה: אם ניסית לשפר את הרזולוציה של תוצאה נמוכה בתמונה, התוצאה היא תמיד בלגן מטושטש עם פיקסלים מפוצצים. עם זאת, GAN מחליף כל תמונה נוספת ויוצר תמונות שיפור באיכות גבוהה גם כאשר הרזולוציה שלהן נמוכה.

העולם ראה דוגמאות רבות של GANs בעבודה, והמחקר המתמשך בכיוון זה מצביע על יישומים רבים ובלתי צפויים יותר של GANs בעתיד.

קשורים: AIs ממשיכים לפעול בדרכים לא צפויות, האם אנחנו צריכים להיכנס לפאניקה?

הטכנולוגיה היא מהפכנית ואנחנו יכולים לצפות ש- GAN יופיעו במכשירים שלנו ביותר מדרך אחת. עם זאת, לפני שהטכנולוגיה הזו מבשילה, יש צורך בדיונים רציניים על השימוש האתי בשיטות למידה עמוקות כה חזקות.


צפו בסרטון: AI photo editors are out of control.. (דֵצֶמבֶּר 2021).