יצרתי את הפרויקט הגדול ביותר בקוד פתוח לשחרור מערכות LLM

GO AI ROBOT

חוקרת ביטחון משתפת את תוצאות פרויקט הפיצוח של מודלים למידתיים חדשים!

בחודשים האחרונים עסקתי בפיתוח שיטות שונות לבדיקת איתנות של מודלים למידתיים חדשים שנכנסו לשימוש. המטרה הייתה לבחון עד כמה קל לרמות את המודלים הללו וכמה הם בטוחים בפועל. ראיתי תוצאות יוצאות דופן עם כמה מהשיטות שפיתחתי, כולל השיטה המכונה TAP (עץ התקיפות), ורציתי לשתף בכך כאן.

ניתן למצוא את הפרויקט בקישור הבא ל-GitHub:
https://github.com/General-Analysis/GA

הנה כמה מהדברים המעניינים שגיליתי במהלך העבודה:
שיטות חדשות לפיצוח: פיתחתי טכניקות שונות שמאפשרות לחדור ולשבש את פעולת המודלים.
בדיקת איתנות: התמקדתי ביכולת של המודלים לעמוד בפני ניסיונות פריצה והטעייה.
תוצאות מרהיבות: חלק מהשיטות שפיתחתי הצליחו לרמות את המודלים בדרכים יצירתיות ולא צפויות.

מוזמנים לבקר בקישור, לעיין בקוד ואף לתרום לפרויקט אם נראה לכם מעניין. 🎯🔥🚀

Scroll to Top