יצרתי את הפרויקט הגדול ביותר בקוד פתוח לשחרור מערכות LLM

חוקרת ביטחון משתפת את תוצאות פרויקט הפיצוח של מודלים למידתיים חדשים!

בחודשים האחרונים עסקתי בפיתוח שיטות שונות לבדיקת איתנות של מודלים למידתיים חדשים שנכנסו לשימוש. המטרה הייתה לבחון עד כמה קל לרמות את המודלים הללו וכמה הם בטוחים בפועל. ראיתי תוצאות יוצאות דופן עם כמה מהשיטות שפיתחתי, כולל השיטה המכונה TAP (עץ התקיפות), ורציתי לשתף בכך כאן.

ניתן למצוא את הפרויקט בקישור הבא ל-GitHub:
https://github.com/General-Analysis/GA

הנה כמה מהדברים המעניינים שגיליתי במהלך העבודה:
• שיטות חדשות לפיצוח: פיתחתי טכניקות שונות שמאפשרות לחדור ולשבש את פעולת המודלים.
• בדיקת איתנות: התמקדתי ביכולת של המודלים לעמוד בפני ניסיונות פריצה והטעייה.
• תוצאות מרהיבות: חלק מהשיטות שפיתחתי הצליחו לרמות את המודלים בדרכים יצירתיות ולא צפויות.

מוזמנים לבקר בקישור, לעיין בקוד ואף לתרום לפרויקט אם נראה לכם מעניין. 🎯🔥🚀

מרגישים שהעולם מתקדם מהר מדי?

הצטרפו לתכנית "בינה בחיים" - הכשרה אישית ומקצועית בבינה מלאכותית, המותאמת במיוחד לבני הגיל השלישי .

לחצו כאן לכל הפרטים והרשמה

הפוסט הזה נכתב ונערך על ידי אסף בנדור, מומחה לבינה מלאכותית יישומית, מרצה ויוצר תוכן בעולמות החדשנות הדיגיטלית.

אני עוסק מדי יום בפיתוח קורסים, הרצאות ויישומים מעשיים של כלים מבוססי AI - מהעולם העסקי ועד היצירתי.

נכתב בידי אדם, לא בידי מכונה - מתוך סקרנות אמיתית, ניסוי אישי ואמונה בכוח של בינה מלאכותית להעצים את האנושיות שבנו.

מרגישים שהעולם מתקדם מהר מדי?

שיתוף

אהבתי

שיתוף מהיר:

פוסטים קשורים: