Cad is AI Red Teaming ann?
Is é AI Red Teaming an cleachtas maidir le slándáil chóras IS a thástáil trí ionsaithe naimhdeacha a ionsamhlú. Déanann an fhoireann dhearg iarracht: guardrails na samhla a sheachaint, giniúint ábhair díobhálaigh a bhrú, sonraí traenála a asbhaint, aschuir a ionramháil agus éillithe prompt injection a aimsiú.
Cén fáth a n-éilítear é?
Éilíonn an tAcht IS tástáil daingne ar chórais IS ardriosca (Airteagal 9). Fiú gan rialáil, is é red teaming an modh is éifeachtaí chun leochaileachtaí a aimsiú roimh imlonnú táirgthe.
Teicníochtaí AI red teaming
I measc na bpríomhtheicníochtaí tá: prompt injection, jailbreaking (srianta samhla a sheachaint), asbhaint sonraí (codanna de shonraí traenála a bhaint amach), ionchuir naimhdeacha (ionchuir mhodhnaithe a chúisíonn torthaí míchruinne) agus aisiompú samhla (sonraí traenála a athchruthú ón tsamhail).