Ar ais go dtí an ghluais Slándáil

AI Red Teaming

Slándáil chóras IS a thástáil trí ionsaithe ionsamhlaithe — leochaileachtaí a aimsiú, seachaint guardrails agus modhanna ionramhála samhlacha.

Cad is AI Red Teaming ann?

Is é AI Red Teaming an cleachtas maidir le slándáil chóras IS a thástáil trí ionsaithe naimhdeacha a ionsamhlú. Déanann an fhoireann dhearg iarracht: guardrails na samhla a sheachaint, giniúint ábhair díobhálaigh a bhrú, sonraí traenála a asbhaint, aschuir a ionramháil agus éillithe prompt injection a aimsiú.

Cén fáth a n-éilítear é?

Éilíonn an tAcht IS tástáil daingne ar chórais IS ardriosca (Airteagal 9). Fiú gan rialáil, is é red teaming an modh is éifeachtaí chun leochaileachtaí a aimsiú roimh imlonnú táirgthe.

Teicníochtaí AI red teaming

I measc na bpríomhtheicníochtaí tá: prompt injection, jailbreaking (srianta samhla a sheachaint), asbhaint sonraí (codanna de shonraí traenála a bhaint amach), ionchuir naimhdeacha (ionchuir mhodhnaithe a chúisíonn torthaí míchruinne) agus aisiompú samhla (sonraí traenála a athchruthú ón tsamhail).

Seirbhísí agus táirgí gaolmhara