Newsletter Subscribe
Enter your email address below and subscribe to our newsletter

bbc+1bbc+1mindgard+1OpenAI-ի ChatGPT-ն կարող է մանիպուլյացիայի ենթարկվել՝ սեռականացված և գրաֆիկական բռնության պատկերներ ստեղծելու համար՝ օգտագործելով լայնորեն տարածված հրահանգի մեջ միայն չնչին փոփոխություններ, ըստ բրիտանական AI անվտանգության Mindgard ընկերության բացահայտումների, որոնք երեքշաբթի օրը հաղորդվել են BBC-ի կողմից:koha+1
Բացահայտումը կենտրոնացած է OpenAI-ի GPT-5.4 մոդելի վրա, որը ChatGPT-ի պատկերների ստեղծման հնարավորության վերջին հանրային տարբերակն է: Mindgard-ի հետազոտողները պարզել են, որ հրահանգի փոփոխումը, որը սկզբնապես նախատեսված էր հումորային արդյունքներ ստանալու համար, ստիպել է համակարգին արտադրել տագնապալի բովանդակություն՝ առանց որևէ հստակ հրահանգի, որը կնշեր բռնի կամ սեռական թեմաներ:bbc+1
Mindgard-ի հիմնադիր Փիթեր Գարագանը BBC-ին ասել է, որ AI-ն "ինքնուրույն ստեղծել է ցնցող և սեռականացված վիզուալների բազմազանություն", թեև հրահանգը չէր սահմանում պատկերների բովանդակությունը: Նա արդյունքները նկարագրել է որպես "շատ սարսափելի, երբեմն սեռական, և երբեմն՝ երկուսը միասին":koha+1
Ստեղծված պատկերների թվում էին գլխի վնասվածքով տղամարդու, արյունոտ մարմնով մահացած կնոջ պատկերներ և սեռական բռնությունը մերկության հետ համատեղող տեսարաններ: Mindgard-ի ավելի վաղ հրապարակված բացահայտումը, որը հրապարակվել էր փետրվարին, նշում էր, որ տեխնիկան կարող է նաև ստեղծել իրական մարդկանց սեռականացված պատկերներ՝ առաջացնելով մտահոգություններ առանց համաձայնության ստեղծված դիփֆեյքերի վերաբերյալ:bbc+3
Այն բանից հետո, երբ BBC-ն դիմեց OpenAI-ին բացահայտումներով, ընկերությունը հայտարարեց, որ գործել է: "Այս երևույթը հետաքննելուց հետո մենք լրացուցիչ պաշտպանիչ միջոցներ ենք ձեռնարկել այս տեսակի հրահանգների դեմ", – հայտարարել է OpenAI-ը: Ընկերությունը հավելել է, որ պահպանում է պաշտպանության բազմաթիվ շերտեր՝ կանխելու համար օգտատերերի կողմից իր քաղաքականությունը խախտող բովանդակության ստեղծումը:bbc+1
Այնուամենայնիվ, AI անվտանգության հետազոտողները BBC-ին հայտնել են, որ միայն չնչին փոփոխություններով խնդրահարույց հրահանգը շարունակում էր տալ տագնապալի արդյունքներ նույնիսկ OpenAI-ի միջամտությունից հետո:koha+1
Mindgard-ի տեխնիկական բլոգը, որը հրապարակվել է փետրվարին, մանրամասն նկարագրել է, թե ինչպես է աշխատել շրջանցումը. հետազոտողները մանիպուլյացիայի են ենթարկել ChatGPT-ի հարմարեցված հիշողությունը և համակարգային հրահանգների համատեքստը՝ շրջանցելու համար պատկերների անվտանգության արգելքները՝ չպահանջելով բեքենդի հասանելիություն կամ հատուկ հավատարմագրեր: Խոցելիությունը առաջին անգամ հայտնաբերվել է հունվարի 1-ին և OpenAI-ին հայտնվել է հունվարի 28-ին:mindgard+2
Բացահայտումները տեղի են ունենում AI պատկերների ստեղծման անվտանգության լայն ստուգումների ֆոնին: OpenAI-ը առանձին հարցերի է բախվել ChatGPT-ի համար նախատեսված "Մեծահասակների ռեժիմ" գործառույթի վերաբերյալ, որը ընկերությունը հետաձգել էր այս տարվա սկզբին այն բանից հետո, երբ ներքին անվտանգության խորհրդատուները զգուշացրել էին, որ դա կարող է անչափահասներին վտանգի ենթարկել: BBC-ն չի հրապարակել հետազոտության մեջ օգտագործված կոնկրետ հրահանգները:mashable