స్టాన్ఫోర్డ్ అధ్యయనంలో $18-గంటల AI ఏజెంట్ మానవ హ్యాకర్లను అధిగమించాడు
16 గంటల పాటు, AI ఏజెంట్ స్టాన్ఫోర్డ్ పబ్లిక్ మరియు ప్రైవేట్ కంప్యూటర్ సైన్స్ నెట్వర్క్లను క్రాల్ చేసి, వేలాది పరికరాల్లో భద్రతా లోపాలను వెలికితీశారు.
పరీక్ష ముగిసే సమయానికి, ఇది ప్రొఫెషనల్ని మించిపోయింది మానవ హ్యాకర్లు – మరియు ఖర్చులో కొంత భాగం.
స్టాన్ఫోర్డ్ పరిశోధకులు బుధవారం ప్రచురించిన ఒక అధ్యయనంలో వారి AI ఏజెంట్, ARTERMIS, ఎంపిక చేసిన 10 మంది సైబర్ సెక్యూరిటీ నిపుణులతో చేసిన ప్రయోగంలో రెండవ స్థానంలో నిలిచినట్లు కనుగొన్నారు. మానవులు తప్పిపోయిన బలహీనతలను ఏజెంట్ వెలికితీసి ఒకేసారి అనేక దుర్బలత్వాలను పరిశోధించగలరని పరిశోధకులు తెలిపారు.
ARTEMIS రన్నింగ్కి గంటకు $18 ఖర్చవుతుంది, ఇది “ప్రొఫెషనల్ పెనెట్రేషన్ టెస్టర్”కి సంవత్సరానికి సగటు జీతం $125,000 కంటే చాలా తక్కువ అని అధ్యయనం తెలిపింది. ఏజెంట్ యొక్క మరింత అధునాతన సంస్కరణ గంటకు $59 ఖర్చవుతుంది మరియు ఇప్పటికీ అత్యుత్తమ మానవ నిపుణుడిని నియమించుకోవడం కంటే చౌకగా వస్తుంది.
ఈ అధ్యయనానికి ముగ్గురు స్టాన్ఫోర్డ్ పరిశోధకులు నాయకత్వం వహించారు – జస్టిన్ లిన్, ఎలియట్ జోన్స్ మరియు డోనోవన్ జాస్పర్ – వీరి పని AI ఏజెంట్లు, సైబర్ భద్రత మరియు యంత్ర అభ్యాస భద్రత. ఇప్పటికే ఉన్న AI సాధనాలు సుదీర్ఘమైన, సంక్లిష్టమైన భద్రతా పనులతో పోరాడుతున్నాయని కనుగొన్న తర్వాత బృందం ARTEMISని సృష్టించింది.
పరిశోధకులు విశ్వవిద్యాలయం యొక్క నెట్వర్క్కు ARTEMIS యాక్సెస్ను అందించారు, ఇందులో సర్వర్లు, కంప్యూటర్లు మరియు స్మార్ట్ పరికరాలతో సహా దాదాపు 8,000 పరికరాలు ఉన్నాయి. మానవ పరీక్షకులు కనీసం 10 గంటల పనిలో ఉంచాలని కోరారు, అయితే ARTEMIS రెండు పనిదినాల్లో 16 గంటలు నడిచింది. మానవ పరీక్షకులతో పోలిక AI యొక్క మొదటి 10 గంటలకే పరిమితం చేయబడింది.
ఈ అధ్యయనం ఇప్పటికే ఉన్న ఏజెంట్లను కూడా పరీక్షించింది, ఇది చాలా మంది మానవ పాల్గొనేవారి కంటే వెనుకబడి ఉంది, అయితే ARTEMIS “బలమైన పాల్గొనేవారితో పోల్చదగినది” అని పరిశోధకులు తెలిపారు.
10-గంటల విండోలో, ఏజెంట్ “82% చెల్లుబాటు అయ్యే సమర్పణ రేటుతో తొమ్మిది చెల్లుబాటు అయ్యే దుర్బలత్వాలను” కనుగొన్నారు, ఇది 10 మంది మానవ పాల్గొనేవారిలో తొమ్మిది మందిని అధిగమించిందని అధ్యయనం తెలిపింది.
పాత సర్వర్లోని బలహీనతతో సహా కొన్ని లోపాలు మానవులచే గుర్తించబడలేదు, టెస్టర్లు దానిని లోడ్ చేయడానికి నిరాకరించినందున వాటిని యాక్సెస్ చేయలేరు. ARTEMIS సమస్యను దాటవేసి, కమాండ్-లైన్ అభ్యర్థనను ఉపయోగించడంలోకి ప్రవేశించింది.
మానవులు చేయలేని విధంగా AI పని చేసిందని పరిశోధకులు తెలిపారు. ARTEMIS స్కాన్లో “గమనించదగినది” ఏదైనా గుర్తించినప్పుడల్లా, అది బ్యాక్గ్రౌండ్లో పరిశోధించడానికి అదనపు “సబ్-ఏజెంట్లను” రూపొందించింది, ఇది ఏకకాలంలో బహుళ లక్ష్యాలను పరిశీలించడానికి అనుమతిస్తుంది. మానవ పరీక్షకులు ఈ పనిని ఒక్కొక్కటిగా చేయాల్సి వచ్చింది.
కానీ AI దోషరహితమైనది కాదు. ARTEMIS గ్రాఫికల్ స్క్రీన్ల ద్వారా క్లిక్ చేయడం అవసరమయ్యే టాస్క్లతో ఇబ్బంది పడింది, దీని వలన ఇది క్లిష్టమైన దుర్బలత్వాన్ని పట్టించుకోలేదు. ప్రమాదకర నెట్వర్క్ సందేశాలను విజయవంతమైన బ్రేక్-ఇన్ సంకేతాల కోసం తప్పుగా భావించే తప్పుడు అలారాలకు కూడా ఇది ఎక్కువ అవకాశం ఉంది.
“ARTEMIS కోడ్ లాంటి ఇన్పుట్ మరియు అవుట్పుట్ను బాగా అన్వయిస్తుంది కాబట్టి, గ్రాఫికల్ యూజర్ ఇంటర్ఫేస్లు అందుబాటులో లేనప్పుడు ఇది మెరుగ్గా పని చేస్తుంది” అని పరిశోధకులు తెలిపారు.
AI హ్యాకింగ్ను సులభతరం చేస్తోంది
AIలోని పురోగతులు హ్యాకింగ్ మరియు తప్పుడు సమాచార కార్యకలాపాలకు అడ్డంకిని తగ్గించాయి, హానికరమైన నటులు తమ దాడులను పెంచుకోవడానికి వీలు కల్పిస్తుంది.
సెప్టెంబర్లో, ఎ ఉత్తర కొరియా హ్యాకింగ్ గ్రూప్ ఫిషింగ్ ఇమెయిల్ల కోసం నకిలీ సైనిక IDలను రూపొందించడానికి ChatGPTని ఉపయోగించారు. నుండి ఒక నివేదిక ఆగస్టులో ఆంత్రోపిక్ US ఫార్చ్యూన్ 500 టెక్ కంపెనీలలో మోసపూరిత రిమోట్ ఉద్యోగాలను పొందేందుకు ఉత్తర కొరియా కార్యకర్తలు దాని క్లాడ్ మోడల్ను ఉపయోగించారని కనుగొన్నారు – ఇది వారికి కార్పొరేట్ సిస్టమ్లకు అంతర్గత ప్రాప్యతను అందించిన వ్యూహం.
వియత్నామీస్ టెలికాం, వ్యవసాయం మరియు ప్రభుత్వ వ్యవస్థలపై సైబర్టాక్లను అమలు చేయడానికి చైనీస్ బెదిరింపు నటుడు క్లాడ్ను ఉపయోగించినట్లు కూడా అదే నివేదిక పేర్కొంది.
సాఫ్ట్వేర్ సప్లై చైన్ కంపెనీ JFrogలో మెషిన్ లెర్నింగ్ ఆపరేషన్స్ చీఫ్ టెక్నాలజీ ఆఫీసర్ యువల్ ఫెర్న్బాచ్ బిజినెస్ ఇన్సైడర్తో మాట్లాడుతూ, “మేము అనేక దాడులను చూస్తున్నాము. ఒక నివేదికలో ఏప్రిల్లో ప్రచురించబడింది. డేటాను సంగ్రహించడానికి, సిస్టమ్లను మూసివేయడానికి లేదా వెబ్సైట్ లేదా సాధనాలను మార్చడానికి హ్యాకర్లు AI మోడల్లను ఉపయోగిస్తున్నారని ఆయన తెలిపారు.



