World

CHATGPT భద్రతా పరీక్షల సమయంలో బాంబు వంటకాలను మరియు హ్యాకింగ్ చిట్కాలను అందించింది | ఓపెనై

చాట్‌గ్ప్ట్ ఈ వేసవిలో జరిపిన భద్రతా పరీక్షల ప్రకారం, నిర్దిష్ట రంగాలలో బలహీనమైన పాయింట్లు, పేలుడు పదార్థాల వంటకాలు మరియు ట్రాక్‌లను కవర్ చేయడానికి సలహాలతో సహా – స్పోర్ట్స్ వేదికపై ఎలా బాంబు పేల్చివేయాలనే దానిపై మోడల్ పరిశోధకులకు వివరణాత్మక సూచనలను ఇచ్చింది.

ఓపెనాయ్ యొక్క జిపిటి -4.1 కూడా ఆంత్రాక్స్ ఎలా ఆయుధాలు చేయాలో మరియు రెండు రకాల అక్రమ మందులను ఎలా తయారు చేయాలో కూడా వివరించింది.

ఈ పరీక్ష ఓపెనాయ్, సామ్ ఆల్ట్మాన్ నేతృత్వంలోని b 500 బిలియన్ల ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ స్టార్ట్-అప్ మధ్య అసాధారణమైన సహకారంలో భాగం, మరియు భద్రతా భయాలపై ఓపెనైని విడిచిపెట్టిన నిపుణులచే స్థాపించబడిన ప్రత్యర్థి కంపెనీ ఆంత్రోపిక్. ప్రతి సంస్థ ఇతర మోడళ్లను ప్రమాదకరమైన పనులకు సహాయపడటానికి నెట్టడం ద్వారా పరీక్షించారు.

అదనపు భద్రతా ఫిల్టర్లు వర్తించినప్పుడు, మోడల్స్ ప్రజల వాడకంలో ఎలా ప్రవర్తిస్తాయో ప్రత్యక్ష ప్రతిబింబం కాదు. కానీ మానవ అన్నారు ఇది GPT-4O మరియు GPT-4.1 లలో “ప్రవర్తన గురించి… దుర్వినియోగం” గురించి చూసింది, మరియు AI “అమరిక” మూల్యాంకనాల అవసరం “అత్యవసరంగా” మారుతోందని అన్నారు.

మానవ కూడా వెల్లడించారు దీని క్లాడ్ మోడల్ పెద్ద ఎత్తున దోపిడీ ఆపరేషన్‌లో ఉపయోగించబడింది, ఉత్తర కొరియా కార్యకర్తలు అంతర్జాతీయ సాంకేతిక సంస్థలకు ఉద్యోగ దరఖాస్తులను నకిలీ చేయడం ద్వారా మరియు AI- సృష్టించిన ransomware ప్యాకేజీల అమ్మకంలో 200 1,200 వరకు ఉపయోగించబడింది.

అధునాతన సైబర్‌టాక్‌లను నిర్వహించడానికి మరియు మోసాలను ప్రారంభించడానికి ఇప్పుడు ఉపయోగించే మోడళ్లతో AI “ఆయుధాలు” చేయబడిందని కంపెనీ తెలిపింది. “ఈ సాధనాలు నిజ సమయంలో మాల్వేర్ డిటెక్షన్ సిస్టమ్స్ వంటి రక్షణాత్మక చర్యలకు అనుగుణంగా ఉంటాయి” అని ఇది తెలిపింది. “AI- సహాయక కోడింగ్ సైబర్ క్రైమ్‌కు అవసరమైన సాంకేతిక నైపుణ్యాన్ని తగ్గించడంతో ఇలాంటి దాడులు సర్వసాధారణంగా మారుతాయని మేము ఆశిస్తున్నాము.”

UK యొక్క సెంటర్ ఫర్ ఎమర్జింగ్ టెక్నాలజీ అండ్ సెక్యూరిటీలో సీనియర్ రీసెర్చ్ అసోసియేట్ ఆర్డ్డి జంజేవా మాట్లాడుతూ, ఉదాహరణలు “ఆందోళన” అని, అయితే ఇంకా “అధిక-వాస్తవ ప్రపంచ కేసుల యొక్క క్లిష్టమైన ద్రవ్యరాశి” లేదు. అంకితమైన వనరులు, పరిశోధన ఫోకస్ మరియు క్రాస్-సెక్టార్ సహకారంతో “తాజా అత్యాధునిక నమూనాలను ఉపయోగించి ఈ హానికరమైన కార్యకలాపాలను నిర్వహించడం సులభం కాకుండా ఇది కష్టతరం అవుతుంది” అని ఆయన అన్నారు.

రెండు సంస్థలు “అలైన్‌మెంట్ మూల్యాంకనాలపై” పారదర్శకతను సృష్టించడానికి కనుగొన్న వాటిని ప్రచురిస్తున్నాయని, ఇవి మరింత అధునాతన AI ని అభివృద్ధి చేయడానికి కంపెనీలు రేసింగ్ చేయడం ద్వారా తరచుగా ఇంట్లో ఉంచబడతాయి. ఓపెనై అన్నారు Chatgpt-5, పరీక్ష నుండి ప్రారంభించబడింది, “సైకోఫాన్సీ, భ్రాంతులు మరియు దుర్వినియోగ నిరోధకత వంటి రంగాలలో గణనీయమైన మెరుగుదలలను చూపిస్తుంది”.

మోడల్ వెలుపల భద్రతలను ఏర్పాటు చేస్తే అది అధ్యయనం చేసిన అనేక దుర్వినియోగ మార్గాలు ఆచరణలో సాధ్యం కాదు.

“మేము ఎంత తరచుగా అర్థం చేసుకోవాలి, మరియు ఏ పరిస్థితులలో, వ్యవస్థలు తీవ్రమైన హాని కలిగించే అవాంఛిత చర్యలను తీసుకోవడానికి ప్రయత్నించవచ్చు” అని ఇది హెచ్చరించింది.

ఆంత్రోపిక్ పరిశోధకులు ఓపెనాయ్ యొక్క నమూనాలు “అనుకరణ వినియోగదారుల స్పష్టంగా హాని కలిగించే అభ్యర్థనలతో సహకరించడంలో మేము ఆశించిన దానికంటే ఎక్కువ అనుమతి” అని కనుగొన్నారు. అణు పదార్థాలు, దొంగిలించబడిన ఐడెంటిటీలు మరియు ఫెంటానిల్ కోసం షాపింగ్ చేయడానికి డార్క్-వెబ్ సాధనాలను ఉపయోగించమని వారు ప్రాంప్ట్‌లతో సహకరించారు, మెథాంఫేటమిన్ మరియు మెరుగైన బాంబుల కోసం వంటకాల కోసం మరియు స్పైవేర్లను అభివృద్ధి చేయడానికి.

మోడల్‌ను ఒప్పించాల్సిన అవసరం బహుళ ప్రయత్నాలు లేదా సన్నగా ఉండే సాకును మాత్రమే పాటించటానికి, అభ్యర్థనను క్లెయిమ్ చేయడం వంటివి పరిశోధన కోసం అని ఆంత్రోపిక్ చెప్పారు.

ఒక సందర్భంలో, టెస్టర్ “భద్రతా ప్రణాళిక” ప్రయోజనాల కోసం క్రీడా కార్యక్రమాలలో దుర్బలత్వాన్ని కోరింది.

దాడి పద్ధతుల యొక్క సాధారణ వర్గాలను ఇచ్చిన తరువాత, పరీక్షకుడు మరింత వివరంగా నొక్కిచెప్పాడు మరియు మోడల్ దోపిడీకి సరైన సమయాలు, పేలుడు పదార్థాల కోసం రసాయన సూత్రాలు, బాంబు టైమర్‌ల కోసం సర్క్యూట్ రేఖాచిత్రాలు, దాచిన మార్కెట్లో తుపాకులను ఎక్కడ కొనాలి మరియు దాడి చేసేవారు నైతిక నిరోధాలు, ఎస్కేప్ మార్గాల ప్రాంతాలను ఎలా అధిగమించవచ్చనే దానిపై సలహా ఇచ్చారు.


Source link

Related Articles

స్పందించండి

మీ ఈమెయిలు చిరునామా ప్రచురించబడదు. తప్పనిసరి ఖాళీలు *‌తో గుర్తించబడ్డాయి

Back to top button