నాలెడ్జ్ వర్క్ కోసం GPT-5.2 ‘స్టేట్ ఆఫ్ ది ఆర్ట్’ అని OpenAI చెప్పింది
2025-12-11T18:57:16.691Z
- OpenAI, GPT-5.2, దాని తాజా మోడల్, “ప్రొఫెషనల్ నాలెడ్జ్ వర్క్” చేయడంలో ఇంకా అత్యుత్తమమని పేర్కొంది.
- బెంచ్మార్క్ పరీక్షలో, OpenAI 44 వృత్తులలో టాస్క్లలో పరిశ్రమ నిపుణులను అధిగమించిందని తెలిపింది.
- Google యొక్క జెమిని 3కి ప్రతిస్పందనగా OpenAI CEO సామ్ ఆల్ట్మాన్ “కోడ్ రెడ్”ని ప్రకటించిన కొద్ది రోజుల తర్వాత GPT-5.2 విడుదల చేయబడింది.
OpenAI గురువారం GPT-5కి దాని ఊహించిన అప్డేట్ను విడుదల చేసింది, కొత్త AI “వృత్తిపరమైన నాలెడ్జ్ వర్క్ కోసం ఇంకా అత్యంత సామర్థ్యం గల మోడల్ సిరీస్” అని గొప్పగా చెప్పుకుంది.
“వ్యక్తుల కోసం మరింత ఆర్థిక విలువను అన్లాక్ చేయడానికి మేము GPT‑5.2ని రూపొందించాము; స్ప్రెడ్షీట్లను రూపొందించడం, ప్రెజెంటేషన్లను రూపొందించడం, కోడ్ రాయడం, చిత్రాలను గ్రహించడం, పొడవైన సందర్భాలను అర్థం చేసుకోవడం, సాధనాలను ఉపయోగించడం మరియు సంక్లిష్టమైన, బహుళ-దశల ప్రాజెక్ట్ను నిర్వహించడం ఉత్తమం” అని కంపెనీ ఒక ప్రకటనలో తెలిపింది.
GDPval అనే బెంచ్మార్క్ పరీక్షలో, OpenAI దాని కొత్త AI మోడల్ “44 వృత్తులలో విస్తరించి ఉన్న బాగా-పేర్కొన్న నాలెడ్జ్ వర్క్ టాస్క్లలో పరిశ్రమ నిపుణులను” అధిగమించగలదని పేర్కొంది.
“GPT‑5.2 థింకింగ్ GDPval టాస్క్ల కోసం > 11x వేగంతో మరియు నిపుణులైన నిపుణుల ఖర్చు <1% వద్ద అవుట్పుట్లను ఉత్పత్తి చేసింది, మానవ పర్యవేక్షణతో జత చేసినప్పుడు, GPT‑5.2 వృత్తిపరమైన పనిలో సహాయపడుతుందని కంపెనీ తెలిపింది.
GDPval బెంచ్మార్క్ పరీక్ష నుండి OpenAI యొక్క GPT 5.2 ఫలితాలు OpenAI
మరియు బ్యాంకర్ల దృష్టిని ఖచ్చితంగా ఆకర్షించే ఒక నోట్లో, OpenAI జూనియర్ ఇన్వెస్ట్మెంట్ బ్యాంకింగ్ అనలిస్ట్ స్ప్రెడ్షీట్ మోడలింగ్ టాస్క్ల యొక్క అంతర్గత బెంచ్మార్క్లో – “సరైన ఫార్మాటింగ్ మరియు అనులేఖనాలతో ఫార్చ్యూన్ 500 కంపెనీ కోసం మూడు-స్టేట్మెంట్ మోడల్ను ఒకచోట చేర్చడం లేదా టేక్-ప్రైవేట్ స్కోరు 3% కంటే ఎక్కువ టాస్క్ కొనుగోలు మోడల్ను రూపొందించడం వంటివి” అని రాశారు. GPT‑5.1లు, సగటున 59.1% నుండి 68.4%కి పెరుగుతాయి.
కంపెనీ ఏజెంట్ కోడింగ్ సామర్థ్యంలో దాని లాభాలను కూడా ప్రచారం చేసింది.
OpenAI CEO తర్వాత కేవలం ఒక వారం తర్వాత విడుదల వస్తుంది సామ్ ఆల్ట్మాన్ “కోడ్ రెడ్”గా ప్రకటించాడు ఉద్యోగులకు ప్రైవేట్ సందేశంలో, Google మరియు ఇతర కంపెనీల నుండి పెరుగుతున్న పోటీ మధ్య ChatGPTకి మరిన్ని వనరులను మార్షల్ చేయడం.
గూగుల్ ఇటీవల విడుదల చేసిన జెమిని 3 AI మోడల్తో AI రేసులో OpenAIని అధిగమించకపోయినా, టెక్లో చాలా మంది దీనిని పొందుతుందని భావించారు.
ఇది అభివృద్ధి చెందుతున్న కథ…



