Life Style

నాలెడ్జ్ వర్క్ కోసం GPT-5.2 ‘స్టేట్ ఆఫ్ ది ఆర్ట్’ అని OpenAI చెప్పింది

2025-12-11T18:57:16.691Z

  • OpenAI, GPT-5.2, దాని తాజా మోడల్, “ప్రొఫెషనల్ నాలెడ్జ్ వర్క్” చేయడంలో ఇంకా అత్యుత్తమమని పేర్కొంది.
  • బెంచ్‌మార్క్ పరీక్షలో, OpenAI 44 వృత్తులలో టాస్క్‌లలో పరిశ్రమ నిపుణులను అధిగమించిందని తెలిపింది.
  • Google యొక్క జెమిని 3కి ప్రతిస్పందనగా OpenAI CEO సామ్ ఆల్ట్‌మాన్ “కోడ్ రెడ్”ని ప్రకటించిన కొద్ది రోజుల తర్వాత GPT-5.2 విడుదల చేయబడింది.

OpenAI గురువారం GPT-5కి దాని ఊహించిన అప్‌డేట్‌ను విడుదల చేసింది, కొత్త AI “వృత్తిపరమైన నాలెడ్జ్ వర్క్ కోసం ఇంకా అత్యంత సామర్థ్యం గల మోడల్ సిరీస్” అని గొప్పగా చెప్పుకుంది.

“వ్యక్తుల కోసం మరింత ఆర్థిక విలువను అన్‌లాక్ చేయడానికి మేము GPT‑5.2ని రూపొందించాము; స్ప్రెడ్‌షీట్‌లను రూపొందించడం, ప్రెజెంటేషన్‌లను రూపొందించడం, కోడ్ రాయడం, చిత్రాలను గ్రహించడం, పొడవైన సందర్భాలను అర్థం చేసుకోవడం, సాధనాలను ఉపయోగించడం మరియు సంక్లిష్టమైన, బహుళ-దశల ప్రాజెక్ట్‌ను నిర్వహించడం ఉత్తమం” అని కంపెనీ ఒక ప్రకటనలో తెలిపింది.

GDPval అనే బెంచ్‌మార్క్ పరీక్షలో, OpenAI దాని కొత్త AI మోడల్ “44 వృత్తులలో విస్తరించి ఉన్న బాగా-పేర్కొన్న నాలెడ్జ్ వర్క్ టాస్క్‌లలో పరిశ్రమ నిపుణులను” అధిగమించగలదని పేర్కొంది.

“GPT‑5.2 థింకింగ్ GDPval టాస్క్‌ల కోసం > 11x వేగంతో మరియు నిపుణులైన నిపుణుల ఖర్చు <1% వద్ద అవుట్‌పుట్‌లను ఉత్పత్తి చేసింది, మానవ పర్యవేక్షణతో జత చేసినప్పుడు, GPT‑5.2 వృత్తిపరమైన పనిలో సహాయపడుతుందని కంపెనీ తెలిపింది.


GDPval బెంచ్‌మార్క్ పరీక్ష నుండి OpenAI GPT 5.2 ఫలితాలు

GDPval బెంచ్‌మార్క్ పరీక్ష నుండి OpenAI యొక్క GPT 5.2 ఫలితాలు

OpenAI



మరియు బ్యాంకర్ల దృష్టిని ఖచ్చితంగా ఆకర్షించే ఒక నోట్‌లో, OpenAI జూనియర్ ఇన్వెస్ట్‌మెంట్ బ్యాంకింగ్ అనలిస్ట్ స్ప్రెడ్‌షీట్ మోడలింగ్ టాస్క్‌ల యొక్క అంతర్గత బెంచ్‌మార్క్‌లో – “సరైన ఫార్మాటింగ్ మరియు అనులేఖనాలతో ఫార్చ్యూన్ 500 కంపెనీ కోసం మూడు-స్టేట్‌మెంట్ మోడల్‌ను ఒకచోట చేర్చడం లేదా టేక్-ప్రైవేట్ స్కోరు 3% కంటే ఎక్కువ టాస్క్ కొనుగోలు మోడల్‌ను రూపొందించడం వంటివి” అని రాశారు. GPT‑5.1లు, సగటున 59.1% నుండి 68.4%కి పెరుగుతాయి.

కంపెనీ ఏజెంట్ కోడింగ్ సామర్థ్యంలో దాని లాభాలను కూడా ప్రచారం చేసింది.

OpenAI CEO తర్వాత కేవలం ఒక వారం తర్వాత విడుదల వస్తుంది సామ్ ఆల్ట్‌మాన్ “కోడ్ రెడ్”గా ప్రకటించాడు ఉద్యోగులకు ప్రైవేట్ సందేశంలో, Google మరియు ఇతర కంపెనీల నుండి పెరుగుతున్న పోటీ మధ్య ChatGPTకి మరిన్ని వనరులను మార్షల్ చేయడం.

గూగుల్ ఇటీవల విడుదల చేసిన జెమిని 3 AI మోడల్‌తో AI రేసులో OpenAIని అధిగమించకపోయినా, టెక్‌లో చాలా మంది దీనిని పొందుతుందని భావించారు.

ఇది అభివృద్ధి చెందుతున్న కథ…




Source link

Related Articles

స్పందించండి

మీ ఈమెయిలు చిరునామా ప్రచురించబడదు. తప్పనిసరి ఖాళీలు *‌తో గుర్తించబడ్డాయి

Back to top button