ఎన్విడియా ఇమెయిల్: మైక్రోసాఫ్ట్ యొక్క బ్లాక్వెల్ కూలింగ్ అప్రోచ్ ‘వ్యర్థమైనదిగా అనిపిస్తుంది’
వంటి ఎన్విడియా దానిలోని కొన్ని సరికొత్త చిప్లను ఇన్స్టాల్ చేయడానికి పని చేస్తుంది మైక్రోసాఫ్ట్ డేటా సెంటర్లు, ఒక ఉద్యోగి GPU ఒక సదుపాయంలో మైక్రోసాఫ్ట్ యొక్క శీతలీకరణ విధానం “వ్యర్థమైనది” అనిపించిందని దిగ్గజం ప్రారంభ పతనంలో గమనించింది.
Nvidia దాని అమలులో ఉంది GB200 బ్లాక్వెల్ మైక్రోసాఫ్ట్ మరియు ఇతర టెక్ దిగ్గజాల వద్ద ఆర్కిటెక్చర్ శిక్షణ మరియు అమలు కోసం కంప్యూట్ కోసం డిమాండ్ AI మోడల్స్ హెచ్చుతగ్గులు.
బ్లాక్వెల్, లో ప్రకటించారు మార్చి 2024దాని ముందున్న హాప్పర్ కంటే ఇంచుమించు రెండింతలు శక్తివంతమైనదని ఎన్విడియా CEO జెన్సన్ హువాంగ్ లాంచ్ సందర్భంగా తెలిపారు. GB200 అనేది బ్లాక్వెల్ విస్తరణల యొక్క మునుపటి తరంగంలో భాగం, ఇప్పుడు GB300 తరం అందుబాటులో ఉంది.
ప్రారంభ పతనంలో, ఎన్విడియా ఇన్ఫ్రాస్ట్రక్చర్ స్పెషలిస్ట్స్ (NVIS) బృందంలోని సిబ్బంది పంపిన అంతర్గత ఇమెయిల్ OpenAI కోసం ఒక బ్లాక్వెల్ సర్వర్ రాక్ల ఇన్స్టాలేషన్ను వివరించింది, మైక్రోసాఫ్ట్ క్లౌడ్ భాగస్వామిగా మరియు అతిపెద్ద పెట్టుబడిదారుగా మద్దతు ఇస్తుంది.
ఇమెయిల్ రెండు GB200 NVL72 రాక్ల సెటప్ను వివరించింది, వీటిలో ప్రతి ఒక్కటి 72 Nvidia GPUలను కలిగి ఉంది. సెటప్ లిక్విడ్ కూలింగ్ టెక్నాలజీని ఉపయోగిస్తుందిబహుళ GPUల ద్వారా ఉత్పన్నమయ్యే వేడిని అందించినందున, అవి సన్నిహితంగా పనిచేస్తాయి.
మెమో ప్రకారం, మైక్రోసాఫ్ట్ యొక్క “శీతలీకరణ వ్యవస్థ మరియు వారి GB200 విస్తరణ కోసం డేటా సెంటర్ కూలింగ్ విధానం పరిమాణం మరియు సౌకర్యాల నీటి వినియోగం లేకపోవడం వల్ల వృధాగా అనిపిస్తోంది, అయితే ఇది చాలా సౌలభ్యం మరియు తప్పు సహనాన్ని అందిస్తుంది” అని సిబ్బంది రాశారు.
కాలిఫోర్నియా విశ్వవిద్యాలయంలో ఎలక్ట్రికల్ మరియు కంప్యూటర్ ఇంజినీరింగ్ అసోసియేట్ ప్రొఫెసర్ షావోలీ రెన్ ప్రకారం, సర్వర్ల కోసం లిక్విడ్ కూలింగ్ ఉపయోగించబడుతున్నప్పటికీ, డేటా సెంటర్లు సౌకర్యం నుండి వేడిని తొలగించడానికి రెండవ, బిల్డింగ్-లెవల్ సిస్టమ్ను కూడా ఉపయోగిస్తాయి.
Nvidia ఉద్యోగి నీటికి బదులుగా గాలి-శీతలీకరణను ఉపయోగించే భవనం-స్థాయి వ్యవస్థను సూచిస్తూ ఉండవచ్చు, డేటా కేంద్రాలు నీరు మరియు ఇతర వనరులను ఎలా ఉపయోగిస్తాయో అధ్యయనం చేసే రెన్ వివరించారు.
“ఈ రకమైన శీతలీకరణ వ్యవస్థ ఎక్కువ శక్తిని ఉపయోగిస్తుంది, కానీ అది నీటిని ఉపయోగించదు” అని అతను చెప్పాడు.
మైక్రోసాఫ్ట్ ప్రతినిధి రెన్ యొక్క రెండు-దశల వివరణకు అనుగుణంగా శీతలీకరణ సెటప్ను వివరించారు.
“మైక్రోసాఫ్ట్ ద్రవ శీతలీకరణ ఉష్ణ వినిమాయకం యూనిట్ మొదటి మరియు థర్డ్-పార్టీ ప్లాట్ఫారమ్లలో శీతలీకరణ సామర్థ్యాన్ని పెంచడానికి మేము ఇప్పటికే ఉన్న ఎయిర్-కూల్డ్ డేటా సెంటర్లలో ఒక క్లోజ్డ్-లూప్ సిస్టమ్ను అమలు చేస్తాము” అని మైక్రోసాఫ్ట్ ప్రతినిధి బిజినెస్ ఇన్సైడర్కి ఒక ప్రకటనలో తెలిపారు.
“ఈ వ్యవస్థలు AI మరియు హైపర్స్కేల్ సిస్టమ్ల డిమాండ్లను తీర్చడానికి సమర్థవంతమైన ఉష్ణ వెదజల్లడం మరియు పవర్ డెలివరీని ఆప్టిమైజ్ చేయడం ద్వారా మా ప్రస్తుత గ్లోబల్ డేటా సెంటర్ ఫుట్ప్రింట్ను స్కేల్ కోసం గరిష్టంగా పెంచుతాయని నిర్ధారిస్తుంది” అని ప్రతినిధి జోడించారు.
వనరుల మధ్య “వ్యాపారం”
AI ఇన్ఫ్రాస్ట్రక్చర్ విస్తరిస్తున్న కొద్దీ, డేటా-సెంటర్ కూలింగ్లో శక్తి మరియు నీటి వినియోగం ప్రపంచవ్యాప్తంగా ఫ్లాష్పాయింట్లుగా మారాయి, కొత్త సౌకర్యాలు నిర్మించబడుతున్న కొన్ని ప్రాంతాలలో పుష్బ్యాక్ను ప్రేరేపిస్తుంది.
డేటా సెంటర్లు బిల్డింగ్ లెవెల్లో ఎయిర్ కూలింగ్, వాటర్ కూలింగ్ లేదా హైబ్రిడ్ సిస్టమ్ను ఉపయోగించగలవు కాబట్టి, వనరుల మధ్య “వాణిజ్యం ఉంది” అని రెన్ పేర్కొన్నాడు.
గాలి శీతలీకరణకు ఎక్కువ శక్తి అవసరమవుతుంది, కానీ “నీటి వినియోగంతో కొన్ని ప్రజా సమస్యలను పరిష్కరించగలదు – ఎందుకంటే నీరు అనేది ప్రజలు నిజంగా చూడగలిగేది” అని ఆయన చెప్పారు.
“ఈ కంపెనీలు లాభాలతో నడిచేవి,” అవి నీటి ఖర్చు, శక్తి ఖర్చు మరియు ప్రచార ఖర్చుతో కూడి ఉంటాయి.
మైక్రోసాఫ్ట్, దాని భాగానికి, ఇది ఉద్దేశించబడింది “కార్బన్ నెగటివ్, వాటర్ పాజిటివ్ మరియు జీరో వేస్ట్“2030 నాటికి.
“మేము కూడా ప్రకటించాము జీరో వాటర్ కూలింగ్ డిజైన్ మా తదుపరి తరం డేటా కేంద్రాలు మరియు పురోగతి కోసం ఆన్-చిప్ శీతలీకరణ,” అని ప్రతినిధి చెప్పారు.
బ్లాక్వెల్ ఇన్స్టాలేషన్ లోపల
Nvidia సిబ్బంది నుండి వచ్చిన అంతర్గత ఇమెయిల్, ప్రారంభ పతనంలో బ్లాక్వెల్ ఇన్స్టాలేషన్ సమయంలో సంభవించిన కొన్ని లాజిస్టికల్ ఎక్కిళ్ళను వివరించింది, ఇది కొత్త డేటా సెంటర్ హార్డ్వేర్ను ముందుగా అమలు చేయడంలో విలక్షణమైనది.
“ఈ కార్యకలాపానికి ఆన్సైట్ మద్దతు అవసరం” అని సిబ్బంది రాశారు. “ధృవీకరణ ప్రక్రియ డాక్యుమెంటేషన్ని సృష్టించడంతోపాటు పని చేసిన దశలను పరిశీలించడంతోపాటు క్లస్టర్ మరియు సిస్టమ్ ధ్రువీకరణ సాధారణంగా ఎలా నిర్వహించబడుతుందో అంతగా తెలియని వారికి అర్థమయ్యేలా చాలా గంటలు గడిపారు.”
అదనంగా, ఎన్విడియా మరియు మైక్రోసాఫ్ట్ మధ్య హ్యాండోవర్ ప్రక్రియలు “రాకముందు ప్రదర్శించిన దానికంటే చాలా ఎక్కువ పటిష్టత అవసరం.”
అయినప్పటికీ, ప్రారంభ నమూనాలతో పోలిస్తే బ్లాక్వెల్ ఉత్పత్తి హార్డ్వేర్ నాణ్యత మెరుగుపడిందని మెమో సూచించింది.
ముందస్తు పరీక్ష కోసం కస్టమర్లకు పంపిన క్వాలిఫైడ్ శాంపిల్స్తో పోలిస్తే GB200 NVL72 ప్రొడక్షన్ హార్డ్వేర్ “మంచి నాణ్యతను కలిగి ఉంది” అని ఇమెయిల్ పేర్కొంది. రెండు రాక్లు నిర్దిష్ట కంప్యూట్ పనితీరు పరీక్షలలో 100% ఉత్తీర్ణత రేటును కలిగి ఉన్నాయి.
ఎన్విడియా ప్రతినిధి బిజినెస్ ఇన్సైడర్తో మాట్లాడుతూ దాని బ్లాక్వెల్ సిస్టమ్లు “వివిధ రకాలైన కంప్యూటింగ్ అప్లికేషన్లకు అసాధారణమైన పనితీరు, విశ్వసనీయత మరియు శక్తి సామర్థ్యాన్ని అందజేస్తాయి.”
“మైక్రోసాఫ్ట్తో సహా మా కస్టమర్లు, కృత్రిమ మేధస్సు కోసం ప్రపంచంలో పెరుగుతున్న అవసరాన్ని తీర్చడానికి వందల వేల బ్లాక్వెల్ GB200 మరియు GB300 NVL72 సిస్టమ్లను విజయవంతంగా అమలు చేశాయి” అని ప్రతినిధి చెప్పారు.



