CUDA కోర్‌లు మరియు టెన్సర్ కోర్‌ల మధ్య తేడా ఏమిటి? (వివరించారు) - అన్ని తేడాలు

 CUDA కోర్‌లు మరియు టెన్సర్ కోర్‌ల మధ్య తేడా ఏమిటి? (వివరించారు) - అన్ని తేడాలు

Mary Davis

CUDA మరియు Tensor కోర్లు Nvidia అనే కంపెనీ ద్వారా అభివృద్ధి చేయబడిన ఉత్పత్తులు. కాబట్టి CUDA కోర్లు మరియు టెన్సర్ కోర్లు అంటే ఏమిటి? CUDA అంటే కంప్యూట్ యూనిఫైడ్ డివైస్ ఆర్కిటెక్చర్. Nvidia డెవలపర్‌లు చెప్పినట్లు CUDA కోర్‌లు మీ GPUలు, స్మార్ట్‌ఫోన్‌లు మరియు మీ కార్లలో కూడా ఉన్నాయి.

CUDA కోర్లు ఒక సమాంతర కంప్యూటింగ్ ప్లాట్‌ఫారమ్ మరియు అప్లికేషన్ ప్రోగ్రామింగ్ ఇంటర్‌ఫేస్ (API), ఇది సాధారణ-ప్రయోజన ప్రాసెసింగ్ కోసం నిర్దిష్ట రకాల గ్రాఫిక్స్ ప్రాసెసింగ్ యూనిట్‌లను (GPUలు) ఉపయోగించుకునేలా సాఫ్ట్‌వేర్‌ను అనుమతిస్తుంది.

ఎన్విడియా ద్వారా అభివృద్ధి చేయబడిన టెన్సర్ కోర్లు GPUలలో కూడా ఉపయోగించబడతాయి. టెన్సర్ కోర్లు మిక్స్డ్-ప్రెసిషన్ కంప్యూటింగ్‌ని ఎనేబుల్ చేస్తాయి, ఖచ్చితత్వాన్ని కొనసాగిస్తూ నిర్గమాంశను పెంచడానికి డైనమిక్‌గా గణనలను స్వీకరించడం.

సులభంగా చెప్పాలంటే, నిర్దిష్ట గణనలను చేయడానికి ఈ కోర్లు మీ PCలోని GPUలలో ముఖ్యమైన భాగం. CUDA కోర్లు రెండు సంఖ్యలను గుణించడానికి మరియు వాటిని మరొక సంఖ్యకు జోడించడానికి ఉపయోగించబడతాయి.

టెన్సర్ కోర్ ఒకేలా ఉంటుంది కానీ 4×4 మాత్రికలతో ఉంటుంది. ఈ గణనలు ప్రాథమికంగా మీ కోసం గ్రాఫిక్‌లను వేగంగా రెండరింగ్ చేస్తున్నాయి.

CUDA అంటే ఏమిటి?

కంప్యూట్ యూనిఫైడ్ డివైస్ ఆర్కిటెక్చర్ ఇన్ షార్ట్ CUDA ద్వారా అభివృద్ధి చేయబడింది, జూన్ 23, 2007న విడుదల చేయబడింది, ఇది ఒక సమాంతర కంప్యూటింగ్ ప్లాట్‌ఫారమ్ మరియు అప్లికేషన్ ప్రోగ్రామింగ్ ఇంటర్‌ఫేస్ (API).

అది. సాధారణ-ప్రయోజన ప్రాసెసింగ్ కోసం నిర్దిష్ట రకాల గ్రాఫిక్స్ ప్రాసెసింగ్ యూనిట్‌లను (GPUలు) ఉపయోగించడానికి సాఫ్ట్‌వేర్‌ను అనుమతిస్తుంది, ఈ పద్ధతిని సాధారణ-ప్రయోజన కంప్యూటింగ్ అని పిలుస్తారుGPUలు (GPU).

CUDA అనేది GPU యొక్క వర్చువల్ ఇన్‌స్ట్రక్షన్ సెట్‌కు మరియు కంప్యూట్ కెర్నల్‌ల అమలు కోసం సమాంతర గణన మూలకాలకు ప్రత్యక్ష ప్రాప్యతను అందించే సాఫ్ట్‌వేర్ లేయర్. C, C++ మరియు Fortranతో సహా వివిధ ప్రోగ్రామింగ్ భాషలతో పని చేయడానికి CUDA అభివృద్ధి చేయబడింది.

వివిధ ప్రోగ్రామింగ్ లాంగ్వేజ్‌లతో పని చేయగల సామర్థ్యం, ​​GPU వనరులను మేము Direct3D లేదా OpenGL వంటి మునుపటి APIల నుండి వేరు చేస్తే, సమాంతర ప్రోగ్రామింగ్‌లోని నిపుణులు ఉపయోగించడాన్ని సులభతరం చేస్తుంది, దీనికి మీరు మరింత అధునాతనంగా ఉండాలి. గ్రాఫికల్ ప్రోగ్రామింగ్‌లో నైపుణ్యం.

CUDAతో GPU కూడా OpenMP, OpenACC, OpenCL వంటి ప్రోగ్రామింగ్ ఫ్రేమ్‌వర్క్‌లకు మద్దతు ఇస్తుంది మరియు CUDAకి అటువంటి కోడ్‌ను కంపైల్ చేయగల HIP కూడా. CUDA కోసం ఉపయోగించిన మొదటి పేరు కంప్యూట్ యూనిఫైడ్ డివైస్ ఆర్కిటెక్చర్ యొక్క సంక్షిప్త రూపం. అయితే, Nvidia తరువాత సాధారణంగా ఉపయోగించే సంక్షిప్త పదాన్ని వదిలివేసింది.

ఒక శక్తివంతమైన Nvidia గ్రాఫిక్స్ కార్డ్ GTX 1080 Ti

CUDA గురించి మరింత

ఒక ప్రత్యేక కంప్యూటర్ ప్రాసెసర్‌గా, గ్రాఫిక్స్ ప్రాసెసింగ్ యూనిట్ (GPU) వాస్తవ అవసరాలను తీరుస్తుంది -సమయం, కంప్యూట్-ఇంటెన్సివ్ 3D గ్రాఫిక్స్ వర్క్‌లోడ్‌లు.

సుమారు 2012 GPUలు అభివృద్ధి చెందాయి మరియు పెద్ద బ్లాక్‌ల కోసం సమర్థవంతమైన డేటా ప్రాసెసింగ్‌ను ప్రారంభించే అత్యంత సమాంతర బహుళ-కోర్ సిస్టమ్‌లుగా మారాయి.

సమాంతరంగా భారీ డేటా బ్లాక్‌లను ప్రాసెస్ చేస్తున్నప్పుడు, ఈ డిజైన్ అల్గారిథమ్‌ల కోసం సాధారణ-ప్రయోజన సెంట్రల్ ప్రాసెసింగ్ యూనిట్‌ల (CPUలు) కంటే మెరుగైనది, ఉదాహరణకు:

  • క్రిప్టోగ్రాఫిక్ హాష్విధులు
  • మెషిన్ లెర్నింగ్
  • మాలిక్యులర్ డైనమిక్స్ సిమ్యులేషన్స్
  • ఫిజిక్స్ ఇంజన్లు
  • క్రమబద్ధీకరణ అల్గారిథమ్‌లు

ఇప్పుడు CUDA ఆర్కిటెక్చర్ ఉపయోగాలు మరియు భవిష్యత్తులో

  • 3D గ్రాఫిక్స్ యొక్క వేగవంతమైన రెండరింగ్
  • వీడియో ఫైల్ ఫార్మాట్‌ల వేగవంతమైన ఇంటర్‌కన్వర్షన్
  • యాక్సిలరేటెడ్ ఎన్‌క్రిప్షన్, డిక్రిప్షన్ మరియు కంప్రెషన్
  • బయోఇన్ఫర్మేటిక్స్, ఉదా., NGS DNA సీక్వెన్సింగ్ BarraCUDA
  • ప్రోటీన్ల స్థానిక ఆకృతిని అంచనా వేయడం వంటి పంపిణీ చేయబడిన లెక్కలు
  • వైద్య విశ్లేషణ అనుకరణలు, ఉదాహరణకు, CT మరియు MRI స్కాన్ చిత్రాల ఆధారంగా వర్చువల్ రియాలిటీ
  • భౌతిక అనుకరణలు, ప్రత్యేకించి ఫ్లూయిడ్ డైనమిక్స్‌లో
  • మెషిన్ లెర్నింగ్ సమస్యలలో న్యూరల్ నెట్‌వర్క్ శిక్షణ
  • ఫేస్ రికగ్నిషన్
  • పంపిణీ చేయబడిన కంప్యూటింగ్ ప్రాజెక్ట్‌లు, [email protected] మరియు ఇతర ప్రాజెక్ట్‌లు BOINC
  • మాలిక్యులర్ డైనమిక్స్
  • మైనింగ్ క్రిప్టోకరెన్సీలు
  • స్ట్రక్చర్ ఫ్రమ్ మోషన్ (SfM) సాఫ్ట్‌వేర్

టెన్సర్ కోర్ అంటే ఏమిటి?

టెన్సర్ కోర్స్ అని పిలువబడే ప్రత్యేక కోర్లు మిశ్రమ-ఖచ్చితమైన శిక్షణను అనుమతిస్తాయి. ఈ ప్రత్యేక కోర్ల ప్రారంభ తరం ఫ్యూజ్డ్ మల్టిప్లై-యాడ్ అల్గారిథమ్‌తో దీన్ని చేస్తుంది. ఇది 4 x 4 FP16 లేదా FP32 మాతృకకు రెండు 4 x 4 FP16 మాత్రికలను గుణించడం మరియు జోడించడం సాధ్యం చేస్తుంది.

అంతిమ ఫలితం FP32 మాత్రమే ఖచ్చితత్వం యొక్క స్వల్ప నష్టాన్ని కలిగి ఉంటుంది, మిశ్రమ ఖచ్చితత్వ కంప్యూటింగ్ అయినప్పటికీఇన్‌పుట్ మాత్రికలు తక్కువ-ఖచ్చితమైన FP16 కావచ్చు.

ఆచరణలో, ఇది మోడల్ యొక్క తుది ప్రభావంపై తక్కువ ప్రభావంతో గణనలను గణనీయంగా వేగవంతం చేస్తుంది. ఈ సామర్ధ్యం తరువాత మైక్రోఆర్కిటెక్చర్ల ద్వారా మరింత తక్కువ ఖచ్చితమైన కంప్యూటర్ నంబర్ ప్రాతినిధ్యాలకు విస్తరించబడింది.

మొదటి తరం V100 నుండి వోల్టా మైక్రోఆర్కిటెక్చర్‌తో పరిచయం చేయబడింది, కొత్త GPU మైక్రోఆర్కిటెక్చర్‌లతో గణన కోసం మరిన్ని కంప్యూటర్ నంబర్ ప్రెసిషన్ ఫార్మాట్‌లు అందుబాటులోకి వచ్చాయి.

మేము అనుసరించే విభాగంలోని ప్రతి మైక్రోఆర్కిటెక్చర్ జనరేషన్‌తో టెన్సర్ కోర్ల సామర్థ్యం మరియు కార్యాచరణ ఎలా మారిపోయింది మరియు మెరుగుపడింది అనే దాని గురించి మాట్లాడుతాము.

టైటాన్ V ద్వారా గ్రాఫికల్‌గా రెండర్ చేయబడిన చిత్రం

టెన్సర్ కోర్‌లు ఎలా పని చేస్తాయి?

మొదటి తరం:

వోల్టా GPU మైక్రోఆర్కిటెక్చర్ మొదటి తరం టెన్సర్ కోర్‌లతో చేర్చబడింది. ఈ కోర్లు మిశ్రమ ఖచ్చితత్వం మరియు FP16 నంబర్ ఫార్మాట్‌తో శిక్షణ పొందడాన్ని సాధ్యం చేశాయి.

ఇది నిర్దిష్ట GPUల కోసం teraFLOP నిర్గమాంశలో గరిష్టంగా 12x బూస్ట్‌ను కలిగి ఉంటుంది. టాప్-టైర్ V100 యొక్క 640 కోర్లు మునుపటి తరం యొక్క పాస్కల్ GPUల కంటే పనితీరు వేగాన్ని 5x వరకు పెంచుతాయి.

రెండవ తరం:

ట్యూరింగ్ GPUల పరిచయంతో, రెండవ తరం టెన్సర్ కోర్లు పరిచయం చేయబడ్డాయి. Int8, Int4 మరియు Int1 మద్దతు ఉన్న టెన్సర్ కోర్ ఖచ్చితత్వాల జాబితాకు జోడించబడ్డాయి, అవిగతంలో FP16కి పరిమితం చేయబడింది.

ఇది కూడ చూడు: Facebook VS M Facebookని టచ్ చేయండి: తేడా ఏమిటి? - అన్ని తేడాలు

మిశ్రమ ఖచ్చితత్వ శిక్షణా విధానాల కారణంగా, పాస్కల్ GPUలతో పోలిస్తే GPU పనితీరు నిర్గమాంశ 32 రెట్లు పెరిగింది.

థర్డ్ జనరేషన్:

ఆంపియర్ GPUలోని ఆర్కిటెక్చర్ FP64, TF32 మరియు bfloat16 ప్రెసిషన్‌లకు మద్దతుని జోడించడం ద్వారా వోల్టా మరియు ట్యూరింగ్ మైక్రోఆర్కిటెక్చర్‌ల మునుపటి పురోగతిపై విస్తరించింది.

డీప్ లెర్నింగ్ ట్రైనింగ్ మరియు అనుమితి కార్యకలాపాలు ఈ అదనపు ఖచ్చితత్వ ఫార్మాట్‌ల ద్వారా మరింత వేగవంతం చేయబడ్డాయి. ఉదాహరణకు, TF32 ఫార్మాట్ FP32 మాదిరిగానే పనిచేస్తుంది, అయితే ఎటువంటి కోడ్‌ను మార్చకుండా 20x స్పీడప్‌లకు హామీ ఇస్తుంది.

తర్వాత, కేవలం కొన్ని లైన్ల కోడ్‌తో, ఆటోమేటిక్ మిక్స్డ్ ప్రిసిషన్ ఇంప్లిమెంటేషన్ శిక్షణను అదనంగా 2x వేగవంతం చేస్తుంది.

ఆమ్పియర్ మైక్రోఆర్కిటెక్చర్ యొక్క అదనపు అంశాలు . 7> నాల్గవ తరం:

హాపర్ మైక్రోఆర్కిటెక్చర్ ఆధారిత నాల్గవ తరం టెన్సర్ కోర్ల యొక్క భవిష్యత్తు విడుదల ప్రణాళిక చేయబడింది. తదుపరి H100లో నాల్గవ తరం టెన్సర్ కోర్లు.

ఇది మార్చి 2022లో విడుదల చేయబడుతుందని భావిస్తున్నారు, FP8 ఖచ్చితమైన ఫార్మాట్‌లను నిర్వహించగలదు మరియు NVIDIA ప్రకారం, భారీ భాషా నమూనాలను “ఆశ్చర్యపరిచే 30X ద్వారా వేగవంతం చేస్తుంది. మునుపటి తరం కంటే.”

ఒక RTX గ్రాఫిక్స్ కార్డ్టెన్సర్ కోర్లను కలిగి ఉన్నందున గ్రాఫిక్‌లను చాలా వేగంగా రెండరింగ్ చేయడానికి ఉపయోగిస్తారు.

ఇది కూడ చూడు: లెక్స్ లూథర్ మరియు జెఫ్ బెజోస్ మధ్య తేడా ఏమిటి? (వాస్తవాలు వెల్లడి చేయబడ్డాయి) - అన్ని తేడాలు

CUDA కోర్లు మరియు టెన్సర్ కోర్ల మధ్య వ్యత్యాసం

Tensor కోర్లు ప్రస్తుతం Titan V మరియు Tesla V100కి పరిమితం చేయబడ్డాయి. రెండు GPUలలోని 5120 CUDA కోర్‌లు ఒక GPU గడియారానికి (ఉదా. టెస్లా V100 PCIe పౌనఃపున్యం 1.38Gz) గరిష్టంగా ఒకే ఖచ్చితత్వ గుణకారం-అక్యుములేట్ ఆపరేషన్ (ఉదాహరణకు, fp32: x += y * z) సామర్థ్యాన్ని కలిగి ఉంటాయి.

ప్రతి టెన్సర్ కోర్ చిన్న మాత్రికల కోసం 4×4 చిన్న మాత్రికలపై పనిచేస్తుంది. ఒక GPU గడియారానికి, ప్రతి టెన్సర్ కోర్ ఒక మ్యాట్రిక్స్ మల్టిప్లై-అక్యుములేట్ ఆపరేషన్‌ను పూర్తి చేయగలదు.

ఇది రెండు 4×4 FP16 మాత్రికలను గుణిస్తుంది మరియు 4×4 FP32 మాతృకను జోడిస్తుంది, దీని ఫలితంగా సంచితం (అది కూడా fp32 4×4 మాతృక).

ఇన్‌పుట్ మాత్రికలు fp16 అయితే గుణకార ఫలితాలు మరియు అక్యుమ్యులేటర్ fp32 అయినందున, అల్గోరిథం మిశ్రమ ఖచ్చితత్వంగా పిలువబడుతుంది.

సరైన పదం కేవలం “4×4 మ్యాట్రిక్స్ కోర్‌లు” కావచ్చు, కానీ NVIDIA మార్కెటింగ్ బృందం “టెన్సర్ కోర్‌లను” ఉపయోగించాలని ఎంచుకుంది.

టెన్సర్ కోర్ల పూర్తి వివరణ క్లుప్తంగా

GPU కార్డ్ CUDA కోర్లు VRAM
GeForce GTX 1660 Ti 1536 6GB
GeForce GTX 1660 Super 1408 6GB
GeForce GTX 1660 1408 6GB
GeForce GTX 1650 Super 1408 4GB
GeForce GTX 1650 1024 మరియు896 4GB
GeForce GTX 1060 3GB 1280 4GB
GeForce GTX 1650 1280 3GB
GeForce GTX 1060 6GB 768 6GB
GeForce GTX 1050 Ti (3GB) 768 4GB
GeForce GTX 1050 (2GB) 640 3GB
GeForce GTX 960 1024 2GB
GeForce GTX 950 786 2GB
GeForce GTX 780 Ti 2880 2GB
GeForce GTX 780 2304 3GB
GeForce GTX 750 Ti 640 2 GB
GeForce GTX 750 512 1GB లేదా 2 GB

CUDA కోర్లను కలిగి ఉన్న GPUలు

ముగింపు

  • CUDA మరియు Tensor కోర్లు ఉత్పత్తులు, రెండూ Nvidia అనే కంపెనీ ద్వారా అభివృద్ధి చేయబడ్డాయి. CUDA అంటే కంప్యూట్ యూనిఫైడ్ డివైస్ ఆర్కిటెక్చర్. ఈ CUDA కోర్‌లు మీ GPUలు, స్మార్ట్‌ఫోన్‌లు మరియు మీ కార్లలో కూడా ఉన్నాయి.
  • ఎన్విడియా ద్వారా కూడా అభివృద్ధి చేయబడిన టెన్సర్ కోర్లు GPUలలో కూడా ఉపయోగించబడతాయి. "టెన్సర్ కోర్స్" అని పిలువబడే ప్రత్యేక కోర్లు మిశ్రమ-ఖచ్చితమైన శిక్షణను అనుమతిస్తాయి. మొదటి తరం టెన్సర్ కోర్స్ మిశ్రమ ఖచ్చితత్వం మరియు FP16 నంబర్ ఫార్మాట్‌తో శిక్షణ పొందడం సాధ్యం చేసింది.
  • ఇది నిర్దిష్ట GPUల కోసం teraFLOP నిర్గమాంశలో 12x వరకు బూస్ట్‌ను కలిగి ఉంటుంది. Int8, Int4 మరియు Int1 మద్దతు ఉన్న టెన్సర్ కోర్ ఖచ్చితత్వాల జాబితాకు జోడించబడ్డాయి.
  • మిశ్రమం కారణంగాఖచ్చితమైన శిక్షణా విధానాలు, GPU పనితీరు 32 రెట్లు పెరిగింది. హాప్పర్ మైక్రోఆర్కిటెక్చర్ ఆధారిత నాల్గవ తరం టెన్సర్ కోర్ల యొక్క భవిష్యత్తు విడుదల ప్రణాళిక చేయబడింది.

ఇతర కథనాలు

Mary Davis

మేరీ డేవిస్ రచయిత, కంటెంట్ సృష్టికర్త మరియు వివిధ అంశాలపై పోలిక విశ్లేషణలో నైపుణ్యం కలిగిన ఆసక్తిగల పరిశోధకురాలు. జర్నలిజంలో డిగ్రీ మరియు ఫీల్డ్‌లో ఐదు సంవత్సరాల అనుభవంతో, మేరీ తన పాఠకులకు నిష్పాక్షికమైన మరియు సూటిగా సమాచారాన్ని అందించాలనే అభిరుచిని కలిగి ఉంది. రాయడం పట్ల ఆమెకున్న ప్రేమ ఆమె చిన్నతనంలోనే మొదలైంది మరియు రచనలో ఆమె విజయవంతమైన వృత్తికి చోదక శక్తిగా నిలిచింది. తేలికగా అర్థం చేసుకోగలిగే మరియు ఆకర్షణీయమైన ఆకృతిలో పరిశోధన మరియు ఫలితాలను అందించడంలో మేరీ యొక్క సామర్థ్యం ప్రపంచవ్యాప్తంగా ఉన్న పాఠకులకు ఆమెను ఆకట్టుకుంది. ఆమె రాయనప్పుడు, మేరీ ప్రయాణం చేయడం, చదవడం మరియు కుటుంబం మరియు స్నేహితులతో సమయం గడపడం ఆనందిస్తుంది.