CUDA ಕೋರ್‌ಗಳು ಮತ್ತು ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು? (ವಿವರಿಸಲಾಗಿದೆ) - ಎಲ್ಲಾ ವ್ಯತ್ಯಾಸಗಳು

01-08-202301-08-2023 Mary Davis

ಪರಿವಿಡಿ

CUDA ಮತ್ತು ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳು Nvidia ಎಂಬ ಕಂಪನಿಯು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ ಉತ್ಪನ್ನಗಳಾಗಿವೆ. ಹಾಗಾದರೆ CUDA ಕೋರ್‌ಗಳು ಮತ್ತು ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳು ಯಾವುವು? CUDA ಎಂದರೆ ಕಂಪ್ಯೂಟ್ ಯುನಿಫೈಡ್ ಡಿವೈಸ್ ಆರ್ಕಿಟೆಕ್ಚರ್. Nvidia ಡೆವಲಪರ್‌ಗಳು ಹೇಳುವಂತೆ CUDA ಕೋರ್‌ಗಳು ನಿಮ್ಮ GPUಗಳು, ಸ್ಮಾರ್ಟ್‌ಫೋನ್‌ಗಳು ಮತ್ತು ನಿಮ್ಮ ಕಾರುಗಳಲ್ಲಿಯೂ ಇರುತ್ತವೆ.

CUDA ಕೋರ್‌ಗಳು ಒಂದು ಸಮಾನಾಂತರ ಕಂಪ್ಯೂಟಿಂಗ್ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಮತ್ತು ಅಪ್ಲಿಕೇಶನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಇಂಟರ್ಫೇಸ್ (API) ಆಗಿದ್ದು, ಇದು ಸಾಮಾನ್ಯ ಉದ್ದೇಶದ ಪ್ರಕ್ರಿಯೆಗಾಗಿ ನಿರ್ದಿಷ್ಟ ರೀತಿಯ ಗ್ರಾಫಿಕ್ಸ್ ಪ್ರೊಸೆಸಿಂಗ್ ಯೂನಿಟ್‌ಗಳನ್ನು (GPU ಗಳು) ಬಳಸಲು ಸಾಫ್ಟ್‌ವೇರ್ ಅನ್ನು ಶಕ್ತಗೊಳಿಸುತ್ತದೆ.

ಎನ್ವಿಡಿಯಾದಿಂದ ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾದ ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳನ್ನು ಸಹ GPU ಗಳಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ. ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳು ಮಿಶ್ರ-ನಿಖರ ಕಂಪ್ಯೂಟಿಂಗ್ ಅನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತವೆ, ನಿಖರತೆಯನ್ನು ಕಾಪಾಡಿಕೊಳ್ಳುವಾಗ ಥ್ರೋಪುಟ್ ಅನ್ನು ಹೆಚ್ಚಿಸಲು ಲೆಕ್ಕಾಚಾರಗಳನ್ನು ಕ್ರಿಯಾತ್ಮಕವಾಗಿ ಅಳವಡಿಸಿಕೊಳ್ಳುತ್ತವೆ.

ಸರಳವಾಗಿ ಹೇಳುವುದಾದರೆ, ಕೆಲವು ಲೆಕ್ಕಾಚಾರಗಳನ್ನು ಮಾಡಲು ಈ ಕೋರ್‌ಗಳು ನಿಮ್ಮ ಪಿಸಿಯಲ್ಲಿನ GPU ಗಳ ಪ್ರಮುಖ ಭಾಗವಾಗಿದೆ. CUDA ಕೋರ್ಗಳನ್ನು ಎರಡು ಸಂಖ್ಯೆಗಳನ್ನು ಗುಣಿಸಲು ಮತ್ತು ಅವುಗಳನ್ನು ಮತ್ತೊಂದು ಸಂಖ್ಯೆಗೆ ಸೇರಿಸಲು ಬಳಸಲಾಗುತ್ತದೆ.

ಆದರೆ ಟೆನ್ಸರ್ ಕೋರ್ ಒಂದೇ ಆದರೆ 4×4 ಮ್ಯಾಟ್ರಿಕ್ಸ್‌ಗಳೊಂದಿಗೆ. ಈ ಲೆಕ್ಕಾಚಾರಗಳು ಮೂಲಭೂತವಾಗಿ ನಿಮಗಾಗಿ ಗ್ರಾಫಿಕ್ಸ್ ಅನ್ನು ವೇಗವಾಗಿ ರೆಂಡರಿಂಗ್ ಮಾಡುತ್ತಿವೆ.

CUDA ಎಂದರೇನು?

ಕಂಪ್ಯೂಟ್ ಯುನಿಫೈಡ್ ಡಿವೈಸ್ ಆರ್ಕಿಟೆಕ್ಚರ್ ಇನ್ ಶಾರ್ಟ್ ಸಿಯುಡಿಎ ಎನ್‌ವಿಡಿಯಾ ಅಭಿವೃದ್ಧಿಪಡಿಸಿದೆ, ಜೂನ್ 23, 2007 ರಂದು ಬಿಡುಗಡೆಯಾಯಿತು, ಇದು ಒಂದು ಸಮಾನಾಂತರ ಕಂಪ್ಯೂಟಿಂಗ್ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಮತ್ತು ಅಪ್ಲಿಕೇಶನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಇಂಟರ್ಫೇಸ್ (API) ಆಗಿದೆ.

ಅದು. ಸಾಮಾನ್ಯ ಉದ್ದೇಶದ ಸಂಸ್ಕರಣೆಗಾಗಿ ನಿರ್ದಿಷ್ಟ ರೀತಿಯ ಗ್ರಾಫಿಕ್ಸ್ ಸಂಸ್ಕರಣಾ ಘಟಕಗಳನ್ನು (GPU) ಬಳಸಲು ಸಾಫ್ಟ್‌ವೇರ್ ಅನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ, ಈ ವಿಧಾನವನ್ನು ಸಾಮಾನ್ಯ ಉದ್ದೇಶದ ಕಂಪ್ಯೂಟಿಂಗ್ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆಜಿಪಿಯುಗಳು (ಜಿಪಿಯು).

ಸಹ ನೋಡಿ: ದಿನಕ್ಕೆ ಎಷ್ಟು ಪುಷ್-ಅಪ್‌ಗಳು ವ್ಯತ್ಯಾಸವನ್ನುಂಟುಮಾಡುತ್ತವೆ? - ಎಲ್ಲಾ ವ್ಯತ್ಯಾಸಗಳು

CUDA ಎನ್ನುವುದು ಸಾಫ್ಟ್‌ವೇರ್ ಲೇಯರ್ ಆಗಿದ್ದು ಅದು GPU ನ ವರ್ಚುವಲ್ ಸೂಚನಾ ಸೆಟ್ ಮತ್ತು ಕಂಪ್ಯೂಟ್ ಕರ್ನಲ್‌ಗಳ ಕಾರ್ಯಗತಗೊಳಿಸಲು ಸಮಾನಾಂತರ ಕಂಪ್ಯೂಟೇಶನಲ್ ಅಂಶಗಳಿಗೆ ನೇರ ಪ್ರವೇಶವನ್ನು ಒದಗಿಸುತ್ತದೆ. C, C++, ಮತ್ತು Fortran ಸೇರಿದಂತೆ ವಿವಿಧ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಭಾಷೆಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು CUDA ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಗಿದೆ.

ವಿಭಿನ್ನ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಭಾಷೆಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವ ಸಾಮರ್ಥ್ಯವು ಸಮಾನಾಂತರ ಪ್ರೋಗ್ರಾಮಿಂಗ್‌ನಲ್ಲಿನ ಪರಿಣಿತರಿಗೆ GPU ಸಂಪನ್ಮೂಲಗಳ ಬಳಕೆಯನ್ನು ಸುಲಭಗೊಳಿಸುತ್ತದೆ, ನಾವು ಅದನ್ನು Direct3D ಅಥವಾ OpenGL ನಂತಹ ಹಿಂದಿನ API ಗಳಿಂದ ಪ್ರತ್ಯೇಕಿಸಿದರೆ, ಅದು ನಿಮಗೆ ಹೆಚ್ಚು ಸುಧಾರಿತ ಅಗತ್ಯವಿರುತ್ತದೆ. ಗ್ರಾಫಿಕಲ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್‌ನಲ್ಲಿ ಕೌಶಲ್ಯ ಬೇಸ್.

CUDA ಜೊತೆಗಿನ GPU ಸಹ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಫ್ರೇಮ್‌ವರ್ಕ್‌ಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ, ಉದಾಹರಣೆಗೆ OpenMP, OpenACC, OpenCL, ಮತ್ತು HIP ಅಂತಹ ಕೋಡ್ ಅನ್ನು CUDA ಗೆ ಕಂಪೈಲ್ ಮಾಡಬಹುದು. CUDA ಗಾಗಿ ಬಳಸಿದ ಮೊದಲ ಹೆಸರು ಕಂಪ್ಯೂಟ್ ಯುನಿಫೈಡ್ ಡಿವೈಸ್ ಆರ್ಕಿಟೆಕ್ಚರ್‌ನ ಸಂಕ್ಷಿಪ್ತ ರೂಪವಾಗಿದೆ. ಆದಾಗ್ಯೂ, ಎನ್ವಿಡಿಯಾ ನಂತರ ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ಸಂಕ್ಷಿಪ್ತ ರೂಪವನ್ನು ಕೈಬಿಟ್ಟಿತು.

ಪ್ರಬಲ Nvidia ಗ್ರಾಫಿಕ್ಸ್ ಕಾರ್ಡ್ GTX 1080 Ti

CUDA ಬಗ್ಗೆ ಇನ್ನಷ್ಟು

ಒಂದು ವಿಶೇಷವಾದ ಕಂಪ್ಯೂಟರ್ ಪ್ರೊಸೆಸರ್ ಆಗಿ, ಗ್ರಾಫಿಕ್ಸ್ ಪ್ರೊಸೆಸಿಂಗ್ ಯುನಿಟ್ (GPU) ನೈಜ ಅಗತ್ಯಗಳನ್ನು ಪೂರೈಸುತ್ತದೆ -ಸಮಯ, ಕಂಪ್ಯೂಟ್-ಇಂಟೆನ್ಸಿವ್ 3D ಗ್ರಾಫಿಕ್ಸ್ ವರ್ಕ್‌ಲೋಡ್‌ಗಳು.

ಸುಮಾರು 2012 GPU ಗಳು ವಿಕಸನಗೊಂಡವು ಮತ್ತು ದೊಡ್ಡ ಬ್ಲಾಕ್‌ಗಳಿಗೆ ಪರಿಣಾಮಕಾರಿ ಡೇಟಾ ಸಂಸ್ಕರಣೆಯನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುವ ಹೆಚ್ಚು ಸಮಾನಾಂತರ ಬಹು-ಕೋರ್ ಸಿಸ್ಟಮ್‌ಗಳಾಗಿ ಮಾರ್ಪಟ್ಟಿವೆ.

ದತ್ತಾಂಶದ ಬೃಹತ್ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಸಮಾನಾಂತರವಾಗಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವಾಗ, ಈ ವಿನ್ಯಾಸವು ಅಲ್ಗಾರಿದಮ್‌ಗಳಿಗಾಗಿ ಸಾಮಾನ್ಯ-ಉದ್ದೇಶದ ಕೇಂದ್ರೀಯ ಸಂಸ್ಕರಣಾ ಘಟಕಗಳಿಗೆ (CPUs) ಉತ್ತಮವಾಗಿದೆ, ಉದಾಹರಣೆಗೆ:

ಕ್ರಿಪ್ಟೋಗ್ರಾಫಿಕ್ ಹ್ಯಾಶ್ಕಾರ್ಯಗಳು
ಯಂತ್ರ ಕಲಿಕೆ
ಆಣ್ವಿಕ ಡೈನಾಮಿಕ್ಸ್ ಸಿಮ್ಯುಲೇಶನ್‌ಗಳು
ಭೌತಶಾಸ್ತ್ರ ಇಂಜಿನ್‌ಗಳು
ವಿಂಗಡಣೆ ಕ್ರಮಾವಳಿಗಳು

CUDA ಆರ್ಕಿಟೆಕ್ಚರ್‌ನ ಉಪಯೋಗಗಳು ಈಗ ಮತ್ತು ಭವಿಷ್ಯದಲ್ಲಿ

3D ಗ್ರಾಫಿಕ್ಸ್‌ನ ವೇಗವರ್ಧಿತ ರೆಂಡರಿಂಗ್
ವೀಡಿಯೊ ಫೈಲ್ ಫಾರ್ಮ್ಯಾಟ್‌ಗಳ ವೇಗವರ್ಧಿತ ಪರಸ್ಪರ ಪರಿವರ್ತನೆ
ವೇಗವರ್ಧಿತ ಎನ್‌ಕ್ರಿಪ್ಶನ್, ಡೀಕ್ರಿಪ್ಶನ್ ಮತ್ತು ಕಂಪ್ರೆಷನ್
ಬಯೋಇನ್‌ಫರ್ಮ್ಯಾಟಿಕ್ಸ್, ಉದಾ., NGS DNA ಅನುಕ್ರಮ BarraCUDA
ವಿತರಿಸಿದ ಲೆಕ್ಕಾಚಾರಗಳು, ಪ್ರೊಟೀನ್‌ಗಳ ಸ್ಥಳೀಯ ಅನುಸರಣೆಯನ್ನು ಊಹಿಸುವುದು
ವೈದ್ಯಕೀಯ ವಿಶ್ಲೇಷಣೆ ಸಿಮ್ಯುಲೇಶನ್‌ಗಳು, ಉದಾಹರಣೆಗೆ, CT ಮತ್ತು MRI ಸ್ಕ್ಯಾನ್ ಚಿತ್ರಗಳ ಆಧಾರದ ಮೇಲೆ ವರ್ಚುವಲ್ ರಿಯಾಲಿಟಿ
ಭೌತಿಕ ಸಿಮ್ಯುಲೇಶನ್‌ಗಳು, ನಿರ್ದಿಷ್ಟವಾಗಿ ದ್ರವ ಡೈನಾಮಿಕ್ಸ್‌ನಲ್ಲಿ
ಯಂತ್ರ ಕಲಿಕೆಯ ಸಮಸ್ಯೆಗಳಲ್ಲಿ ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್ ತರಬೇತಿ
ಮುಖ ಗುರುತಿಸುವಿಕೆ
ವಿತರಿಸಿದ ಕಂಪ್ಯೂಟಿಂಗ್ ಪ್ರಾಜೆಕ್ಟ್‌ಗಳು, ಉದಾಹರಣೆಗೆ [ಇಮೇಲ್ ರಕ್ಷಿತ] ಮತ್ತು ಇತರ ಯೋಜನೆಗಳು BOINC
ಆಣ್ವಿಕ ಡೈನಾಮಿಕ್ಸ್
ಮೈನಿಂಗ್ ಕ್ರಿಪ್ಟೋಕರೆನ್ಸಿಗಳು
ಸ್ಟ್ರಕ್ಚರ್ ಫ್ರಮ್ ಮೋಷನ್ (SfM) ಸಾಫ್ಟ್‌ವೇರ್

ಟೆನ್ಸರ್ ಕೋರ್ ಎಂದರೇನು?

ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳು ಎಂಬ ವಿಶೇಷ ಕೋರ್‌ಗಳು ಮಿಶ್ರ-ನಿಖರ ತರಬೇತಿಗೆ ಅವಕಾಶ ನೀಡುತ್ತವೆ. ಈ ವಿಶೇಷ ಕೋರ್‌ಗಳ ಆರಂಭಿಕ ಪೀಳಿಗೆಯು ಇದನ್ನು ಫ್ಯೂಸ್ಡ್ ಮಲ್ಟಿಪ್ಲೈ-ಆಡ್ ಅಲ್ಗಾರಿದಮ್‌ನೊಂದಿಗೆ ಮಾಡುತ್ತದೆ. ಇದು 4 x 4 FP16 ಅಥವಾ FP32 ಮ್ಯಾಟ್ರಿಕ್ಸ್‌ಗೆ ಎರಡು 4 x 4 FP16 ಮ್ಯಾಟ್ರಿಕ್ಸ್‌ಗಳನ್ನು ಗುಣಿಸಲು ಮತ್ತು ಸೇರಿಸಲು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ.

ಅಂತಿಮ ಫಲಿತಾಂಶವು FP32 ಆಗಿರುತ್ತದೆ ಮತ್ತು ಸ್ವಲ್ಪ ನಿಖರವಾದ ನಷ್ಟದೊಂದಿಗೆ, ಮಿಶ್ರ ನಿಖರವಾದ ಕಂಪ್ಯೂಟಿಂಗ್ ಅನ್ನು ಗೊತ್ತುಪಡಿಸಲಾಗಿದೆಇನ್‌ಪುಟ್ ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಕಡಿಮೆ-ನಿಖರವಾದ FP16 ಆಗಿರಬಹುದು.

ಸಹ ನೋಡಿ: "ಡಾಕ್" ಮತ್ತು "ಡಾಕ್ಸ್" ನಡುವಿನ ವ್ಯತ್ಯಾಸ (ಸತ್ಯಗಳು ವಿವರಿಸಲಾಗಿದೆ) - ಎಲ್ಲಾ ವ್ಯತ್ಯಾಸಗಳು

ಆಚರಣೆಯಲ್ಲಿ, ಇದು ಮಾದರಿಯ ಅಂತಿಮ ಪರಿಣಾಮಕಾರಿತ್ವದ ಮೇಲೆ ಕಡಿಮೆ ಪ್ರಭಾವದೊಂದಿಗೆ ಲೆಕ್ಕಾಚಾರಗಳನ್ನು ಗಮನಾರ್ಹವಾಗಿ ವೇಗಗೊಳಿಸುತ್ತದೆ. ಈ ಸಾಮರ್ಥ್ಯವನ್ನು ನಂತರದ ಮೈಕ್ರೋಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳು ಇನ್ನೂ ಕಡಿಮೆ ನಿಖರವಾದ ಕಂಪ್ಯೂಟರ್ ಸಂಖ್ಯೆ ಪ್ರಾತಿನಿಧ್ಯಗಳಿಗೆ ವಿಸ್ತರಿಸಲಾಗಿದೆ.

ಮೊದಲ ಪೀಳಿಗೆಯನ್ನು V100 ರಿಂದ ಪ್ರಾರಂಭವಾಗುವ ವೋಲ್ಟಾ ಮೈಕ್ರೋಆರ್ಕಿಟೆಕ್ಚರ್‌ನೊಂದಿಗೆ ಪರಿಚಯಿಸಲಾಯಿತು, ಪ್ರತಿ ಹಾದುಹೋಗುವ ಪೀಳಿಗೆಯೊಂದಿಗೆ ಹೊಸ GPU ಮೈಕ್ರೊ ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳೊಂದಿಗೆ ಗಣನೆಗಾಗಿ ಹೆಚ್ಚಿನ ಕಂಪ್ಯೂಟರ್ ಸಂಖ್ಯೆಯ ನಿಖರ ಸ್ವರೂಪಗಳನ್ನು ಲಭ್ಯಗೊಳಿಸಲಾಯಿತು.

ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳ ಸಾಮರ್ಥ್ಯ ಮತ್ತು ಕಾರ್ಯಚಟುವಟಿಕೆಯು ಹೇಗೆ ಬದಲಾಗಿದೆ ಮತ್ತು ಪ್ರತಿ ಮೈಕ್ರೋಆರ್ಕಿಟೆಕ್ಚರ್ ಉತ್ಪಾದನೆಯೊಂದಿಗೆ ಸುಧಾರಿಸಿದೆ ಎಂಬುದರ ಕುರಿತು ನಾವು ಮುಂದಿನ ವಿಭಾಗದಲ್ಲಿ ಮಾತನಾಡುತ್ತೇವೆ.

ಟೈಟಾನ್ V ನಿಂದ ಸಚಿತ್ರವಾಗಿ ನಿರೂಪಿಸಲಾದ ಚಿತ್ರ

ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ?

ಮೊದಲ ತಲೆಮಾರು:

ವೋಲ್ಟಾ GPU ಮೈಕ್ರೊ ಆರ್ಕಿಟೆಕ್ಚರ್ ಅನ್ನು ಮೊದಲ ತಲೆಮಾರಿನ ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳೊಂದಿಗೆ ಸೇರಿಸಲಾಗಿದೆ. ಈ ಕೋರ್‌ಗಳು ಮಿಶ್ರ ನಿಖರತೆ ಮತ್ತು FP16 ಸಂಖ್ಯೆಯ ಸ್ವರೂಪದೊಂದಿಗೆ ತರಬೇತಿ ನೀಡಲು ಸಾಧ್ಯವಾಗಿಸಿತು.

ಇದು ನಿರ್ದಿಷ್ಟ GPU ಗಳಿಗಾಗಿ teraFLOP ಥ್ರೋಪುಟ್‌ನಲ್ಲಿ 12x ವರೆಗೆ ವರ್ಧಕವನ್ನು ಹೊಂದಿರಬಹುದು. ಉನ್ನತ-ಶ್ರೇಣಿಯ V100 ನ 640 ಕೋರ್‌ಗಳು ಹಿಂದಿನ ಪೀಳಿಗೆಯ ಪ್ಯಾಸ್ಕಲ್ GPUಗಳಿಗಿಂತ ಕಾರ್ಯಕ್ಷಮತೆಯ ವೇಗದಲ್ಲಿ 5x ಹೆಚ್ಚಳವನ್ನು ನೀಡುತ್ತದೆ.

ಎರಡನೇ ತಲೆಮಾರು:

ಟ್ಯೂರಿಂಗ್ ಜಿಪಿಯುಗಳ ಪರಿಚಯದೊಂದಿಗೆ, ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳ ಎರಡನೇ ಪೀಳಿಗೆಯನ್ನು ಪರಿಚಯಿಸಲಾಯಿತು. Int8, Int4 ಮತ್ತು Int1 ಅನ್ನು ಬೆಂಬಲಿತ ಟೆನ್ಸರ್ ಕೋರ್ ನಿಖರತೆಗಳ ಪಟ್ಟಿಗೆ ಸೇರಿಸಲಾಗಿದೆ, ಅವುಗಳೆಂದರೆಹಿಂದೆ FP16 ಗೆ ಸೀಮಿತವಾಗಿತ್ತು.

ಮಿಶ್ರ ನಿಖರವಾದ ತರಬೇತಿ ಕಾರ್ಯವಿಧಾನಗಳ ಕಾರಣದಿಂದಾಗಿ, ಪ್ಯಾಸ್ಕಲ್ GPU ಗಳಿಗೆ ಹೋಲಿಸಿದರೆ GPU ನ ಕಾರ್ಯಕ್ಷಮತೆಯ ಥ್ರೋಪುಟ್ ಅನ್ನು 32 ಪಟ್ಟು ಹೆಚ್ಚಿಸಲಾಗಿದೆ.

ಮೂರನೇ ತಲೆಮಾರಿನ:

FP64, TF32, ಮತ್ತು bfloat16 ನಿಖರತೆಗಳಿಗೆ ಬೆಂಬಲವನ್ನು ಸೇರಿಸುವ ಮೂಲಕ ಆಂಪಿಯರ್ GPU ನಲ್ಲಿನ ಆರ್ಕಿಟೆಕ್ಚರ್ ವೋಲ್ಟಾ ಮತ್ತು ಟ್ಯೂರಿಂಗ್ ಮೈಕ್ರೋಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳ ಹಿಂದಿನ ಪ್ರಗತಿಗಳ ಮೇಲೆ ವಿಸ್ತರಿಸುತ್ತದೆ.

ಆಳವಾದ ಕಲಿಕೆಯ ತರಬೇತಿ ಮತ್ತು ನಿರ್ಣಯ ಚಟುವಟಿಕೆಗಳು ಈ ಹೆಚ್ಚುವರಿ ನಿಖರ ಸ್ವರೂಪಗಳಿಂದ ಹೆಚ್ಚು ವೇಗವನ್ನು ಪಡೆಯುತ್ತವೆ. ಉದಾಹರಣೆಗೆ, TF32 ಸ್ವರೂಪವು FP32 ನಂತೆಯೇ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಮತ್ತು ಯಾವುದೇ ಕೋಡ್ ಅನ್ನು ಬದಲಾಯಿಸದೆ 20x ವೇಗವನ್ನು ಖಾತರಿಪಡಿಸುತ್ತದೆ.

ನಂತರ, ಕೋಡ್‌ನ ಕೆಲವೇ ಸಾಲುಗಳೊಂದಿಗೆ, ಸ್ವಯಂಚಾಲಿತ ಮಿಶ್ರ ನಿಖರವಾದ ಅನುಷ್ಠಾನವು ಹೆಚ್ಚುವರಿ 2x ಮೂಲಕ ತರಬೇತಿಯನ್ನು ವೇಗಗೊಳಿಸುತ್ತದೆ.

ಪ್ರಜ್ವಲಿಸುವ ವೇಗದ ಬಹು-ಜಿಪಿಯು ಸಂವಹನಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಲು ಮೂರನೇ ತಲೆಮಾರಿನ NVLink, ಮೂರನೇ ತಲೆಮಾರಿನ ರೇ ಟ್ರೇಸಿಂಗ್ ಕೋರ್‌ಗಳು ಮತ್ತು ವಿರಳ ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಗಣಿತದೊಂದಿಗೆ ವಿಶೇಷತೆ ಆಂಪಿಯರ್ ಮೈಕ್ರೊ ಆರ್ಕಿಟೆಕ್ಚರ್‌ನ ಹೆಚ್ಚುವರಿ ಅಂಶಗಳಾಗಿವೆ .

ನಾಲ್ಕನೇ ತಲೆಮಾರು:

ಹಾಪರ್ ಮೈಕ್ರೋಆರ್ಕಿಟೆಕ್ಚರ್ ಆಧಾರಿತ ನಾಲ್ಕನೇ ತಲೆಮಾರಿನ ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳ ಭವಿಷ್ಯದ ಬಿಡುಗಡೆಯನ್ನು ಯೋಜಿಸಲಾಗಿದೆ. ಮುಂದಿನ H100 ನಲ್ಲಿ ನಾಲ್ಕನೇ ತಲೆಮಾರಿನ ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳು.

ಇದು ಮಾರ್ಚ್ 2022 ರಲ್ಲಿ ಬಿಡುಗಡೆಯಾಗುವ ನಿರೀಕ್ಷೆಯಿದೆ, FP8 ನಿಖರ ಸ್ವರೂಪಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ ಮತ್ತು NVIDIA ಪ್ರಕಾರ, ಬೃಹತ್ ಭಾಷಾ ಮಾದರಿಗಳನ್ನು "ವಿಸ್ಮಯಕಾರಿ 30X ಮೂಲಕ ವೇಗಗೊಳಿಸುತ್ತದೆ ಹಿಂದಿನ ಪೀಳಿಗೆಯ ಮೇಲೆ.”

ಆರ್‌ಟಿಎಕ್ಸ್ ಗ್ರಾಫಿಕ್ಸ್ ಕಾರ್ಡ್ ಆಗಿದೆಟೆನ್ಸರ್ ಕೋರ್‌ಗಳನ್ನು ಹೊಂದಿರುವುದರಿಂದ ಗ್ರಾಫಿಕ್ಸ್ ಅನ್ನು ಅತ್ಯಂತ ವೇಗವಾಗಿ ರೆಂಡರಿಂಗ್ ಮಾಡಲು ಬಳಸಲಾಗುತ್ತದೆ.

CUDA ಕೋರ್‌ಗಳು ಮತ್ತು ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸ

ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳು ಪ್ರಸ್ತುತ ಟೈಟಾನ್ V ಮತ್ತು ಟೆಸ್ಲಾ V100 ಗೆ ಸೀಮಿತವಾಗಿವೆ. ಎರಡೂ GPUಗಳಲ್ಲಿನ 5120 CUDA ಕೋರ್‌ಗಳು ಒಂದು GPU ಗಡಿಯಾರಕ್ಕೆ ಒಂದು ಏಕ ನಿಖರ ಗುಣಾಕಾರ-ಸಂಗ್ರಹ ಕಾರ್ಯಾಚರಣೆಯ ಗರಿಷ್ಠ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿವೆ (ಉದಾಹರಣೆಗೆ, fp32: x += y * z) ಪ್ರತಿ GPU ಗಡಿಯಾರ (ಉದಾ. Tesla V100 PCIe ಆವರ್ತನೆ 1.38Gz).

ಪ್ರತಿಯೊಂದು ಟೆನ್ಸರ್ ಕೋರ್ ಸಣ್ಣ ಮ್ಯಾಟ್ರಿಕ್ಸ್‌ಗಳಿಗೆ 4×4 ಸಣ್ಣ ಮ್ಯಾಟ್ರಿಕ್ಸ್‌ಗಳಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಒಂದು GPU ಗಡಿಯಾರಕ್ಕೆ, ಪ್ರತಿ ಟೆನ್ಸರ್ ಕೋರ್ ಒಂದು ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಗುಣಿಸಿ-ಸಂಗ್ರಹ ಕಾರ್ಯಾಚರಣೆಯನ್ನು ಪೂರ್ಣಗೊಳಿಸಬಹುದು.

ಇದು ಎರಡು 4×4 FP16 ಮ್ಯಾಟ್ರಿಕ್ಸ್‌ಗಳನ್ನು ಗುಣಿಸುತ್ತದೆ ಮತ್ತು 4×4 FP32 ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಅನ್ನು ಸೇರಿಸುತ್ತದೆ ಅದು ಸಂಚಯಕಕ್ಕೆ ಕಾರಣವಾಗುತ್ತದೆ (ಅದು ಕೂಡ fp32 4×4 ಮ್ಯಾಟ್ರಿಕ್ಸ್).

ಇನ್‌ಪುಟ್ ಮ್ಯಾಟ್ರಿಕ್ಸ್‌ಗಳು fp16 ಆಗಿರುವುದರಿಂದ ಗುಣಾಕಾರ ಫಲಿತಾಂಶಗಳು ಮತ್ತು ಸಂಚಯಕವು fp32 ಆಗಿರುವುದರಿಂದ, ಅಲ್ಗಾರಿದಮ್ ಅನ್ನು ಮಿಶ್ರ ನಿಖರತೆ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.

ಸರಿಯಾದ ಪದವು "4×4 ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಕೋರ್‌ಗಳು" ಆಗಿರಬಹುದು, ಆದರೆ NVIDIA ಮಾರ್ಕೆಟಿಂಗ್ ತಂಡವು "ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳನ್ನು" ಬಳಸಲು ಆಯ್ಕೆ ಮಾಡಿದೆ.

ಸಂಕ್ಷಿಪ್ತವಾಗಿ ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳ ಸಂಪೂರ್ಣ ವಿವರಣೆ

GPU ಕಾರ್ಡ್	CUDA ಕೋರ್‌ಗಳು	VRAM
GeForce GTX 1660 Ti	1536	6GB
GeForce GTX 1660 Super	1408	6GB
GeForce GTX 1660	1408	6GB
GeForce GTX 1650 Super	1408	4GB
GeForce GTX 1650	1024 ಮತ್ತು896	4GB
GeForce GTX 1060 3GB	1280	4GB
GeForce GTX 1650	1280	3GB
GeForce GTX 1060 6GB	768	6GB
GeForce GTX 1050 Ti (3GB)	768	4GB
GeForce GTX 1050 (2GB)	640	3GB
GeForce GTX 960	1024	2GB
GeForce GTX 950	786	2GB
GeForce GTX 780 Ti	2880	2GB
GeForce GTX 780	2304	3GB
GeForce GTX 750 Ti	640	2 GB
GeForce GTX 750	512	1GB ಅಥವಾ 2 GB

CUDA ಕೋರ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿರುವ GPUಗಳು

ತೀರ್ಮಾನ

CUDA ಮತ್ತು ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳು ಉತ್ಪನ್ನಗಳಾಗಿವೆ, ಇವೆರಡನ್ನೂ Nvidia ಎಂಬ ಕಂಪನಿಯು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದೆ. CUDA ಎಂದರೆ ಕಂಪ್ಯೂಟ್ ಯುನಿಫೈಡ್ ಡಿವೈಸ್ ಆರ್ಕಿಟೆಕ್ಚರ್. ಈ CUDA ಕೋರ್‌ಗಳು ನಿಮ್ಮ GPUಗಳು, ಸ್ಮಾರ್ಟ್‌ಫೋನ್‌ಗಳು ಮತ್ತು ನಿಮ್ಮ ಕಾರುಗಳಲ್ಲಿಯೂ ಇರುತ್ತವೆ.
ಎನ್ವಿಡಿಯಾದಿಂದ ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾದ ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳನ್ನು ಸಹ GPU ಗಳಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ. "ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳು" ಎಂದು ಕರೆಯಲ್ಪಡುವ ವಿಶೇಷ ಕೋರ್‌ಗಳು ಮಿಶ್ರ-ನಿಖರ ತರಬೇತಿಗೆ ಅವಕಾಶ ನೀಡುತ್ತವೆ. ಮೊದಲ ತಲೆಮಾರಿನ ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳು ಮಿಶ್ರ ನಿಖರತೆ ಮತ್ತು FP16 ಸಂಖ್ಯೆಯ ಸ್ವರೂಪದೊಂದಿಗೆ ತರಬೇತಿ ನೀಡಲು ಸಾಧ್ಯವಾಗಿಸಿತು.
ಇದು ನಿರ್ದಿಷ್ಟ GPU ಗಳಿಗಾಗಿ teraFLOP ಥ್ರೋಪುಟ್‌ನಲ್ಲಿ 12x ವರೆಗೆ ವರ್ಧಕವನ್ನು ಹೊಂದಿರಬಹುದು. Int8, Int4 ಮತ್ತು Int1 ಅನ್ನು ಬೆಂಬಲಿತ ಟೆನ್ಸರ್ ಕೋರ್ ನಿಖರತೆಗಳ ಪಟ್ಟಿಗೆ ಸೇರಿಸಲಾಗಿದೆ.
ಮಿಶ್ರಣದ ಕಾರಣದಿಂದಾಗಿನಿಖರವಾದ ತರಬೇತಿ ಕಾರ್ಯವಿಧಾನಗಳು, GPU ನ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು 32 ಪಟ್ಟು ಹೆಚ್ಚಿಸಲಾಗಿದೆ. ಹಾಪರ್ ಮೈಕ್ರೋಆರ್ಕಿಟೆಕ್ಚರ್ ಆಧಾರಿತ ನಾಲ್ಕನೇ ತಲೆಮಾರಿನ ಟೆನ್ಸರ್ ಕೋರ್‌ಗಳ ಭವಿಷ್ಯದ ಬಿಡುಗಡೆಯನ್ನು ಯೋಜಿಸಲಾಗಿದೆ.

#SNIGCONSULTANCY