CUDA ਕੋਰ ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਵਿਚਕਾਰ ਕੀ ਅੰਤਰ ਹੈ? (ਵਿਖਿਆਨ ਕੀਤਾ) - ਸਾਰੇ ਅੰਤਰ

01-08-202301-08-2023 Mary Davis

ਵਿਸ਼ਾ - ਸੂਚੀ

CUDA ਅਤੇ Tensor ਕੋਰ Nvidia ਨਾਮ ਦੀ ਇੱਕ ਕੰਪਨੀ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤੇ ਉਤਪਾਦ ਹਨ। ਤਾਂ CUDA ਕੋਰ ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਕੀ ਹਨ? CUDA ਦਾ ਅਰਥ ਹੈ ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ। CUDA ਕੋਰ ਤੁਹਾਡੇ GPUs, ਸਮਾਰਟਫ਼ੋਨਸ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਤੁਹਾਡੀਆਂ ਕਾਰਾਂ ਵਿੱਚ ਮੌਜੂਦ ਹਨ, ਜਿਵੇਂ ਕਿ Nvidia ਡਿਵੈਲਪਰ ਕਹਿੰਦੇ ਹਨ।

CUDA ਕੋਰ ਇੱਕ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟਿੰਗ ਪਲੇਟਫਾਰਮ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਪ੍ਰੋਗਰਾਮਿੰਗ ਇੰਟਰਫੇਸ (API) ਹਨ ਜੋ ਆਮ-ਉਦੇਸ਼ ਦੀ ਪ੍ਰਕਿਰਿਆ ਲਈ ਖਾਸ ਕਿਸਮ ਦੇ ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟਾਂ (GPUs) ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਸੌਫਟਵੇਅਰ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੇ ਹਨ।

ਜਦੋਂ ਕਿ ਟੈਂਸਰ ਕੋਰ ਜੋ ਕਿ ਐਨਵੀਡੀਆ ਦੁਆਰਾ ਵੀ ਵਿਕਸਤ ਕੀਤੇ ਗਏ ਸਨ, ਜੀਪੀਯੂ ਵਿੱਚ ਵੀ ਵਰਤੇ ਜਾਂਦੇ ਹਨ। ਟੈਂਸਰ ਕੋਰ ਮਿਕਸਡ-ਪ੍ਰੀਸੀਜ਼ਨ ਕੰਪਿਊਟਿੰਗ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੇ ਹਨ, ਸ਼ੁੱਧਤਾ ਬਰਕਰਾਰ ਰੱਖਦੇ ਹੋਏ ਥ੍ਰੋਪੁੱਟ ਨੂੰ ਵਧਾਉਣ ਲਈ ਗਤੀਸ਼ੀਲ ਤੌਰ 'ਤੇ ਗਣਨਾਵਾਂ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਂਦੇ ਹਨ।

ਸਧਾਰਨ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਇਹ ਕੋਰ ਕੁਝ ਗਣਨਾਵਾਂ ਕਰਨ ਲਈ ਤੁਹਾਡੇ PC ਵਿੱਚ GPUs ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸਾ ਹਨ। CUDA ਕੋਰਾਂ ਦੀ ਵਰਤੋਂ ਦੋ ਸੰਖਿਆਵਾਂ ਨੂੰ ਗੁਣਾ ਕਰਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਕਿਸੇ ਹੋਰ ਸੰਖਿਆ ਵਿੱਚ ਜੋੜਨ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।

ਜਦੋਂ ਕਿ ਟੈਂਸਰ ਕੋਰ ਇੱਕੋ ਹੈ ਪਰ 4×4 ਮੈਟ੍ਰਿਕਸ ਦੇ ਨਾਲ। ਇਹ ਗਣਨਾਵਾਂ ਅਸਲ ਵਿੱਚ ਤੁਹਾਡੇ ਲਈ ਗ੍ਰਾਫਿਕਸ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਪੇਸ਼ ਕਰ ਰਹੀਆਂ ਹਨ।

CUDA ਕੀ ਹੈ?

ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ ਛੋਟੇ CUDA ਵਿੱਚ ਐਨਵੀਡੀਆ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ, 23 ਜੂਨ 2007 ਨੂੰ ਜਾਰੀ ਕੀਤਾ ਗਿਆ, ਇੱਕ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟਿੰਗ ਪਲੇਟਫਾਰਮ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਪ੍ਰੋਗਰਾਮਿੰਗ ਇੰਟਰਫੇਸ (API) ਹੈ।

ਉਹ ਸਾੱਫਟਵੇਅਰ ਨੂੰ ਆਮ-ਉਦੇਸ਼ ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਖਾਸ ਕਿਸਮ ਦੇ ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟਾਂ (GPUs) ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ, ਇੱਕ ਵਿਧੀ ਜਿਸਨੂੰ ਆਮ-ਉਦੇਸ਼ ਕੰਪਿਊਟਿੰਗ ਕਿਹਾ ਜਾਂਦਾ ਹੈGPUs (GPU)।

CUDA ਇੱਕ ਸਾਫਟਵੇਅਰ ਲੇਅਰ ਹੈ ਜੋ GPU ਦੇ ਵਰਚੁਅਲ ਇੰਸਟ੍ਰਕਸ਼ਨ ਸੈੱਟ ਅਤੇ ਕੰਪਿਊਟ ਕਰਨਲ ਦੇ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਲਈ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟੇਸ਼ਨਲ ਐਲੀਮੈਂਟਸ ਤੱਕ ਸਿੱਧੀ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ। CUDA ਨੂੰ C, C++, ਅਤੇ Fortran ਸਮੇਤ ਵੱਖ-ਵੱਖ ਪ੍ਰੋਗਰਾਮਿੰਗ ਭਾਸ਼ਾਵਾਂ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਸੀ।

ਵੱਖ-ਵੱਖ ਪ੍ਰੋਗ੍ਰਾਮਿੰਗ ਭਾਸ਼ਾਵਾਂ ਨਾਲ ਕੰਮ ਕਰਨ ਦੀ ਯੋਗਤਾ ਸਮਾਂਤਰ ਪ੍ਰੋਗਰਾਮਿੰਗ ਵਿੱਚ ਮਾਹਿਰਾਂ ਲਈ GPU ਸਰੋਤਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਆਸਾਨ ਬਣਾਉਂਦੀ ਹੈ ਜੇਕਰ ਅਸੀਂ ਇਸਨੂੰ ਡਾਇਰੈਕਟ3D ਜਾਂ ਓਪਨਜੀਐਲ ਵਰਗੇ ਪੁਰਾਣੇ API ਤੋਂ ਵੱਖ ਕਰਦੇ ਹਾਂ, ਜਿਸ ਲਈ ਤੁਹਾਨੂੰ ਵਧੇਰੇ ਉੱਨਤ ਹੋਣ ਦੀ ਲੋੜ ਹੋਵੇਗੀ। ਗ੍ਰਾਫਿਕਲ ਪ੍ਰੋਗਰਾਮਿੰਗ ਵਿੱਚ ਹੁਨਰ ਅਧਾਰ.

CUDA ਵਾਲਾ GPU ਪ੍ਰੋਗਰਾਮਿੰਗ ਫਰੇਮਵਰਕ ਦਾ ਵੀ ਸਮਰਥਨ ਕਰਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ OpenMP, OpenACC, OpenCL, ਅਤੇ HIP ਵੀ ਜੋ ਅਜਿਹੇ ਕੋਡ ਨੂੰ CUDA ਵਿੱਚ ਕੰਪਾਇਲ ਕਰ ਸਕਦੇ ਹਨ। CUDA ਲਈ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਪਹਿਲਾ ਨਾਮ ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ ਦਾ ਸੰਖੇਪ ਰੂਪ ਸੀ। ਹਾਲਾਂਕਿ, ਐਨਵੀਡੀਆ ਨੇ ਬਾਅਦ ਵਿੱਚ ਆਮ ਤੌਰ 'ਤੇ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਸੰਖੇਪ ਸ਼ਬਦ ਛੱਡ ਦਿੱਤਾ।

ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਐਨਵੀਡੀਆ ਗ੍ਰਾਫਿਕਸ ਕਾਰਡ GTX 1080 Ti

CUDA ਬਾਰੇ ਹੋਰ

ਇੱਕ ਵਿਸ਼ੇਸ਼ ਕੰਪਿਊਟਰ ਪ੍ਰੋਸੈਸਰ ਵਜੋਂ, ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟ (GPU) ਅਸਲ ਲੋੜਾਂ ਨੂੰ ਪੂਰਾ ਕਰਦਾ ਹੈ -ਸਮਾਂ, ਕੰਪਿਊਟ-ਇੰਟੈਂਸਿਵ 3D ਗਰਾਫਿਕਸ ਵਰਕਲੋਡ।

ਇਹ ਵੀ ਵੇਖੋ: ਸੇਸਨਾ 150 ਅਤੇ ਸੇਸਨਾ 152 (ਤੁਲਨਾ) ਵਿਚਕਾਰ ਅੰਤਰ - ਸਾਰੇ ਅੰਤਰ

2012 ਦੇ ਲਗਭਗ GPUs ਦਾ ਵਿਕਾਸ ਹੋਇਆ ਅਤੇ ਵੱਡੇ ਬਲਾਕਾਂ ਲਈ ਪ੍ਰਭਾਵੀ ਡਾਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਵਾਲੇ ਉੱਚ ਸਮਾਨਾਂਤਰ ਮਲਟੀ-ਕੋਰ ਸਿਸਟਮ ਬਣ ਗਏ।

ਸਮਾਂਤਰ ਵਿੱਚ ਡੇਟਾ ਦੇ ਵੱਡੇ ਬਲਾਕਾਂ ਦੀ ਪ੍ਰੋਸੈਸਿੰਗ ਕਰਦੇ ਸਮੇਂ, ਇਹ ਡਿਜ਼ਾਈਨ ਐਲਗੋਰਿਦਮ ਲਈ ਆਮ-ਉਦੇਸ਼ ਕੇਂਦਰੀ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟਾਂ (CPUs) ਨਾਲੋਂ ਉੱਤਮ ਹੈ, ਜਿਵੇਂ ਕਿ:

ਕ੍ਰਿਪਟੋਗ੍ਰਾਫਿਕ ਹੈਸ਼ਫੰਕਸ਼ਨ
ਮਸ਼ੀਨ ਲਰਨਿੰਗ
ਮੌਲੀਕਿਊਲਰ ਡਾਇਨਾਮਿਕਸ ਸਿਮੂਲੇਸ਼ਨ
ਭੌਤਿਕ ਵਿਗਿਆਨ ਇੰਜਣ
ਐਲਗੋਰਿਦਮ ਨੂੰ ਕ੍ਰਮਬੱਧ ਕਰੋ

ਹੁਣ CUDA ਆਰਕੀਟੈਕਚਰ ਦੀ ਵਰਤੋਂ ਅਤੇ ਭਵਿੱਖ ਵਿੱਚ

3D ਗਰਾਫਿਕਸ ਦੀ ਤੇਜ਼ ਰੈਂਡਰਿੰਗ
ਵੀਡੀਓ ਫਾਈਲ ਫਾਰਮੈਟਾਂ ਦਾ ਐਕਸਲਰੇਟਿਡ ਇੰਟਰਕਨਵਰਜ਼ਨ
ਐਕਸਲਰੇਟਿਡ ਐਨਕ੍ਰਿਪਸ਼ਨ, ਡੀਕ੍ਰਿਪਸ਼ਨ, ਅਤੇ ਕੰਪਰੈਸ਼ਨ
ਬਾਇਓਇਨਫਾਰਮੈਟਿਕਸ, ਉਦਾਹਰਨ ਲਈ, NGS DNA ਸੀਕੁਏਂਸਿੰਗ BarraCUDA
ਵਿਤਰਿਤ ਗਣਨਾਵਾਂ, ਜਿਵੇਂ ਕਿ ਪ੍ਰੋਟੀਨ ਦੀ ਮੂਲ ਰਚਨਾ ਦਾ ਅਨੁਮਾਨ ਲਗਾਉਣਾ
ਮੈਡੀਕਲ ਵਿਸ਼ਲੇਸ਼ਣ ਸਿਮੂਲੇਸ਼ਨ, ਉਦਾਹਰਨ ਲਈ, CT ਅਤੇ MRI ਸਕੈਨ ਚਿੱਤਰਾਂ 'ਤੇ ਆਧਾਰਿਤ ਵਰਚੁਅਲ ਰਿਐਲਿਟੀ
ਭੌਤਿਕ ਸਿਮੂਲੇਸ਼ਨ, ਖਾਸ ਤੌਰ 'ਤੇ ਤਰਲ ਗਤੀਸ਼ੀਲਤਾ ਵਿੱਚ
ਮਸ਼ੀਨ ਸਿੱਖਣ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਵਿੱਚ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਸਿਖਲਾਈ
ਚਿਹਰੇ ਦੀ ਪਛਾਣ
ਵਿਤਰਿਤ ਕੰਪਿਊਟਿੰਗ ਪ੍ਰੋਜੈਕਟ, ਜਿਵੇਂ ਕਿ [ਈਮੇਲ ਪ੍ਰੋਟੈਕਟਡ] ਅਤੇ ਹੋਰ ਪ੍ਰੋਜੈਕਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ BOINC
ਮੌਲੀਕਿਊਲਰ ਡਾਇਨਾਮਿਕਸ
ਮਾਈਨਿੰਗ ਕ੍ਰਿਪਟੋਕਰੰਸੀ
ਗਤੀ (SfM) ਸਾਫਟਵੇਅਰ ਤੋਂ ਬਣਤਰ

ਟੈਂਸਰ ਕੋਰ ਕੀ ਹੈ?

ਟੈਨਸਰ ਕੋਰ ਕਹੇ ਜਾਂਦੇ ਵਿਸ਼ੇਸ਼ ਕੋਰ ਮਿਸ਼ਰਤ-ਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਲਈ ਆਗਿਆ ਦਿੰਦੇ ਹਨ। ਇਹ ਵਿਸ਼ੇਸ਼ ਕੋਰਾਂ ਦੀ ਸ਼ੁਰੂਆਤੀ ਪੀੜ੍ਹੀ ਇਹ ਇੱਕ ਫਿਊਜ਼ਡ ਮਲਟੀਪਲਾਈ-ਐਡ ਐਲਗੋਰਿਦਮ ਨਾਲ ਕਰਦੀ ਹੈ। ਇਹ ਇੱਕ 4 x 4 FP16 ਜਾਂ FP32 ਮੈਟ੍ਰਿਕਸ ਵਿੱਚ ਦੋ 4 x 4 FP16 ਮੈਟ੍ਰਿਕਸ ਨੂੰ ਗੁਣਾ ਕਰਨਾ ਅਤੇ ਜੋੜਨਾ ਸੰਭਵ ਬਣਾਉਂਦਾ ਹੈ।

ਅੰਤਮ ਨਤੀਜਾ FP32 ਹੋਵੇਗਾ ਜਿਸ ਵਿੱਚ ਸ਼ੁੱਧਤਾ ਦੇ ਮਾਮੂਲੀ ਨੁਕਸਾਨ ਦੇ ਨਾਲ, ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਕੰਪਿਊਟਿੰਗ ਨੂੰ ਮਨੋਨੀਤ ਕੀਤਾ ਗਿਆ ਹੈ ਭਾਵੇਂ ਕਿਇਨਪੁਟ ਮੈਟ੍ਰਿਕਸ ਘੱਟ-ਸ਼ੁੱਧਤਾ FP16 ਹੋ ਸਕਦੇ ਹਨ।

ਅਭਿਆਸ ਵਿੱਚ, ਇਹ ਮਾਡਲ ਦੀ ਅੰਤਮ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ 'ਤੇ ਬਹੁਤ ਘੱਟ ਪ੍ਰਭਾਵ ਦੇ ਨਾਲ ਗਣਨਾਵਾਂ ਨੂੰ ਬਹੁਤ ਤੇਜ਼ ਕਰਦਾ ਹੈ। ਇਸ ਸਮਰੱਥਾ ਨੂੰ ਬਾਅਦ ਵਿੱਚ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਦੁਆਰਾ ਹੋਰ ਵੀ ਘੱਟ ਸਟੀਕ ਕੰਪਿਊਟਰ ਨੰਬਰ ਪ੍ਰਸਤੁਤੀਆਂ ਤੱਕ ਵਧਾਇਆ ਗਿਆ ਹੈ।

ਪਹਿਲੀ ਪੀੜ੍ਹੀ ਨੂੰ V100 ਤੋਂ ਸ਼ੁਰੂ ਹੋਣ ਵਾਲੇ ਵੋਲਟਾ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਨਾਲ ਪੇਸ਼ ਕੀਤਾ ਗਿਆ ਸੀ, ਹਰ ਲੰਘਦੀ ਪੀੜ੍ਹੀ ਦੇ ਨਾਲ ਨਵੇਂ GPU ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਦੇ ਨਾਲ ਗਣਨਾ ਲਈ ਵਧੇਰੇ ਕੰਪਿਊਟਰ ਨੰਬਰ ਸ਼ੁੱਧਤਾ ਫਾਰਮੈਟ ਉਪਲਬਧ ਕਰਵਾਏ ਗਏ ਸਨ।

ਅਸੀਂ ਇਸ ਬਾਰੇ ਗੱਲ ਕਰਾਂਗੇ ਕਿ ਕਿਵੇਂ ਟੈਂਸਰ ਕੋਰ ਦੀ ਸਮਰੱਥਾ ਅਤੇ ਕਾਰਜਕੁਸ਼ਲਤਾ ਅਗਲੇ ਭਾਗ ਵਿੱਚ ਹਰੇਕ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਪੀੜ੍ਹੀ ਦੇ ਨਾਲ ਬਦਲੀ ਅਤੇ ਸੁਧਾਰੀ ਗਈ ਹੈ।

ਇਹ ਵੀ ਵੇਖੋ: ਪਾਈਕਸ, ਸਪੀਅਰਸ, & ਲੈਂਸ (ਵਿਖਿਆਨ ਕੀਤਾ) - ਸਾਰੇ ਅੰਤਰ

ਟਾਈਟਨ V ਦੁਆਰਾ ਬਣਾਈ ਗਈ ਇੱਕ ਗ੍ਰਾਫਿਕਲੀ ਰੂਪ ਵਿੱਚ ਪੇਸ਼ ਕੀਤੀ ਗਈ ਤਸਵੀਰ

ਟੈਂਸਰ ਕੋਰ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ?

ਪਹਿਲੀ ਪੀੜ੍ਹੀ:

ਵੋਲਟਾ GPU ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਨੂੰ ਟੈਂਸਰ ਕੋਰ ਦੀ ਪਹਿਲੀ ਪੀੜ੍ਹੀ ਦੇ ਨਾਲ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ। ਇਹਨਾਂ ਕੋਰਾਂ ਨੇ ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਅਤੇ FP16 ਨੰਬਰ ਫਾਰਮੈਟ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣਾ ਸੰਭਵ ਬਣਾਇਆ ਹੈ।

ਇਸ ਨਾਲ ਕੁਝ GPUs ਲਈ teraFLOP ਥਰੂਪੁੱਟ ਵਿੱਚ 12x ਤੱਕ ਦਾ ਵਾਧਾ ਹੋ ਸਕਦਾ ਹੈ। ਟਾਪ-ਟੀਅਰ V100 ਦੇ 640 ਕੋਰ ਪਿਛਲੀ ਪੀੜ੍ਹੀ ਦੇ ਪਾਸਕਲ GPUs ਦੇ ਮੁਕਾਬਲੇ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਗਤੀ ਵਿੱਚ 5 ਗੁਣਾ ਵਾਧਾ ਦਿੰਦੇ ਹਨ।

ਦੂਜੀ ਪੀੜ੍ਹੀ:

ਟਿਊਰਿੰਗ GPUs ਦੀ ਸ਼ੁਰੂਆਤ ਦੇ ਨਾਲ, ਟੈਂਸਰ ਕੋਰ ਦੀ ਦੂਜੀ ਪੀੜ੍ਹੀ ਪੇਸ਼ ਕੀਤੀ ਗਈ ਸੀ। Int8, Int4, ਅਤੇ Int1 ਨੂੰ ਸਮਰਥਿਤ ਟੈਂਸਰ ਕੋਰ ਸ਼ੁੱਧਤਾਵਾਂ ਦੀ ਸੂਚੀ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ, ਜੋ ਕਿ ਸਨਪਹਿਲਾਂ FP16 ਤੱਕ ਸੀਮਿਤ ਸੀ।

ਮਿਕਸਡ ਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆਵਾਂ ਦੇ ਕਾਰਨ, ਪਾਸਕਲ GPUs ਦੇ ਮੁਕਾਬਲੇ GPU ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਥ੍ਰਰੂਪੁਟ ਨੂੰ 32 ਗੁਣਾ ਤੱਕ ਵਧਾਇਆ ਗਿਆ ਸੀ।

ਤੀਜੀ ਜਨਰੇਸ਼ਨ:

ਇੱਕ ਐਂਪੀਅਰ GPU ਵਿੱਚ ਆਰਕੀਟੈਕਚਰ FP64, TF32, ਅਤੇ bfloat16 ਸ਼ੁੱਧਤਾਵਾਂ ਲਈ ਸਮਰਥਨ ਜੋੜ ਕੇ ਵੋਲਟਾ ਅਤੇ ਟਿਊਰਿੰਗ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰਜ਼ ਦੀਆਂ ਪੁਰਾਣੀਆਂ ਤਰੱਕੀਆਂ 'ਤੇ ਫੈਲਦਾ ਹੈ।

ਇਨ੍ਹਾਂ ਵਾਧੂ ਸਟੀਕਸ਼ਨ ਫਾਰਮੈਟਾਂ ਦੁਆਰਾ ਡੂੰਘੀ ਸਿੱਖਣ ਦੀ ਸਿਖਲਾਈ ਅਤੇ ਅਨੁਮਾਨ ਗਤੀਵਿਧੀਆਂ ਨੂੰ ਹੋਰ ਤੇਜ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, TF32 ਫਾਰਮੈਟ FP32 ਵਾਂਗ ਹੀ ਕੰਮ ਕਰਦਾ ਹੈ ਜਦੋਂ ਕਿ ਬਿਨਾਂ ਕਿਸੇ ਕੋਡ ਨੂੰ ਬਦਲੇ 20x ਸਪੀਡਅੱਪ ਦੀ ਗਰੰਟੀ ਵੀ ਦਿੰਦਾ ਹੈ।

ਫਿਰ, ਕੋਡ ਦੀਆਂ ਕੁਝ ਲਾਈਨਾਂ ਦੇ ਨਾਲ, ਆਟੋਮੈਟਿਕ ਮਿਕਸਡ ਸ਼ੁੱਧਤਾ ਲਾਗੂ ਕਰਨ ਨਾਲ ਸਿਖਲਾਈ ਨੂੰ ਇੱਕ ਵਾਧੂ 2x ਦੀ ਗਤੀ ਮਿਲੇਗੀ।

ਤੀਜੀ ਪੀੜ੍ਹੀ ਦਾ NVLink ਬਹੁਤ ਤੇਜ਼ ਮਲਟੀ-ਜੀਪੀਯੂ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ, ਤੀਜੀ ਪੀੜ੍ਹੀ ਦੇ ਰੇ ਟਰੇਸਿੰਗ ਕੋਰ, ਅਤੇ ਸਪਾਰਸ ਮੈਟ੍ਰਿਕਸ ਗਣਿਤ ਨਾਲ ਵਿਸ਼ੇਸ਼ਤਾ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਲਈ ਐਂਪੀਅਰ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਦੇ ਵਾਧੂ ਪਹਿਲੂ ਹਨ ।

ਚੌਥੀ ਪੀੜ੍ਹੀ:

ਟੈਂਸਰ ਕੋਰ ਦੀ ਹੌਪਰ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ-ਅਧਾਰਿਤ ਚੌਥੀ ਪੀੜ੍ਹੀ ਦੇ ਭਵਿੱਖ ਵਿੱਚ ਰਿਲੀਜ਼ ਦੀ ਯੋਜਨਾ ਹੈ। ਅਗਲੇ H100 ਵਿੱਚ ਚੌਥੀ ਪੀੜ੍ਹੀ ਦੇ ਟੈਂਸਰ ਕੋਰ।

ਜੋ ਕਿ ਮਾਰਚ 2022 ਵਿੱਚ ਰਿਲੀਜ਼ ਹੋਣ ਦੀ ਉਮੀਦ ਹੈ, FP8 ਸ਼ੁੱਧਤਾ ਫਾਰਮੈਟਾਂ ਨੂੰ ਸੰਭਾਲਣ ਦੇ ਯੋਗ ਹੋਵੇਗਾ ਅਤੇ, NVIDIA ਦੇ ਅਨੁਸਾਰ, ਇੱਕ ਹੈਰਾਨੀਜਨਕ 30X ਦੁਆਰਾ ਵਿਸ਼ਾਲ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਤੇਜ਼ ਕਰੇਗਾ। ਪਿਛਲੀ ਪੀੜ੍ਹੀ ਤੋਂ ਵੱਧ।”

ਇੱਕ RTX ਗ੍ਰਾਫਿਕਸ ਕਾਰਡ ਹੈਗ੍ਰਾਫਿਕਸ ਨੂੰ ਬਹੁਤ ਤੇਜ਼ੀ ਨਾਲ ਰੈਂਡਰ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ ਕਿਉਂਕਿ ਇਸ ਵਿੱਚ ਟੈਂਸਰ ਕੋਰ ਹੁੰਦੇ ਹਨ।

CUDA ਕੋਰ ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਵਿੱਚ ਅੰਤਰ

ਟੈਂਸਰ ਕੋਰ ਵਰਤਮਾਨ ਵਿੱਚ Titan V ਅਤੇ Tesla V100 ਤੱਕ ਸੀਮਿਤ ਹਨ। ਦੋਨਾਂ GPUs 'ਤੇ 5120 CUDA ਕੋਰਾਂ ਵਿੱਚ ਇੱਕ ਸਿੰਗਲ ਸ਼ੁੱਧਤਾ ਗੁਣਾ-ਇਕਮੁਲ ਕਾਰਜ (ਉਦਾਹਰਨ ਲਈ, fp32 ਵਿੱਚ: x += y * z) ਪ੍ਰਤੀ GPU ਘੜੀ (ਜਿਵੇਂ ਕਿ Tesla V100 PCIe ਫ੍ਰੀਕੁਐਂਸੀ 1.38Gz ਹੈ) ਦੀ ਅਧਿਕਤਮ ਸਮਰੱਥਾ ਹੈ।

ਹਰੇਕ ਟੈਂਸਰ ਕੋਰ ਛੋਟੇ ਮੈਟ੍ਰਿਕਸ ਲਈ 4×4 ਛੋਟੇ ਮੈਟ੍ਰਿਕਸ 'ਤੇ ਕੰਮ ਕਰਦਾ ਹੈ। ਪ੍ਰਤੀ ਇੱਕ GPU ਘੜੀ, ਹਰੇਕ ਟੈਂਸਰ ਕੋਰ ਇੱਕ ਮੈਟ੍ਰਿਕਸ ਗੁਣਾ-ਇਕਮੁਲੇਟ ਕਾਰਵਾਈ ਨੂੰ ਪੂਰਾ ਕਰ ਸਕਦਾ ਹੈ।

ਇਹ ਦੋ 4×4 FP16 ਮੈਟ੍ਰਿਕਸ ਨੂੰ ਗੁਣਾ ਕਰਦਾ ਹੈ ਅਤੇ 4×4 FP32 ਮੈਟ੍ਰਿਕਸ ਜੋੜਦਾ ਹੈ ਜਿਸਦਾ ਨਤੀਜਾ ਐਕਯੂਮੂਲੇਟਰ ਹੁੰਦਾ ਹੈ (ਜੋ ਕਿ ਇੱਕ fp32 4×4 ਮੈਟ੍ਰਿਕਸ ਵੀ ਹੈ)।

ਕਿਉਂਕਿ ਇਨਪੁਟ ਮੈਟ੍ਰਿਕਸ fp16 ਹਨ ਜਦੋਂ ਕਿ ਗੁਣਾ ਦੇ ਨਤੀਜੇ ਅਤੇ ਸੰਚਵਕ fp32 ਹਨ, ਐਲਗੋਰਿਦਮ ਨੂੰ ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਵਜੋਂ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ।

ਸਹੀ ਸ਼ਬਦ ਸੰਭਾਵਤ ਤੌਰ 'ਤੇ ਸਿਰਫ਼ "4×4 ਮੈਟ੍ਰਿਕਸ ਕੋਰ" ਹੋਵੇਗਾ, ਪਰ NVIDIA ਮਾਰਕੀਟਿੰਗ ਟੀਮ ਨੇ "ਟੈਂਸਰ ਕੋਰ" ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਚੁਣਿਆ ਹੈ।

ਟੈਂਸਰ ਕੋਰ ਸੰਖੇਪ ਵਿੱਚ ਪੂਰੀ ਵਿਆਖਿਆ

<23

GPU ਕਾਰਡ	CUDA ਕੋਰ	VRAM
GeForce GTX 1660 Ti	1536	6GB
GeForce GTX 1660 ਸੁਪਰ	1408	6GB
GeForce GTX 1660	1408	6GB
GeForce GTX 1650 Super	1408	4GB
GeForce GTX 1650	1024 ਅਤੇ896	4GB
GeForce GTX 1060 3GB	1280	4GB
GeForce GTX 1650	1280	3GB
GeForce GTX 1060 6GB	768	6GB
GeForce GTX 1050 Ti (3GB)	768	4GB
GeForce GTX 1050 (2GB)	640	3GB
GeForce GTX 960	1024	2GB
GeForce GTX 950	786	2GB
GeForce GTX 780 Ti	2880	2GB
GeForce GTX 780	2304	3GB
GeForce GTX 750 Ti	640	2 GB
GeForce GTX 750	512	1GB ਜਾਂ 2 GB

GPUs ਜਿਨ੍ਹਾਂ ਵਿੱਚ CUDA ਕੋਰ ਹੁੰਦੇ ਹਨ

ਸਿੱਟਾ

CUDA ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਉਤਪਾਦ ਹਨ, ਦੋਵੇਂ ਐਨਵੀਡੀਆ ਨਾਮਕ ਕੰਪਨੀ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤੇ ਗਏ ਹਨ। CUDA ਦਾ ਅਰਥ ਹੈ ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ। ਇਹ CUDA ਕੋਰ ਤੁਹਾਡੇ GPU, ਸਮਾਰਟਫ਼ੋਨ ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਤੁਹਾਡੀਆਂ ਕਾਰਾਂ ਵਿੱਚ ਮੌਜੂਦ ਹਨ।
ਜਦੋਂ ਕਿ ਟੈਂਸਰ ਕੋਰ, ਜੋ ਕਿ ਐਨਵੀਡੀਆ ਦੁਆਰਾ ਵੀ ਵਿਕਸਤ ਕੀਤੇ ਗਏ ਸਨ, ਜੀਪੀਯੂ ਵਿੱਚ ਵੀ ਵਰਤੇ ਜਾਂਦੇ ਹਨ। "ਟੈਂਸਰ ਕੋਰ" ਨਾਮਕ ਵਿਸ਼ੇਸ਼ ਕੋਰ ਮਿਸ਼ਰਤ-ਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਲਈ ਆਗਿਆ ਦਿੰਦੇ ਹਨ। ਟੈਂਸਰ ਕੋਰ ਦੀ ਪਹਿਲੀ ਪੀੜ੍ਹੀ ਨੇ ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਅਤੇ FP16 ਨੰਬਰ ਫਾਰਮੈਟ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣਾ ਸੰਭਵ ਬਣਾਇਆ ਹੈ।
ਇਸ ਨਾਲ ਕੁਝ GPUs ਲਈ teraFLOP ਥਰੂਪੁੱਟ ਵਿੱਚ 12x ਤੱਕ ਦਾ ਵਾਧਾ ਹੋ ਸਕਦਾ ਹੈ। Int8, Int4, ਅਤੇ Int1 ਨੂੰ ਸਮਰਥਿਤ ਟੈਂਸਰ ਕੋਰ ਸ਼ੁੱਧਤਾਵਾਂ ਦੀ ਸੂਚੀ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ।
ਮਿਕਸਡ ਦੇ ਕਾਰਨਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆਵਾਂ, GPU ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ 32 ਗੁਣਾ ਤੱਕ ਵਧਾਇਆ ਗਿਆ ਸੀ। ਟੈਂਸਰ ਕੋਰ ਦੀ ਹੋਪਰ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ-ਅਧਾਰਤ ਚੌਥੀ ਪੀੜ੍ਹੀ ਦੀ ਭਵਿੱਖੀ ਰੀਲੀਜ਼ ਦੀ ਯੋਜਨਾ ਬਣਾਈ ਗਈ ਹੈ।

#SNIGCONSULTANCY