CUDA ਕੋਰ ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਵਿਚਕਾਰ ਕੀ ਅੰਤਰ ਹੈ? (ਵਿਖਿਆਨ ਕੀਤਾ) - ਸਾਰੇ ਅੰਤਰ
ਵਿਸ਼ਾ - ਸੂਚੀ
CUDA ਅਤੇ Tensor ਕੋਰ Nvidia ਨਾਮ ਦੀ ਇੱਕ ਕੰਪਨੀ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤੇ ਉਤਪਾਦ ਹਨ। ਤਾਂ CUDA ਕੋਰ ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਕੀ ਹਨ? CUDA ਦਾ ਅਰਥ ਹੈ ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ। CUDA ਕੋਰ ਤੁਹਾਡੇ GPUs, ਸਮਾਰਟਫ਼ੋਨਸ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਤੁਹਾਡੀਆਂ ਕਾਰਾਂ ਵਿੱਚ ਮੌਜੂਦ ਹਨ, ਜਿਵੇਂ ਕਿ Nvidia ਡਿਵੈਲਪਰ ਕਹਿੰਦੇ ਹਨ।
CUDA ਕੋਰ ਇੱਕ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟਿੰਗ ਪਲੇਟਫਾਰਮ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਪ੍ਰੋਗਰਾਮਿੰਗ ਇੰਟਰਫੇਸ (API) ਹਨ ਜੋ ਆਮ-ਉਦੇਸ਼ ਦੀ ਪ੍ਰਕਿਰਿਆ ਲਈ ਖਾਸ ਕਿਸਮ ਦੇ ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟਾਂ (GPUs) ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਸੌਫਟਵੇਅਰ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੇ ਹਨ।
ਜਦੋਂ ਕਿ ਟੈਂਸਰ ਕੋਰ ਜੋ ਕਿ ਐਨਵੀਡੀਆ ਦੁਆਰਾ ਵੀ ਵਿਕਸਤ ਕੀਤੇ ਗਏ ਸਨ, ਜੀਪੀਯੂ ਵਿੱਚ ਵੀ ਵਰਤੇ ਜਾਂਦੇ ਹਨ। ਟੈਂਸਰ ਕੋਰ ਮਿਕਸਡ-ਪ੍ਰੀਸੀਜ਼ਨ ਕੰਪਿਊਟਿੰਗ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੇ ਹਨ, ਸ਼ੁੱਧਤਾ ਬਰਕਰਾਰ ਰੱਖਦੇ ਹੋਏ ਥ੍ਰੋਪੁੱਟ ਨੂੰ ਵਧਾਉਣ ਲਈ ਗਤੀਸ਼ੀਲ ਤੌਰ 'ਤੇ ਗਣਨਾਵਾਂ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਂਦੇ ਹਨ।
ਸਧਾਰਨ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਇਹ ਕੋਰ ਕੁਝ ਗਣਨਾਵਾਂ ਕਰਨ ਲਈ ਤੁਹਾਡੇ PC ਵਿੱਚ GPUs ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸਾ ਹਨ। CUDA ਕੋਰਾਂ ਦੀ ਵਰਤੋਂ ਦੋ ਸੰਖਿਆਵਾਂ ਨੂੰ ਗੁਣਾ ਕਰਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਕਿਸੇ ਹੋਰ ਸੰਖਿਆ ਵਿੱਚ ਜੋੜਨ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।
ਜਦੋਂ ਕਿ ਟੈਂਸਰ ਕੋਰ ਇੱਕੋ ਹੈ ਪਰ 4×4 ਮੈਟ੍ਰਿਕਸ ਦੇ ਨਾਲ। ਇਹ ਗਣਨਾਵਾਂ ਅਸਲ ਵਿੱਚ ਤੁਹਾਡੇ ਲਈ ਗ੍ਰਾਫਿਕਸ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਪੇਸ਼ ਕਰ ਰਹੀਆਂ ਹਨ।
CUDA ਕੀ ਹੈ?
ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ ਛੋਟੇ CUDA ਵਿੱਚ ਐਨਵੀਡੀਆ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ, 23 ਜੂਨ 2007 ਨੂੰ ਜਾਰੀ ਕੀਤਾ ਗਿਆ, ਇੱਕ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟਿੰਗ ਪਲੇਟਫਾਰਮ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਪ੍ਰੋਗਰਾਮਿੰਗ ਇੰਟਰਫੇਸ (API) ਹੈ।
ਉਹ ਸਾੱਫਟਵੇਅਰ ਨੂੰ ਆਮ-ਉਦੇਸ਼ ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਖਾਸ ਕਿਸਮ ਦੇ ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟਾਂ (GPUs) ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ, ਇੱਕ ਵਿਧੀ ਜਿਸਨੂੰ ਆਮ-ਉਦੇਸ਼ ਕੰਪਿਊਟਿੰਗ ਕਿਹਾ ਜਾਂਦਾ ਹੈGPUs (GPU)।
CUDA ਇੱਕ ਸਾਫਟਵੇਅਰ ਲੇਅਰ ਹੈ ਜੋ GPU ਦੇ ਵਰਚੁਅਲ ਇੰਸਟ੍ਰਕਸ਼ਨ ਸੈੱਟ ਅਤੇ ਕੰਪਿਊਟ ਕਰਨਲ ਦੇ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਲਈ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟੇਸ਼ਨਲ ਐਲੀਮੈਂਟਸ ਤੱਕ ਸਿੱਧੀ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ। CUDA ਨੂੰ C, C++, ਅਤੇ Fortran ਸਮੇਤ ਵੱਖ-ਵੱਖ ਪ੍ਰੋਗਰਾਮਿੰਗ ਭਾਸ਼ਾਵਾਂ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਸੀ।
ਵੱਖ-ਵੱਖ ਪ੍ਰੋਗ੍ਰਾਮਿੰਗ ਭਾਸ਼ਾਵਾਂ ਨਾਲ ਕੰਮ ਕਰਨ ਦੀ ਯੋਗਤਾ ਸਮਾਂਤਰ ਪ੍ਰੋਗਰਾਮਿੰਗ ਵਿੱਚ ਮਾਹਿਰਾਂ ਲਈ GPU ਸਰੋਤਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਆਸਾਨ ਬਣਾਉਂਦੀ ਹੈ ਜੇਕਰ ਅਸੀਂ ਇਸਨੂੰ ਡਾਇਰੈਕਟ3D ਜਾਂ ਓਪਨਜੀਐਲ ਵਰਗੇ ਪੁਰਾਣੇ API ਤੋਂ ਵੱਖ ਕਰਦੇ ਹਾਂ, ਜਿਸ ਲਈ ਤੁਹਾਨੂੰ ਵਧੇਰੇ ਉੱਨਤ ਹੋਣ ਦੀ ਲੋੜ ਹੋਵੇਗੀ। ਗ੍ਰਾਫਿਕਲ ਪ੍ਰੋਗਰਾਮਿੰਗ ਵਿੱਚ ਹੁਨਰ ਅਧਾਰ.
CUDA ਵਾਲਾ GPU ਪ੍ਰੋਗਰਾਮਿੰਗ ਫਰੇਮਵਰਕ ਦਾ ਵੀ ਸਮਰਥਨ ਕਰਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ OpenMP, OpenACC, OpenCL, ਅਤੇ HIP ਵੀ ਜੋ ਅਜਿਹੇ ਕੋਡ ਨੂੰ CUDA ਵਿੱਚ ਕੰਪਾਇਲ ਕਰ ਸਕਦੇ ਹਨ। CUDA ਲਈ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਪਹਿਲਾ ਨਾਮ ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ ਦਾ ਸੰਖੇਪ ਰੂਪ ਸੀ। ਹਾਲਾਂਕਿ, ਐਨਵੀਡੀਆ ਨੇ ਬਾਅਦ ਵਿੱਚ ਆਮ ਤੌਰ 'ਤੇ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਸੰਖੇਪ ਸ਼ਬਦ ਛੱਡ ਦਿੱਤਾ।
ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਐਨਵੀਡੀਆ ਗ੍ਰਾਫਿਕਸ ਕਾਰਡ GTX 1080 Ti
CUDA ਬਾਰੇ ਹੋਰ
ਇੱਕ ਵਿਸ਼ੇਸ਼ ਕੰਪਿਊਟਰ ਪ੍ਰੋਸੈਸਰ ਵਜੋਂ, ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟ (GPU) ਅਸਲ ਲੋੜਾਂ ਨੂੰ ਪੂਰਾ ਕਰਦਾ ਹੈ -ਸਮਾਂ, ਕੰਪਿਊਟ-ਇੰਟੈਂਸਿਵ 3D ਗਰਾਫਿਕਸ ਵਰਕਲੋਡ।
ਇਹ ਵੀ ਵੇਖੋ: ਸੇਸਨਾ 150 ਅਤੇ ਸੇਸਨਾ 152 (ਤੁਲਨਾ) ਵਿਚਕਾਰ ਅੰਤਰ - ਸਾਰੇ ਅੰਤਰ2012 ਦੇ ਲਗਭਗ GPUs ਦਾ ਵਿਕਾਸ ਹੋਇਆ ਅਤੇ ਵੱਡੇ ਬਲਾਕਾਂ ਲਈ ਪ੍ਰਭਾਵੀ ਡਾਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਵਾਲੇ ਉੱਚ ਸਮਾਨਾਂਤਰ ਮਲਟੀ-ਕੋਰ ਸਿਸਟਮ ਬਣ ਗਏ।
ਸਮਾਂਤਰ ਵਿੱਚ ਡੇਟਾ ਦੇ ਵੱਡੇ ਬਲਾਕਾਂ ਦੀ ਪ੍ਰੋਸੈਸਿੰਗ ਕਰਦੇ ਸਮੇਂ, ਇਹ ਡਿਜ਼ਾਈਨ ਐਲਗੋਰਿਦਮ ਲਈ ਆਮ-ਉਦੇਸ਼ ਕੇਂਦਰੀ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟਾਂ (CPUs) ਨਾਲੋਂ ਉੱਤਮ ਹੈ, ਜਿਵੇਂ ਕਿ:
- ਕ੍ਰਿਪਟੋਗ੍ਰਾਫਿਕ ਹੈਸ਼ਫੰਕਸ਼ਨ
- ਮਸ਼ੀਨ ਲਰਨਿੰਗ
- ਮੌਲੀਕਿਊਲਰ ਡਾਇਨਾਮਿਕਸ ਸਿਮੂਲੇਸ਼ਨ
- ਭੌਤਿਕ ਵਿਗਿਆਨ ਇੰਜਣ
- ਐਲਗੋਰਿਦਮ ਨੂੰ ਕ੍ਰਮਬੱਧ ਕਰੋ
ਹੁਣ CUDA ਆਰਕੀਟੈਕਚਰ ਦੀ ਵਰਤੋਂ ਅਤੇ ਭਵਿੱਖ ਵਿੱਚ
- 3D ਗਰਾਫਿਕਸ ਦੀ ਤੇਜ਼ ਰੈਂਡਰਿੰਗ
- ਵੀਡੀਓ ਫਾਈਲ ਫਾਰਮੈਟਾਂ ਦਾ ਐਕਸਲਰੇਟਿਡ ਇੰਟਰਕਨਵਰਜ਼ਨ
- ਐਕਸਲਰੇਟਿਡ ਐਨਕ੍ਰਿਪਸ਼ਨ, ਡੀਕ੍ਰਿਪਸ਼ਨ, ਅਤੇ ਕੰਪਰੈਸ਼ਨ
- ਬਾਇਓਇਨਫਾਰਮੈਟਿਕਸ, ਉਦਾਹਰਨ ਲਈ, NGS DNA ਸੀਕੁਏਂਸਿੰਗ BarraCUDA
- ਵਿਤਰਿਤ ਗਣਨਾਵਾਂ, ਜਿਵੇਂ ਕਿ ਪ੍ਰੋਟੀਨ ਦੀ ਮੂਲ ਰਚਨਾ ਦਾ ਅਨੁਮਾਨ ਲਗਾਉਣਾ
- ਮੈਡੀਕਲ ਵਿਸ਼ਲੇਸ਼ਣ ਸਿਮੂਲੇਸ਼ਨ, ਉਦਾਹਰਨ ਲਈ, CT ਅਤੇ MRI ਸਕੈਨ ਚਿੱਤਰਾਂ 'ਤੇ ਆਧਾਰਿਤ ਵਰਚੁਅਲ ਰਿਐਲਿਟੀ
- ਭੌਤਿਕ ਸਿਮੂਲੇਸ਼ਨ, ਖਾਸ ਤੌਰ 'ਤੇ ਤਰਲ ਗਤੀਸ਼ੀਲਤਾ ਵਿੱਚ
- ਮਸ਼ੀਨ ਸਿੱਖਣ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਵਿੱਚ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਸਿਖਲਾਈ
- ਚਿਹਰੇ ਦੀ ਪਛਾਣ
- ਵਿਤਰਿਤ ਕੰਪਿਊਟਿੰਗ ਪ੍ਰੋਜੈਕਟ, ਜਿਵੇਂ ਕਿ [ਈਮੇਲ ਪ੍ਰੋਟੈਕਟਡ] ਅਤੇ ਹੋਰ ਪ੍ਰੋਜੈਕਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ BOINC
- ਮੌਲੀਕਿਊਲਰ ਡਾਇਨਾਮਿਕਸ
- ਮਾਈਨਿੰਗ ਕ੍ਰਿਪਟੋਕਰੰਸੀ
- ਗਤੀ (SfM) ਸਾਫਟਵੇਅਰ ਤੋਂ ਬਣਤਰ
ਟੈਂਸਰ ਕੋਰ ਕੀ ਹੈ?
ਟੈਨਸਰ ਕੋਰ ਕਹੇ ਜਾਂਦੇ ਵਿਸ਼ੇਸ਼ ਕੋਰ ਮਿਸ਼ਰਤ-ਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਲਈ ਆਗਿਆ ਦਿੰਦੇ ਹਨ। ਇਹ ਵਿਸ਼ੇਸ਼ ਕੋਰਾਂ ਦੀ ਸ਼ੁਰੂਆਤੀ ਪੀੜ੍ਹੀ ਇਹ ਇੱਕ ਫਿਊਜ਼ਡ ਮਲਟੀਪਲਾਈ-ਐਡ ਐਲਗੋਰਿਦਮ ਨਾਲ ਕਰਦੀ ਹੈ। ਇਹ ਇੱਕ 4 x 4 FP16 ਜਾਂ FP32 ਮੈਟ੍ਰਿਕਸ ਵਿੱਚ ਦੋ 4 x 4 FP16 ਮੈਟ੍ਰਿਕਸ ਨੂੰ ਗੁਣਾ ਕਰਨਾ ਅਤੇ ਜੋੜਨਾ ਸੰਭਵ ਬਣਾਉਂਦਾ ਹੈ।
ਅੰਤਮ ਨਤੀਜਾ FP32 ਹੋਵੇਗਾ ਜਿਸ ਵਿੱਚ ਸ਼ੁੱਧਤਾ ਦੇ ਮਾਮੂਲੀ ਨੁਕਸਾਨ ਦੇ ਨਾਲ, ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਕੰਪਿਊਟਿੰਗ ਨੂੰ ਮਨੋਨੀਤ ਕੀਤਾ ਗਿਆ ਹੈ ਭਾਵੇਂ ਕਿਇਨਪੁਟ ਮੈਟ੍ਰਿਕਸ ਘੱਟ-ਸ਼ੁੱਧਤਾ FP16 ਹੋ ਸਕਦੇ ਹਨ।
ਅਭਿਆਸ ਵਿੱਚ, ਇਹ ਮਾਡਲ ਦੀ ਅੰਤਮ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ 'ਤੇ ਬਹੁਤ ਘੱਟ ਪ੍ਰਭਾਵ ਦੇ ਨਾਲ ਗਣਨਾਵਾਂ ਨੂੰ ਬਹੁਤ ਤੇਜ਼ ਕਰਦਾ ਹੈ। ਇਸ ਸਮਰੱਥਾ ਨੂੰ ਬਾਅਦ ਵਿੱਚ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਦੁਆਰਾ ਹੋਰ ਵੀ ਘੱਟ ਸਟੀਕ ਕੰਪਿਊਟਰ ਨੰਬਰ ਪ੍ਰਸਤੁਤੀਆਂ ਤੱਕ ਵਧਾਇਆ ਗਿਆ ਹੈ।
ਪਹਿਲੀ ਪੀੜ੍ਹੀ ਨੂੰ V100 ਤੋਂ ਸ਼ੁਰੂ ਹੋਣ ਵਾਲੇ ਵੋਲਟਾ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਨਾਲ ਪੇਸ਼ ਕੀਤਾ ਗਿਆ ਸੀ, ਹਰ ਲੰਘਦੀ ਪੀੜ੍ਹੀ ਦੇ ਨਾਲ ਨਵੇਂ GPU ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਦੇ ਨਾਲ ਗਣਨਾ ਲਈ ਵਧੇਰੇ ਕੰਪਿਊਟਰ ਨੰਬਰ ਸ਼ੁੱਧਤਾ ਫਾਰਮੈਟ ਉਪਲਬਧ ਕਰਵਾਏ ਗਏ ਸਨ।
ਅਸੀਂ ਇਸ ਬਾਰੇ ਗੱਲ ਕਰਾਂਗੇ ਕਿ ਕਿਵੇਂ ਟੈਂਸਰ ਕੋਰ ਦੀ ਸਮਰੱਥਾ ਅਤੇ ਕਾਰਜਕੁਸ਼ਲਤਾ ਅਗਲੇ ਭਾਗ ਵਿੱਚ ਹਰੇਕ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਪੀੜ੍ਹੀ ਦੇ ਨਾਲ ਬਦਲੀ ਅਤੇ ਸੁਧਾਰੀ ਗਈ ਹੈ।
ਇਹ ਵੀ ਵੇਖੋ: ਪਾਈਕਸ, ਸਪੀਅਰਸ, & ਲੈਂਸ (ਵਿਖਿਆਨ ਕੀਤਾ) - ਸਾਰੇ ਅੰਤਰਟਾਈਟਨ V ਦੁਆਰਾ ਬਣਾਈ ਗਈ ਇੱਕ ਗ੍ਰਾਫਿਕਲੀ ਰੂਪ ਵਿੱਚ ਪੇਸ਼ ਕੀਤੀ ਗਈ ਤਸਵੀਰ
ਟੈਂਸਰ ਕੋਰ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ?
ਪਹਿਲੀ ਪੀੜ੍ਹੀ:
ਵੋਲਟਾ GPU ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਨੂੰ ਟੈਂਸਰ ਕੋਰ ਦੀ ਪਹਿਲੀ ਪੀੜ੍ਹੀ ਦੇ ਨਾਲ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ। ਇਹਨਾਂ ਕੋਰਾਂ ਨੇ ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਅਤੇ FP16 ਨੰਬਰ ਫਾਰਮੈਟ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣਾ ਸੰਭਵ ਬਣਾਇਆ ਹੈ।
ਇਸ ਨਾਲ ਕੁਝ GPUs ਲਈ teraFLOP ਥਰੂਪੁੱਟ ਵਿੱਚ 12x ਤੱਕ ਦਾ ਵਾਧਾ ਹੋ ਸਕਦਾ ਹੈ। ਟਾਪ-ਟੀਅਰ V100 ਦੇ 640 ਕੋਰ ਪਿਛਲੀ ਪੀੜ੍ਹੀ ਦੇ ਪਾਸਕਲ GPUs ਦੇ ਮੁਕਾਬਲੇ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਗਤੀ ਵਿੱਚ 5 ਗੁਣਾ ਵਾਧਾ ਦਿੰਦੇ ਹਨ।
ਦੂਜੀ ਪੀੜ੍ਹੀ:
ਟਿਊਰਿੰਗ GPUs ਦੀ ਸ਼ੁਰੂਆਤ ਦੇ ਨਾਲ, ਟੈਂਸਰ ਕੋਰ ਦੀ ਦੂਜੀ ਪੀੜ੍ਹੀ ਪੇਸ਼ ਕੀਤੀ ਗਈ ਸੀ। Int8, Int4, ਅਤੇ Int1 ਨੂੰ ਸਮਰਥਿਤ ਟੈਂਸਰ ਕੋਰ ਸ਼ੁੱਧਤਾਵਾਂ ਦੀ ਸੂਚੀ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ, ਜੋ ਕਿ ਸਨਪਹਿਲਾਂ FP16 ਤੱਕ ਸੀਮਿਤ ਸੀ।
ਮਿਕਸਡ ਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆਵਾਂ ਦੇ ਕਾਰਨ, ਪਾਸਕਲ GPUs ਦੇ ਮੁਕਾਬਲੇ GPU ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਥ੍ਰਰੂਪੁਟ ਨੂੰ 32 ਗੁਣਾ ਤੱਕ ਵਧਾਇਆ ਗਿਆ ਸੀ।
ਤੀਜੀ ਜਨਰੇਸ਼ਨ:
ਇੱਕ ਐਂਪੀਅਰ GPU ਵਿੱਚ ਆਰਕੀਟੈਕਚਰ FP64, TF32, ਅਤੇ bfloat16 ਸ਼ੁੱਧਤਾਵਾਂ ਲਈ ਸਮਰਥਨ ਜੋੜ ਕੇ ਵੋਲਟਾ ਅਤੇ ਟਿਊਰਿੰਗ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰਜ਼ ਦੀਆਂ ਪੁਰਾਣੀਆਂ ਤਰੱਕੀਆਂ 'ਤੇ ਫੈਲਦਾ ਹੈ।
ਇਨ੍ਹਾਂ ਵਾਧੂ ਸਟੀਕਸ਼ਨ ਫਾਰਮੈਟਾਂ ਦੁਆਰਾ ਡੂੰਘੀ ਸਿੱਖਣ ਦੀ ਸਿਖਲਾਈ ਅਤੇ ਅਨੁਮਾਨ ਗਤੀਵਿਧੀਆਂ ਨੂੰ ਹੋਰ ਤੇਜ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, TF32 ਫਾਰਮੈਟ FP32 ਵਾਂਗ ਹੀ ਕੰਮ ਕਰਦਾ ਹੈ ਜਦੋਂ ਕਿ ਬਿਨਾਂ ਕਿਸੇ ਕੋਡ ਨੂੰ ਬਦਲੇ 20x ਸਪੀਡਅੱਪ ਦੀ ਗਰੰਟੀ ਵੀ ਦਿੰਦਾ ਹੈ।
ਫਿਰ, ਕੋਡ ਦੀਆਂ ਕੁਝ ਲਾਈਨਾਂ ਦੇ ਨਾਲ, ਆਟੋਮੈਟਿਕ ਮਿਕਸਡ ਸ਼ੁੱਧਤਾ ਲਾਗੂ ਕਰਨ ਨਾਲ ਸਿਖਲਾਈ ਨੂੰ ਇੱਕ ਵਾਧੂ 2x ਦੀ ਗਤੀ ਮਿਲੇਗੀ।
ਤੀਜੀ ਪੀੜ੍ਹੀ ਦਾ NVLink ਬਹੁਤ ਤੇਜ਼ ਮਲਟੀ-ਜੀਪੀਯੂ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ, ਤੀਜੀ ਪੀੜ੍ਹੀ ਦੇ ਰੇ ਟਰੇਸਿੰਗ ਕੋਰ, ਅਤੇ ਸਪਾਰਸ ਮੈਟ੍ਰਿਕਸ ਗਣਿਤ ਨਾਲ ਵਿਸ਼ੇਸ਼ਤਾ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਲਈ ਐਂਪੀਅਰ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਦੇ ਵਾਧੂ ਪਹਿਲੂ ਹਨ ।
ਚੌਥੀ ਪੀੜ੍ਹੀ:
ਟੈਂਸਰ ਕੋਰ ਦੀ ਹੌਪਰ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ-ਅਧਾਰਿਤ ਚੌਥੀ ਪੀੜ੍ਹੀ ਦੇ ਭਵਿੱਖ ਵਿੱਚ ਰਿਲੀਜ਼ ਦੀ ਯੋਜਨਾ ਹੈ। ਅਗਲੇ H100 ਵਿੱਚ ਚੌਥੀ ਪੀੜ੍ਹੀ ਦੇ ਟੈਂਸਰ ਕੋਰ।
ਜੋ ਕਿ ਮਾਰਚ 2022 ਵਿੱਚ ਰਿਲੀਜ਼ ਹੋਣ ਦੀ ਉਮੀਦ ਹੈ, FP8 ਸ਼ੁੱਧਤਾ ਫਾਰਮੈਟਾਂ ਨੂੰ ਸੰਭਾਲਣ ਦੇ ਯੋਗ ਹੋਵੇਗਾ ਅਤੇ, NVIDIA ਦੇ ਅਨੁਸਾਰ, ਇੱਕ ਹੈਰਾਨੀਜਨਕ 30X ਦੁਆਰਾ ਵਿਸ਼ਾਲ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਤੇਜ਼ ਕਰੇਗਾ। ਪਿਛਲੀ ਪੀੜ੍ਹੀ ਤੋਂ ਵੱਧ।”
ਇੱਕ RTX ਗ੍ਰਾਫਿਕਸ ਕਾਰਡ ਹੈਗ੍ਰਾਫਿਕਸ ਨੂੰ ਬਹੁਤ ਤੇਜ਼ੀ ਨਾਲ ਰੈਂਡਰ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ ਕਿਉਂਕਿ ਇਸ ਵਿੱਚ ਟੈਂਸਰ ਕੋਰ ਹੁੰਦੇ ਹਨ।
CUDA ਕੋਰ ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਵਿੱਚ ਅੰਤਰ
ਟੈਂਸਰ ਕੋਰ ਵਰਤਮਾਨ ਵਿੱਚ Titan V ਅਤੇ Tesla V100 ਤੱਕ ਸੀਮਿਤ ਹਨ। ਦੋਨਾਂ GPUs 'ਤੇ 5120 CUDA ਕੋਰਾਂ ਵਿੱਚ ਇੱਕ ਸਿੰਗਲ ਸ਼ੁੱਧਤਾ ਗੁਣਾ-ਇਕਮੁਲ ਕਾਰਜ (ਉਦਾਹਰਨ ਲਈ, fp32 ਵਿੱਚ: x += y * z) ਪ੍ਰਤੀ GPU ਘੜੀ (ਜਿਵੇਂ ਕਿ Tesla V100 PCIe ਫ੍ਰੀਕੁਐਂਸੀ 1.38Gz ਹੈ) ਦੀ ਅਧਿਕਤਮ ਸਮਰੱਥਾ ਹੈ।
ਹਰੇਕ ਟੈਂਸਰ ਕੋਰ ਛੋਟੇ ਮੈਟ੍ਰਿਕਸ ਲਈ 4×4 ਛੋਟੇ ਮੈਟ੍ਰਿਕਸ 'ਤੇ ਕੰਮ ਕਰਦਾ ਹੈ। ਪ੍ਰਤੀ ਇੱਕ GPU ਘੜੀ, ਹਰੇਕ ਟੈਂਸਰ ਕੋਰ ਇੱਕ ਮੈਟ੍ਰਿਕਸ ਗੁਣਾ-ਇਕਮੁਲੇਟ ਕਾਰਵਾਈ ਨੂੰ ਪੂਰਾ ਕਰ ਸਕਦਾ ਹੈ।
ਇਹ ਦੋ 4×4 FP16 ਮੈਟ੍ਰਿਕਸ ਨੂੰ ਗੁਣਾ ਕਰਦਾ ਹੈ ਅਤੇ 4×4 FP32 ਮੈਟ੍ਰਿਕਸ ਜੋੜਦਾ ਹੈ ਜਿਸਦਾ ਨਤੀਜਾ ਐਕਯੂਮੂਲੇਟਰ ਹੁੰਦਾ ਹੈ (ਜੋ ਕਿ ਇੱਕ fp32 4×4 ਮੈਟ੍ਰਿਕਸ ਵੀ ਹੈ)।
ਕਿਉਂਕਿ ਇਨਪੁਟ ਮੈਟ੍ਰਿਕਸ fp16 ਹਨ ਜਦੋਂ ਕਿ ਗੁਣਾ ਦੇ ਨਤੀਜੇ ਅਤੇ ਸੰਚਵਕ fp32 ਹਨ, ਐਲਗੋਰਿਦਮ ਨੂੰ ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਵਜੋਂ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ।
ਸਹੀ ਸ਼ਬਦ ਸੰਭਾਵਤ ਤੌਰ 'ਤੇ ਸਿਰਫ਼ "4×4 ਮੈਟ੍ਰਿਕਸ ਕੋਰ" ਹੋਵੇਗਾ, ਪਰ NVIDIA ਮਾਰਕੀਟਿੰਗ ਟੀਮ ਨੇ "ਟੈਂਸਰ ਕੋਰ" ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਚੁਣਿਆ ਹੈ।
ਟੈਂਸਰ ਕੋਰ ਸੰਖੇਪ ਵਿੱਚ ਪੂਰੀ ਵਿਆਖਿਆ
GPU ਕਾਰਡ | CUDA ਕੋਰ | VRAM |
---|---|---|
GeForce GTX 1660 Ti | 1536 | 6GB |
GeForce GTX 1660 ਸੁਪਰ | 1408 | 6GB |
GeForce GTX 1660 | 1408 | 6GB |
GeForce GTX 1650 Super | 1408 | 4GB |
GeForce GTX 1650 | 1024 ਅਤੇ896 | 4GB |
GeForce GTX 1060 3GB | 1280 | 4GB |
GeForce GTX 1650 | 1280 | 3GB |
GeForce GTX 1060 6GB | 768 | 6GB |
GeForce GTX 1050 Ti (3GB) | 768 | 4GB |
GeForce GTX 1050 (2GB) | 640 | 3GB |
GeForce GTX 960 | 1024 | 2GB |
GeForce GTX 950 | 786 | 2GB |
GeForce GTX 780 Ti | 2880 | 2GB |
GeForce GTX 780 | 2304 | 3GB |
GeForce GTX 750 Ti | 640 | 2 GB |
GeForce GTX 750 | 512 | 1GB ਜਾਂ 2 GB |
GPUs ਜਿਨ੍ਹਾਂ ਵਿੱਚ CUDA ਕੋਰ ਹੁੰਦੇ ਹਨ
ਸਿੱਟਾ
- CUDA ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਉਤਪਾਦ ਹਨ, ਦੋਵੇਂ ਐਨਵੀਡੀਆ ਨਾਮਕ ਕੰਪਨੀ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤੇ ਗਏ ਹਨ। CUDA ਦਾ ਅਰਥ ਹੈ ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ। ਇਹ CUDA ਕੋਰ ਤੁਹਾਡੇ GPU, ਸਮਾਰਟਫ਼ੋਨ ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਤੁਹਾਡੀਆਂ ਕਾਰਾਂ ਵਿੱਚ ਮੌਜੂਦ ਹਨ।
- ਜਦੋਂ ਕਿ ਟੈਂਸਰ ਕੋਰ, ਜੋ ਕਿ ਐਨਵੀਡੀਆ ਦੁਆਰਾ ਵੀ ਵਿਕਸਤ ਕੀਤੇ ਗਏ ਸਨ, ਜੀਪੀਯੂ ਵਿੱਚ ਵੀ ਵਰਤੇ ਜਾਂਦੇ ਹਨ। "ਟੈਂਸਰ ਕੋਰ" ਨਾਮਕ ਵਿਸ਼ੇਸ਼ ਕੋਰ ਮਿਸ਼ਰਤ-ਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਲਈ ਆਗਿਆ ਦਿੰਦੇ ਹਨ। ਟੈਂਸਰ ਕੋਰ ਦੀ ਪਹਿਲੀ ਪੀੜ੍ਹੀ ਨੇ ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਅਤੇ FP16 ਨੰਬਰ ਫਾਰਮੈਟ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣਾ ਸੰਭਵ ਬਣਾਇਆ ਹੈ।
- ਇਸ ਨਾਲ ਕੁਝ GPUs ਲਈ teraFLOP ਥਰੂਪੁੱਟ ਵਿੱਚ 12x ਤੱਕ ਦਾ ਵਾਧਾ ਹੋ ਸਕਦਾ ਹੈ। Int8, Int4, ਅਤੇ Int1 ਨੂੰ ਸਮਰਥਿਤ ਟੈਂਸਰ ਕੋਰ ਸ਼ੁੱਧਤਾਵਾਂ ਦੀ ਸੂਚੀ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ।
- ਮਿਕਸਡ ਦੇ ਕਾਰਨਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆਵਾਂ, GPU ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ 32 ਗੁਣਾ ਤੱਕ ਵਧਾਇਆ ਗਿਆ ਸੀ। ਟੈਂਸਰ ਕੋਰ ਦੀ ਹੋਪਰ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ-ਅਧਾਰਤ ਚੌਥੀ ਪੀੜ੍ਹੀ ਦੀ ਭਵਿੱਖੀ ਰੀਲੀਜ਼ ਦੀ ਯੋਜਨਾ ਬਣਾਈ ਗਈ ਹੈ।