CUDA ਕੋਰ ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਵਿਚਕਾਰ ਕੀ ਅੰਤਰ ਹੈ? (ਵਿਖਿਆਨ ਕੀਤਾ) - ਸਾਰੇ ਅੰਤਰ

 CUDA ਕੋਰ ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਵਿਚਕਾਰ ਕੀ ਅੰਤਰ ਹੈ? (ਵਿਖਿਆਨ ਕੀਤਾ) - ਸਾਰੇ ਅੰਤਰ

Mary Davis

CUDA ਅਤੇ Tensor ਕੋਰ Nvidia ਨਾਮ ਦੀ ਇੱਕ ਕੰਪਨੀ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤੇ ਉਤਪਾਦ ਹਨ। ਤਾਂ CUDA ਕੋਰ ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਕੀ ਹਨ? CUDA ਦਾ ਅਰਥ ਹੈ ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ। CUDA ਕੋਰ ਤੁਹਾਡੇ GPUs, ਸਮਾਰਟਫ਼ੋਨਸ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਤੁਹਾਡੀਆਂ ਕਾਰਾਂ ਵਿੱਚ ਮੌਜੂਦ ਹਨ, ਜਿਵੇਂ ਕਿ Nvidia ਡਿਵੈਲਪਰ ਕਹਿੰਦੇ ਹਨ।

CUDA ਕੋਰ ਇੱਕ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟਿੰਗ ਪਲੇਟਫਾਰਮ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਪ੍ਰੋਗਰਾਮਿੰਗ ਇੰਟਰਫੇਸ (API) ਹਨ ਜੋ ਆਮ-ਉਦੇਸ਼ ਦੀ ਪ੍ਰਕਿਰਿਆ ਲਈ ਖਾਸ ਕਿਸਮ ਦੇ ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟਾਂ (GPUs) ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਸੌਫਟਵੇਅਰ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੇ ਹਨ।

ਜਦੋਂ ਕਿ ਟੈਂਸਰ ਕੋਰ ਜੋ ਕਿ ਐਨਵੀਡੀਆ ਦੁਆਰਾ ਵੀ ਵਿਕਸਤ ਕੀਤੇ ਗਏ ਸਨ, ਜੀਪੀਯੂ ਵਿੱਚ ਵੀ ਵਰਤੇ ਜਾਂਦੇ ਹਨ। ਟੈਂਸਰ ਕੋਰ ਮਿਕਸਡ-ਪ੍ਰੀਸੀਜ਼ਨ ਕੰਪਿਊਟਿੰਗ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੇ ਹਨ, ਸ਼ੁੱਧਤਾ ਬਰਕਰਾਰ ਰੱਖਦੇ ਹੋਏ ਥ੍ਰੋਪੁੱਟ ਨੂੰ ਵਧਾਉਣ ਲਈ ਗਤੀਸ਼ੀਲ ਤੌਰ 'ਤੇ ਗਣਨਾਵਾਂ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਂਦੇ ਹਨ।

ਸਧਾਰਨ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਇਹ ਕੋਰ ਕੁਝ ਗਣਨਾਵਾਂ ਕਰਨ ਲਈ ਤੁਹਾਡੇ PC ਵਿੱਚ GPUs ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸਾ ਹਨ। CUDA ਕੋਰਾਂ ਦੀ ਵਰਤੋਂ ਦੋ ਸੰਖਿਆਵਾਂ ਨੂੰ ਗੁਣਾ ਕਰਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਕਿਸੇ ਹੋਰ ਸੰਖਿਆ ਵਿੱਚ ਜੋੜਨ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।

ਜਦੋਂ ਕਿ ਟੈਂਸਰ ਕੋਰ ਇੱਕੋ ਹੈ ਪਰ 4×4 ਮੈਟ੍ਰਿਕਸ ਦੇ ਨਾਲ। ਇਹ ਗਣਨਾਵਾਂ ਅਸਲ ਵਿੱਚ ਤੁਹਾਡੇ ਲਈ ਗ੍ਰਾਫਿਕਸ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਪੇਸ਼ ਕਰ ਰਹੀਆਂ ਹਨ।

CUDA ਕੀ ਹੈ?

ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ ਛੋਟੇ CUDA ਵਿੱਚ ਐਨਵੀਡੀਆ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ, 23 ਜੂਨ 2007 ਨੂੰ ਜਾਰੀ ਕੀਤਾ ਗਿਆ, ਇੱਕ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟਿੰਗ ਪਲੇਟਫਾਰਮ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਪ੍ਰੋਗਰਾਮਿੰਗ ਇੰਟਰਫੇਸ (API) ਹੈ।

ਉਹ ਸਾੱਫਟਵੇਅਰ ਨੂੰ ਆਮ-ਉਦੇਸ਼ ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਖਾਸ ਕਿਸਮ ਦੇ ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟਾਂ (GPUs) ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ, ਇੱਕ ਵਿਧੀ ਜਿਸਨੂੰ ਆਮ-ਉਦੇਸ਼ ਕੰਪਿਊਟਿੰਗ ਕਿਹਾ ਜਾਂਦਾ ਹੈGPUs (GPU)।

CUDA ਇੱਕ ਸਾਫਟਵੇਅਰ ਲੇਅਰ ਹੈ ਜੋ GPU ਦੇ ਵਰਚੁਅਲ ਇੰਸਟ੍ਰਕਸ਼ਨ ਸੈੱਟ ਅਤੇ ਕੰਪਿਊਟ ਕਰਨਲ ਦੇ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਲਈ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟੇਸ਼ਨਲ ਐਲੀਮੈਂਟਸ ਤੱਕ ਸਿੱਧੀ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ। CUDA ਨੂੰ C, C++, ਅਤੇ Fortran ਸਮੇਤ ਵੱਖ-ਵੱਖ ਪ੍ਰੋਗਰਾਮਿੰਗ ਭਾਸ਼ਾਵਾਂ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਸੀ।

ਵੱਖ-ਵੱਖ ਪ੍ਰੋਗ੍ਰਾਮਿੰਗ ਭਾਸ਼ਾਵਾਂ ਨਾਲ ਕੰਮ ਕਰਨ ਦੀ ਯੋਗਤਾ ਸਮਾਂਤਰ ਪ੍ਰੋਗਰਾਮਿੰਗ ਵਿੱਚ ਮਾਹਿਰਾਂ ਲਈ GPU ਸਰੋਤਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਆਸਾਨ ਬਣਾਉਂਦੀ ਹੈ ਜੇਕਰ ਅਸੀਂ ਇਸਨੂੰ ਡਾਇਰੈਕਟ3D ਜਾਂ ਓਪਨਜੀਐਲ ਵਰਗੇ ਪੁਰਾਣੇ API ਤੋਂ ਵੱਖ ਕਰਦੇ ਹਾਂ, ਜਿਸ ਲਈ ਤੁਹਾਨੂੰ ਵਧੇਰੇ ਉੱਨਤ ਹੋਣ ਦੀ ਲੋੜ ਹੋਵੇਗੀ। ਗ੍ਰਾਫਿਕਲ ਪ੍ਰੋਗਰਾਮਿੰਗ ਵਿੱਚ ਹੁਨਰ ਅਧਾਰ.

CUDA ਵਾਲਾ GPU ਪ੍ਰੋਗਰਾਮਿੰਗ ਫਰੇਮਵਰਕ ਦਾ ਵੀ ਸਮਰਥਨ ਕਰਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ OpenMP, OpenACC, OpenCL, ਅਤੇ HIP ਵੀ ਜੋ ਅਜਿਹੇ ਕੋਡ ਨੂੰ CUDA ਵਿੱਚ ਕੰਪਾਇਲ ਕਰ ਸਕਦੇ ਹਨ। CUDA ਲਈ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਪਹਿਲਾ ਨਾਮ ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ ਦਾ ਸੰਖੇਪ ਰੂਪ ਸੀ। ਹਾਲਾਂਕਿ, ਐਨਵੀਡੀਆ ਨੇ ਬਾਅਦ ਵਿੱਚ ਆਮ ਤੌਰ 'ਤੇ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਸੰਖੇਪ ਸ਼ਬਦ ਛੱਡ ਦਿੱਤਾ।

ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਐਨਵੀਡੀਆ ਗ੍ਰਾਫਿਕਸ ਕਾਰਡ GTX 1080 Ti

CUDA ਬਾਰੇ ਹੋਰ

ਇੱਕ ਵਿਸ਼ੇਸ਼ ਕੰਪਿਊਟਰ ਪ੍ਰੋਸੈਸਰ ਵਜੋਂ, ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟ (GPU) ਅਸਲ ਲੋੜਾਂ ਨੂੰ ਪੂਰਾ ਕਰਦਾ ਹੈ -ਸਮਾਂ, ਕੰਪਿਊਟ-ਇੰਟੈਂਸਿਵ 3D ਗਰਾਫਿਕਸ ਵਰਕਲੋਡ।

ਇਹ ਵੀ ਵੇਖੋ: ਸੇਸਨਾ 150 ਅਤੇ ਸੇਸਨਾ 152 (ਤੁਲਨਾ) ਵਿਚਕਾਰ ਅੰਤਰ - ਸਾਰੇ ਅੰਤਰ

2012 ਦੇ ਲਗਭਗ GPUs ਦਾ ਵਿਕਾਸ ਹੋਇਆ ਅਤੇ ਵੱਡੇ ਬਲਾਕਾਂ ਲਈ ਪ੍ਰਭਾਵੀ ਡਾਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਵਾਲੇ ਉੱਚ ਸਮਾਨਾਂਤਰ ਮਲਟੀ-ਕੋਰ ਸਿਸਟਮ ਬਣ ਗਏ।

ਸਮਾਂਤਰ ਵਿੱਚ ਡੇਟਾ ਦੇ ਵੱਡੇ ਬਲਾਕਾਂ ਦੀ ਪ੍ਰੋਸੈਸਿੰਗ ਕਰਦੇ ਸਮੇਂ, ਇਹ ਡਿਜ਼ਾਈਨ ਐਲਗੋਰਿਦਮ ਲਈ ਆਮ-ਉਦੇਸ਼ ਕੇਂਦਰੀ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟਾਂ (CPUs) ਨਾਲੋਂ ਉੱਤਮ ਹੈ, ਜਿਵੇਂ ਕਿ:

  • ਕ੍ਰਿਪਟੋਗ੍ਰਾਫਿਕ ਹੈਸ਼ਫੰਕਸ਼ਨ
  • ਮਸ਼ੀਨ ਲਰਨਿੰਗ
  • ਮੌਲੀਕਿਊਲਰ ਡਾਇਨਾਮਿਕਸ ਸਿਮੂਲੇਸ਼ਨ
  • ਭੌਤਿਕ ਵਿਗਿਆਨ ਇੰਜਣ
  • ਐਲਗੋਰਿਦਮ ਨੂੰ ਕ੍ਰਮਬੱਧ ਕਰੋ

ਹੁਣ CUDA ਆਰਕੀਟੈਕਚਰ ਦੀ ਵਰਤੋਂ ਅਤੇ ਭਵਿੱਖ ਵਿੱਚ

  • 3D ਗਰਾਫਿਕਸ ਦੀ ਤੇਜ਼ ਰੈਂਡਰਿੰਗ
  • ਵੀਡੀਓ ਫਾਈਲ ਫਾਰਮੈਟਾਂ ਦਾ ਐਕਸਲਰੇਟਿਡ ਇੰਟਰਕਨਵਰਜ਼ਨ
  • ਐਕਸਲਰੇਟਿਡ ਐਨਕ੍ਰਿਪਸ਼ਨ, ਡੀਕ੍ਰਿਪਸ਼ਨ, ਅਤੇ ਕੰਪਰੈਸ਼ਨ
  • ਬਾਇਓਇਨਫਾਰਮੈਟਿਕਸ, ਉਦਾਹਰਨ ਲਈ, NGS DNA ਸੀਕੁਏਂਸਿੰਗ BarraCUDA
  • ਵਿਤਰਿਤ ਗਣਨਾਵਾਂ, ਜਿਵੇਂ ਕਿ ਪ੍ਰੋਟੀਨ ਦੀ ਮੂਲ ਰਚਨਾ ਦਾ ਅਨੁਮਾਨ ਲਗਾਉਣਾ
  • ਮੈਡੀਕਲ ਵਿਸ਼ਲੇਸ਼ਣ ਸਿਮੂਲੇਸ਼ਨ, ਉਦਾਹਰਨ ਲਈ, CT ਅਤੇ MRI ਸਕੈਨ ਚਿੱਤਰਾਂ 'ਤੇ ਆਧਾਰਿਤ ਵਰਚੁਅਲ ਰਿਐਲਿਟੀ
  • ਭੌਤਿਕ ਸਿਮੂਲੇਸ਼ਨ, ਖਾਸ ਤੌਰ 'ਤੇ ਤਰਲ ਗਤੀਸ਼ੀਲਤਾ ਵਿੱਚ
  • ਮਸ਼ੀਨ ਸਿੱਖਣ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਵਿੱਚ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਸਿਖਲਾਈ
  • ਚਿਹਰੇ ਦੀ ਪਛਾਣ
  • ਵਿਤਰਿਤ ਕੰਪਿਊਟਿੰਗ ਪ੍ਰੋਜੈਕਟ, ਜਿਵੇਂ ਕਿ [ਈਮੇਲ ਪ੍ਰੋਟੈਕਟਡ] ਅਤੇ ਹੋਰ ਪ੍ਰੋਜੈਕਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ BOINC
  • ਮੌਲੀਕਿਊਲਰ ਡਾਇਨਾਮਿਕਸ
  • ਮਾਈਨਿੰਗ ਕ੍ਰਿਪਟੋਕਰੰਸੀ
  • ਗਤੀ (SfM) ਸਾਫਟਵੇਅਰ ਤੋਂ ਬਣਤਰ

ਟੈਂਸਰ ਕੋਰ ਕੀ ਹੈ?

ਟੈਨਸਰ ਕੋਰ ਕਹੇ ਜਾਂਦੇ ਵਿਸ਼ੇਸ਼ ਕੋਰ ਮਿਸ਼ਰਤ-ਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਲਈ ਆਗਿਆ ਦਿੰਦੇ ਹਨ। ਇਹ ਵਿਸ਼ੇਸ਼ ਕੋਰਾਂ ਦੀ ਸ਼ੁਰੂਆਤੀ ਪੀੜ੍ਹੀ ਇਹ ਇੱਕ ਫਿਊਜ਼ਡ ਮਲਟੀਪਲਾਈ-ਐਡ ਐਲਗੋਰਿਦਮ ਨਾਲ ਕਰਦੀ ਹੈ। ਇਹ ਇੱਕ 4 x 4 FP16 ਜਾਂ FP32 ਮੈਟ੍ਰਿਕਸ ਵਿੱਚ ਦੋ 4 x 4 FP16 ਮੈਟ੍ਰਿਕਸ ਨੂੰ ਗੁਣਾ ਕਰਨਾ ਅਤੇ ਜੋੜਨਾ ਸੰਭਵ ਬਣਾਉਂਦਾ ਹੈ।

ਅੰਤਮ ਨਤੀਜਾ FP32 ਹੋਵੇਗਾ ਜਿਸ ਵਿੱਚ ਸ਼ੁੱਧਤਾ ਦੇ ਮਾਮੂਲੀ ਨੁਕਸਾਨ ਦੇ ਨਾਲ, ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਕੰਪਿਊਟਿੰਗ ਨੂੰ ਮਨੋਨੀਤ ਕੀਤਾ ਗਿਆ ਹੈ ਭਾਵੇਂ ਕਿਇਨਪੁਟ ਮੈਟ੍ਰਿਕਸ ਘੱਟ-ਸ਼ੁੱਧਤਾ FP16 ਹੋ ਸਕਦੇ ਹਨ।

ਅਭਿਆਸ ਵਿੱਚ, ਇਹ ਮਾਡਲ ਦੀ ਅੰਤਮ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ 'ਤੇ ਬਹੁਤ ਘੱਟ ਪ੍ਰਭਾਵ ਦੇ ਨਾਲ ਗਣਨਾਵਾਂ ਨੂੰ ਬਹੁਤ ਤੇਜ਼ ਕਰਦਾ ਹੈ। ਇਸ ਸਮਰੱਥਾ ਨੂੰ ਬਾਅਦ ਵਿੱਚ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਦੁਆਰਾ ਹੋਰ ਵੀ ਘੱਟ ਸਟੀਕ ਕੰਪਿਊਟਰ ਨੰਬਰ ਪ੍ਰਸਤੁਤੀਆਂ ਤੱਕ ਵਧਾਇਆ ਗਿਆ ਹੈ।

ਪਹਿਲੀ ਪੀੜ੍ਹੀ ਨੂੰ V100 ਤੋਂ ਸ਼ੁਰੂ ਹੋਣ ਵਾਲੇ ਵੋਲਟਾ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਨਾਲ ਪੇਸ਼ ਕੀਤਾ ਗਿਆ ਸੀ, ਹਰ ਲੰਘਦੀ ਪੀੜ੍ਹੀ ਦੇ ਨਾਲ ਨਵੇਂ GPU ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਦੇ ਨਾਲ ਗਣਨਾ ਲਈ ਵਧੇਰੇ ਕੰਪਿਊਟਰ ਨੰਬਰ ਸ਼ੁੱਧਤਾ ਫਾਰਮੈਟ ਉਪਲਬਧ ਕਰਵਾਏ ਗਏ ਸਨ।

ਅਸੀਂ ਇਸ ਬਾਰੇ ਗੱਲ ਕਰਾਂਗੇ ਕਿ ਕਿਵੇਂ ਟੈਂਸਰ ਕੋਰ ਦੀ ਸਮਰੱਥਾ ਅਤੇ ਕਾਰਜਕੁਸ਼ਲਤਾ ਅਗਲੇ ਭਾਗ ਵਿੱਚ ਹਰੇਕ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਪੀੜ੍ਹੀ ਦੇ ਨਾਲ ਬਦਲੀ ਅਤੇ ਸੁਧਾਰੀ ਗਈ ਹੈ।

ਇਹ ਵੀ ਵੇਖੋ: ਪਾਈਕਸ, ਸਪੀਅਰਸ, & ਲੈਂਸ (ਵਿਖਿਆਨ ਕੀਤਾ) - ਸਾਰੇ ਅੰਤਰ

ਟਾਈਟਨ V ਦੁਆਰਾ ਬਣਾਈ ਗਈ ਇੱਕ ਗ੍ਰਾਫਿਕਲੀ ਰੂਪ ਵਿੱਚ ਪੇਸ਼ ਕੀਤੀ ਗਈ ਤਸਵੀਰ

ਟੈਂਸਰ ਕੋਰ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ?

ਪਹਿਲੀ ਪੀੜ੍ਹੀ:

ਵੋਲਟਾ GPU ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਨੂੰ ਟੈਂਸਰ ਕੋਰ ਦੀ ਪਹਿਲੀ ਪੀੜ੍ਹੀ ਦੇ ਨਾਲ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ। ਇਹਨਾਂ ਕੋਰਾਂ ਨੇ ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਅਤੇ FP16 ਨੰਬਰ ਫਾਰਮੈਟ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣਾ ਸੰਭਵ ਬਣਾਇਆ ਹੈ।

ਇਸ ਨਾਲ ਕੁਝ GPUs ਲਈ teraFLOP ਥਰੂਪੁੱਟ ਵਿੱਚ 12x ਤੱਕ ਦਾ ਵਾਧਾ ਹੋ ਸਕਦਾ ਹੈ। ਟਾਪ-ਟੀਅਰ V100 ਦੇ 640 ਕੋਰ ਪਿਛਲੀ ਪੀੜ੍ਹੀ ਦੇ ਪਾਸਕਲ GPUs ਦੇ ਮੁਕਾਬਲੇ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਗਤੀ ਵਿੱਚ 5 ਗੁਣਾ ਵਾਧਾ ਦਿੰਦੇ ਹਨ।

ਦੂਜੀ ਪੀੜ੍ਹੀ:

ਟਿਊਰਿੰਗ GPUs ਦੀ ਸ਼ੁਰੂਆਤ ਦੇ ਨਾਲ, ਟੈਂਸਰ ਕੋਰ ਦੀ ਦੂਜੀ ਪੀੜ੍ਹੀ ਪੇਸ਼ ਕੀਤੀ ਗਈ ਸੀ। Int8, Int4, ਅਤੇ Int1 ਨੂੰ ਸਮਰਥਿਤ ਟੈਂਸਰ ਕੋਰ ਸ਼ੁੱਧਤਾਵਾਂ ਦੀ ਸੂਚੀ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ, ਜੋ ਕਿ ਸਨਪਹਿਲਾਂ FP16 ਤੱਕ ਸੀਮਿਤ ਸੀ।

ਮਿਕਸਡ ਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆਵਾਂ ਦੇ ਕਾਰਨ, ਪਾਸਕਲ GPUs ਦੇ ਮੁਕਾਬਲੇ GPU ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਥ੍ਰਰੂਪੁਟ ਨੂੰ 32 ਗੁਣਾ ਤੱਕ ਵਧਾਇਆ ਗਿਆ ਸੀ।

ਤੀਜੀ ਜਨਰੇਸ਼ਨ:

ਇੱਕ ਐਂਪੀਅਰ GPU ਵਿੱਚ ਆਰਕੀਟੈਕਚਰ FP64, TF32, ਅਤੇ bfloat16 ਸ਼ੁੱਧਤਾਵਾਂ ਲਈ ਸਮਰਥਨ ਜੋੜ ਕੇ ਵੋਲਟਾ ਅਤੇ ਟਿਊਰਿੰਗ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰਜ਼ ਦੀਆਂ ਪੁਰਾਣੀਆਂ ਤਰੱਕੀਆਂ 'ਤੇ ਫੈਲਦਾ ਹੈ।

ਇਨ੍ਹਾਂ ਵਾਧੂ ਸਟੀਕਸ਼ਨ ਫਾਰਮੈਟਾਂ ਦੁਆਰਾ ਡੂੰਘੀ ਸਿੱਖਣ ਦੀ ਸਿਖਲਾਈ ਅਤੇ ਅਨੁਮਾਨ ਗਤੀਵਿਧੀਆਂ ਨੂੰ ਹੋਰ ਤੇਜ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, TF32 ਫਾਰਮੈਟ FP32 ਵਾਂਗ ਹੀ ਕੰਮ ਕਰਦਾ ਹੈ ਜਦੋਂ ਕਿ ਬਿਨਾਂ ਕਿਸੇ ਕੋਡ ਨੂੰ ਬਦਲੇ 20x ਸਪੀਡਅੱਪ ਦੀ ਗਰੰਟੀ ਵੀ ਦਿੰਦਾ ਹੈ।

ਫਿਰ, ਕੋਡ ਦੀਆਂ ਕੁਝ ਲਾਈਨਾਂ ਦੇ ਨਾਲ, ਆਟੋਮੈਟਿਕ ਮਿਕਸਡ ਸ਼ੁੱਧਤਾ ਲਾਗੂ ਕਰਨ ਨਾਲ ਸਿਖਲਾਈ ਨੂੰ ਇੱਕ ਵਾਧੂ 2x ਦੀ ਗਤੀ ਮਿਲੇਗੀ।

ਤੀਜੀ ਪੀੜ੍ਹੀ ਦਾ NVLink ਬਹੁਤ ਤੇਜ਼ ਮਲਟੀ-ਜੀਪੀਯੂ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ, ਤੀਜੀ ਪੀੜ੍ਹੀ ਦੇ ਰੇ ਟਰੇਸਿੰਗ ਕੋਰ, ਅਤੇ ਸਪਾਰਸ ਮੈਟ੍ਰਿਕਸ ਗਣਿਤ ਨਾਲ ਵਿਸ਼ੇਸ਼ਤਾ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਲਈ ਐਂਪੀਅਰ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ ਦੇ ਵਾਧੂ ਪਹਿਲੂ ਹਨ

ਚੌਥੀ ਪੀੜ੍ਹੀ:

ਟੈਂਸਰ ਕੋਰ ਦੀ ਹੌਪਰ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ-ਅਧਾਰਿਤ ਚੌਥੀ ਪੀੜ੍ਹੀ ਦੇ ਭਵਿੱਖ ਵਿੱਚ ਰਿਲੀਜ਼ ਦੀ ਯੋਜਨਾ ਹੈ। ਅਗਲੇ H100 ਵਿੱਚ ਚੌਥੀ ਪੀੜ੍ਹੀ ਦੇ ਟੈਂਸਰ ਕੋਰ।

ਜੋ ਕਿ ਮਾਰਚ 2022 ਵਿੱਚ ਰਿਲੀਜ਼ ਹੋਣ ਦੀ ਉਮੀਦ ਹੈ, FP8 ਸ਼ੁੱਧਤਾ ਫਾਰਮੈਟਾਂ ਨੂੰ ਸੰਭਾਲਣ ਦੇ ਯੋਗ ਹੋਵੇਗਾ ਅਤੇ, NVIDIA ਦੇ ਅਨੁਸਾਰ, ਇੱਕ ਹੈਰਾਨੀਜਨਕ 30X ਦੁਆਰਾ ਵਿਸ਼ਾਲ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਤੇਜ਼ ਕਰੇਗਾ। ਪਿਛਲੀ ਪੀੜ੍ਹੀ ਤੋਂ ਵੱਧ।”

ਇੱਕ RTX ਗ੍ਰਾਫਿਕਸ ਕਾਰਡ ਹੈਗ੍ਰਾਫਿਕਸ ਨੂੰ ਬਹੁਤ ਤੇਜ਼ੀ ਨਾਲ ਰੈਂਡਰ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ ਕਿਉਂਕਿ ਇਸ ਵਿੱਚ ਟੈਂਸਰ ਕੋਰ ਹੁੰਦੇ ਹਨ।

CUDA ਕੋਰ ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਵਿੱਚ ਅੰਤਰ

ਟੈਂਸਰ ਕੋਰ ਵਰਤਮਾਨ ਵਿੱਚ Titan V ਅਤੇ Tesla V100 ਤੱਕ ਸੀਮਿਤ ਹਨ। ਦੋਨਾਂ GPUs 'ਤੇ 5120 CUDA ਕੋਰਾਂ ਵਿੱਚ ਇੱਕ ਸਿੰਗਲ ਸ਼ੁੱਧਤਾ ਗੁਣਾ-ਇਕਮੁਲ ਕਾਰਜ (ਉਦਾਹਰਨ ਲਈ, fp32 ਵਿੱਚ: x += y * z) ਪ੍ਰਤੀ GPU ਘੜੀ (ਜਿਵੇਂ ਕਿ Tesla V100 PCIe ਫ੍ਰੀਕੁਐਂਸੀ 1.38Gz ਹੈ) ਦੀ ਅਧਿਕਤਮ ਸਮਰੱਥਾ ਹੈ।

ਹਰੇਕ ਟੈਂਸਰ ਕੋਰ ਛੋਟੇ ਮੈਟ੍ਰਿਕਸ ਲਈ 4×4 ਛੋਟੇ ਮੈਟ੍ਰਿਕਸ 'ਤੇ ਕੰਮ ਕਰਦਾ ਹੈ। ਪ੍ਰਤੀ ਇੱਕ GPU ਘੜੀ, ਹਰੇਕ ਟੈਂਸਰ ਕੋਰ ਇੱਕ ਮੈਟ੍ਰਿਕਸ ਗੁਣਾ-ਇਕਮੁਲੇਟ ਕਾਰਵਾਈ ਨੂੰ ਪੂਰਾ ਕਰ ਸਕਦਾ ਹੈ।

ਇਹ ਦੋ 4×4 FP16 ਮੈਟ੍ਰਿਕਸ ਨੂੰ ਗੁਣਾ ਕਰਦਾ ਹੈ ਅਤੇ 4×4 FP32 ਮੈਟ੍ਰਿਕਸ ਜੋੜਦਾ ਹੈ ਜਿਸਦਾ ਨਤੀਜਾ ਐਕਯੂਮੂਲੇਟਰ ਹੁੰਦਾ ਹੈ (ਜੋ ਕਿ ਇੱਕ fp32 4×4 ਮੈਟ੍ਰਿਕਸ ਵੀ ਹੈ)।

ਕਿਉਂਕਿ ਇਨਪੁਟ ਮੈਟ੍ਰਿਕਸ fp16 ਹਨ ਜਦੋਂ ਕਿ ਗੁਣਾ ਦੇ ਨਤੀਜੇ ਅਤੇ ਸੰਚਵਕ fp32 ਹਨ, ਐਲਗੋਰਿਦਮ ਨੂੰ ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਵਜੋਂ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ।

ਸਹੀ ਸ਼ਬਦ ਸੰਭਾਵਤ ਤੌਰ 'ਤੇ ਸਿਰਫ਼ "4×4 ਮੈਟ੍ਰਿਕਸ ਕੋਰ" ਹੋਵੇਗਾ, ਪਰ NVIDIA ਮਾਰਕੀਟਿੰਗ ਟੀਮ ਨੇ "ਟੈਂਸਰ ਕੋਰ" ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਚੁਣਿਆ ਹੈ।

ਟੈਂਸਰ ਕੋਰ ਸੰਖੇਪ ਵਿੱਚ ਪੂਰੀ ਵਿਆਖਿਆ

<23
GPU ਕਾਰਡ CUDA ਕੋਰ VRAM
GeForce GTX 1660 Ti 1536 6GB
GeForce GTX 1660 ਸੁਪਰ 1408 6GB
GeForce GTX 1660 1408 6GB
GeForce GTX 1650 Super 1408 4GB
GeForce GTX 1650 1024 ਅਤੇ896 4GB
GeForce GTX 1060 3GB 1280 4GB
GeForce GTX 1650 1280 3GB
GeForce GTX 1060 6GB 768 6GB
GeForce GTX 1050 Ti (3GB) 768 4GB
GeForce GTX 1050 (2GB) 640 3GB
GeForce GTX 960 1024 2GB
GeForce GTX 950 786 2GB
GeForce GTX 780 Ti 2880 2GB
GeForce GTX 780 2304 3GB
GeForce GTX 750 Ti 640 2 GB
GeForce GTX 750 512 1GB ਜਾਂ 2 GB

GPUs ਜਿਨ੍ਹਾਂ ਵਿੱਚ CUDA ਕੋਰ ਹੁੰਦੇ ਹਨ

ਸਿੱਟਾ

  • CUDA ਅਤੇ ਟੈਂਸਰ ਕੋਰ ਉਤਪਾਦ ਹਨ, ਦੋਵੇਂ ਐਨਵੀਡੀਆ ਨਾਮਕ ਕੰਪਨੀ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤੇ ਗਏ ਹਨ। CUDA ਦਾ ਅਰਥ ਹੈ ਕੰਪਿਊਟ ਯੂਨੀਫਾਈਡ ਡਿਵਾਈਸ ਆਰਕੀਟੈਕਚਰ। ਇਹ CUDA ਕੋਰ ਤੁਹਾਡੇ GPU, ਸਮਾਰਟਫ਼ੋਨ ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਤੁਹਾਡੀਆਂ ਕਾਰਾਂ ਵਿੱਚ ਮੌਜੂਦ ਹਨ।
  • ਜਦੋਂ ਕਿ ਟੈਂਸਰ ਕੋਰ, ਜੋ ਕਿ ਐਨਵੀਡੀਆ ਦੁਆਰਾ ਵੀ ਵਿਕਸਤ ਕੀਤੇ ਗਏ ਸਨ, ਜੀਪੀਯੂ ਵਿੱਚ ਵੀ ਵਰਤੇ ਜਾਂਦੇ ਹਨ। "ਟੈਂਸਰ ਕੋਰ" ਨਾਮਕ ਵਿਸ਼ੇਸ਼ ਕੋਰ ਮਿਸ਼ਰਤ-ਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਲਈ ਆਗਿਆ ਦਿੰਦੇ ਹਨ। ਟੈਂਸਰ ਕੋਰ ਦੀ ਪਹਿਲੀ ਪੀੜ੍ਹੀ ਨੇ ਮਿਸ਼ਰਤ ਸ਼ੁੱਧਤਾ ਅਤੇ FP16 ਨੰਬਰ ਫਾਰਮੈਟ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣਾ ਸੰਭਵ ਬਣਾਇਆ ਹੈ।
  • ਇਸ ਨਾਲ ਕੁਝ GPUs ਲਈ teraFLOP ਥਰੂਪੁੱਟ ਵਿੱਚ 12x ਤੱਕ ਦਾ ਵਾਧਾ ਹੋ ਸਕਦਾ ਹੈ। Int8, Int4, ਅਤੇ Int1 ਨੂੰ ਸਮਰਥਿਤ ਟੈਂਸਰ ਕੋਰ ਸ਼ੁੱਧਤਾਵਾਂ ਦੀ ਸੂਚੀ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ।
  • ਮਿਕਸਡ ਦੇ ਕਾਰਨਸ਼ੁੱਧਤਾ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆਵਾਂ, GPU ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ 32 ਗੁਣਾ ਤੱਕ ਵਧਾਇਆ ਗਿਆ ਸੀ। ਟੈਂਸਰ ਕੋਰ ਦੀ ਹੋਪਰ ਮਾਈਕ੍ਰੋਆਰਕੀਟੈਕਚਰ-ਅਧਾਰਤ ਚੌਥੀ ਪੀੜ੍ਹੀ ਦੀ ਭਵਿੱਖੀ ਰੀਲੀਜ਼ ਦੀ ਯੋਜਨਾ ਬਣਾਈ ਗਈ ਹੈ।

ਹੋਰ ਲੇਖ

    Mary Davis

    ਮੈਰੀ ਡੇਵਿਸ ਇੱਕ ਲੇਖਕ, ਸਮਗਰੀ ਨਿਰਮਾਤਾ, ਅਤੇ ਵੱਖ-ਵੱਖ ਵਿਸ਼ਿਆਂ 'ਤੇ ਤੁਲਨਾਤਮਕ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਮਾਹਰ ਖੋਜਕਰਤਾ ਹੈ। ਪੱਤਰਕਾਰੀ ਦੀ ਡਿਗਰੀ ਅਤੇ ਖੇਤਰ ਵਿੱਚ ਪੰਜ ਸਾਲਾਂ ਤੋਂ ਵੱਧ ਦੇ ਤਜ਼ਰਬੇ ਦੇ ਨਾਲ, ਮੈਰੀ ਨੂੰ ਆਪਣੇ ਪਾਠਕਾਂ ਤੱਕ ਨਿਰਪੱਖ ਅਤੇ ਸਿੱਧੀ ਜਾਣਕਾਰੀ ਪ੍ਰਦਾਨ ਕਰਨ ਦਾ ਜਨੂੰਨ ਹੈ। ਲਿਖਣ ਲਈ ਉਸਦਾ ਪਿਆਰ ਉਦੋਂ ਸ਼ੁਰੂ ਹੋਇਆ ਜਦੋਂ ਉਹ ਜਵਾਨ ਸੀ ਅਤੇ ਲੇਖਣੀ ਵਿੱਚ ਉਸਦੇ ਸਫਲ ਕੈਰੀਅਰ ਦੇ ਪਿੱਛੇ ਇੱਕ ਪ੍ਰੇਰਣਾ ਸ਼ਕਤੀ ਰਹੀ ਹੈ। ਮੈਰੀ ਦੀ ਖੋਜ ਅਤੇ ਖੋਜਾਂ ਨੂੰ ਸਮਝਣ ਵਿੱਚ ਆਸਾਨ ਅਤੇ ਦਿਲਚਸਪ ਫਾਰਮੈਟ ਵਿੱਚ ਪੇਸ਼ ਕਰਨ ਦੀ ਯੋਗਤਾ ਨੇ ਉਸਨੂੰ ਪੂਰੀ ਦੁਨੀਆ ਦੇ ਪਾਠਕਾਂ ਲਈ ਪਿਆਰਾ ਬਣਾਇਆ ਹੈ। ਜਦੋਂ ਉਹ ਲਿਖ ਨਹੀਂ ਰਹੀ ਹੁੰਦੀ, ਮੈਰੀ ਨੂੰ ਸਫ਼ਰ ਕਰਨਾ, ਪੜ੍ਹਨਾ ਅਤੇ ਪਰਿਵਾਰ ਅਤੇ ਦੋਸਤਾਂ ਨਾਲ ਸਮਾਂ ਬਿਤਾਉਣਾ ਪਸੰਦ ਹੈ।