CUDA يادروسى بىلەن تېنزور مەركىزىنىڭ قانداق پەرقى بار؟ (چۈشەندۈرۈلگەن) - بارلىق پەرقلەر

 CUDA يادروسى بىلەن تېنزور مەركىزىنىڭ قانداق پەرقى بار؟ (چۈشەندۈرۈلگەن) - بارلىق پەرقلەر

Mary Davis

CUDA ۋە Tensor يادروسى Nvidia دەپ ئاتىلىدىغان شىركەت تەرىپىدىن ئىشلەپچىقىرىلغان مەھسۇلات. ئۇنداقتا CUDA يادروسى ۋە Tensor يادروسى دېگەن نېمە؟ CUDA ھېسابلاش بىرلىككە كەلگەن ئۈسكۈنە قۇرۇلمىسىنى كۆرسىتىدۇ. Nvidia ئاچقۇچىلار ئېيتقاندەك CUDA مەركىزى سىزنىڭ GPU لىرىڭىز ، ئەقلىي ئىقتىدارلىق تېلېفونلىرىڭىز ، ھەتتا ماشىنىلىرىڭىزدا بار.

CUDA يادروسى پاراللېل ھېسابلاش سۇپىسى ۋە قوللىنىشچان پروگرامما كۆرۈنمە يۈزى (API) بولۇپ ، يۇمشاق دېتالنى ئادەتتىكى تىپتىكى بىر تەرەپ قىلىش ئۈچۈن ئالاھىدە تىپتىكى گرافىك بىر تەرەپ قىلىش ئورۇنلىرى (GPU) دىن پايدىلىنالايدۇ.

قاراڭ: مارس قاۋاقخانىسى VS سامان يولى: قانداق پەرقى بار؟ - بارلىق پەرقلەر

Nvidia تەرىپىدىن ئىجاد قىلىنغان تېنىزور مەركىزىمۇ GPU دا ئىشلىتىلىدۇ. Tensor Cores ئارىلاش ئېنىقلىق ھېسابلاشنى قوزغىتىدۇ ، ھېسابلاشنى ھەرىكەتچان ماسلاشتۇرۇپ ، توغرىلىقنى ساقلاش بىلەن بىللە كىرگۈزۈشنى ئاشۇرىدۇ.

ئاددىي قىلىپ ئېيتقاندا ، بۇ يادرولار سىزنىڭ كومپيۇتېرىڭىزدىكى GPU نىڭ مۇھىم بىر قىسمى. CUDA يادروسى ئىككى ساننى كۆپەيتىش ۋە باشقا سانغا قوشۇشقا ئىشلىتىلىدۇ.

تېنزورنىڭ يادروسى ئوخشاش ، ئەمما 4 × 4 ماترىسسا. بۇ ھېسابلاشلار ئاساسەن سىز ئۈچۈن گرافىكنى تېزرەك كۆرسىتىپ بېرىدۇ.

CUDA دېگەن نېمە؟

Nvidia تەرىپىدىن ئىجاد قىلىنغان قىسقا CUDA دىكى ھېسابلاش بىرلىككە كەلگەن ئۈسكۈنە قۇرۇلمىسى 2007-يىلى 6-ئاينىڭ 23-كۈنى تارقىتىلغان ، پاراللېل ھېسابلاش سۇپىسى ۋە قوللىنىشچان پروگرامما كۆرۈنمە يۈزى (API).

يۇمشاق دېتالنىڭ ئادەتتىكى تىپتىكى بىر تەرەپ قىلىش ئۈچۈن ئالاھىدە تىپتىكى گرافىك بىر تەرەپ قىلىش ئورۇنلىرى (GPU) نى ئىشلىتىشىگە ياردەم بېرىدۇ ، بۇ ئۇسۇل ئادەتتىكى مەقسەت ھېسابلاش دەپ ئاتىلىدۇ.GPUs (GPU).

CUDA يۇمشاق دېتال قەۋىتى بولۇپ ، GPU نىڭ مەۋھۇم كۆرسەتمە توپلىمى ۋە ھېسابلاش مېغىزىنىڭ ئىجرا قىلىنىشى ئۈچۈن پاراللېل ھېسابلاش ئېلېمېنتلىرىنى بىۋاسىتە زىيارەت قىلالايدۇ. CUDA C ، C ++ ۋە Fortran قاتارلىق ئوخشىمىغان پروگرامما تىللىرى بىلەن ئىشلەش ئۈچۈن ياسالغان.

ئوخشىمىغان پروگرامما تىلى بىلەن ئىشلەش ئىقتىدارى پاراللېل پروگرامما تۈزۈش مۇتەخەسسىسلىرىنىڭ GPU بايلىقىدىن پايدىلىنىشىنى ئاسانلاشتۇرىدۇ ، ئەگەر بىز Direct3D ياكى OpenGL غا ئوخشاش ئالدىنقى API لاردىن پەرقلەنسەك ، بۇ سىزنىڭ تېخىمۇ ئىلغار بولۇشىڭىزنى تەلەپ قىلىدۇ. گرافىكلىق پروگرامما تۈزۈشتىكى ماھارەت ئاساسى.

CUDA بىلەن GPU يەنە پروگرامما رامكىسىنى قوللايدۇ ، مەسىلەن OpenMP ، OpenACC ، OpenCL ، شۇنداقلا CUDA غا بۇ خىل كودلارنى تۈزەلەيدىغان HIP. CUDA غا ئىشلىتىلگەن تۇنجى ئىسىم كومپيۇتېر بىرلىككە كەلگەن ئۈسكۈنىلەر قۇرۇلمىسىنىڭ قىسقارتىلمىسى. قانداقلا بولمىسۇن ، Nvidia كېيىن كۆپ ئىشلىتىلىدىغان قىسقارتىلمىنى تاشلىدى.

كۈچلۈك Nvidia گرافىك كارتىسى GTX 1080 Ti

قاراڭ: مىسىرنىڭ پەرقى & amp; كوپتىك مىسىر - بارلىق پەرقلەر

CUDA ھەققىدە تېخىمۇ كۆپ

مەخسۇس كومپيۇتېر بىر تەرەپ قىلغۇچ بولۇش سۈپىتى بىلەن ، گرافىك بىر تەرەپ قىلىش بىرلىكى (GPU) ھەقىقىي ئېھتىياجنى قاندۇردى ۋاقىت ، كومپيۇتېرنى ئاساس قىلىدىغان 3D گرافىكلىق خىزمەت يۈكى.

پاراللېل ھالدا غايەت زور سانلىق مەلۇماتلارنى بىر تەرەپ قىلغاندا ، بۇ لايىھە ئالگورىزىم ئۈچۈن ئادەتتىكى مەقسەت مەركىزى بىر تەرەپ قىلىش ئورۇنلىرىدىن ئۈستۈن تۇرىدۇ ، مەسىلەن:

  • شىفىرلىق hashفۇنكسىيەسى
  • ماشىنا ئۆگىنىشى
  • مولېكۇلا دىنامىك تەقلىد قىلىش
  • فىزىكا ماتورى كەلگۈسىدە
    • 3D گرافىكنىڭ تېز سۈرئەتتە كۆرسىتىلىشى
    • سىن ھۆججىتىنىڭ فورماتلىرىنى تېز سۈرئەتتە ئۆزئارا ئالماشتۇرۇش
    • شىفىرلاش ، شىفىرلاش ۋە پىرىسلاشنى تېزلىتىدۇ
    • بىيو ئۇچۇر تېخنىكىسى ، مەسىلەن ، NGS DNA تەرتىپى BarraCUDA
    • تارقىتىلغان ھېسابلاش ، مەسىلەن ئاقسىلنىڭ يەرلىك ئۆزگىرىشىنى ئالدىن پەرەز قىلىش
    • داۋالاش ئانالىز تەقلىدلىرى ، مەسىلەن CT ۋە MRI سىكانىرلاش رەسىملىرىنى ئاساس قىلغان مەۋھۇم رېئاللىق
    • فىزىكىلىق تەقلىد قىلىش ، بولۇپمۇ سۇيۇقلۇق دىنامىكىسى
    • ماشىنا ئۆگىنىش مەسىلىسىدىكى نېرۋا تورى مەشىقى
    • چىراي تونۇش
    • تارقىتىلغان ھېسابلاش تۈرلىرى ، مەسىلەن [ئېلېكترونلۇق خەت قوغدالدى] ۋە باشقا تۈرلەر. BOINC
    • مولېكۇلا دىنامىكىسى
    • كان ئېچىش مەخپىي شىفىرى
    • ھەرىكەت (SfM) يۇمشاق دېتالىنىڭ قۇرۇلمىسى

    تېنزورنىڭ يادروسى نېمە؟

    Tensor Cores دەپ ئاتىلىدىغان ئالاھىدە يادرو ئارىلاش ئېنىقلىق مەشىقىگە يول قويىدۇ. بۇ ئالاھىدە يادرونىڭ دەسلەپكى ئەۋلادلىرى بىرلەشتۈرۈلگەن كۆپەيتىش ھېسابلاش ئۇسۇلى بىلەن قىلىدۇ. بۇنىڭ بىلەن 4 x 4 FP16 ياكى FP32 ماترىسساغا ئىككى 4 x 4 FP16 ماترىسسا كۆپەيتىش ۋە قوشۇش مۇمكىن.

    ئاخىرقى نەتىجە FP32 بولۇپ ، پەقەت ئازراقلا ئېنىقلىقنى يوقىتىدۇ ، ئارىلاشما ئىنچىكە ھېسابلاش گەرچە شۇنداق بولسىمۇ بېكىتىلگەن.كىرگۈزۈش ماترىسسا تۆۋەن ئېنىقلىقتىكى FP16 بولۇشى مۇمكىن.

    ئەمەلىيەتتە ، بۇ مودېلنىڭ ئاخىرقى ئۈنۈمىگە ئازراق تەسىر كۆرسەتمەي ھېسابلاشنى كۆرۈنەرلىك تېزلىتىدۇ. بۇ سىغىمچانلىقى كېيىنكى مىكرو قۇرۇلما ئارقىلىق تېخىمۇ ئېنىق بولغان كومپيۇتېر نومۇرىغا كېڭەيتىلدى.

    بىرىنچى ئەۋلاد V100 دىن باشلاپ ۋولتا مىكرو قۇرۇلما بىلەن تونۇشتۇرۇلدى ، ھەر بىر ئەۋلاد ئەۋلادلار بىلەن يېڭى GPU مىكرو قۇرۇلما بىلەن ھېسابلاش ئۈچۈن تېخىمۇ كۆپ كومپيۇتېر نومۇرى ئېنىق فورماتى تەمىنلەندى.

    كېيىنكى بۆلەكتىكى ھەر بىر مىكرو قۇرۇلما ئەۋلادلىرى بىلەن Tensor Cores نىڭ ئىقتىدارى ۋە ئىقتىدارىنىڭ قانداق ئۆزگەرگەنلىكى ۋە ياخشىلانغانلىقى ھەققىدە توختىلىمىز.

    تىتان V تەرىپىدىن ياسالغان گرافىكلىق تەسۋىرلەنگەن رەسىم

    تېنزور مەركىزى قانداق ئىشلەيدۇ؟

    بىرىنچى ئەۋلاد:

    ۋولتا GPU مىكرو قۇرۇلمىسى بىرىنچى ئەۋلاد تېنزور مەركىزىگە كىرگۈزۈلدى. بۇ يادرولۇق ئارىلاشما ئېنىقلىق ۋە FP16 نومۇر فورماتى بىلەن مەشىقلەندۈرۈشنى مۇمكىن قىلدى.

    بۇ بەزى GPU لارنىڭ teraFLOP كىرگۈزۈش مىقدارىدا 12 ھەسسە يۇقىرى كۆتۈرۈلۈشى مۇمكىن. ئالدىنقى قاتاردىكى V100 نىڭ 640 يادروسى ئالدىنقى بىر ئەۋلاد Pascal GPU لارغا قارىغاندا ئىقتىدار سۈرئىتىنى 5 ھەسسە ئاشۇرۇشتىن ۋاز كېچىدۇ.

    ئىككىنچى ئەۋلاد:

    Turing GPUs نىڭ ئوتتۇرىغا چىقىشى بىلەن ئىككىنچى ئەۋلاد تېنسور مەركىزى بارلىققا كەلدى. قوللايدىغان Tensor Core ئېنىقلىقلىرى تىزىملىكىگە Int8 ، Int4 ۋە Int1 قوشۇلدىئىلگىرى FP16 بىلەنلا چەكلەنگەن.

    ئارىلاشما ئىنچىكە مەشىق تەرتىپلىرى سەۋەبىدىن ، GPU نىڭ ئىقتىدار كىرگۈزۈش ئۈنۈمى Pascal GPUs غا سېلىشتۇرغاندا 32 ھەسسە ئاشتى.

    ئۈچىنچى ئەۋلاد:

    Ampere GPU دىكى قۇرۇلما FP64 ، TF32 ۋە bfloat16 ئېنىقلىقلىرىنى قوللاش ئارقىلىق ۋولتا ۋە Turing مىكرو قۇرۇلما قۇرۇلمىسىنىڭ ئىلگىرىكى ئىلگىرىلەشلىرىنى كېڭەيتىدۇ.

    چوڭقۇر ئۆگىنىش مەشىقى ۋە خۇلاسە پائالىيىتى بۇ قوشۇمچە فورماتلار ئارقىلىق تېخىمۇ تېزلىشىدۇ. مەسىلەن ، TF32 فورماتى FP32 غا ئوخشاش ئىقتىدار بىلەن تەمىنلەيدۇ ، شۇنىڭ بىلەن بىر ۋاقىتتا ھېچقانداق كودنى ئۆزگەرتمەيلا 20x تېزلىنىشكە كاپالەتلىك قىلىدۇ.

    ئاندىن ، پەقەت بىر نەچچە قۇر كود بىلەنلا ، ئاپتوماتىك ئارىلاش ئېنىقلىقنى يولغا قويۇش قوشۇمچە 2x ئارقىلىق مەشىقنى تېزلىتىدۇ.

    ئۈچىنچى ئەۋلاد NVLink چاقماق تېز سۈرئەتتە كۆپ GPU ئۆز-ئارا تەسىر كۆرسىتىش ، ئۈچىنچى ئەۋلاد Ray Tracing مەركىزى ۋە شالاڭ ماترىسسا ماتېماتىكا بىلەن شۇغۇللىنىش Ampere مىكرو قۇرۇلمىسىنىڭ قوشۇمچە تەرەپلىرى .

    تۆتىنچى ئەۋلاد:

    كەلگۈسىدىكى Hopper مىكرو قۇرۇلمىسىنى ئاساس قىلغان تۆتىنچى ئەۋلاد تېنسور مەركىزىنى ئېلان قىلىش پىلانلاندى. كېيىنكى H100 دىكى تۆتىنچى ئەۋلاد تېنزور مەركىزى. ئالدىنقى ئەۋلادلارغا قارىغاندا. »

    RTX گرافىك كارتىسىگرافىكنى تېز سۈرئەتتە كۆرسىتىشكە ئىشلىتىلىدۇ ، چۈنكى ئۇنىڭدا تېنىزور يادروسى بار. ھەر ئىككى GPU دىكى 5120 CUDA يادروسىنىڭ ئەڭ چوڭ سىغىمى بىر GPU سائىتىگە بىر ئېنىق ئېنىقلىق كۆپەيتىش مەشغۇلاتى (مەسىلەن fp32: x + = y * z) (مەسىلەن تېسلا V100 PCIe چاستوتىسى 1.38Gz).

    ھەر بىر جىددىيلىك يادروسى كىچىك ماترىسسا ئۈچۈن 4 × 4 كىچىك ماترىسسادا مەشغۇلات قىلىدۇ. ھەر بىر GPU سائىتىگە ، ھەر بىر سېنزور يادروسى بىر ماترىسسا كۆپەيتىش مەشغۇلاتىنى تاماملىيالايدۇ.

    ئۇ ئىككى 4 × 4 FP16 ماترىسسانى كۆپەيتىدۇ ۋە ئاككۇمۇلياتورنى ھاسىل قىلىدىغان 4 × 4 FP32 ماترىسسانى قوشىدۇ (بۇمۇ fp32 4 × 4 ماترىسسا).

    كىرگۈزۈش ماترىسكىسى fp16 بولغاچقا ، كۆپەيتىش نەتىجىسى ۋە ئاككۇمۇلياتور fp32 بولغاچقا ، ھېسابلاش ئۇسۇلى ئارىلاش ئېنىقلىق دەپ ئاتىلىدۇ.

    توغرا ئاتالغۇ بەلكىم «4 × 4 ماترىسسا يادروسى» بولۇشى مۇمكىن ، ئەمما NVIDIA سېتىش ئەترىتى «تېنىزور مەركىزى» ئىشلىتىشنى تاللىدى.

    تېڭشۈن قىسقىچە چۈشەنچە بېرىدۇ

    > CUDA ھېسابلاش بىرلىككە كەلگەن ئۈسكۈنىلەر قۇرۇلمىسىنى كۆرسىتىدۇ. بۇ CUDA مەركىزى سىزنىڭ GPU لىرىڭىز ، ئەقلىي ئىقتىدارلىق تېلېفونلىرىڭىز ، ھەتتا ماشىنىلىرىڭىزدا بار.
    GPU كارتىسى CUDA يادروسى VRAM
    GeForce GTX 1660 Ti 1536 6GB
    GeForce GTX 1660 دەرىجىدىن تاشقىرى 1408 6GB
    GeForce GTX 1660 1408 6GB
    GeForce GTX 1650 Super 1408 4GB
    GeForce GTX 1650 1024 ۋە896 4GB
    GeForce GTX 1060 3GB 1280 4GB
    GeForce GTX 1650 1280 3GB
    GeForce GTX 1060 6GB 768 6GB
    GeForce GTX 1050 Ti (3GB) 768 4GB
    GeForce GTX 1050 (2GB) 640 3GB
    GeForce GTX 960 1024 2GB
    GeForce GTX 950 786 2GB
    GeForce GTX 780 Ti 2880 2GB
    GeForce GTX 780 2304 3GB
    GeForce GTX 750 Ti 640 2 GB
    GeForce GTX 750 512 1GB ياكى 2 GB
  • Nvidia تەرىپىدىن ئىجاد قىلىنغان تېنىزور يادروسى GPU دا ئىشلىتىلىدۇ. «تېنىزور يادروسى» دەپ ئاتىلىدىغان ئالاھىدە يادرو ئارىلاش ئېنىقلىق مەشىقىگە يول قويىدۇ. بىرىنچى ئەۋلاد Tensor Cores ئارىلاش ئېنىقلىق ۋە FP16 نومۇر فورماتى بىلەن مەشىق قىلىشنى مۇمكىن قىلدى.
  • بۇ بەزى GPU لارنىڭ teraFLOP كىرگۈزۈش مىقدارىدا 12 ھەسسە يۇقىرى كۆتۈرۈلۈشى مۇمكىن. قوللايدىغان Tensor Core ئېنىقلىقلىرى تىزىملىكىگە Int8 ، Int4 ۋە Int1 قوشۇلدى.
  • ئارىلاشقانلىقتىنئېنىق مەشىق تەرتىپى ، GPU نىڭ ئىقتىدارى 32 ھەسسە يۇقىرى كۆتۈرۈلگەن. كەلگۈسىدىكى Hopper مىكرو قۇرۇلما ئاساسىدىكى تۆتىنچى ئەۋلاد Tensor Cores ئېلان قىلىنىش پىلانلانغان.

باشقا ماقالىلەر

    Mary Davis

    مارى داۋىس ھەر خىل تېمىدىكى سېلىشتۇرۇش ئانالىزى بىلەن شۇغۇللىنىدىغان يازغۇچى ، مەزمۇن ئىجادچىسى ۋە قىزغىن تەتقىقاتچى. ئاخباراتچىلىق ئۇنۋانى ۋە بۇ ساھەدە بەش يىلدىن ئارتۇق تەجرىبىسى بار مەريەمنىڭ ئوقۇرمەنلىرىگە تەرەپسىز ۋە بىۋاسىتە ئۇچۇرلارنى يەتكۈزۈش قىزغىنلىقى بار. ئۇنىڭ يېزىقچىلىققا بولغان مۇھەببىتى ياش ۋاقتىدىن باشلانغان بولۇپ ، ئۇنىڭ يېزىقچىلىقتىكى مۇۋەپپەقىيەت قازىنىشىدىكى ھەرىكەتلەندۈرگۈچ كۈچ بولۇپ كەلگەن. مەريەمنىڭ تەتقىقات ۋە بايقاشلارنى ئاسان چۈشىنىشلىك ۋە جەلپ قىلارلىق شەكىلدە ئوتتۇرىغا قويۇش ئىقتىدارى ئۇنى دۇنيانىڭ ھەرقايسى جايلىرىدىكى ئوقۇرمەنلەرنىڭ ياقتۇرۇشىغا ئېرىشتى. ئۇ يازمىغان ۋاقىتتا ، مەريەم ساياھەت قىلىش ، ئوقۇش ۋە ئائىلىسىدىكىلەر ۋە دوستلىرى بىلەن بىللە ۋاقىت ئۆتكۈزۈشكە ئامراق.