Автоматты аударма пайдаланылды

FP8: жасанды интеллект модельдерін оқыту және шығару трансформациясы

Қарқынды дамып келе жатқан жасанды интеллект (AI) әлемінде есептеу тиімділігі мен өнімділігі инновацияның маңызды қозғаушы күші болып табылады. Өзгермелі нүктелік форматтар көптен бері сандық есептеулердің негізі болды, ал FP32 (32 биттік) және FP16 (16 биттік) форматтары жасанды интеллект модельдерін оқытуда және логикалық қорытындылар шығаруда басым болды. Дегенмен, 8 биттік fp8 пішімінің пайда болуы Жасанды интеллект арқылы есептеу тиімділігін арттырудағы маңызды қадам болып табылады. Бұл мақалада FP8 дегеніміз не, ол қалай жұмыс істейді және қазіргі заманғы жасанды интеллект жүйелері үшін неге маңызды бола бастайды.

FP8 дегеніміз не?

FP8-дәлдік пен диапазон балансы бар сандарды өтеактам түрде көрсетуге арналған 8 биттік өзгермелі нүкте пішімі. Өзгермелі нүктелік көріністер, тұрақты нүктелік көріністерден айырмашылығы, сандарды кодтау үшін мантисса (немесе мәндер) мен көрсеткіштердің тіркесімін пайдаланады, бұл оларға өте кішкентай және өте үлкен мәндерді тиімді көрсетуге мүмкіндік береді. FP8-де бұл компоненттер тек 8 битке дейін қысылған, бұл дәстүрлі түрде есептеу техникасында қолданылатын 32 биттік (FP32) немесе 16 биттік (FP16) форматтармен салыстырғанда айтарлықтай аз.

FP8 форматы екі негізгі нұсқада келеді, олардың екеуі де IEEE p3109 жұмыс тобымен стандартталған және оларды аппараттық өндірушілер кеңінен қолданады:

  • E4M3 (4 биттік экспонент, 3 биттік мантисса): бұл конфигурация белгі үшін 1 бит, экспонент үшін 4 бит және мантисса үшін 3 бит бөледі. Ол кіші сандар үшін жоғары дәлдікті қамтамасыз етеді, максималды мәні шамамен 448.
  • E5M2 (5 биттік көрсеткіш, 2 биттік мантисса): мұнда 1 бит белгіге, 5 бит көрсеткішке және 2 бит мантиске сәйкес келеді. Бұл опция шамамен 57344-ке дейінгі мәндерді сақтай отырып, кеңірек диапазон үшін кейбір дәлдікті құрбан етеді.

Бұл екі нұсқа әзірлеушілерге нақты пайдалану жағдайларына байланысты дәлдік пен динамикалық диапазон арасындағыроманы таңдауға мүмкіндік береді, бұл FP8 жасанды интеллект жұмыс жүктемелері үшін әмбебап етеді.

Жасанды интеллект үшін fp8 артықшылықтары

1. Жадты пайдалану тиімділігі

FP8 жад талаптарын FP32-мен салыстырғанда 4 есе және FP16/BF16-мен салыстырғанда 2 есе төмендетеді. Миллиардтаған параметрлері бар үлкен тілдік модельдер үшін бұл дегеніміз:

  • Кіші модель өлшемдері
  •  Жадтың өткізу қабілеттілігінің төмендетілген талаптары
  • Қолданыстағы жабдыққа үлкен модельдерді орнату мүмкіндігі

2. Есептеу өнімділігі

Hopper архитектурасы бар NVIDIA графикалық процессорлары сияқты заманауи үдеткіштерде fp8 мамандандырылған тензор ядролары бар, олар матрицалық операцияларды жоғары дәлдіктегі форматтарға қарағанда тезірек орындай алады. Бұл қамтамасыз етеді:

  • Оқу операциялары үшін өткізу қабілеттілігі 4 есе жоғары
  • Логикалық шығыс операциялары үшін өткізу қабілеттілігі 6 есе жоғары
  • Бір операцияға энергия тұтынуды азайту

3. Масштабтау мүмкіндіктері

FP8 арқасында тиімділікті арттыру мүмкіндік береді:

  • Бірдей ресурстарды қолдана отырып, үлкенірек модельдерді үйрету
  • Мүмкіндігі шектеулі заманауи құрылғыларда модельдерді қолдану
  • Ai жаттығулары мен логикалық қорытындылардан көміртегі ізін азайту

Қазіргі заманғы FP8 қосымшалары

Үлкен тілдік модельдер

NVIDIA, Google және Meta сияқты компаниялар FP8-ді дәлдікті айтарлықтай жоғалтпай, үлкен тілдік модельдерді оқыту және дәл баптау үшін пайдалануға болатындығын көрсетті. NVIDIA Hopper архитектурасы transformer негізіндегі модельдер үшін FP8-мен жұмыс істеуге бағытталған.

Компьютерлік көру

Машиналық көру модельдері оқу үшін де, шығару үшін де fp8 тиімділігінің пайдасын көреді, әсіресе смартфондар мен ендірілген жүйелер сияқты ресурстары шектеулі құрылғыларға орналастырылған кезде.

Нақты уақыттағы жасанды интеллект жүйелері

Автономды жүргізу, робототехника және нақты уақыттағы аударма сияқты төмен кідірісті қажет ететін қосымшалар FP8 ұсынған жоғары шығыс жылдамдығынан пайда көреді.

Үйлесімді NVIDIA графикалық процессорлары

Барлық графикалық процессорлар FP8 форматын қолдамайды. 2025 жылдың бірінші тоқсанындағы жағдай бойынша келесі NVIDIA құрылғылары FP8 үйлесімді :

  • NVIDIA Hopper GPU: H100, H200, H800
  •  NVIDIA L4 және L40S модельдері: ең алдымен оқуға емес, AI шығаруға арналған
  •  NVIDIA ' s Blackwell GPU: B100, B200, 5000 сериясы

FP8-ді қолдау үшін NVIDIA H100 сияқты заманауи графикалық процессорларда жаңа тензор ядролары енгізілді. Олар 8 биттік операциялар үшін оңтайландырылған, бұл өткізу қабілеттілігін айтарлықтай арттырады және қуат тұтынуды азайтады. Бұл жетілдіру деректерді тиімдірек және жылдам өңдеуге мүмкіндік береді, бұл графикалық процессорларды ai және шығыс тапсырмаларын үйрету үшін өте қолайлы етеді.

Дереккөздер

Пікірлер 1

Кіру пікір қалдыру үшін

Очень актуальная штука!

Жауап беру