Когда дело доходит до графических процессоров, Nvidia - ведущий эксперт. Находясь в бизнесе с 1993 года, Nvidia произвела широкий спектр высококачественных профессиональных и потребительских графических процессоров. Уважаемые архитектуры их процессоров лежат в основе успеха их продуктов, особенно их основной линейки, GeForce. Графические процессоры Nvidia вышли за рамки игрового пространства, расширив свое присутствие в области глубокого обучения, ИИ (искусственного интеллекта) и ускоренной аналитики. Nvidia проникла на рынок центров обработки данных десять лет назад, начав с чипов Fermi. Были сделаны последующие итерации, и компания постоянно выпускала графические процессоры, удовлетворяющие ненасытный спрос на более высокую скорость обработки в центрах обработки данных. Графические процессоры Nvidia развивались на протяжении многих лет, и дизайн архитектуры в первую очередь способствует эволюции.
Архитектура Ampere от Nvidia
Конкуренция среди производителей графических процессоров очень жесткая, но Nvidia ничего не сдерживает, чтобы занять первое место. Фактически, Nvidia доминировала на рынке искусственного интеллекта в последнее десятилетие. В 2020 году новости о первом 7-нм (8-нм для потребительских компонентов) графическом процессоре Nvidia с 54 миллиардами транзисторов, сжатых в таком маленьком кристалле, вызвали настоящий ажиотаж. Под кодовым названием Ампер после французского математика Андре-Мари Ампера, Архитектура процессора Nvidia значительно улучшена по сравнению с ее предшественниками, Turing и Volta, обещая больше функциональных возможностей, лучшую эффективность и более высокую производительность при более низких уровнях мощности. Ampere стоит за вторым поколением графических процессоров RTX от Nvidia, серией RTX 30, и, как говорят, в два раза быстрее, чем их аналоги серии RTX 20. Архитектура Ampere также является движущей силой графических процессоров для центров обработки данных Nvidia A100.
Технические характеристики Ампера
Ampere - это первый 7-нм / 8-нм графический процессор Nvidia, второе поколение потребительской трассировки лучей и третье поколение тензорных ядер. Ampere - это базовая архитектура графических процессоров GA100, GA102 и GA104, которые встроены в GeForce RTX 3090, RTX 3080, RTX 3070 и, в последнее время, в RTX 3060. Nvidia также планирует выпустить RTX 3050 в следующие месяцы. Между тем, корпоративный графический процессор GA100 обеспечивает в 20 раз большую вычислительную мощность, чем графические процессоры для центров обработки данных предыдущих поколений. Вот обзор профессиональных и потребительских графических процессоров Nvidia Ampere [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Видеокарта | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Процесс (нм) | TSMC N7 | Samsung 8N | Samsung 8N | Samsung 8N |
Транзисторы (млрд) | 54 | 28 год.3 | 28 год.3 | 17.4 |
Размер матрицы (мм ^ 2) | 826 | 628.4 | 628.4 | 392.5 |
Конфигурация GPC | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
Смс | 108 | 82 | 68 | 46 |
Ядра CUDA | 6912 | 10496 | 8704 | 5888 |
Ядра RT | Никто | 82 | 68 | 46 |
Тензорные ядра | 432 | 328 | 272 | 184 |
Частота разгона (МГц) | 1410 | 1700 | 1710 г | 1730 |
Скорость видеопамяти (Гбит / с) | 2.43 год | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (ГБ) | 40 (48 макс.) | 24 | 10 | 8 |
Ширина автобуса | 5120 (6144 макс.) | 384 | 320 | 256 |
ROP | 128 | 112 | 96 | 96 |
TMU | 864 | 656 | 544 | 368 |
GFLOPS FP32 | 19492 | 35686 | 29768 | 20372 |
RT TFLOPS | N / A | 69 | 58 | 40 |
Тензор TFLOPS FP16 (разреженный) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Пропускная способность (ГБ / с) | 1555 | 936 | 760 | 448 |
TBP (Вт) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia A100
Nvidia A100 - первый графический процессор, использующий архитектуру Ampere. Корпоративный чип предназначен для центров обработки данных и предназначен для задач с интенсивным использованием графических процессоров, таких как глубокое обучение и искусственный интеллект. Построенный по 7-нм техпроцессу TSMC, он содержит огромное количество из 54 миллиардов транзисторов. Он превзошел предыдущие поколения корпоративных графических процессоров с 20-кратным увеличением производительности благодаря 6912 ядрам CUDA, 432 блокам отображения текстур, 160 ROP, тензорным ядрам третьего поколения и 40 ГБ видеопамяти с пропускной способностью памяти, которая достигает максимума в 1.6 ТБ / сек. DGX A100 - первая в мире система искусственного интеллекта с кластером из восьми A100 и внушительной ценой в 199 000 долларов.
GeForce RTX 30 серии
Помимо доминирования на корпоративном рынке, Nvidia всегда думает о потребителях, особенно о геймерах и создателях. Архитектура Ampere также используется в потребительских видеокартах Nvidia. Второе поколение GeForce RTX оснащено графическими процессорами на базе Ampere, которые увеличивают производительность вдвое по сравнению с предыдущим поколением.
В большинстве аспектов вычислительная мощность Ampere более чем в два раза превосходит вычислительную мощность Тьюринга. Он удвоил производительность шейдеров Тьюринга с вдвое большим количеством ядер FP32 CUDA. В частности, он имеет 30 шейдерных терафлопс, 2.В 7 раз больше, чем у Тьюринга, что составляет всего 11 шейдерных терафлопс. Точно так же тензорное ядро Тьюринга измеряет 89 тензорных терафлопс, но Ampere более чем удвоил эту скорость со своими 238 тензорными терафлопсами. Не забывайте про скорость ядра трассировки лучей, которая составляет 58 RT-TFLOPS, 1.В 7 раз быстрее, чем у Тьюринга 34 RT-TFLOPS, а чтобы графические процессоры работали еще быстрее, чип Ampere подключается к самой быстрой памяти в мире, Micron G6X.
Серия RTX 30 сделана с использованием Samsung 8N Nvidia Custom Process с 28 миллиардами транзисторов для GA102 и 17 миллиардов транзисторов для GA104. RTX 3090 класса Titan оснащен графическим процессором GA102 и обеспечивает чрезвычайно высокую производительность потребительских карт. В отличие от предыдущих поколений, RTX 3090 открыт для сторонних разработчиков для индивидуального проектирования.
RTX 3080 также использует графический процессор GA102, обеспечивающий вдвое большую производительность, чем RTX 2080, и впечатляющее игровое мастерство 4K. RTX 3070 на базе графического процессора GA104 находится на одном уровне с RTX 2080 Ti за половину цены. Недавно выпущенный RTX 3060 также неизменно поражает своей потрясающей производительностью благодаря улучшенным ядрам трассировки лучей, тензорным ядрам, новым потоковым мультипроцессорам и высокоскоростной памяти G6.
Несмотря на значительное увеличение производительности, новые графические процессоры RTX не слишком тяжелы для карманов. Гораздо более быстрые видеокарты легко доступны, если говорить о ценах. Флагман Nvidia GeForce, RTX 3080, стоит от 699 долларов, RTX 3070 продается по цене 499 долларов, а RTX 3060 стоит 329 долларов. Более дорогая RTX 3090 стоит 1499 долларов; по-прежнему довольно дешевый, учитывая его производительность на уровне Титана.
Спустя всего несколько месяцев после его выпуска, как сообщается, наблюдается нехватка видеокарт на базе Ampere, и неудивительно, что его потрясающая производительность по разумной цене. Для тех, кто рассматривает возможность обновления графического процессора, сейчас лучшее время, чтобы заполучить графические процессоры Nvidia на базе Ampere.
Источники
[1] Уолтон, Джарред. «Глубокое погружение в архитектуру Ampere от Nvidia RTX 30-й серии: все, что мы знаем». https: // www.Томсаппаратное обеспечение.com / Features / NVIDIA-ампер-архитектура-глубокое погружение. 13 октября 2020 г.