Планируется, что архитектура Nvidia Ada и предполагаемые видеокарты серии GeForce RTX 40 появятся к концу года и, вероятно, в период с сентября по октябрь. Это через два года после архитектуры Nvidia Ampere и в основном точно по графику, учитывая замедление (или, если хотите, смерть) «Закона Мура». Благодаря взлому Nvidia в начале этого года у нас, по-видимому, достаточно информации о том, чего ожидать. Мы собрали все в этом центральном хабе, подробно описав все, что мы знаем и ожидаем от архитектуры Nvidia Ada и семейства RTX 40-й серии.
Сейчас ходит множество слухов, и Nvidia очень мало рассказала о своих планах в отношении Ады, которую некоторые попеременно называют Lovelace. Что мы действительно знаем, так это то, что Nvidia подробно описала свой графический процессор Hopper H100 для центра обработки данных, и мы подозреваем, что, как и в случае с Volta V100 и Ampere A100, потребительские продукты появятся в недалеком будущем.
Это последнее, пожалуй, лучший пример того, чего ожидать. A100 был официально представлен в мае 2020 года, когда потребительские графические процессоры Ampere были запущены в виде RTX 3080 и RTX 3090 около четырех месяцев спустя. Если Nvidia будет следовать аналогичному графику выпуска графических процессоров Ada Lovelace, мы можем ожидать, что серия RTX 40 появится где-то в августе или сентябре. Давайте начнем с общего обзора слухов о спецификациях графических процессоров серии Ada.
графический процессор | AD102 | AD103 | AD104 | AD106 | AD107 |
---|---|---|---|---|---|
Технология процесса | ТСМС 4Н | ТСМС 4Н | ТСМС 4Н | ТСМС 4Н | ТСМС 4Н |
Количество транзисторов | 60Б? | 40Б? | 30Б? | 20Б? | 15Б? |
SM / CU | 144 | 84 | 60 | 36 | 24 |
Ядра графического процессора | 18432 | 10752 | 7680 | 4608 | 3072 |
Тензорные ядра | 576 | 336 | 240 | 144 | 96 |
Ядра РТ | 144 | 84 | 60 | 36 | 24 |
Повышенная тактовая частота (МГц) | 1600-2000 | 1600-2000 | 1600-2000 | 1600-2000 | 1600-2000 |
Общий кэш L2 (МБ) | 96 | 64 | 48 | 32 | 32 |
Скорость видеопамяти (Гбит/с) | 21-24 | 21-24 | 16-21 | 16-21 | 14-21 |
Ширина шины VRAM | 384 | 256 | 192 | 128 | 128 |
ROP | 128-196? | 112? | 96? | 64? | 48? |
TMU | 576 | 336 | 240 | 144 | 96 |
TFLOPS FP32 (ускорение) | 59-73,7 | 34.4-43 | 24,6-30,7 | 14,7-18,4 | 9,8-12,3 |
TFLOPS FP16 (тензор) | 472-590 | 275-344 | 197-246 | 118-147 | 79-98 |
Пропускная способность (Гбит/с) | 1008-1152 | 672-768 | 384-504 | 256-336 | 224-336 |
TDP (Вт) | <600 | <450 | <300 | <225 | <150 |
Оценка цены | 1000 долларов США+ | 600-1000 долларов | 450-600 долларов | $300-$450 | 200-300 долларов |
Во- первых, к вышеуказанной информации нужно применить огромные порции соли. Мы поставили предварительные оценки тактовой частоты для графических процессоров от 1,6 до 2,0 ГГц, что соответствует предыдущим архитектурам Nvidia Ampere, Turing и даже Pascal. Вполне возможно, что Nvidia превысит эти частоты, поэтому мы считаем это консервативной оценкой.
Мы исходим из того, что Nvidia будет использовать процесс 4N TSMC — «4nm Nvidia» — на всех графических процессорах Ada, что опять же может быть технически неверным. Мы знаем, что Hopper H100 использует узел 4N от TSMC, который в основном выглядит как измененный вариант узла N5 от TSMC, который широко используется в чипах Apple для смартфонов и ноутбуков и, по слухам, является узлом, который Nvidia будет использовать для Ada.
Честно говоря, имя узла не так важно, как фактические характеристики и производительность графического процессора. Другими словами, роза под любым другим названием пахла бы так же сладко. Мы уже давно прошли точку, когда имена узлов процесса имеют какую-либо реальную связь с физическими характеристиками чипа. В чипах размером 250 нм (или 0,25 микрона) на самом деле были элементы, на которые можно было указать и измерить ширину 0,25 мкм, физическое масштабирование чипов замедлилось с появлением нескольких последних технологических узлов, и теперь они просто маркетинговые названия.
Количество транзисторов — лучшее предположение на данный момент. Мы знаем, что Hopper H100 будет иметь 80 миллиардов транзисторов (это всего лишь приблизительная цифра, но мы с этим смиримся). Графический процессор A100 имел 56 миллиардов транзисторов, что вдвое больше, чем у потребительского чипа Halo GA102, но есть признаки того, что Nvidia будет «добиваться больших успехов» с графическим процессором AD102 и что он может быть ближе по размеру к H100, чем GA102 к GA100. Мы обновим таблицы, если и когда появится достоверная информация, но пока любые заявления о количестве транзисторов — это просто разные предположения, чем наши.
Теоретически, основываясь на «просочившейся» информации, которую мы видели до сих пор, Ада выглядит монстром. Он будет включать гораздо больше SM и связанных ядер, чем текущие графические процессоры Ampere, что должно обеспечить существенное повышение производительности. Даже если Ada окажется меньше, чем заявлено утечками, можно с уверенностью сказать, что мы увидим производительность топового графического процессора — возможно, RTX 4090, хотя Nvidia может снова изменить номенклатуру — это будет большой шаг вперед по сравнению с RTX 3090 Ti.
Например, RTX 3080 была примерно на 30% быстрее, чем RTX 2080 Ti при запуске, а RTX 3090 прибавила еще 15%, по крайней мере, если вы довели GPU до предела, работая на 4K Ultra. Что также следует иметь в виду. Если вы в настоящее время используете более скромный процессор, а не один из лучших процессоров для игр,Core i9-12900K или Ryzen 7 5800X3D, вы вполне можете получить ограничение по процессору даже при ультравысоком разрешении 1440p. Скорее всего, потребуется более крупное обновление системы, чтобы получить максимальную отдачу от самых быстрых графических процессоров Ada.
АДА ЗНАЧИТЕЛЬНО ПОВЫСИТ ПРОИЗВОДИТЕЛЬНОСТЬ ВЫЧИСЛЕНИЙ
Оставив общий обзор, давайте перейдем к деталям. Наиболее заметным изменением графических процессоров Ada будет количество SM по сравнению с текущим поколением Ampere. В верхней части AD102 потенциально содержит на 71% больше SM, чем GA102. Даже если в архитектуре больше ничего существенно не изменится, мы ожидаем огромного прироста производительности.
Это относится не только к графике, но и к другим элементам. Мы используем расчеты Ampere для производительности ядра Tensor, и полностью включенный чип AD102, работающий на частоте около 2 ГГц, будет иметь скорость вычислений глубокого обучения/ИИ до 590 TFLOPS в FP16. Для сравнения, GA102 в RTX 3090 Ti достигает максимума около 321 TFLOPS FP16 (с использованием функции разреженности Nvidia). Это теоретическое увеличение на 84%, исходя из количества ядер и тактовой частоты. Тот же теоретический прирост производительности на 84% должен применяться и к оборудованию для трассировки лучей.
Это если Nvidia не переработает ядра RT и ядра Tensor для соответствующих реализаций третьего и четвертого поколений. Мы подозреваем, что нет особой необходимости в массовых изменениях ядер Tensor — большие улучшения в оборудовании для глубокого обучения будут больше для Hopper H100, чем для Ada AD102 — хотя мы можем ошибаться. Между тем, ядра RT могли легко увидеть улучшения, которые улучшают производительность RT на ядро еще на 25–50% по сравнению с Ampere, точно так же, как Ampere был примерно на 75% быстрее на ядро RT, чем Turing.
В худшем случае, просто перенос архитектуры Ampere с процесса 8N от Samsung Foundry на процесс TSMC 4N (или 5N или что-то еще) и ничего не меняя в архитектуре, добавление большего количества ядер и сохранение аналогичных тактовых частот должно обеспечить более чем достаточный прирост производительности поколения. Nvidia может сделать гораздо больше, чем минимум, но даже чип AD107 нижнего уровня будет представлять собой твердое улучшение на 30% или более по сравнению с текущей RTX 3050.
Имейте в виду, что указанные значения SM относятся к полному чип, и, скорее всего, Nvidia будет использовать частично отключенные чипы для повышения производительности. Например, Hopper H100 имеет 144 потенциальных SM, но только 132 SM включены в варианте SXM5, а карта PCIe 5.0 будет иметь 114 SM. Вероятно, мы увидим, как Nvidia выпустит топовое решение AD102 (то есть RTX 4090) с включенным где-то между 132 и 140 SM, а модели более низкого уровня будут использовать меньше SM. Это, конечно, оставляет дверь открытой для будущей карты (например, RTX 4090 Ti) с полностью включенным AD102 после того, как производительность улучшится.
УГАДЫВАНИЕ ROP АДЫ
Мы поставили вопросительные знаки после подсчета ROP (результатов рендеринга) на всех графических процессорах Ada, поскольку мы еще не знаем, как они настроены. В Ampere Nvidia связала ROP с GPC, кластерами обработки графики. Каждый GPC содержит определенное количество SM (потоковых мультипроцессоров), которые можно отключать попарно. Однако, даже если мы знаем количество SM, мы не знаем, как они делятся на GPC.
Возьмем AD102 со 144 SM. Это может быть 12 ОПК по 12 СМ в каждой, 8 ОПК по 18 СМ в каждой или 9 ОПК по 16 СМ в каждой. Существуют и другие возможности, но эти три мы считаем наиболее вероятными. Nvidia не новичок в игре с графическими процессорами, поэтому, каким бы ни было расположение, в конечном итоге мы должны ожидать, что оно будет соответствовать потребностям графического процессора.
Мы видели некоторые предположения, предполагающие, что GA102 будет иметь 12 GPC по 12 SM в каждом, что даст максимум 192 ROP. Это не исключено, но обратите внимание, что Hopper H100 имеет восемь кластеров GPC по 18 SM в каждом, поэтому такая конфигурация также кажется разумной для AD102 — только без HBM3 и с меньшим вниманием к оборудованию для глубокого обучения.
СОМНИТЕЛЬНЫЕ УТЕЧКИ И СЛУХИ
Опять же, отказ от ответственности в порядке. Цифра 144 SM для AD102… подозрительна. По совпадению, чип Hopper H100 также имеет всего 144 SM, из которых 132 включены в предложение высшего уровня прямо сейчас. Было бы очень удивительно, если бы Ада и Хоппер имели одинаковые 144 SM. У GA100 было максимум 120 SM, поэтому с H100 Nvidia увеличила количество SM только на 20%. Напротив, предполагаемые утечки показывают, что AD102 имеет на 71% больше SM, чем GA102.
У нас сейчас нет ничего лучше, поэтому мы сообщаем о слухах о цифре 144 SM, но не удивляйтесь, если это окажется полной чушью. Тот факт, что Nvidia была взломана и произошла утечка данных, не означает, что все, что было получено, было точным. Потенциально Nvidia было бы лучше настроить архитектуру для более высоких тактовых частот и использовать меньше SM, подобно тому, как AMD сделала с RDNA 2, но это может потребовать более значительного пересмотра базовой архитектуры.
С другой стороны, есть по крайней мере одна веская причина для того, чтобы AD102 был огромным чипом: профессиональные графические процессоры. Nvidia не производит полностью отдельные микросхемы для потребительского и профессионального рынков, о чем свидетельствуют чипы серии A, такие как RTX A6000. В нем используется тот же чип GA102, что и в RTX 3080–3090 Ti, только с несколькими дополнительными функциями, включенными в драйверах. Трассировка лучей на самом деле не произвела фурор в игровом мире, но имеет большое значение для профессионального рынка, и добавление еще большего количества ядер RT было бы благом для ферм 3D-рендеринга. Также обратите внимание, что Hopper H100 не включает оборудование для трассировки лучей, как и GA100, которое он заменяет.
Различные графические процессоры Ada также будут использоваться для платформ логического вывода, использующих алгоритмы искусственного интеллекта и машинного обучения, что опять же означает, что можно будет использовать больше ядер Tensor и вычислений. Итак, суть в том, что предполагаемый максимум 144 SM не совсем исключен, но он, безусловно, требует здоровой дозы скептицизма. Возможно, взлом Nvidia обнаружил устаревшую информацию, или люди неправильно ее интерпретировали. Мы узнаем больше в ближайшие месяцы.
ПОДСИСТЕМА ПАМЯТИ: GDDR6X СНОВА НА ВЫСОТЕ
Недавно Micron объявила, что у нее есть дорожные карты для памяти GDDR6X, работающей со скоростью до 24 Гбит/с. Последняя RTX 3090 Ti использует только память 21 Гбит/с, и Nvidia в настоящее время является единственной компанией, использующей GDDR6X для чего- либо. Это сразу же поднимает вопрос о том, что будет использовать 24 Гбит/с GDDR6X, и единственным разумным ответом кажется Nvidia Ada. Графические процессоры более низкого уровня, скорее всего, будут придерживаться стандартной GDDR6, а не GDDR6X, максимальная скорость которой составляет 18 Гбит/с.
Это представляет собой небольшую проблему, поскольку графическим процессорам обычно требуются вычислительные мощности и пропускная способность для пропорционального масштабирования, чтобы реализовать обещанный уровень производительности. Например, RTX 3090 Ti имеет на 12% больше вычислений, чем 3090, а более высокая тактовая частота памяти обеспечивает на 8% большую пропускную способность. Если наши оценки вычислений, приведенные выше, окажутся хотя бы близкими к точным, назревает огромный разрыв. Гипотетическая RTX 4090 может иметь примерно на 80% больше вычислений, чем RTX 3090 Ti, но только на 14% больше пропускной способности.
На графических процессорах нижнего уровня гораздо больше возможностей для роста пропускной способности, если предположить, что энергопотребление GDDR6X можно контролировать. Текущие версии RTX 3050 — RTX 3070 используют стандартную память GDDR6 с тактовой частотой 14–15 Гбит/с. Мы уже знаем, что GDDR6 со скоростью 18 Гбит/с будет доступна для Ada со временем, поэтому гипотетическая RTX 4050 с GDDR6 18 Гбит/с должна легко справиться с увеличением вычислительной мощности графического процессора. Если Nvidia по-прежнему нуждается в большей пропускной способности, она может использовать GDDR6X и для графических процессоров более низкого уровня.
Также существует небольшая вероятность того, что графические процессоры Ada более высокого уровня могут оказаться в паре с GDDR7 или, возможно, с «GDDR6+» от Samsung.Сообщается, что скорость будет достигать 27 Гбит/с. Однако мы не слышали конкретных подробностей ни об одном из них, и на данном этапе Nvidia потребуется, чтобы ее партнеры наращивали производство памяти. Увеличение производства неизбежно приведет к увеличению утечек, и, поскольку мы не видели утечек производства GDDR7 или GDDR6+, мы предполагаем, что со временем их не будет.
Более вероятно, что Nvidia не потребуется значительного увеличения чистой пропускной способности памяти, потому что вместо этого она переработает архитектуру, подобно тому, что мы видели, что AMD сделала с RDNA 2 по сравнению с исходной архитектурой RDNA.
АДА НАДЕЕТСЯ ЗАРАБОТАТЬ НА КЭШЕ L2
Один отличный способ уменьшить потребность в большей необработанной пропускной способности памяти — это то, что известно и используется на протяжении десятилетий. Добавьте больше кеша в чип, и вы получите больше попаданий в кеш, а каждое попадание в кеш означает, что графическому процессору не нужно извлекать данные из памяти GDDR6/GDDR6X. Кэш AMD Infinity Cache позволил чипам RDNA 2 в основном делать больше с меньшей пропускной способностью, а просочившаяся информация о кэше Nvidia Ada L2 предполагает, что Nvidia применит несколько аналогичный подход.
AMD использует массивный кэш L3 размером до 128 МБ на графическом процессоре Navi 21, с 96 МБ на Navi 22, 32 МБ на Navi 23 и всего 16 МБ на Navi 24. Удивительно, но даже меньший кэш 16 МБ творит чудеса с подсистемой памяти. Мы не думали, что Radeon RX 6500 XTВ целом это была отличная карта, но в основном она не отставала от карт с почти вдвое большей пропускной способностью памяти.
Архитектура Ada, по-видимому, связывает кэш L2 объемом 8 МБ с каждым 32-разрядным контроллером памяти. Это означает, что карты со 128-битным интерфейсом памяти получат 32 МБ общего кэша L2, а карты с 384-битным интерфейсом в верхней части стека будут иметь 96 МБ кэш-памяти L2. Хотя в некоторых случаях это меньше, чем у AMD Infinity Cache, мы пока не знаем задержек или других аспектов дизайна. Кэш L2, как правило, имеет меньшие задержки, чем кеш L3, поэтому немного меньший L2 определенно может идти в ногу с большим, но более медленным кешем L3.
Если мы посмотрим на AMD RX 6700 XT в качестве примера, у него примерно на 35% больше вычислений, чем у RX 5700 XT предыдущего поколения. Производительность в нашей иерархии тестов GPUв то же время примерно на 32% выше при разрешении 1440p Ultra, поэтому общая производительность масштабируется в значительной степени в соответствии с вычислениями. За исключением того, что 6700 XT имеет 192-битный интерфейс и пропускную способность всего 384 ГБ/с, что на 14% меньше, чем 448 ГБ/с у RX 5700 XT. Это означает, что большой Infinity Cache дал AMD 50-процентное увеличение эффективной пропускной способности.
Предполагая, что Nvidia может получить аналогичные результаты с Ada, возьмите увеличение пропускной способности на 14%, которое достигается за счет памяти 24 Гбит / с, а затем соедините это с увеличением эффективной пропускной способности на 50%. Это дало бы AD102 примерно на 71% большую эффективную пропускную способность, что достаточно близко к увеличению вычислительной мощности графического процессора, чтобы все должно было работать хорошо.
Тем не менее, необходимо больше заявлений о слухах о кеше. Nvidia опубликовала множество подробностей о Hopper H100. Он действительно имеет больший размер кэша L2, чем GA100 предыдущего поколения, но не 8 МБ на контроллер памяти. Фактически, общий объем кэш-памяти L2 на H100 составляет 50 МБ, по сравнению с 40 МБ L2 у A100. Но Hopper также использует память HBM3 и будет использоваться с большими наборами данных, поэтому у него 80 ГБ графической памяти. Все, что не помещается в 40 МБ, вряд ли уместится и в 50 МБ, и даже в 150 МБ. Потребительские рабочие нагрузки и, в частности, игры, скорее всего, выиграют от большего кэша. Здесь Nvidia может пойти по стопам AMD, или слухи могут оказаться совершенно неверными.
АДА ЭНЕРГОПОТРЕБЛЕНИЕ
Одним из элементов архитектуры Ada, который наверняка вызовет удивление, будет энергопотребление. Игорь из Igor’s Lab был первым, кто сообщил слухи о 600 Вт TBP (типичная мощность платы) для Ada, и когда мы впервые услышали это, мы рассмеялись. «Ни за что», — подумали мы. Графические карты Nvidia в течение многих лет работали на максимальной мощности около 250 Вт, и скачок Ampere до 350 Вт на RTX 3090 (а позже и на RTX 3080 Ti) уже казался несколько чрезмерным. Затем Nvidia объявила спецификации Hopper H100 и выпустила RTX 3090 Ti, и вдруг 600 Вт не казались такими уж маловероятными.
Все это восходит к концу масштабирования Деннарда, одновременно со смертью закона Мура. Проще говоря, масштабирование Деннарда — также называемое масштабированием MOSFET — показало, что с каждым поколением размеры могут уменьшаться примерно на 30%. Это уменьшило общую площадь на 50% (масштабирование как по длине, так и по ширине), напряжение упало на такие же 30%, а задержки цепи также уменьшились на 30%. Кроме того, частота увеличится примерно на 40%, а общее энергопотребление уменьшится на 50%.
Если все это звучит слишком хорошо, чтобы быть правдой, то это потому, что масштабирование Деннарда фактически перестало происходить где-то в 2007 году. Как и закон Мура, оно не сработало полностью, но выгоды стали гораздо менее выраженными. Тактовая частота в интегральных схемах только увеличилась с максимума около 3,7 ГГц в 2004 году для Pentium 4 Extreme Edition до сегодняшнего максимума в 5,5 ГГц для Core i9-12900KS. Это по-прежнему увеличение частоты почти на 50%, но это произошло за шесть поколений (или более, в зависимости от того, как вы хотите считать) улучшений узла процесса. Иными словами, если бы масштабирование Деннарда не умерло, современные процессоры работали бы на частоте 28 ГГц. Покойся с миром, масштабирование Деннарда, тебя будет не хватать.
Умерло не только масштабирование частоты, но и масштабирование мощности и напряжения. Сегодня новый технологический узел может улучшить плотность транзисторов, но необходимо сбалансировать напряжения и частоты. Если вам нужен чип, который в два раза быстрее, вам может потребоваться почти вдвое больше энергии. В качестве альтернативы вы можете построить более эффективный чип, но он не будет быстрее. Похоже, Nvidia выбрала первый вариант с Адой.
Возьмите графический процессор Ampere мощностью 350 Вт, такой как GA102, и повысьте производительность на 70–80%. Таким образом, это будет означать использование на 70–80% больше энергии. Затем 350 Вт становится 595–630 Вт. Nvidia может получить немного больше, чем линейное масштабирование, и 600 Вт, скорее всего, будет максимальным энергопотреблением на эталонных картах, но мы уже слышим слухи о том, что некоторые разогнанные карты следующего поколения от сторонних производителей могут иметь два 16-контактных разъема питания. Зот!
СТАНЕТ ЛИ ADA НА САМОМ ДЕЛЕ RTX 40-Й СЕРИИ?
Остается вопрос, как будут называться графические процессоры Nvidia следующего поколения. Мы предложили серию RTX 40, придерживаясь модели, установленной несколькими последними поколениями, но Nvidia всегда может что-то изменить. Одна из возможных причин изменения: китайская «неприязнь» к числу четыре, которое также означает смерть на кантонском диалекте и мандаринском наречии.
Это достаточно веская причина, чтобы изменить ситуацию? Возможно нет. Конечно, мы видели много графических карт и других продуктов для ПК с цифрой «4» в номере модели на протяжении многих лет. Nvidia вложила много денег в свой бренд RTX, и хотя это может быть не так интересно, если все точно угадают названия следующей серии графических процессоров, в конечном итоге важны продажи.
Как бы ни назывались графические карты Ada, это не изменит их производительности или функций. Большинство из нас обоснованно убеждены, что Nvidia будет использовать названия серии RTX 40, но это не конец света, если Nvidia изменит ситуацию.
СКОЛЬКО БУДУТ СТОИТЬ КАРТЫ RTX 40-Й СЕРИИ?
Короткий и верный ответ заключается в том, что они будут стоить столько, сколько Nvidia может обойтись без зарядки. Nvidia запустила Ampere с одним набором финансовых моделей, которые оказались совершенно неверными для эпохи пандемии Covid. Реальные цены подскочили, а скальперы нажились, и это было до того, как майнеры криптовалюты начали платить в два-три раза больше официальных рекомендованных цен. Даже сейчас мы все еще видим наценки в размере 30% и более. Хорошая новость заключается в том, что цены на графические процессоры снижаются.
Скорее всего, цены на графические процессоры поколений вырастут с Ada и RTX 40-й серии. Тем не менее, предполагаемые большие кэши L2 и относительно ограниченное увеличение пропускной способности памяти должны привести к тому, что Ada обеспечит лишь незначительное увеличение производительности майнинга по сравнению с Ampere, точно так же, как карты AMD RDNA 2 лишь немного быстрее, чем модели RDNA. Это означает, что майнинг сам по себе почти наверняка не сможет поддерживать чрезвычайно завышенные цены, которые мы наблюдали с конца 2020 до начала 2022 года, даже если прибыльность майнинга «восстановится» до прибытия Ады.
В зависимости от того, где спрос и предложение на существующие карты появятся в сентябре, мы не удивимся, увидев запуск топовых видеокарт AD102 со стартовой ценой 999 долларов за базовую модель (вероятно, RTX 4080) с более высокой производительностью «RTX 4090». «взяв цену RTX 3090 Ti за 1999 долларов. Возможно, Nvidia даже возродит бренд Titan для Ada, хотя, скорее всего, этот корабль уже уплыл — похоже, слишком много профессионалов использовали Titan, чтобы не покупать видеокарты Quadro или A-серии.
Как мы обсудим в следующем разделе, у Nvidia также нет причин немедленно переводить все производство графических процессоров с Ampere на Ada. Скорее всего, мы увидим, что графические процессоры серии RTX 30 будут производиться еще довольно долго, тем более что никакие другие графические процессоры или процессоры не конкурируют за производство Samsung Foundry 8N. Nvidia выиграет, сначала представив карты Ada высокого класса, используя всю доступную емкость, которую она может получить от TSMC, и, при необходимости, снизив цены на существующие карты RTX 30, чтобы закрыть любые дыры.
Реальность такова, что цены — это одна из последних частей головоломки, которую собирают. В прошлом мы видели изменения цен в последнюю минуту на довольно много видеокарт. AMD RX 5700 XT и RX 5700 были объявлены для прессы по цене 499 и 399 долларов соответственно, а затем упали до 399 и 349 долларов через неделю после фактического запуска. Прямо сейчас, за несколько месяцев до розничной доступности, никто точно не знает, где окажутся цены. Существует несколько планов на случай непредвиденных обстоятельств, и какой из них будет выбран, будет определен за неделю или две до того, как карты официально поступят в продажу.
ИЗМЕНИТ ЛИ NVIDIA ДИЗАЙН FOUNDERS EDITION?
Nvidia сделала много заявлений о дизайне своей новой карты Founders Edition при запуске RTX 3080 и 3090. Хотя карты в целом работают нормально, за последние 18 месяцев мы обнаружили, что традиционные карты с осевым охлаждением от стороннего AIC партнеры, как правило, лучше охлаждаются и работают тише, даже при использовании большей мощности. GeForce RTX 3080 Ti Founders Edition была особенно вопиющим примером того, как температура и скорость вращения вентилятора не соответствовали более горячим графическим процессорам.
Теперь, учитывая слухи о энергопотреблении, которое в некоторых случаях почти вдвое превышает то, что мы наблюдали у Ampere, трудно представить, что Nvidia придерживается нынешнего промышленного дизайна. Возможно, потребуется всего несколько настроек, но есть причина, по которой все карты RTX 3090 Ti занимают три или более слота. Если у Nvidia действительно есть деталь мощностью 600 Вт, ей потребуется обеспечить исключительное охлаждение, чтобы отводить тепло, в идеале выводить его из корпуса.
Насколько нам известно, не было никаких утечек, которые могли бы показать, как будут выглядеть карты Ada, ни от Nvidia, ни от ее партнеров. Это имеет смысл, так как до розничной продажи еще довольно много месяцев. Мы, вероятно, получим несколько просочившихся изображений за месяц или два до официального запуска, а это означает, что, пока нет утечек изображений, до большого раскрытия, вероятно, осталось не менее двух месяцев.
КОГДА БУДУТ ВЫПУЩЕНЫ ГРАФИЧЕСКИЕ ПРОЦЕССОРЫ ADA?
Мы неоднократно упоминали сентябрьские сроки запуска графических процессоров Ada и RTX 40-й серии, но важно помнить, что первые карты Ada будут лишь верхушкой айсберга. Nvidia выпустила RTX 3080 и RTX 3090 в сентябре 2020 года, RTX 3070 появилась через месяц, а чуть более месяца спустя появилась RTX 3060 Ti. RTX 3060 вышла только в конце февраля 2021 года, затем Nvidia обновила серию, выпустив RTX 3080 Ti и RTX 3070 Ti в июне 2021 года. Недорогая RTX 3050 появилась только в январе 2022 года, и, наконец, RTX 3090. Ti был запущен в конце марта 2022 года.
Мы также ожидаем постепенного запуска карт Ada, начиная с самых быстрых моделей и заканчивая высококлассными и массовыми предложениями, а бюджетные модели AD106 и AD107, скорее всего, появятся не раньше 2023 года. Как мы только что отметили, RTX 3050 была выпущена только в конце января, поэтому замена не потребуется еще как минимум год, если не дольше. Опять же, нам все еще нужны действительно бюджетные предложения, чтобы заменить серии GTX 1660 и GTX 1650. Можем ли мы получить новую серию GTX или настоящую бюджетную карту RTX менее чем за 200 долларов? Это возможно, но не рассчитывайте на это, так как Nvidia, похоже, довольна тем, что AMD и Intel борются в ценовом диапазоне менее 200 долларов.
Примерно через год после первоначального запуска неизбежно произойдет обновление предложений Ada. На данном этапе можно только догадываться, станут ли они моделями «Ti» или «Super» или чем-то еще, но вы можете отметить это в своем календаре.
БОЛЬШЕ КОНКУРЕНЦИИ В ПРОСТРАНСТВЕ ГРАФИЧЕСКИХ ПРОЦЕССОРОВ
Nvidia уже несколько десятилетий является доминирующим игроком на рынке видеокарт. Он контролирует примерно от 80 до 90 процентов всего рынка графических процессоров и в значительной степени может диктовать создание и внедрение новых технологий, таких как трассировка лучей и DLSS. Однако в связи с продолжающимся ростом важности ИИ и вычислений для научных исследований и других вычислительных рабочих нагрузок, а также их зависимостью от процессоров, подобных графическим процессорам, многие другие компании стремятся проникнуть в отрасль, главным из которых является Intel.
Intel не предпринимала надлежащих попыток создания выделенной видеокарты с конца 90-х годов, если не считать недоработанную Larrabee. На этот раз Intel Arc кажется реальной сделкой — или, по крайней мере, ногой в двери. Похоже, что Intel больше сосредоточилась на мультимедийных возможностях, и жюри по-прежнему не принимает решения, когда речь заходит об игровых или общих вычислительных возможностях Arc. Насколько нам известно, лучшие потребительские модели в лучшем случае будут работать только в диапазоне 18 TFLOPS. Посмотрите на нашу таблицу вверху, и похоже, что она будет конкурировать только с AD106.
Но Arc Alchemist — это всего лишь первый в регулярной череде архитектур графических процессоров, запланированных Intel. Battlemage может легко удвоить возможности Alchemist, и если Intel сможет сделать это раньше, чем позже, она может начать отъедать долю рынка Nvidia, особенно в области игровых ноутбуков.
AMD тоже не будет стоять на месте, и она несколько раз заявляла, что «на пути» к запуску своей архитектуры RDNA 3 к концу года. Мы ожидаем, что AMD перейдет на узел TSMC N5, а это означает, что она, скорее всего, будет напрямую конкурировать с Nvidia за пластины, и обеим компаниям придется принимать аналогичные конструктивные решения. До сих пор AMD избегала внедрять какое-либо оборудование для глубокого обучения в свои потребительские графические процессоры (в отличие от своей серии MI200), но поскольку Arc также включает ядра Xe Matrix, ей, возможно, придется переосмыслить этот подход.
Также нет никаких сомнений в том, что Nvidia в настоящее время обеспечивает гораздо более высокую производительность трассировки лучей, чем карты AMD серии RX 6000, но AMD не так громко заявляет об аппаратном обеспечении трассировки лучей или необходимости эффектов RT в играх. Intel, со своей стороны, похоже, может обеспечить даже меньшую производительность RT, чем AMD. Но пока большинство игр продолжают работать быстрее и хорошо выглядят без эффектов RT, убедить людей обновить свои видеокарты будет непростой задачей.
Это были долгие два года засух GPU и карт с завышенными ценами. 2022 год обещает стать первым настоящим ажиотажем в области графических процессоров с 2020 года. Надеемся, что в этом раунде будет гораздо лучшая доступность и цены. Едва ли это может быть хуже того, что мы видели за последние 18 месяцев.