По не так давно размещенным неподтвержденным данным, семейство графических микропроцессоров на основе архитектуры Pascal будет одним из самых общих муляжных рядов компании Nvidiа в последнее время. Практически за несколько лет компания продемонстрировала 4 GPU на базе Pascal и при этом не планирует останавливаться на достигнутом. Со слов главы компании, не все микросхемы Pascal, не вспоминая о настоящих продуктах, были показаны. По всей видимости, в скором времени нас ожидают свежие новости.
Nvidiа Pascal: 8 товаров за 4 месяца
Начиная с мая 2014 г Nvidiа продемонстрировала 4 микросхемы на базе Pascal: GP100 c 16 Гигабайт памяти HBM2, GP102 c помощью GDDR5X, GP104 и GP106. При этом организация объявила 8 товаров на базе обозначенных GPU (если не думать за некоторые продукты различного рода особые редакции обозначенных ниже, и специальные устройства вида DGX-1): GeForce GTX 1080/1070 (GP104), GeForce GTX 1060 (GP106), Титан X (GP102 + 12 Гигабайт GDDR5X), Quadro P5000 (GP104GL + 16 Гигабайт GDDR5X), Quadro P6000 (GP102GL + 24 Гигабайт GDDR5X), Тесла P100 SXM и Тесла P100 PCIe (обе на основе GP100 + 16 Гигабайт HBM2).
Впрочем 4 GPU и 8 товаров за 4 месяца это очень великолепное завоевание, существенно, что организация не продемонстрировала ни единого нового решения для компьютеров, и ни одной новой видеокарты выгоднее $250. Со слов главы Nvidiа, организация делает свежие GPU на основе Pascal, они есть в кремнии, однако на рынок выйдут только через определенное время.
Nvidiа: Все Pascal способны, не все показаны
«Мы разработали, проверяли и начали изготовление всех GPU на основе архитектуры Pascal», — заявил Дженсен Хуанг (Jen-Hsun Huang), директор Nvidiа, в процессе телеконференции с инвесторами и денежными специалистами. «Но мы пока не продемонстрировали все эти графические микропроцессоры».
Nvidiа GeForce GTX 1080
Учитывая утечки из базы данных AIDA64 (свежие данные включатся в БД платформы на основании объявленной помощи в драйверах Nvidiа), кроме GP100, GP102, GP104 и GP106, в семейство Pascal также будут входить микропроцессоры GP107 и GP108. Заключительные 2 — GPU сравнительно незначительного объема с сокращенным энергопотреблением, которые будут применяться для компьютеров, и для групповых графических карт (стоимостью ниже $250). Так что, модельный ряд микросхем Pascal будет содержать 6 GPU. Для аналогии, семейство Maxwell состояло из 5-и микросхем (General Motors107, General Motors108, General Motors200, General Motors204, General Motors206), из аналогичного числа состояло и семейство Kepler (GK104, GK107, GK110, GK208 и GK220, который был применен только для ускорителей вычислений).
GP102: микросхема-загадка
Как нетрудно увидеть, из типического ряда Nvidiа несколько отбивается схема GP102 (иcпользуется для Титан X и Quadro P6000), которая владеет 3840 потоковыми микропроцессорами и сопоставимой с GP100 вычисляемой производительностью с одинарной правильностью (single precision/SP, FP32). Этот GPU не сохраняет врожденных вычислений с двойной правильностью (double precision/DP, FP64), не сохраняет форсирования вычислений при половинной правильности (half precision, FP16), не соединим с внешним видом NVLink, применяет память GDDR5X вместо HBM2 (что предполагает определенное облегчение контроллера с одновременным повышением габаритов физических интерфейсов работы с DRAM), однако сохраняет аппаратное шифрование/декодирование видео в разных сегодняшних форматах (HEVC/H.265, H.264 и т. д.).
Nvidiа Титан X
Все-таки, разница между GP100 и GP102 вполне может быть намного более значительной, чем представляется изначально: GP102 состоит из 12 млн транзисторов, в то время как GP100 содержит 16,3 млн транзисторов; площадь ядра GP102 составляет 470 миллиметров2 против 610 миллиметров2 у GP100. Разницу в 4,3 млн транзисторов и 140 миллиметров2 площади (транзисторный расчет и габариты ядра производительного мобильного процессора) трудно разъяснить только полномочиями в сфере вычислений и возможностью вести взаимодействие с микропроцессорами IBM POWER8+.
По всей видимости, все дело в том, что GP102 имеет другую (сравнивая с GP100) конфигурацию потоковых мультипроцессоров (streaming multiprocessors, СМС), аналогичную той, что применяет GP104: 128 потоковых микропроцессоров (stream processors, SPs) на 1 SM у GP102/GP104, против 64 SP на 1 SM у GP100. Аналогичная форма вдвое повышает площадь, которую занимает правящая разумность для любого SM (буфер инструкций, планировщик задач, диспетчер и т. д.), но попутно даёт вероятность в два раза повысить объем регистрового документа, дешевого для SP, что имеет резон для суперкомпьютерных вычислений, однако будет иметь самые низкие превосходства в графических целях. Также, GP100 может владеть некоторыми сокрытыми полномочиями, которые пока не были открыты. Вероятно, речь идёт о каких-то особых направлениях (и специальных ускорителях внутри GPU), внедрённых в микросхему для потребностей точных клиентов (мы видели такой подход у микропроцессоров Intel Xeon) из мира суперкомпьютеров.
GP100 и GP104: Одна архитектура, большое количество отличий. Картинка с AnandTech
При всём этом, для повышенной мощности в графических дополнениях — как игровых, так и квалифицированных — прекрасно подходит GP102, применяемый на Титан X и Quadro P6000. По всей видимости, мы следим картину, когда Nvidiа сделала похожие микросхемы для супервычислений (high-performance computing, HPC) и графики, которые основываются на одной архитектуре, однако имеют важно различное внутреннее здание и, как следствие, возможности.
Имеет ли экономический резон планировать отдельную микросхему (пускай и, на самом деле, на основе другой) для 2-ух–четырёх товаров (2 на основе GP102 и 2 на основе GP102GL) — это вопрос к Nvidiа. Но логично, что образование специальных микропроцессоров для HPC и графических задач принесло ряд плюсов для двух видов дополнений. Так, суперкомпьютеры приобрели самые лучшие возможности в сфере выполнения кода совместного предназначения (с учётом специфичности HPC), но клиенты игровых карт приобрели большее потребление и отличный потенциал для ускорения.
Свежие конфигурации
Тем не менее, энтузиазм для приверженцев игр и энтузиастов мощности представляют не столько GP107, GP108 и внутреннее здание GP102, сколько тот факт, что любая схема Pascal будет жить как минимум в 2-ух стандартных конфигурациях (с позиции личного номера PCIe ID, который применяет драйвер Nvidiа). Это открывает возможности для образования массы свежих товаров на основе микросхем GP100, GP102, GP104 и GP106.
Так, GP104 есть в конфигурации GP104-A и GP104-B, и в качестве модификаций с включённым ускорением для квалифицированных дополнений — GP104GL-A и GP104GL-B. Мы не знаем, чему как раз отвечают буквы «A» и «B», однако можем допустить, что «A» означает микросхему в предельной конфигурации. Так что, GP104-A может отвечать GeForce GTX 1080, но GP104-B — GeForce GTX 1070.
Учитывая, что микросхемы GP102 и GP106 также есть в 2-ух конфигурациях (как бы там ни было, про это рассказывают информационная база AIDA64 и драйверы Nvidiа), однако при этом на их основе присутствует только по одному продукту (GeForce GTX 1060 и Титан X), мы вполне можем ждать возникновения свежих решений на их базе. Будут ли эти карты стремительней либо медленнее имеющихся — покажет время. Как бы там ни было, GP102 может масштабироваться как «наверх» (до 3840 потоковых микропроцессоров), так и «вверх». При этом, конечно, невозможно ликвидировать гипотетичной возможности возникновения 3-ей версии GP102-С, в случае, если она потребуется Nvidiа.
В любом случае, логично, что Nvidiа рассчитывает увеличивать семейство графических карт на основе Pascal. Впрочем обозримые проекты очевидно должны содержать мобильные и групповые GPU, весьма возможно, что в дальнейшем нас ожидают свежие решения для высокопроизводительных игровых ПК.