Как включить отключенные Потоковые процессоры (SM)?

Я использую NVIDIA Quadro K2000 GPU. Я побежал deviceQuery.exe, результаты которого приведены ниже. Он говорит, что у меня есть только 2 см единиц. Я не уверен, если у меня действительно есть только 2 SMs или некоторые из моих SMs отключены, как упоминалось в третий комментарий на этот SO вопрос.

Я также видел, что число SP 192 на СМ. Может быть, есть какой-то способ включить больше SM, а затем количество SP на SM будет уменьшенный.

image

обновление: причина, по которой я спрашиваю, заключается в том, что я хочу сделать свою обработку GPU эффективной. У меня есть изображение 1080 x 1920, которое я разделил на три сегмента. Я передаю эти сегменты H2D, обрабатывая и передавая d2h асинхронно. Поэтому я хочу выбрать такие размеры блоков и количество потоков на блок, который может эффективно использовать аппаратную конфигурацию моего ГПУ. Кроме того, я до сих пор путают, что ГПУ имея более чем 2 смс (скажем 8 смс), но меньшим числом спс за см (384/8 = 48 СП на СМ) бы проанализировать же в ГПУ имея 2 смс и 192 спс за см ? я имею в виду, имеет ли значение общее количество доступных СФС?

12
задан Community
10.12.2022 8:05 Количество просмотров материала 3105
Распечатать страницу

1 ответ

по порядку:

  1. Я не уверен, если у меня действительно есть только 2 SMs или некоторые из моих SMs отключены

    ваш GPU-GK107. Он имеет два SMX, каждый со 192 SP. Нет отключенных процессоров.

  2. May быть [sic] некоторый путь включить больше SM и после этого число SP в SM уменьшит.

    никакой волшебный путь изменять кремний в програмном обеспечении.

  3. Я до сих пор путают, что ГПУ имея более чем 2 смс (скажем 8 смс), но меньшим числом спс за см (384/8 = 48 СП на СМ) бы проанализировать же в ГПУ имея 2 смс и 192 спс за см ?

    Это огромный вопрос и я не буду пытаться ответить здесь. NVIDIA выпустила много очень подробных технических описаний архитектуры и производительности различных поколений своих флагманских вычислительных карт, как каждый из них был освобожденный. Если вы так склонны, я предлагаю прочитать их для себя. Сказав это, эмпирическое правило заключается в том, что в пределах одного поколения архитектуры чем больше SM или SMX имеет устройство, тем лучше оно будет выполнять арифметические связанные операции. Сравнение разных поколений графических процессоров бесполезно. Например, самая первая вычислительная карта Telsa, выпущенная NVIDIA, имеет 16 см (C860). Самый последний имеет 15 SMX (K40). Разница в около 10 времен в их пиковое одиночном точности исполнения. Обратите внимание также, что многие приложения реального мира связаны пропускной способностью памяти, и это может радикально изменить разницу в производительности между различными картами. В то время как количество ядер и пиковый флоп более или менее следовали закону Мура, bandwdith памяти-нет.

1
отвечен talonmies 2022-12-11 15:53

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх