این دستور alt-nvidia-361-smi است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
nvidia-smi - برنامه رابط مدیریت سیستم NVIDIA
خلاصه
nvidia-smi [OPTION1 [ARG1]] [OPTION2 [ARG2]] ...
شرح
nvidia-smi (همچنین NVSMI) قابلیت های نظارت و مدیریت را برای هر یک از آنها فراهم می کند
دستگاه های Tesla، Quadro، GRID و GeForce NVIDIA از فرمی و معماری بالاتر
خانواده ها. دستگاه های سری GeForce Titan برای اکثر عملکردها با بسیار محدود پشتیبانی می شوند
اطلاعاتی که برای بقیه برند Geforce ارائه شده است. NVSMI یک پلت فرم متقابل است
ابزاری که از تمام توزیعهای لینوکس استاندارد NVIDIA و همچنین 64 بیت پشتیبانی میکند
نسخه های ویندوز که با ویندوز سرور 2008 R2 شروع می شود. متریک ها را می توان مصرف کرد
به طور مستقیم توسط کاربران از طریق stdout، یا توسط فایل از طریق فرمت های CSV و XML برای اسکریپت ارائه شده است
اهداف.
توجه داشته باشید که بسیاری از عملکردهای NVSMI توسط NVML مبتنی بر C ارائه می شود
کتابخانه برای اطلاعات بیشتر در مورد NVML به پیوند وب سایت توسعه دهنده NVIDIA در زیر مراجعه کنید.
اتصالات پایتون مبتنی بر NVML نیز در دسترس هستند.
خروجی NVSMI تضمینی برای سازگاری با عقب نیست. با این حال، هم NVML و هم
اتصالات پایتون با عقب سازگار هستند و باید اولین انتخاب در هنگام نوشتن باشد
هر ابزاری که باید در نسخه های درایور NVIDIA نگهداری شود.
NVML SDK ها: http://developer.nvidia.com/nvidia-management-library-nvml/
پــایتــون اتصالات: http://pypi.python.org/pypi/nvidia-ml-py/
OPTIONS
عمومی OPTIONS
-h، --کمک
چاپ اطلاعات استفاده و خروج.
خلاصه OPTIONS
-ل، --list-gpus
هر یک از GPU های NVIDIA در سیستم را به همراه UUID های آنها فهرست کنید.
پرس و جو OPTIONS
-q، --پرس و جو
نمایش اطلاعات GPU یا Unit. اطلاعات نمایش داده شده شامل تمام داده های فهرست شده در (GPU ویژگی های)
یا (واحد ویژگی های) بخش های این سند. برخی از دستگاه ها و/یا محیط ها این کار را نمی کنند
پشتیبانی از تمام اطلاعات ممکن هر داده پشتیبانی نشده با یک "N/A" در نشان داده می شود
خروجی بهطور پیشفرض اطلاعات مربوط به تمام واحدهای گرافیکی یا واحدهای موجود نمایش داده میشود. استفاده کنید -i
گزینه ای برای محدود کردن خروجی به یک GPU یا واحد.
[به علاوه اختیاری]
-u، --واحد
نمایش داده های واحد به جای داده های GPU. داده های واحد فقط برای NVIDIA S-class در دسترس است
محوطه های تسلا
-من، --id=ID
نمایش داده ها برای یک واحد گرافیکی یا واحد مشخص. شناسه مشخص شده ممکن است GPU/Unit باشد
شاخص مبتنی بر 0 در شمارش طبیعی که توسط درایور برگردانده شده است، سریال برد GPU
شماره، UUID GPU، یا شناسه گذرگاه PCI GPU (به عنوان domain:bus:device.function به صورت هگز).
توصیه می شود که کاربرانی که مایل به سازگاری هستند از UUID یا PCI bus ID استفاده کنند
ترتیب شمارش دستگاه تضمین نمی شود که بین راه اندازی مجدد و برد هماهنگ باشد
شماره سریال ممکن است بین چندین GPU در یک برد مشترک به اشتراک گذاشته شود.
-f فایل، --filename=FILE
خروجی query را به جای stdout پیش فرض به فایل مشخص شده هدایت کنید. مشخص شده
فایل رونویسی خواهد شد
-ایکس، فرمت --xml
به جای فرمت پیش فرض قابل خواندن توسط انسان، خروجی XML تولید کنید. هم GPU و هم Unit query
خروجی ها با DTD های مربوطه مطابقت دارند. اینها از طریق در دسترس هستند --dtd پرچم.
--dtd
با استفاده از -x. DTD را در خروجی XML قرار دهید.
--debug=FILE
یک گزارش اشکال زدایی رمزگذاری شده برای استفاده در ارسال باگ ها به NVIDIA تولید می کند.
-d نوع، --display=TYPE
نمایش فقط اطلاعات انتخاب شده: حافظه، استفاده، ECC، دما، برق، ساعت،
COMPUTE، PIDS، PERFORMANCE، SUPPORTED_CLOCKS، PAGE_RETIREMENT، ACCOUNTING پرچم ها را می توان
ترکیب با کاما به عنوان مثال "MEMORY,ECC". نمونه برداری از داده ها با حداکثر، حداقل و میانگین نیز می باشد
برای انواع نمایشگر POWER، UTILIZATION و CLOCK برگردانده شد. با -u/--unit یا کار نمی کند
پرچم های -x/--xml با فرمت.
-l SEC، --loop=SEC
بهجای پیشفرض فقط، دادههای پرس و جو را به طور مداوم در بازه زمانی مشخص گزارش کنید
یک بار. برنامه در بین پرس و جوها می خوابد. توجه داشته باشید که در لینوکس خطا ECC یا XID
رویدادهای خطا در طول دوره خواب چاپ می شوند اگر -x پرچم مشخص نشد
با فشار دادن Ctrl+C در هر زمان، حلقه قطع می شود، در غیر این صورت به طور نامحدود اجرا می شود.
اگر هیچ آرگومانی برای -l فرم یک فاصله پیش فرض 5 ثانیه استفاده می شود.
انتخابی پرس و جو OPTIONS
به تماسگیرنده اجازه میدهد تا فهرست صریح ویژگیها را به پرس و جو ارسال کند.
[یک از]
--query-gpu=
اطلاعات در مورد پردازنده گرافیکی لیست خصوصیاتی را که می خواهید پرس و جو کنید، با ویرگول جدا کنید. به عنوان مثال
--query-gpu=pci.bus_id,persistence_mode. برای اطلاعات بیشتر با --help-query-gpu تماس بگیرید.
--query-supported-clocks=
لیست ساعت های پشتیبانی شده برای اطلاعات بیشتر با --help-query-supported-clocks تماس بگیرید.
--query-compute-apps=
فهرست فرآیندهای محاسباتی فعال در حال حاضر. برای اطلاعات بیشتر با --help-query-compute-apps تماس بگیرید.
--query-accounted-apps=
فهرست فرآیندهای محاسباتی حساب شده برای اطلاعات بیشتر با --help-query-accounted-apps تماس بگیرید.
--query-retired-pages=
فهرست صفحات حافظه دستگاه GPU که بازنشسته شده اند. با --help-query-retired-pages تماس بگیرید
برای اطلاعات بیشتر.
[اجباری]
--فرمت=
لیست گزینه های قالب جدا شده با کاما:
· csv - مقادیر جدا شده با کاما (اجباری)
· noheader - از خط اول با سرصفحه های ستون بگذرید
· واحدها - واحدها را برای مقادیر عددی چاپ نکنید
[به علاوه هر از]
-من، --id=ID
نمایش داده ها برای یک GPU مشخص. شناسه مشخص شده ممکن است شاخص مبتنی بر 0 GPU باشد
در شمارش طبیعی ارائه شده توسط راننده، شماره سریال برد GPU،
UUID GPU یا شناسه گذرگاه PCI GPU (به عنوان domain:bus:device.function به صورت هگز). این است
توصیه می شود که کاربرانی که مایل به سازگاری هستند از UUID یا PCI bus ID استفاده کنند
ترتیب شمارش بین راه اندازی مجدد و سریال برد تضمین نمی شود
ممکن است شماره بین چندین GPU در یک برد مشترک باشد.
-f فایل، --filename=FILE
خروجی query را به جای stdout پیش فرض به فایل مشخص شده هدایت کنید. مشخص شده
فایل رونویسی خواهد شد
-l SEC، --loop=SEC
بهجای پیشفرض فقط، دادههای پرس و جو را به طور مداوم در بازه زمانی مشخص گزارش کنید
یک بار. برنامه در بین پرس و جوها می خوابد. توجه داشته باشید که در لینوکس خطا ECC یا XID
رویدادهای خطا در طول دوره خواب چاپ می شوند اگر -x پرچم مشخص نشد
با فشار دادن Ctrl+C در هر زمان، حلقه قطع می شود، در غیر این صورت به طور نامحدود اجرا می شود.
اگر هیچ آرگومانی برای -l فرم یک فاصله پیش فرض 5 ثانیه استفاده می شود.
-lms اماس، --loop-ms=ms
همان حلقه -l،-- اما در میلی ثانیه.
دستگاه تغییر OPTIONS
[هر یک از]
-بعد از ظهر، -Persistence-mode=MODE
حالت ماندگاری را برای GPUهای مورد نظر تنظیم کنید. ببینید (GPU ویژگی های) بخش برای الف
شرح حالت ماندگاری نیاز به روت دارد. روی همه پردازندههای گرافیکی تأثیر میگذارد، مگر اینکه یک GPU واحد
با استفاده از -i بحث و جدل. تاثیر این عمل فوری است. با این حال،
در طول راه اندازی مجدد باقی نمی ماند. پس از هر راهاندازی مجدد، حالت ماندگاری پیشفرض به حالت پیشفرض خواهد بود
"معلول". فقط در لینوکس موجود است.
-ه ، --ecc-config=CONFIG
حالت ECC را برای GPUهای مورد نظر تنظیم کنید. ببینید (GPU ویژگی های) بخش برای توضیح
از حالت ECC نیاز به روت دارد. روی همه پردازندههای گرافیکی تأثیر میگذارد، مگر اینکه یک واحد پردازش گرافیکی با استفاده از آن مشخص شده باشد
la -i بحث و جدل. این تنظیم پس از راه اندازی مجدد بعدی اعمال می شود و پایدار است.
-پ، --reset-ecc-errors=TYPE
شمارشگرهای خطای ECC را برای GPUهای هدف بازنشانی کنید. ببینید (GPU ویژگی های) بخش برای الف
شرح انواع شمارنده خطا ECC آرگومان های موجود 0|VOLATILE یا
1|مجموعه. نیاز به روت دارد. روی همه پردازندههای گرافیکی تأثیر میگذارد، مگر اینکه یک واحد پردازش گرافیکی با استفاده از آن مشخص شده باشد
la -i بحث و جدل. تاثیر این عمل فوری است.
-c، --compute-mode=MODE
حالت محاسبه را برای GPUهای مورد نظر تنظیم کنید. ببینید (GPU ویژگی های) بخش برای الف
شرح حالت محاسباتی نیاز به روت دارد. روی همه پردازندههای گرافیکی تأثیر میگذارد، مگر اینکه یک GPU واحد باشد
مشخص شده با استفاده از -i بحث و جدل. تاثیر این عمل فوری است. با این حال، آن را
در طول راه اندازی مجدد باقی نمی ماند. پس از هر بار راه اندازی مجدد، حالت محاسبه به "پیش فرض" بازنشانی می شود.
-dm نوع، --driver-model=TYPE
-fdm نوع، --force-driver-model=TYPE
مدل درایور TCC را فعال یا غیرفعال کنید. فقط برای ویندوز به حقوق مدیر نیاز دارد.
-dm اگر یک صفحه نمایش متصل شود، شکست خواهد خورد، اما -fdm مدل درایور را مجبور به تغییر می کند.
روی همه پردازندههای گرافیکی تأثیر میگذارد، مگر اینکه یک GPU واحد با استفاده از آن مشخص شده باشد -i بحث و جدل. راه اندازی مجدد است
برای انجام تغییر لازم است. دیدن راننده مدل برای اطلاعات بیشتر در مورد ویندوز
مدل های درایور
--gom=MODE
تنظیم حالت عملکرد GPU: 0/ALL_ON، 1/COMPUTE، 2/LOW_DP پشتیبانی شده در GK110 M-class و X-
محصولات کلاس تسلا از خانواده کپلر. در Quadro و Tesla C-class پشتیبانی نمی شود
محصولات LOW_DP و ALL_ON تنها حالتهایی هستند که در دستگاههای GeForce Titan پشتیبانی میشوند.
به حقوق مدیر نیاز دارد. دیدن GPU عمل حالت برای اطلاعات بیشتر در مورد GOM.
تغییرات GOM پس از راه اندازی مجدد اعمال می شود. مورد نیاز راه اندازی مجدد ممکن است در حذف شود
آینده. فقط GOM های محاسبه از WDDM (مدل درایور نمایشگر ویندوز) پشتیبانی نمی کنند
-r، --gpu-reset
بازنشانی GPU را راه اندازی کنید. می توان از آن برای پاک کردن وضعیت GPU HW و SW در شرایطی استفاده کرد
در غیر این صورت نیاز به راه اندازی مجدد دستگاه دارد. اگر خطای ECC دو بیتی داشته باشد، معمولاً مفید است
رخ داده است. نیاز دارد -i به دستگاه خاص مورد نظر تغییر دهید. نیاز به روت دارد. نمی تواند وجود داشته باشد
هر برنامه ای که از این دستگاه خاص استفاده می کند (مانند برنامه CUDA، برنامه گرافیکی
مانند سرور X، برنامه نظارتی مانند سایر نمونه های nvidia-smi). اونجا هم
نمیتوان برنامههای محاسباتی را روی هر GPU دیگری در سیستم اجرا کرد. فقط در
دستگاه های پشتیبانی شده از خانواده Fermi و Kepler که روی لینوکس اجرا می شوند.
تنظیم مجدد GPU تضمینی برای کارکرد در همه موارد نیست. برای تولید توصیه نمی شود
محیط ها در این زمان در برخی شرایط ممکن است اجزای HW روی برد وجود داشته باشد
که پس از درخواست تنظیم مجدد به حالت اولیه باز نمی گردند. این بیشتر است
به احتمال زیاد در محصولات نسل فرمی در مقابل کپلر دیده می شود و به احتمال زیاد اگر دیده شود
بازنشانی بر روی یک GPU آویزان انجام می شود.
پس از تنظیم مجدد، توصیه می شود که سلامت GPU قبل از ادامه بررسی شود
استفاده کنید. ابزار nvidia-healthmon انتخاب خوبی برای این تست است. اگر GPU سالم نیست
بازنشانی کامل باید با چرخه برق گره ایجاد شود.
بازدید http://developer.nvidia.com/gpu-deployment-kit برای دانلود GDK و nvidia-
سلامتی
-ac، --applications-clocks=MEM_CLOCK,GRAPHICS_CLOCK
حداکثر را مشخص می کند ساعت ها به عنوان یک جفت (مثلا 2000,800) که GPU ها را تعریف می کند
سرعت در حین اجرای برنامه ها روی GPU برای دستگاه های تسلا از خانواده Kepler+ و
GeForce Titan مبتنی بر Maxwell. نیاز به روت دارد مگر اینکه محدودیت ها با -acp کاهش یابد
فرمان..
-راس، --بازنشانی-برنامه ها-ساعت
ساعت برنامه ها را به مقدار پیش فرض بازنشانی می کند. برای دستگاه های تسلا از Kepler+
خانواده و GeForce Titan مبتنی بر Maxwell. نیاز به روت دارد مگر اینکه محدودیت ها رفع شوند
با دستور -acp.
-acp، --applications-clocks-permission=MODE
تغییر دهید که آیا ساعت برنامهها توسط همه کاربران قابل تغییر است یا فقط توسط روت. در دسترس
آرگومان ها 0|نامحدود، 1|محدود هستند. برای دستگاه های تسلا از خانواده Kepler+ و
GeForce Titan مبتنی بر Maxwell. نیاز به روت دارد.
-pl، --power-limit=POWER_LIMIT
حداکثر حد توان را بر حسب وات مشخص می کند. اعداد صحیح و ممیز شناور را می پذیرد. فقط
در دستگاه های پشتیبانی شده از خانواده Kepler. به حقوق مدیر نیاز دارد. نیازهای ارزشی
همانطور که توسط nvidia-smi گزارش شده است، بین حداقل و حداکثر توان مجاز باشد.
-صبح، --accounting-mode=MODE
حسابداری GPU را فعال یا غیرفعال می کند. با حسابداری GPU می توان میزان استفاده از آن را پیگیری کرد
منابع در طول عمر یک فرآیند واحد فقط در دستگاه های پشتیبانی شده از Kepler
خانواده. به حقوق مدیر نیاز دارد. آرگومان های موجود 0|غیرفعال یا
1|فعال.
-کاآ، -پاک کردن برنامه های حساب شده
تمام فرآیندهای حساب شده تا کنون را پاک می کند. فقط در دستگاه های پشتیبانی شده از خانواده Kepler.
به حقوق مدیر نیاز دارد.
--auto-boost-default=MODE
سیاست تقویت خودکار پیشفرض را روی 0/DISABLED یا 1/ENABLED تنظیم کنید و فقط تغییر را اعمال کنید.
پس از خروج آخرین بوست کلاینت. فقط در دستگاههای خاص تسلا از Kepler+
خانواده و دستگاه های GeForce مبتنی بر Maxwell. نیاز به روت دارد.
--auto-boost-default-force=MODE
سیاست تقویت خودکار پیشفرض را روی 0/DISABLED یا 1/ENABLED تنظیم کنید و تغییر را اعمال کنید.
بلافاصله. مستقیما. فقط در برخی از دستگاههای تسلا از خانواده Kepler+ و مبتنی بر Maxwell
دستگاه های GeForce نیاز به روت دارد.
--auto-boost-permission=MODE
اجازه کنترل غیر ادمین/روت روی حالت تقویت خودکار. آرگومان های موجود هستند
0|بدون محدودیت، 1|محدود. فقط در دستگاههای خاص تسلا از خانواده Kepler+ و
دستگاه های GeForce مبتنی بر Maxwell. نیاز به روت دارد.
[به علاوه اختیاری]
-من، --id=ID
یک GPU مشخص شده را تغییر دهید. شناسه مشخص شده ممکن است شاخص 0 مبتنی بر GPU/Unit باشد
شمارش طبیعی ارائه شده توسط درایور، شماره سریال برد GPU، GPU
UUID یا شناسه گذرگاه PCI GPU (به عنوان domain:bus:device.function به صورت هگز). توصیه می شود
که کاربرانی که مایل به ثبات هستند، از زمان شمارش دستگاه، از شناسه اتوبوس UUID یا PCI استفاده می کنند
تضمین نمی شود که سفارش بین راه اندازی مجدد و شماره سریال برد هماهنگ باشد
بین چندین پردازنده گرافیکی روی یک برد به اشتراک گذاشته شود.
واحد تغییر OPTIONS
-t، --toggle-led=STATE
وضعیت نشانگر LED در جلو و پشت دستگاه را روی رنگ مشخص شده تنظیم کنید. دیدن
(واحد ویژگی های) بخش برای شرح حالات LED. رنگ های مجاز هستند
0|سبز و 1|کهربا. نیاز به روت دارد.
[به علاوه اختیاری]
-من، --id=ID
یک واحد مشخص شده را تغییر دهید. شناسه مشخص شده ایندکس مبتنی بر 0 واحد است
شمارش طبیعی توسط راننده برگردانده شده است.
SHOW DTD OPTIONS
--dtd
نمایش دستگاه یا واحد DTD.
[به علاوه اختیاری]
-f فایل، --filename=FILE
خروجی query را به جای stdout پیش فرض به فایل مشخص شده هدایت کنید. مشخص شده
فایل رونویسی خواهد شد
-u، --واحد
نمایش واحد DTD به جای دستگاه DTD.
آمار
نمایش اطلاعات آماری در مورد GPU. برای اطلاعات بیشتر از "nvidia-smi stats -h" استفاده کنید
اطلاعات فقط لینوکس
TOPO
نمایش اطلاعات توپولوژی در مورد سیستم برای اطلاعات بیشتر از "nvidia-smi topo -h" استفاده کنید
اطلاعات فقط لینوکس همه پردازندههای گرافیکی را نشان میدهد که NVML قادر به تشخیص میباشد، اما وابستگی CPU
اطلاعات فقط برای پردازنده های گرافیکی با معماری Kepler یا جدیدتر نشان داده می شود. نکته: GPU
شمارش همان NVML است.
اب کشیدن از
نمایش و تغییر وضعیت های تخلیه GPU. برای اطلاعات بیشتر از "nvidia-smi drain -h" استفاده کنید.
فقط لینوکس
nvlink
نمایش اطلاعات nvlink برای اطلاعات بیشتر از "nvidia-smi nvlink -h" استفاده کنید.
ساعتها
پرس و جو و کنترل رفتار ساعت. در حال حاضر، این فقط به تقویت همزمان مربوط می شود.
برای اطلاعات بیشتر از "nvidia-smi clocks --help" استفاده کنید.
برگشت ارزش
کد بازگشت نشان می دهد که آیا عملیات موفقیت آمیز بوده یا شکست خورده است و دلیل آن چه بوده است
شکست.
· کد بازگشت 0 - موفقیت آمیز
· کد برگشتی 2 - آرگومان یا پرچم ارائه شده نامعتبر است
· کد بازگشت 3 - عملیات درخواستی در دستگاه مورد نظر در دسترس نیست
· کد برگشت 4 - کاربر فعلی اجازه دسترسی به این دستگاه را ندارد یا
این عملیات را انجام دهید
· کد بازگشت 6 - پرس و جو برای یافتن یک شی ناموفق بود
· کد برگشت 8 - کابل های برق خارجی دستگاه به درستی وصل نشده اند
· کد بازگشت 9 - درایور NVIDIA بارگذاری نشده است
· کد برگشت 10 - هسته NVIDIA یک مشکل وقفه در یک GPU را شناسایی کرد
· کد بازگشت 12 - کتابخانه مشترک NVML یافت نشد یا بارگیری شد
· کد بازگشت 13 - نسخه محلی NVML این تابع را اجرا نمی کند
· کد برگشت 14 - infoROM خراب است
· کد برگشتی 15 - GPU از اتوبوس افتاده یا در غیر این صورت تبدیل شده است
غیر قابل دسترس
· کد برگشت 255 - خطای دیگر یا خطای داخلی درایور رخ داده است
GPU ویژگی های
لیست زیر تمام داده های ممکن برگردانده شده توسط -q گزینه پرس و جو دستگاه
مگر اینکه خلاف آن ذکر شده باشد، همه نتایج عددی پایه 10 و بدون واحد هستند.
TIMESTAMP
مهر زمانی سیستم فعلی در زمانی که nvidia-smi فراخوانی شد. قالب "روز از هفته است
ماه روز HH:MM:SS سال".
راننده نسخه
نسخه درایور نمایشگر NVIDIA نصب شده. این یک رشته الفبایی است.
پیوست GPU ها
تعداد GPU های NVIDIA در سیستم.
محصول نام
نام رسمی محصول GPU. این یک رشته الفبایی است. برای تمامی محصولات
نمایش دادن حالت
پرچمی که نشان می دهد آیا یک صفحه نمایش فیزیکی (مثلاً مانیتور) در حال حاضر به آن متصل است یا خیر
هر یک از کانکتورهای GPU "Enabled" یک صفحه نمایش پیوست را نشان می دهد. "معلول"
خلاف آن را نشان می دهد.
نمایش دادن فعال
پرچمی که نشان میدهد آیا نمایشگر روی GPU مقداردهی اولیه شده است (مثلاً حافظه است
بر روی دستگاه برای نمایش اختصاص داده شده است). حتی زمانی که هیچ مانیتوری وجود ندارد، نمایشگر می تواند فعال باشد
از نظر فیزیکی متصل شده است. "فعال" یک صفحه نمایش فعال را نشان می دهد. "غیرفعال" نشان می دهد
در غیر این صورت.
اصرار حالت
پرچمی که نشان می دهد که آیا حالت ماندگاری برای GPU فعال است یا خیر. ارزش هر دو است
"فعال" یا "غیرفعال". هنگامی که حالت ماندگاری فعال است، درایور NVIDIA باقی می ماند
حتی زمانی که هیچ کلاینت فعالی مانند X11 یا nvidia-smi وجود ندارد، بارگیری می شود. این به حداقل می رساند
تأخیر بارگذاری درایور مرتبط با اجرای برنامههای وابسته، مانند برنامههای CUDA. برای
همه محصولات با قابلیت CUDA فقط لینوکس
حسابداری (Accounting) حالت
پرچمی که نشان میدهد آیا حالت حسابداری برای مقدار GPU فعال است یا خیر، زمانی است
حسابداری فعال است آمار برای هر فرآیند محاسباتی در حال اجرا بر روی محاسبه می شود
پردازنده گرافیکی آمار را می توان در طول عمر یا پس از پایان فرآیند استعلام کرد.
زمان اجرای فرآیند در حالی که فرآیند در حال اجرا است 0 گزارش می شود
پس از پایان فرآیند به زمان اجرای واقعی به روز می شود. مشاهده --help-query-
برنامه های حسابداری برای اطلاعات بیشتر
حسابداری (Accounting) حالت بافر اندازه
اندازه بافر دایرهای را برمیگرداند که فهرستی از فرآیندهای قابل پرس و جو را در خود نگه میدارد
برای آمار حسابداری این حداکثر تعداد فرآیندهایی است که اطلاعات حسابداری انجام می شود
قبل از اینکه اطلاعات مربوط به قدیمی ترین فرآیندها توسط آنها بازنویسی شود، ذخیره می شود
اطلاعات در مورد فرآیندهای جدید
راننده مدل
در ویندوز، مدلهای درایور TCC و WDDM پشتیبانی میشوند. مدل درایور قابل تغییر است
با (-dm) یا (-fdm) پرچم ها مدل درایور TCC برای محاسبه بهینه شده است
برنامه های کاربردی. زمان راه اندازی هسته اینترنت اکسپلورر با TCC سریعتر خواهد بود. مدل درایور WDDM
برای برنامه های گرافیکی طراحی شده است و برای برنامه های محاسباتی توصیه نمی شود.
لینوکس از چندین مدل درایور پشتیبانی نمی کند و همیشه مقدار "N/A" خواهد داشت.
جاری مدل راننده در حال حاضر استفاده می شود. همیشه در لینوکس "N/A" وجود دارد.
در انتظار مدل درایوری که در راه اندازی مجدد بعدی استفاده می شود. همیشه "N/A" روشن است
لینوکس است.
سریال شماره
این شماره با شماره سریال چاپ شده روی هر تابلو مطابقت دارد. جهانی است
ارزش الفبایی تغییرناپذیر منحصر به فرد
GPU UUID
این مقدار شناسه الفبایی و عددی تغییرناپذیر منحصر به فرد GPU در سراسر جهان است. این کار را انجام می دهد
با هیچ برچسب فیزیکی روی تابلو مطابقت ندارد.
صغیر شماره
عدد کوچک برای دستگاه به گونه ای است که فایل گره دستگاه Nvidia برای هر GPU خواهد بود
فرم /dev/nvidia [شماره کوچک] را داشته باشید. فقط در پلتفرم لینوکس موجود است.
VBIOS نسخه
بایوس برد GPU.
MultiGPU تخته
این که آیا این GPU بخشی از یک برد چند GPU است یا خیر.
تخته ID
شناسه منحصر به فرد برد که توسط راننده اختصاص داده شده است. اگر دو یا چند GPU شناسه برد یکسانی داشته باشند
و فیلد "MultiGPU" بالا درست است، سپس GPUها روی همان برد قرار دارند.
اطلاعات نسخه
شماره نسخه برای هر شیء در فضای ذخیره اطلاعات برد GPU. اینفورم یک است
ذخیره کوچک و دائمی اطلاعات پیکربندی و وضعیت برای GPU. نسخه همه اطلاعات
فیلدها عددی هستند دانستن این شمارههای نسخه به دلیل برخی از GPU میتواند مفید باشد
ویژگیها فقط با اطلاعات یک نسخه خاص یا بالاتر در دسترس هستند.
اگر هر یک از فیلدهای زیر خطای ناشناخته را برگرداند، بررسی تأیید صحت اطلاعات اضافی است
انجام شده و پیام هشدار مناسب نمایش داده می شود.
تصویر نسخه نسخه جهانی تصویر infoROM. نسخه تصویر درست مانند نسخه VBIOS
نسخه دقیق infoROM فلش شده روی برد را به طور منحصر به فرد توصیف می کند
برخلاف نسخه شیء infoROM که فقط نشانگر پشتیبانی است
ویژگی های.
OEM شیء نسخه برای داده های پیکربندی OEM.
ECC شیء نسخه برای داده های ضبط ECC.
قدرت شیء نسخه برای داده های مدیریت انرژی.
GPU عمل حالت
GOM با غیرفعال کردن ویژگی های GPU امکان کاهش مصرف انرژی و بهینه سازی توان پردازش گرافیکی را فراهم می کند.
هر GOM برای برآوردن نیازهای کاربر خاص طراحی شده است.
در حالت "همه روشن" همه چیز فعال است و با سرعت کامل اجرا می شود.
حالت "Compute" فقط برای اجرای وظایف محاسباتی طراحی شده است. عملیات گرافیکی نیست
مجاز.
حالت "Low Double Precision" برای اجرای برنامه های گرافیکی طراحی شده است که این کار را نمی کنند
نیاز به پهنای باند بالا دقت مضاعف.
GOM را می توان با (-- گوم) پرچم.
پشتیبانی از محصولات GK110 M-class و X-class Tesla از خانواده Kepler. نه
در محصولات Quadro و Tesla C-class پشتیبانی می شود. حالت های Low Double Precision و All On هستند
تنها حالت های موجود برای محصولات GeForce Titan پشتیبانی شده.
جاری GOM در حال حاضر در حال استفاده است.
در انتظار GOM که در راه اندازی مجدد بعدی استفاده خواهد شد.
PCI
اطلاعات اولیه PCI برای دستگاه. برخی از این اطلاعات ممکن است هر زمان که کارت ها تغییر کنند
اضافه/حذف/انتقال در یک سیستم. برای تمامی محصولات
اتوبوس شماره باس PCI، به صورت هگز
دستگاه شماره دستگاه PCI، به صورت هگز
دامنه شماره دامنه PCI، به صورت هگز
دستگاه Id شناسه دستگاه فروشنده PCI، به صورت هگز
زیر سیستم Id شناسه سیستم فرعی PCI، به صورت هگز
اتوبوس Id شناسه گذرگاه PCI به صورت "domain:bus:device.function" به صورت هگز
GPU ارتباط دادن اطلاعات
تولید پیوند PCIe و عرض گذرگاه
جاری نسل و عرض پیوند فعلی. این ممکن است زمانی که GPU کاهش می یابد
استفاده نمی شود
بیشترین حداکثر تولید لینک و عرض ممکن با این GPU و سیستم
پیکربندی برای مثال، اگر GPU از نسل بالاتر PCIe پشتیبانی کند
پس از آن که سیستم از آن پشتیبانی می کند، تولید PCIe سیستم را گزارش می دهد.
پل تراشه
اطلاعات مربوط به Bridge Chip روی دستگاه. سیستم عامل تراشه پل فقط موجود است
روی بردهای خاص و ممکن است برای برخی از بردهای چند GPU جدیدتر "N/A" نمایش داده شود.
نوع نوع تراشه پل. در صورت عدم وجود، به عنوان N/A گزارش شده است.
سفت افزار نسخه
نسخه سیستم عامل تراشه بریج. در صورت عدم وجود، به عنوان N/A گزارش شده است.
پخش مقابله با
این شمارنده داخلی است که خطاهای مختلف را در گذرگاه PCIe ثبت می کند.
Tx ظرفیت تولید
توان انتقال GPU محور در گذرگاه PCIe در مگابایت بر ثانیه در 20 میلی ثانیه گذشته.
فقط در معماری های Maxwell و جدیدتر پشتیبانی می شود.
Rx ظرفیت تولید
توان دریافتی مبتنی بر GPU در گذرگاه PCIe در مگابایت بر ثانیه در 20 میلی ثانیه گذشته. فقط
در معماری های Maxwell و جدیدتر پشتیبانی می شود.
پنکه سرعت
مقدار سرعت فن، درصد حداکثر سرعتی است که فن دستگاه در حال حاضر دارد
در نظر گرفته شده برای اجرا در. از 0 تا 100 درصد متغیر است. توجه: سرعت گزارش شده در نظر گرفته شده است
سرعت فن. اگر فن از نظر فیزیکی مسدود شده باشد و نتواند بچرخد، این خروجی نخواهد بود
مطابق با سرعت واقعی فن بسیاری از قطعات سرعت فن را گزارش نمی کنند زیرا به آن تکیه می کنند
خنک سازی از طریق فن در محفظه اطراف. برای همه محصولات مجزا با اختصاصی
طرفداران.
عملکرد دولت
وضعیت عملکرد فعلی برای GPU. وضعیت ها از P0 (حداکثر عملکرد) تا
P12 (حداقل عملکرد).
ساعت دریچه گاز دلایل
اطلاعاتی در مورد عواملی که فرکانس ساعت ها را کاهش می دهند بازیابی می کند. فقط در
از دستگاه های تسلا از خانواده کپلر پشتیبانی می کند.
اگر همه دلایل دریچه گاز به عنوان "Not Active" برگردانده شوند، به این معنی است که ساعت ها به عنوان کار می کنند
بالاترین حد ممکن
آرام هیچ چیز روی GPU اجرا نمی شود و ساعت ها به حالت Idle می روند.
این محدود کننده ممکن است در نسخه بعدی حذف شود.
کاربرد ساعت محیط
ساعتهای GPU با تنظیمات ساعت برنامهها محدود میشوند. به عنوان مثال قابل تغییر است
با استفاده از nvidia-smi --applications-clocks=
SW قدرت کلاه الگوریتم SW Power Scaling ساعتهای زیر ساعتهای درخواستی را کاهش میدهد
زیرا GPU انرژی زیادی مصرف می کند. به عنوان مثال SW قدرت محدودیت کلاهک می تواند
با nvidia-smi --power-limit= تغییر دهید
HW کاهش سرعت HW Slowdown (کاهش ساعت هسته با ضریب 2 یا بیشتر) درگیر است.
این یک شاخص است از:
*دما خیلی بالاست
* اصرار ترمز قدرت خارجی (به عنوان مثال با قدرت سیستم) فعال می شود
عرضه)
* مصرف برق خیلی زیاد است و حفاظت از ماشه سریع ساعت ها را کاهش می دهد
ناشناخته یکی دیگر از عوامل نامشخص کاهش ساعت است.
FB حافظه استفاده
اطلاعات حافظه بافر فریم روی برد. کل حافظه گزارش شده تحت تأثیر وضعیت ECC قرار می گیرد.
اگر ECC فعال باشد، کل حافظه موجود چند درصد کاهش می یابد، به دلیل این
بیت های برابری لازم درایور همچنین ممکن است مقدار کمی از حافظه داخلی را رزرو کند
استفاده کنید، حتی بدون کار فعال روی GPU. برای تمامی محصولات
جمع حجم کل حافظه FB
استفاده می شود اندازه استفاده شده از حافظه FB.
رایگان اندازه موجود حافظه FB.
BAR1 حافظه استفاده
BAR1 برای نقشه برداری از FB (حافظه دستگاه) استفاده می شود تا بتواند مستقیماً توسط CPU به آن دسترسی داشته باشد
یا توسط دستگاه های شخص ثالث (نظیر به نظیر در گذرگاه PCIe).
جمع اندازه کل حافظه BAR1.
استفاده می شود اندازه استفاده شده از حافظه BAR1.
رایگان اندازه موجود حافظه BAR1.
محاسبه حالت
پرچم حالت محاسباتی نشان می دهد که آیا برنامه های محاسباتی منفرد یا چندگانه ممکن است
روی GPU اجرا شود
"پیشفرض" به این معنی است که چندین زمینه در هر دستگاه مجاز است.
"فرآیند انحصاری" به این معنی است که فقط یک زمینه در هر دستگاه مجاز است که از چندین مورد قابل استفاده است
رشته ها در یک زمان
"ممنوع" به این معنی است که هیچ زمینه ای برای هر دستگاه مجاز نیست (بدون برنامه محاسباتی).
"EXCLUSIVE_PROCESS" در CUDA 4.0 اضافه شد. نسخههای قبلی CUDA فقط یکی را پشتیبانی میکرد
حالت انحصاری، که معادل "EXCLUSIVE_THREAD" در CUDA 4.0 و بالاتر است.
برای همه محصولات دارای CUDA.
بهره برداری
نرخهای استفاده گزارش میدهند که هر GPU در طول زمان چقدر مشغول است و میتواند برای تعیین نحوه استفاده از آن استفاده شود
بسیاری از برنامه ها از GPU در سیستم استفاده می کنند.
توجه: در هنگام راه اندازی اولیه درایور هنگامی که ECC فعال است، می توانید GPU و حافظه بالایی را مشاهده کنید
قرائت های استفاده این به دلیل مکانیسم Scrubbing حافظه ECC است که انجام می شود
در طول اولیه سازی درایور
GPU درصد زمان در دوره نمونه گذشته که طی آن یک یا چند
کرنل روی پردازنده گرافیکی در حال اجرا بود. دوره نمونه ممکن است بین 1 باشد
دوم و 1/6 ثانیه بسته به محصول.
حافظه درصد زمان در دوره نمونه گذشته که طی آن جهانی (دستگاه)
حافظه خوانده یا نوشته می شد. دوره نمونه ممکن است بین 1 باشد
دوم و 1/6 ثانیه بسته به محصول.
رمز گذار درصد زمان در دوره نمونه گذشته که طی آن ویدیوی GPU
رمزگذار استفاده می شد نرخ نمونه گیری متغیر است و می توان به دست آورد
مستقیماً از طریق nvmlDeviceGetEncoderUtilization() API
رمز گشا درصد زمان در دوره نمونه گذشته که طی آن ویدیوی GPU
رسیور استفاده می شد نرخ نمونه گیری متغیر است و می توان به دست آورد
مستقیماً از طریق nvmlDeviceGetDecoderUtilization() API
Ecc حالت
پرچمی که نشان می دهد پشتیبانی ECC فعال است یا خیر. ممکن است "فعال" یا
"معلول". تغییر در حالت ECC نیاز به راه اندازی مجدد دارد. به نسخه شی Inforom ECC نیاز دارد
1.0 یا بالاتر
جاری حالت ECC که GPU در حال حاضر تحت آن کار می کند.
در انتظار حالت ECC که GPU پس از راهاندازی مجدد بعدی تحت آن کار میکند.
ECC خطاهای
پردازندههای گرافیکی NVIDIA میتوانند تعداد خطاها را برای انواع مختلف خطاهای ECC ارائه دهند. برخی از خطاهای ECC هستند
تک بیت یا دو بیت، که در آن خطاهای تک بیت تصحیح می شوند و خطاهای دو بیتی
غیر قابل اصلاح هستند خطاهای حافظه بافت ممکن است از طریق ارسال مجدد قابل اصلاح یا غیر قابل اصلاح باشند
اگر ارسال مجدد ناموفق باشد. این خطاها در دو مقیاس زمانی (فرار و
تجمیع). خطاهای ECC تک بیتی به طور خودکار توسط HW تصحیح می شوند و به نتیجه نمی رسند
در فساد داده ها خطاهای دو بیتی شناسایی می شوند اما اصلاح نمی شوند. لطفا ECC را ببینید
اسنادی در وب برای اطلاعات در مورد رفتار برنامه کاربردی زمانی که دو بیتی هستند
خطاها رخ می دهد شمارشگرهای خطای فرار تعداد خطاهای شناسایی شده از آخرین خطا را ردیابی می کنند
بار راننده تعداد کل خطاها به طور نامحدود ادامه می یابد و بنابراین به عنوان یک عمر عمل می کند
پیشخوان.
نکته ای در مورد تعداد فرار: در ویندوز این یک بار در هر بوت است. در لینوکس این می تواند بیشتر باشد
زود زود. در لینوکس، زمانی که هیچ کلاینت فعالی وجود نداشته باشد، درایور بارگیری می شود. از این رو، اگر
حالت تداوم فعال است یا همیشه یک سرویس گیرنده درایور فعال است (مثلا X11).
لینوکس همچنین رفتار هر بوت را می بیند. در غیر این صورت، هر بار که محاسبه میشود، شمارشهای فرار بازنشانی میشوند
برنامه اجرا می شود
محصولات تسلا و کوادرو از خانواده فرمی و کپلر می توانند خطای کل ECC را نشان دهند
شمارش، و همچنین تفکیک خطاها بر اساس مکان روی تراشه. مکان ها هستند
در زیر شرح داده شده است. دادههای مبتنی بر مکان برای تعداد کل خطاها به Inforom ECC نیاز دارند
شی نسخه 2.0. همه شمارشهای دیگر ECC به شی ECC نسخه 1.0 نیاز دارند.
دستگاه حافظه خطاهای شناسایی شده در حافظه جهانی دستگاه.
ثبت نام پرونده خطاهای شناسایی شده در حافظه فایل رجیستر.
L1 مخزن خطاهای شناسایی شده در حافظه پنهان L1.
L2 مخزن خطاهای شناسایی شده در حافظه پنهان L2.
بافت حافظه خطاهای برابری در حافظه بافت شناسایی شده است.
جمع کل خطاهای شناسایی شده در کل تراشه. مجموع دستگاه حافظه, ثبت نام
پرونده, L1 مخزن, L2 مخزن و بافت حافظه.
صفحه بازنشستگی
پردازندههای گرافیکی NVIDIA میتوانند صفحات حافظه دستگاه GPU را زمانی که غیرقابل اعتماد شوند، بازنشسته کنند. این می تواند
زمانی اتفاق می افتد که چندین خطای ECC تک بیتی برای یک صفحه یا در یک ECC دو بیتی رخ دهد
خطا هنگامی که صفحه ای بازنشسته می شود، درایور NVIDIA آن را به گونه ای مخفی می کند که هیچ درایوری وجود نداشته باشد، یا
تخصیص حافظه برنامه می تواند به آن دسترسی داشته باشد.
دوبار بیت ECC تعداد صفحات حافظه دستگاه GPU که به دلیل الف بازنشسته شده اند
خطای ECC دو بیتی
تنها بیت ECC تعداد صفحات حافظه دستگاه GPU که به دلیل بازنشستگی
چندین خطای ECC تک بیتی
در انتظار بررسی می کند که آیا صفحات حافظه دستگاه GPU در راه اندازی مجدد بعدی در انتظار بازنشستگی هستند یا خیر.
صفحاتی که در انتظار بازنشستگی هستند هنوز هم قابل تخصیص هستند و ممکن است باعث ایجاد بیشتر شوند
مسائل مربوط به قابلیت اطمینان
درجه حرارت
خوانش سنسورهای دما روی برد. همه قرائت ها در درجه C هستند. نه همه
محصولات از همه انواع خواندن پشتیبانی می کنند. به ویژه، محصولات در ماژول عواملی را تشکیل می دهند که
تکیه بر فن های کیس یا خنک کننده غیرفعال معمولاً خوانش دما را ارائه نمی دهد. دیدن
در زیر برای محدودیت
GPU دمای هسته پردازنده گرافیکی برای همه محصولات گسسته و کلاس S.
تعطیل دمای دمایی که در آن یک GPU خاموش می شود.
کاهش سرعت دمای دمایی که در آن یک GPU شروع به کاهش سرعت خود می کند تا بتواند
سرد.
قدرت خوانش
خوانش قدرت به روشن کردن میزان مصرف برق فعلی GPU و عوامل کمک می کند
که بر آن استفاده تأثیر می گذارد. هنگامی که مدیریت انرژی فعال است، GPU مصرف انرژی را محدود می کند
بارگذاری کنید تا با دستکاری عملکرد فعلی در یک پوشش توان از پیش تعریف شده قرار گیرد
دولت. برای محدودیت در دسترس بودن به زیر مراجعه کنید.
قدرت دولت Power State منسوخ شده و به Performance State in تغییر نام داده است
2.285. برای حفظ سازگاری XML، در قالب XML وضعیت عملکرد است
در هر دو مکان ذکر شده است.
قدرت مدیریت
پرچمی که نشان می دهد آیا مدیریت انرژی فعال است یا خیر. هر دو
"پشتیبانی شده" یا "N/A". به شیء Inforom PWR نسخه 3.0 یا بالاتر یا بالاتر نیاز دارد
دستگاه کپلر.
قدرت قرعه کشی آخرین مصرف انرژی اندازه گیری شده برای کل برد، بر حسب وات. فقط
در صورت پشتیبانی از مدیریت انرژی موجود است. این خواندن دقیق است
در +/- 5 وات. به شیء Inforom PWR نسخه 3.0 یا بالاتر یا بالاتر نیاز دارد
دستگاه کپلر.
قدرت محدود کردن محدودیت توان نرم افزار، بر حسب وات. توسط نرم افزارهایی مانند nvidia-smi تنظیم شده است.
فقط در صورتی در دسترس است که مدیریت انرژی پشتیبانی شود. به اطلاعات PWR نیاز دارد
شی نسخه 3.0 یا بالاتر یا دستگاه کپلر. در دستگاه های Kepler Power
حد را می توان با استفاده از کلیدهای -pl،--power-limit= تنظیم کرد.
اجرا قدرت محدود کردن
سقف توان الگوریتم مدیریت توان، بر حسب وات. کل تخته
جذب نیرو توسط الگوریتم مدیریت توان به گونه ای دستکاری می شود که
زیر این مقدار باقی می ماند این حد حداقل حدهای مختلف از این قبیل است
به عنوان محدودیت نرم افزار ذکر شده در بالا. فقط در صورت وجود مدیریت انرژی در دسترس است
پشتیبانی. به دستگاه کپلر نیاز دارد.
به طور پیش فرض قدرت محدود کردن
سقف توان الگوریتم مدیریت توان پیشفرض، بر حسب وات. قدرت
پس از بارگیری درایور، محدودیت به حد پیشفرض قدرت برمیگردد. فقط در
دستگاه های پشتیبانی شده از خانواده Kepler.
حداقل قدرت محدود کردن
حداقل مقدار بر حسب وات که محدودیت توان را می توان روی آن تنظیم کرد. فقط در
دستگاه های پشتیبانی شده از خانواده Kepler.
حداکثر قدرت محدود کردن
حداکثر مقدار بر حسب وات که محدودیت توان را می توان روی آن تنظیم کرد. فقط در
دستگاه های پشتیبانی شده از خانواده Kepler.
ساعت
فرکانس فعلی که در آن بخش هایی از GPU در حال اجرا است. تمام قرائت ها بر حسب مگاهرتز هستند.
گرافیک فرکانس فعلی ساعت گرافیکی (شیدر).
SM فرکانس فعلی ساعت SM (چند پردازنده جریانی).
حافظه فرکانس فعلی ساعت حافظه
تصویری فرکانس فعلی ساعت های ویدیویی (رمزگذار + رمزگشا).
اپلیکیشنها ساعت
فرکانس مشخص شده توسط کاربر که برنامه ها در آن اجرا می شوند. قابل تغییر با
[-ac | --applications-clocks] سوئیچ.
گرافیک فرکانس ساعت گرافیکی (سایه زن) مشخص شده توسط کاربر.
حافظه فرکانس ساعت حافظه مشخص شده توسط کاربر
به طور پیش فرض اپلیکیشنها ساعت
فرکانس پیشفرض که برنامهها در آن اجرا میشوند. ساعت های کاربردی می تواند باشد
با [-ac | تغییر کرد --applications-clocks] سوئیچ. ساعت های برنامه را می توان روی آن تنظیم کرد
پیش فرض با استفاده از [-rac | --بازنشانی-اپلیکیشن-ساعت] سوئیچ ها.
گرافیک فرکانس پیش فرض برنامه های کاربردی ساعت گرافیکی (سایه زن).
حافظه فرکانس پیش فرض ساعت حافظه برنامه ها.
حداکثر ساعت
حداکثر فرکانسی که بخشهایی از GPU برای اجرا طراحی شدهاند. تمام قرائت ها بر حسب مگاهرتز هستند.
در پردازندههای گرافیکی خانواده فرمی، ساعتهای فعلی P0 (گزارششده در بخش ساعتها) میتوانند با
حداکثر ساعت چند مگاهرتز
گرافیک حداکثر فرکانس ساعت گرافیکی (شیدر).
SM حداکثر فرکانس ساعت SM (چند پردازنده جریانی).
حافظه حداکثر فرکانس ساعت حافظه
تصویری حداکثر فرکانس ساعت ویدیو (رمزگذار + رمزگشا).
ساعت سیاست
تنظیمات مشخص شده توسط کاربر برای تغییرات ساعت خودکار مانند تقویت خودکار.
خودکار بالا بردن نشان می دهد که آیا حالت تقویت خودکار در حال حاضر برای این GPU (روشن) فعال است یا خیر
برای این پردازنده گرافیکی غیرفعال است (خاموش). در صورت عدم پشتیبانی از تقویت (N/A) نمایش داده می شود. خودکار
بوست به کلاک GPU پویا بر اساس توان، حرارت و استفاده امکان پذیر میشود.
هنگامی که تقویت خودکار غیرفعال است، پردازنده گرافیکی سعی می کند ساعت را در حالت ثابت نگه دارد
دقیقاً تنظیمات ساعتهای برنامه فعلی (هر زمان که زمینه CUDA باشد
فعال است). با فعال کردن بوست خودکار، GPU همچنان تلاش میکند حفظ کند
این طبقه، اما به طور فرصت طلبانه به ساعت های بالاتر در هنگام برق رسانی،
حرارتی و استفاده از فضای سر اجازه می دهد. این تنظیم برای زندگی ادامه دارد
از زمینه CUDA که برای آن درخواست شده است. برنامه ها می توانند درخواست a
حالت خاص یا از طریق تماس NVML (به NVML SDK مراجعه کنید) یا با تنظیم
متغیر محیطی CUDA CUDA_AUTO_BOOST.
خودکار بالا بردن به طور پیش فرض
تنظیم پیشفرض برای حالت تقویت خودکار، فعال (روشن) یا فعال را نشان میدهد
غیر فعال (خاموش). در صورت عدم پشتیبانی از تقویت (N/A) نمایش داده می شود. برنامه ها در
حالت پیش فرض اگر آنها به صراحت حالت خاصی را درخواست نکرده باشند. توجه داشته باشید:
تنظیمات Boost خودکار را فقط در صورتی می توان تغییر داد که «حالت ماندگاری» فعال باشد،
که به طور پیش فرض نیست.
پشتیبانی ساعتها
لیستی از ترکیبات حافظه و ساعت های گرافیکی ممکن که GPU می تواند روی آنها کار کند (نه
با در نظر گرفتن ساعت های کاهش یافته ترمز HW). اینها تنها ترکیبات ساعتی هستند که
را می توان به پرچم --applications-clocks منتقل کرد. ساعتهای پشتیبانیشده فقط زمانی فهرست میشوند که -q -d باشد
سوئیچ SUPPORTED_CLOCKS یا در قالب XML ارائه شده است.
فرآیندهای
فهرستی از فرآیندهای دارای زمینه محاسباتی یا گرافیکی در دستگاه. فرآیندهای محاسباتی هستند
در مورد تمام محصولات کاملاً پشتیبانی شده گزارش شده است. گزارش برای فرآیندهای گرافیکی محدود است
به محصولات پشتیبانی شده که با معماری کپلر شروع می شود.
هر ورودی با فرمت است " "
GPU شاخص نمایه NVML دستگاه را نشان می دهد.
PID شناسه فرآیند مربوط به Compute یا Graphics فعال را نشان می دهد
متن نوشته.
نوع نمایش داده شده به صورت "C" برای Compute Process، "G" برای Graphics Process و "C+G"
برای فرآیندی که هم زمینه محاسباتی و هم گرافیکی دارد.
روند نام نشان دهنده نام فرآیند برای فرآیند محاسباتی یا گرافیکی است.
GPU حافظه استفاده
مقدار حافظه استفاده شده در دستگاه توسط زمینه. در دسترس نیست
ویندوز هنگام اجرا در حالت WDDM زیرا Windows KMD همه موارد را مدیریت می کند
حافظه نه درایور NVIDIA
آمار (تجربی)
فهرست آمارهای GPU مانند نمونه های قدرت، نمونه های استفاده، رویدادهای xid، تغییر ساعت
رویدادها و شمارنده های تخلف
بر روی محصولات مبتنی بر Tesla، GRID و Quadro تحت لینوکس پشتیبانی می شود.
محدود به Kepler یا GPUهای جدیدتر.
آمار را در قالب CSV به صورت زیر نمایش می دهد:
، ، ،
معیارهای نمایش با واحدهای آنها به شرح زیر است:
نمونه های قدرت بر حسب وات
نمونه های دمای GPU بر حسب درجه سانتیگراد.
نمونه های استفاده از GPU، حافظه، رمزگذار و رمزگشا به درصد.
رویدادهای خطای Xid با کد خطای Xid گزارش شده است. کد خطا برای xid ناشناخته 999 است
خطا.
ساعت پردازنده و حافظه بر حسب مگاهرتز تغییر می کند.
نقض به دلیل درپوش قدرت با زمان نقض در ns. (فقط تسلا)
تخلف ناشی از پوشش حرارتی با پرچم بولی نقض (1/0). (فقط تسلا)
یادداشت:
هر آماری که قبل از "#" باشد یک نظر است.
دستگاه پشتیبانی نشده به عنوان "# نمایش داده می شود ، دستگاه پشتیبانی نمی شود".
اندازه گیری پشتیبانی نشده به صورت " نمایش داده می شود ، , N/A, N/A”.
نقض ناشی از حرارت/برق فقط برای محصولات مبتنی بر تسلا پشتیبانی میشود. تخلفات حرارتی
محدود به تسلا K20 و بالاتر هستند.
دستگاه نظارت
خط فرمان "nvidia-smi dmon" برای نظارت بر یک یا چند GPU (حداکثر 4 دستگاه) استفاده می شود.
به سیستم وصل شده است. این ابزار به کاربر اجازه می دهد تا یک خط داده نظارتی را در هر کدام ببیند
چرخه نظارت خروجی در قالب مختصر و به راحتی قابل تفسیر در تعامل است
حالت داده های خروجی در هر خط با اندازه ترمینال محدود می شود. در تسلا پشتیبانی می شود،
محصولات GRID، Quadro و محدود GeForce برای Kepler یا پردازندههای گرافیکی جدیدتر زیر فلز 64
بیت لینوکس به طور پیش فرض، داده های مانیتورینگ شامل میزان مصرف برق، دما، ساعت های SM،
ساعت های حافظه و مقادیر استفاده برای SM، حافظه، رمزگذار و رمزگشا. همچنین می تواند باشد
پیکربندی شده برای گزارش معیارهای دیگر مانند استفاده از حافظه فریم بافر، استفاده از حافظه bar1،
نقض قدرت/حرارت و مجموع خطاهای ecc تک بیتی/دو بیتی. اگر هر یک از معیارها
در دستگاه پشتیبانی نمی شود یا هر خطای دیگری در واکشی متریک به عنوان گزارش شده است
"-" در داده های خروجی. کاربر همچنین می تواند فرکانس نظارت و تعداد آن را پیکربندی کند
نظارت بر تکرارها برای هر اجرا همچنین گزینه ای برای درج تاریخ و زمان وجود دارد
هر خط. همه گزینه های پشتیبانی شده انحصاری هستند و می توانند با هم به هر ترتیبی استفاده شوند.
طریقه استفاده:
1) به طور پیش فرض با نه استدلال
nvidia-smi dmon
معیارهای پیش فرض را برای حداکثر 4 دستگاه پشتیبانی شده تحت شمارش طبیعی (شروع
با شاخص GPU 0) در فرکانس 1 ثانیه. اجرا می شود تا زمانی که با ^C خاتمه یابد.
2) انتخاب کنید یک or بیش دستگاه
nvidia-smi dmon -i <دستگاه1،دستگاه2، .. , deviceN>
سنجههای پیشفرض را برای دستگاههای انتخاب شده با فهرست دستگاههای جدا شده با کاما گزارش میکند. ابزار
حداکثر 4 دستگاه پشتیبانی شده را از لیست تحت شمارش طبیعی (شروع با GPU) انتخاب می کند
شاخص 0).
3) انتخاب کنید متریک به be نمایش داده
nvidia-smi dmon -s
می تواند یک یا چند مورد از موارد زیر باشد:
p - مصرف برق (بر حسب وات) و دما (بر حسب C)
u - استفاده (SM، حافظه، رمزگذار و استفاده از رمزگشا به درصد)
c - ساعتهای Proc و Mem (به مگاهرتز)
v - نقض برق (در درصد) و نقض حرارتی (به عنوان یک پرچم بولی)
m - فریم بافر و استفاده از حافظه Bar1 (در مگابایت)
e - ECC (تعداد خطاهای انباشته تک بیتی، دو بیتی خطاهای ecc) و پخش مجدد PCIe
خطا
t - PCIe Rx و Tx Throughput در مگابایت بر ثانیه (مکسول و بالاتر)
4) مجموعه نظارت بر تکرار
nvidia-smi dmon -c <تعداد of نمونه ها>
نمایش داده ها برای تعداد مشخصی از نمونه ها و خروج.
5) مجموعه نظارت بر فرکانس
nvidia-smi dmon -d <زمان in ثانیه>
داده ها را در هر بازه نظارتی مشخص جمع آوری و نمایش می دهد تا زمانی که به پایان برسد
^ سی.
6) نمایش دادن تاریخ
nvidia-smi dmon -o D
داده های نظارت را با تاریخ در قالب YYYYMMDD آماده می کند.
7) نمایش دادن زمان
nvidia-smi dmon -o T
داده های نظارت را با زمان در قالب HH:MM:SS آماده می کند.
8) کمک اطلاعات
nvidia-smi dmon -h
اطلاعات راهنما را برای استفاده از خط فرمان نمایش می دهد.
دیمون (تجربی)
"nvidia-smi daemon" یک فرآیند پس زمینه را برای نظارت بر یک یا چند پردازنده گرافیکی متصل به آن آغاز می کند.
به سیستم GPU های درخواستی را در هر چرخه نظارتی نظارت می کند و فایل را وارد می کند
فرمت فشرده در مسیر ارائه شده توسط کاربر یا مکان پیش فرض در /var/log/nvstats/.
فایل لاگ با تاریخ سیستم و با فرمت nvstats- ایجاد می شود.
YYYYMMDD. عملیات شستشوی فایل لاگ در هر چرخه نظارتی جایگزین انجام می شود.
Daemon همچنین PID خود را در /var/run/nvsmi.pid ثبت می کند. به طور پیش فرض، داده های نظارت به
تداوم شامل مصرف انرژی، دما، ساعت SM، ساعت حافظه و مقادیر استفاده
برای SM، حافظه، رمزگذار و رمزگشا. ابزارهای شبح را نیز می توان برای ضبط پیکربندی کرد
معیارهای دیگر مانند استفاده از حافظه بافر فریم، استفاده از حافظه bar1، قدرت/حرارتی
تخلفات و مجموع خطاهای ecc تک بیتی/دو بیتی. چرخه نظارت پیش فرض تنظیم شده است
تا 10 ثانیه و می توان از طریق خط فرمان پیکربندی کرد. در Tesla، GRID، Quadro پشتیبانی می شود
و محصولات GeForce برای Kepler یا GPUهای جدیدتر تحت لینوکس 64 بیتی فلزی خالی. دیمون
برای اجرا به حقوق ریشه نیاز دارد و تنها از اجرای یک نمونه بر روی آن پشتیبانی می کند
سیستم. همه گزینه های پشتیبانی شده انحصاری هستند و می توانند با هم به هر ترتیبی استفاده شوند.
طریقه استفاده:
1) به طور پیش فرض با نه استدلال
nvidia-smi روح پلید
در پسزمینه اجرا میشود تا معیارهای پیشفرض را برای حداکثر 4 دستگاه پشتیبانیشده تحت نظارت داشته باشد
شمارش طبیعی (شروع با شاخص GPU 0) در فرکانس 10 ثانیه. تاریخ مهر شده
فایل log در /var/log/nvstats/ ایجاد می شود.
2) انتخاب کنید یک or بیش دستگاه
nvidia-smi روح پلید -i <دستگاه1،دستگاه2، .. , deviceN>
در پسزمینه اجرا میشود تا معیارهای پیشفرض دستگاههایی را که با کاما انتخاب میشوند، نظارت کند
لیست دستگاه جدا شده این ابزار حداکثر 4 دستگاه پشتیبانی شده را از لیست زیر انتخاب می کند
شمارش طبیعی (شروع با شاخص GPU 0).
3) انتخاب کنید متریک به be نظارت
nvidia-smi روح پلید -s
می تواند یک یا چند مورد از موارد زیر باشد:
p - مصرف برق (بر حسب وات) و دما (بر حسب C)
u - استفاده (SM، حافظه، رمزگذار و استفاده از رمزگشا به درصد)
c - ساعتهای Proc و Mem (به مگاهرتز)
v - نقض برق (در درصد) و نقض حرارتی (به عنوان یک پرچم بولی)
m - فریم بافر و استفاده از حافظه Bar1 (در مگابایت)
e - ECC (تعداد خطاهای انباشته تک بیتی، دو بیتی خطاهای ecc) و پخش مجدد PCIe
خطا
t - PCIe Rx و Tx Throughput در مگابایت بر ثانیه (مکسول و بالاتر)
4) مجموعه نظارت بر فرکانس
nvidia-smi روح پلید -d <زمان in ثانیه>
داده ها را در هر بازه نظارتی مشخص تا زمان پایان جمع آوری می کند.
5) مجموعه ورود به سیستم فهرست راهنما
nvidia-smi روح پلید -p of دایرکتوری>
فایل های گزارش در دایرکتوری مشخص شده ایجاد می شوند.
6) مجموعه ورود به سیستم پرونده نام
nvidia-smi روح پلید -j <رشته به ضمیمه کردن ورود به سیستم پرونده نام>
خط فرمان برای الحاق نام فایل لاگ با رشته ارائه شده توسط کاربر استفاده می شود.
7) خاتمه دادن la روح پلید
nvidia-smi روح پلید -t
این خط فرمان از PID ذخیره شده (در /var/run/nvsmi.pid) برای خاتمه دادن به دیمون استفاده می کند. آی تی
بهترین تلاش را برای متوقف کردن دیمون انجام می دهد و هیچ تضمینی برای خاتمه آن ارائه نمی دهد. که در
در صورتی که دیمون خاتمه داده نشود، کاربر می تواند به صورت دستی با ارسال kill خاتمه دهد
سیگنال به دیمون انجام عملیات بازنشانی GPU (از طریق nvidia-smi) به تمام GPU نیاز دارد
فرآیندهایی که باید خارج شوند، از جمله دیمون. کاربرانی که دیمون را باز کرده اند، یک عدد را مشاهده خواهند کرد
خطا به این موضوع که GPU مشغول است.
8) کمک اطلاعات
nvidia-smi روح پلید -h
اطلاعات راهنما را برای استفاده از خط فرمان نمایش می دهد.
پخش حالت (تجربی)
خط فرمان "nvidia-smi replay" برای استخراج/بازپخش تمام یا بخش هایی از فایل لاگ استفاده می شود.
تولید شده توسط دیمون بهطور پیشفرض، ابزار سعی میکند معیارهایی مانند Power را مشخص کند
استفاده، دما، ساعتهای SM، ساعتهای حافظه و مقادیر استفاده برای SM، حافظه،
رمزگذار و رمزگشا. ابزار پخش مجدد همچنین می تواند معیارهای دیگری مانند بافر فریم را واکشی کند
استفاده از حافظه، استفاده از حافظه bar1، نقض برق/حرارت و مجموع تک بیت/دو بیت
خطاهای ecc گزینه ای برای انتخاب مجموعه ای از معیارها برای پخش مجدد وجود دارد، در صورت وجود هر یک از آنها
متریک درخواستی حفظ نمیشود یا بهعنوان غیرپشتیبانی نمیشود، سپس به صورت «-» نشان داده میشود
خروجی. فرمت داده های تولید شده توسط این حالت به گونه ای است که کاربر در حال اجرای آن است
ابزار نظارت بر دستگاه به صورت تعاملی خط فرمان به گزینه اجباری "-f" نیاز دارد
برای تعیین مسیر کامل نام فایل لاگ، سایر گزینه های پشتیبانی شده هستند
منحصر به فرد است و می تواند با هم به هر ترتیب استفاده شود.
طریقه استفاده:
1) مشخص کردن ورود به سیستم پرونده به be دوباره پخش شد
nvidia-smi پخش -f <ورود پرونده نام>
داده های نظارتی را از فایل گزارش فشرده واکشی می کند و به کاربر امکان می دهد یک خط را ببیند
داده های نظارت (متریک های پیش فرض با مهر زمانی) برای هر تکرار نظارت ذخیره شده
در فایل لاگ یک خط جدید از داده های نظارتی بدون در نظر گرفتن هر ثانیه دوباره پخش می شود
فرکانس پایش واقعی حفظ شده در زمان جمع آوری. نمایش داده می شود
تا پایان فایل یا تا زمانی که توسط ^C خاتمه یابد.
2) فیلتر متریک به be دوباره پخش شد
nvidia-smi پخش -f به ورود به سیستم فایل> -s
می تواند یک یا چند مورد از موارد زیر باشد:
p - مصرف برق (بر حسب وات) و دما (بر حسب C)
u - استفاده (SM، حافظه، رمزگذار و استفاده از رمزگشا به درصد)
c - ساعتهای Proc و Mem (به مگاهرتز)
v - نقض برق (در درصد) و نقض حرارتی (به عنوان یک پرچم بولی)
m - فریم بافر و استفاده از حافظه Bar1 (در مگابایت)
e - ECC (تعداد خطاهای انباشته تک بیتی، دو بیتی خطاهای ecc) و پخش مجدد PCIe
خطا
t - PCIe Rx و Tx Throughput در مگابایت بر ثانیه (مکسول و بالاتر)
3) محدود کردن پخش به یک or بیش دستگاه
nvidia-smi پخش -f <ورود فایل> -i <دستگاه1،دستگاه2، .. , deviceN>
گزارش سنجهها را به مجموعه دستگاههای انتخاب شده با دستگاه جدا شده با کاما محدود میکند
فهرست این ابزار از هر یک از دستگاه هایی که در فایل گزارش نگهداری نمی شوند پرش می کند.
4) محدود کردن la زمان قاب میان که داده ها is گزارش
nvidia-smi پخش -f <ورود فایل> -b <شروع زمان in HH: MM: SS قالب> -e <پایان زمان in
HH: MM: SS قالب>
این گزینه اجازه می دهد تا داده ها بین محدوده زمانی مشخص شده محدود شوند. مشخص کردن
زمان به عنوان 0 با گزینه -b یا -e به ترتیب به معنی شروع یا پایان فایل است.
5) تغییر مسیر پخش اطلاعات به a ورود به سیستم پرونده
nvidia-smi پخش -f <ورود فایل> -r <خروجی پرونده نام>
این گزینه فایل log را به عنوان ورودی می گیرد و اطلاعات مربوط به پیش فرض را استخراج می کند
معیارها در فایل خروجی مشخص شده
6) کمک اطلاعات
nvidia-smi پخش -h
اطلاعات راهنما را برای استفاده از خط فرمان نمایش می دهد.
روند نظارت
خط فرمان "nvidia-smi pmon" برای نظارت بر پردازش های محاسباتی و گرافیکی استفاده می شود
در حال اجرا بر روی یک یا چند GPU (حداکثر 4 دستگاه) متصل به سیستم. این ابزار اجازه می دهد
کاربر برای دیدن آمار برای تمام فرآیندهای در حال اجرا در هر دستگاه در هر
چرخه نظارت خروجی در قالب مختصر و به راحتی قابل تفسیر در تعامل است
حالت داده های خروجی در هر خط با اندازه ترمینال محدود می شود. در تسلا پشتیبانی می شود،
محصولات GRID، Quadro و محدود GeForce برای Kepler یا پردازندههای گرافیکی جدیدتر زیر فلز 64
بیت لینوکس به طور پیش فرض، داده های نظارت برای هر فرآیند شامل دستور pid، می باشد
نام و مقادیر میانگین استفاده برای SM، Memory، Encoder و Decoder از آخرین
چرخه نظارت همچنین می توان آن را طوری پیکربندی کرد که میزان استفاده از حافظه بافر فریم را برای هر کدام گزارش کند
روند. اگر هیچ فرآیندی برای دستگاه در حال اجرا نباشد، تمام معیارها گزارش میشوند
به عنوان "-" برای دستگاه. اگر هر یک از معیارها در دستگاه یا موارد دیگر پشتیبانی نمی شود
خطا در واکشی متریک نیز به صورت "-" در داده های خروجی گزارش می شود. کاربر همچنین می تواند
فرکانس نظارت و تعداد تکرارهای نظارت را برای هر اجرا پیکربندی کنید. آنجا
همچنین گزینه ای برای درج تاریخ و زمان در هر خط است. همه گزینه های پشتیبانی شده هستند
منحصر به فرد است و می تواند با هم به هر ترتیب استفاده شود.
طریقه استفاده:
1) به طور پیش فرض با نه استدلال
nvidia-smi Pmon
تمام فرآیندهای در حال اجرا در هر دستگاه را برای حداکثر 4 دستگاه پشتیبانی شده تحت نظارت می کند
شمارش طبیعی (شروع با شاخص GPU 0) در فرکانس 1 ثانیه. اجرا می شود تا
با ^C خاتمه یافته است.
2) انتخاب کنید یک or بیش دستگاه
nvidia-smi Pmon -i <دستگاه1،دستگاه2، .. , deviceN>
آمار تمام فرآیندهای در حال اجرا در دستگاه های انتخاب شده با کاما را گزارش می دهد
لیست دستگاه جدا شده این ابزار حداکثر 4 دستگاه پشتیبانی شده را از لیست زیر انتخاب می کند
شمارش طبیعی (شروع با شاخص GPU 0).
3) انتخاب کنید متریک به be نمایش داده
nvidia-smi Pmon -s
می تواند یک یا چند مورد از موارد زیر باشد:
u - استفاده (SM، Memory، Encoder و Decoder Utilization برای فرآیند بر حسب درصد).
میانگین استفاده از آخرین چرخه نظارت را گزارش می دهد.
m - استفاده از بافر فریم (در مگابایت). مقدار آنی مصرف حافظه را گزارش می کند.
4) مجموعه نظارت بر تکرار
nvidia-smi Pmon -c <تعداد of نمونه ها>
نمایش داده ها برای تعداد مشخصی از نمونه ها و خروج.
5) مجموعه نظارت بر فرکانس
nvidia-smi Pmon -d <زمان in ثانیه>
داده ها را در هر بازه نظارتی مشخص جمع آوری و نمایش می دهد تا زمانی که به پایان برسد
^ سی. فرکانس مانیتورینگ باید بین 1 تا 10 ثانیه باشد.
6) نمایش دادن تاریخ
nvidia-smi Pmon -o D
داده های نظارت را با تاریخ در قالب YYYYMMDD آماده می کند.
7) نمایش دادن زمان
nvidia-smi Pmon -o T
داده های نظارت را با زمان در قالب HH:MM:SS آماده می کند.
8) کمک اطلاعات
nvidia-smi Pmon -h
اطلاعات راهنما را برای استفاده از خط فرمان نمایش می دهد.
توپولوژی (تجربی)
اطلاعات توپولوژی مربوط به GPUهای سیستم، نحوه اتصال آنها به یکدیگر را نیز فهرست کنید
به عنوان NIC های واجد شرایط که قادر به RDMA هستند
ماتریسی از GPUهای موجود را با شرح زیر نمایش می دهد:
شرح:
X = خود
SOC = مسیر از یک پیوند در سطح سوکت (مثلا QPI) عبور می کند.
PHB = مسیر از پل میزبان PCIe عبور می کند
PXB = مسیر چندین سوئیچ داخلی PCIe را طی می کند
PIX = مسیر از یک سوئیچ داخلی PCIe عبور می کند
واحد ویژگی های
لیست زیر تمام داده های ممکن برگردانده شده توسط -q -u گزینه پرس و جو واحد
مگر اینکه خلاف آن ذکر شده باشد، همه نتایج عددی پایه 10 و بدون واحد هستند.
TIMESTAMP
مهر زمانی سیستم فعلی در زمانی که nvidia-smi فراخوانی شد. قالب "روز از هفته است
ماه روز HH:MM:SS سال".
راننده نسخه
نسخه درایور نمایشگر NVIDIA نصب شده. فرمت است
«عداد-عدد.فرع-عدد».
این اطلاعات
اطلاعات مربوط به هر کارت رابط میزبان (HIC) که در سیستم نصب شده است.
سفت افزار نسخه
نسخه سیستم عامل در حال اجرا بر روی HIC.
پیوست واحد
تعداد واحدهای پیوست شده در سیستم.
محصول نام
نام رسمی محصول واحد. این یک مقدار الفبایی است. برای همه کلاس S
محصولات می باشد.
محصول Id
شناسه محصول برای واحد. این مقدار حروف عددی فرم است
"part1-part2-part3". برای تمام محصولات کلاس S.
محصول سریال
شناسه منحصر به فرد جهانی غیرقابل تغییر برای واحد. این یک مقدار الفبایی است.
برای تمام محصولات کلاس S.
سفت افزار نسخه
نسخه سفتافزاری که روی دستگاه اجرا میشود. قالب "Major-Number.Minor-Number" است.
برای تمام محصولات کلاس S.
رهبری دولت
نشانگر LED برای نشان دادن سیستم هایی با مشکلات احتمالی استفاده می شود. رنگ ال ای دی کهربایی
مسئله ای را نشان می دهد برای تمام محصولات کلاس S.
رنگ رنگ نشانگر LED. یا "سبز" یا "کهربا".
علت دلیل رنگ فعلی LED. علت ممکن است به عنوان هر یک ذکر شود
ترکیبی از "ناشناخته"، "تنظیم به AMBER توسط سیستم میزبان"، "حسگر حرارتی
خرابی، "شکست فن" و "دما از حد بحرانی فراتر رفت".
درجه حرارت
خوانش دما برای اجزای مهم واحد. همه قرائت ها بر حسب درجه سانتیگراد هستند.
ممکن است همه خواندن در دسترس نباشد. برای تمام محصولات کلاس S.
مصرف دمای هوا در ورودی واحد.
اگزوز دمای هوا در نقطه خروجی واحد
تخته دمای هوا در سراسر صفحه واحد.
PSU
قرائت برای منبع تغذیه واحد. برای تمام محصولات کلاس S.
دولت وضعیت عملکرد PSU. حالت منبع تغذیه می تواند هر یک از
موارد زیر: "عادی"، "غیر طبیعی"، "ولتاژ بالا"، "عملکرد فن"، "هیت سینک"
دما، "محدودیت جریان"، "ولتاژ زیر آستانه هشدار UV"،
"ولتاژ پایین"، "فرمان خاموش کردن از راه دور I2C"، "ورودی MOD_DISABLE" یا "پین کوتاه"
انتقال".
ولتاژ تنظیم ولتاژ PSU، بر حسب ولت.
جاری کشش جریان PSU، بر حسب آمپر.
پنکه اطلاعات
قرائت فن برای واحد. برای هر طرفدار قرائتی ارائه می شود که می تواند وجود داشته باشد
زیاد. برای تمام محصولات کلاس S.
دولت وضعیت فن، یا "NORMAL" یا "FAILED".
سرعت برای یک فن سالم، سرعت فن در RPM است.
پیوست GPU ها
فهرستی از شناسه های گذرگاه PCI که مربوط به هر یک از GPU های متصل به واحد است. اتوبوس
شناسه ها به شکل "domain:bus:device.function" به صورت هگز هستند. برای تمام محصولات کلاس S.
NOTES
در لینوکس، فایل های دستگاه NVIDIA ممکن است توسط nvidia-smi اصلاح شوند، اگر به صورت روت اجرا شوند. لطفا ببینید
بخش مربوطه از فایل README درایور.
La -a و -g در حال حاضر استدلال به نفع منسوخ شده است -q و -i، به ترتیب. با این حال،
استدلال های قدیمی هنوز برای این نسخه کار می کنند.
مثال ها
nvidia-smi -q
صفات را برای همه GPUها یک بار جستجو کنید و به صورت متنی ساده در stdout نمایش دهید.
nvidia-smi --format=csv,noheader --query-gpu=uuid,persistence_mode
UUID و حالت ماندگاری همه پردازندههای گرافیکی در سیستم را جستجو کنید.
nvidia-smi -q -d ECC، POWER -i 0 -l 10 -f خارج کردن.ورود
پرس و جو خطاهای ECC و مصرف انرژی برای GPU 0 در فرکانس 10 ثانیه،
به طور نامحدود، و در فایل out.log ضبط کنید.
"nvidia-smi -c 1 -i GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8"
حالت محاسبه را برای GPU با UUID روی "ممنوع" تنظیم کنید
"GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8".
nvidia-smi -q -u -x --dtd
صفات را برای همه واحدها یک بار جستجو کنید و در قالب XML با DTD تعبیه شده به نمایش داده شود
stdout.
nvidia-smi --dtd -u -f nvsmi_unit.dtd
واحد DTD را در nvsmi_unit.dtd بنویسید.
nvidia-smi -q -d SUPPORTED_CLOCKS
نمایش ساعت های پشتیبانی شده از تمام پردازنده های گرافیکی
nvidia-smi -i 0 --برنامه ها-ساعت 2500,745
ساعت برنامه ها را روی حافظه 2500 مگاهرتز و گرافیک 745 مگاهرتز تنظیم کنید.
EXCHANGE ورود کاربران
=== مسائل شناخته شده ===
* در لینوکس بازنشانی GPU نمیتواند زمانی که در انتظار تغییر GOM باشد فعال شود.
* در لینوکس، تنظیم مجدد GPU ممکن است با موفقیت حالت ECC معلق را تغییر ندهد. راه اندازی مجدد کامل ممکن است باشد
برای فعال کردن تغییر حالت مورد نیاز است.
=== بین به روز رسانی nvidia-smi v346 و v352 تغییر می کند ===
* اضافه شدن پشتیبانی topo برای نمایش شباهت در هر GPU
* اضافه شدن پشتیبانی topo برای نمایش GPUهای مجاور برای یک سطح معین
* اضافه شدن پشتیبانی topo برای نشان دادن مسیر بین دو GPU داده شده
* خط فرمان "nvidia-smi pmon" برای نظارت بر فرآیند در قالب پیمایش اضافه شد
* اضافه شدن گزینه "--debug" برای تولید یک گزارش اشکال زدایی رمزگذاری شده برای استفاده در ارسال اشکالات
بازگشت به NVIDIA
* گزارش ثابت حافظه استفاده شده/رایگان در حالت WDDM ویندوز
* آمار حسابداری به روز می شود تا شامل فرآیندهای در حال اجرا و پایان یافته باشد. در
زمان اجرای فرآیند در حال اجرا به عنوان 0 گزارش می شود و زمانی که به مقدار واقعی به روز می شود
فرآیند خاتمه یافته است.
=== بین به روز رسانی nvidia-smi v340 و v346 تغییر می کند ===
* اضافه شدن گزارش شمارنده های پخش مجدد PCIe
* اضافه شدن پشتیبانی برای گزارش فرآیندهای گرافیکی از طریق nvidia-smi
* اضافه شدن گزارش استفاده از PCIe
* اضافه شدن خط فرمان dmon برای نظارت بر دستگاه در قالب پیمایش
* خط فرمان daemon برای اجرا در پسزمینه و نظارت بر دستگاهها به عنوان یک شبح اضافه شده است
روند. فایل های ثبت تاریخ را در /var/log/nvstats/ ایجاد می کند
* اضافه شدن خط فرمان پخش مجدد برای پخش مجدد/استخراج فایل های آماری تولید شده توسط دیمون
ابزار
=== بین به روز رسانی nvidia-smi v331 و v340 تغییر می کند ===
* اضافه شدن گزارش اطلاعات آستانه دما.
* اضافه شدن گزارش اطلاعات برند (به عنوان مثال تسلا، کوادرو، و غیره)
* اضافه شدن پشتیبانی از K40d و K80.
* اضافه شدن گزارش حداکثر، حداقل و میانگین برای نمونه ها (قدرت، استفاده، تغییرات ساعت).
خط فرمان مثال: nvidia-smi -q -d power, utilization, clock
* اضافه شدن رابط آماری nvidia-smi برای جمع آوری آمارهایی مانند قدرت، استفاده،
تغییرات ساعت، رویدادهای xid و شمارندههای درپوش perf با مفهوم زمان متصل به هر یک
نمونه. مثال خط فرمان: آمار nvidia-smi
* اضافه شدن پشتیبانی برای گزارش دادن معیارهای جمعی در بیش از یک GPU. با کاما استفاده می شود
با گزینه "-i" جدا شده است. مثال: nvidia-smi -i 0,1,2
* اضافه شدن پشتیبانی برای نمایش رمزگذار GPU و استفاده از رمزگشا
* اضافه شدن رابط nvidia-smi topo برای نمایش ماتریس ارتباطی GPUDirect
(تجربی)
* اضافه شدن پشتیبانی برای نمایش شناسه برد GPU و اینکه آیا این برد چند GPU است یا خیر
* دلیل دریچه گاز تعریف شده توسط کاربر از خروجی XML حذف شد
=== بین به روز رسانی nvidia-smi v5.319 و v331 تغییر می کند ===
* اضافه شدن گزارش تعداد جزئی.
* اضافه شدن گزارش اندازه حافظه BAR1.
* اضافه شدن گزارش سیستم عامل تراشه پل.
=== تغییرات بین nvidia-smi v4.319 Production و v4.319 update ===
* سوئیچ جدید --applications-clocks-permission برای تغییر الزامات مجوز اضافه شد
برای تنظیم و تنظیم مجدد ساعت برنامه ها
=== تغییرات بین nvidia-smi v4.304 و v4.319 Production ===
* اضافه شدن گزارش وضعیت Display Active و اسناد به روز شده برای روشن شدن چگونگی آن
با حالت نمایش و حالت نمایش فعال متفاوت است
* برای ثبات در بردهای چند GPU، nvidia-smi -L همیشه UUID را به جای
شماره سریال
* اضافه شدن گزارش انتخابی قابل خواندن توسط ماشین. بخش SELECTIVE QUERY OPTIONs را ببینید
nvidia-smi -h
* اضافه شده نمایش داده شد برای اطلاعات بازنشستگی صفحه. به --help-query-retired-pages و -d مراجعه کنید
PAGE_RETIREMENT
* تغییر نام ساعت دریچه گاز دلیل تعیین شده توسط کاربر ساعت ها به برنامه ها تنظیمات ساعت
* در صورت خطا، کدهای بازگشتی مقادیر غیر صفر متمایز برای هر کلاس خطا دارند. رجوع به بازگشت شود
بخش VALUE
* nvidia-smi -i اکنون می تواند در صورت بروز مشکل، اطلاعات را از GPU سالم استعلام کند
GPU دیگر در سیستم
* همه پیامهایی که به مشکلی در GPU نشان میدهند که شناسه گذرگاه pci یک GPU خطاکار را چاپ میکنند
* پرچم جدید --loop-ms برای جستجوی اطلاعات با نرخ های بالاتر از یک بار در ثانیه (می تواند
تأثیر منفی بر عملکرد سیستم دارد)
* اضافه شده نمایش داده شد برای فرآیندهای حسابداری. به --help-query-accounted-apps و -d مراجعه کنید
حسابداری
* محدودیت قدرت اجباری را به خروجی پرس و جو اضافه کرد
=== تغییرات بین nvidia-smi v4.304 RC و v4.304 Production ===
* اضافه شدن گزارش حالت عملیات GPU (GOM)
* اضافه شدن سوئیچ --gom جدید برای تنظیم حالت عملیات GPU
=== بین nvidia-smi v3.295 و v4.304 RC تغییر می کند ===
* به دلیل بازخورد کاربر، خروجی غیرکلامی دوباره فرمت شد. اطلاعات معلق حذف شد
جدول.
* در صورت عدم موفقیت اولیه به دلیل دریافت نشدن ماژول هسته، پیام مفید را چاپ کنید
قطع می شود
* هنگامی که کتابخانه مشترک NVML در سیستم وجود ندارد مدیریت بهتر خطاها
* اضافه شدن سوئیچ جدید --applications-clocks
* اضافه شدن فیلتر جدید به سوئیچ -display. اجرا با -d SUPPORTED_CLOCKS به لیست ممکن است
ساعت روی یک GPU
* هنگام گزارش حافظه آزاد، آن را از مجموع گرد شده و حافظه استفاده شده محاسبه کنید
که ارزش ها جمع می شوند
* اضافه شدن گزارش محدودیت های مدیریت توان و محدودیت پیش فرض
* سوئیچ جدید -- power-limit اضافه شد
* اضافه شدن گزارش خطاهای ECC حافظه بافت
* اضافه شدن گزارش از دلایل دریچه گاز ساعت
=== بین nvidia-smi v2.285 و v3.295 تغییر می کند ===
* گزارش خطای واضح تر برای دستورات در حال اجرا (مانند تغییر حالت محاسباتی)
* هنگام اجرای دستورات روی چندین پردازنده گرافیکی همزمان، خطاهای N/A به عنوان هشدار تلقی می شوند.
* nvidia-smi -i اکنون از UUID نیز پشتیبانی می کند
* قالب UUID برای مطابقت با استاندارد UUID تغییر کرده و مقدار متفاوتی را گزارش خواهد کرد.
=== بین nvidia-smi v2.0 و v2.285 تغییر می کند ===
* گزارش نسخه VBIOS.
* اضافه شده -d/--پرچم نمایش برای فیلتر کردن بخش هایی از داده ها
* اضافه شدن گزارش PCI Sub System ID
* اسناد به روز شد تا نشان دهد ما از M2075 و C2075 پشتیبانی می کنیم
* نسخه سیستم عامل HIC HWBC را با سوئیچ -u گزارش کنید
* حداکثر (P0) ساعت ها را در کنار ساعت های فعلی گزارش کنید
* اضافه شدن پرچم --dtd برای چاپ دستگاه یا واحد DTD
* هنگامی که درایور NVIDIA در حال اجرا نیست، پیام اضافه شد
* اضافه شدن گزارش تولید پیوند PCIe (حداکثر و فعلی)، و عرض پیوند (حداکثر و
جاری).
* دریافت مدل درایور معلق روی غیر مدیر کار می کند
* اضافه شدن پشتیبانی برای اجرای nvidia-smi در حساب های Windows Guest
* اجرای nvidia-smi بدون دستور -q به جای خروجی نسخه غیرکلامی -q
کمک
* تجزیه آرگومان -l/--loop= ثابت شد (مقدار پیشفرض، 0، به مقدار بزرگ)
* فرمت pciBusId تغییر کرد (به XXXX:XX:XX.X - این تغییر در 280 قابل مشاهده بود)
* تجزیه دستور busId برای -i محدودتر است. شما می توانید 0:2:0.0 یا
0000:02:00 و تغییرات دیگر
* طرح نسخهسازی تغییر کرد تا شامل "نسخه درایور" نیز شود
* قالب XML همیشه با DTD مطابقت دارد، حتی زمانی که شرایط خطا رخ می دهد
* اضافه شدن پشتیبانی از رویدادهای ECC تک بیتی و دو بیتی و خطاهای XID (به طور پیش فرض فعال است
با پرچم -l غیرفعال برای پرچم -x)
* اضافه شدن پرچم های تنظیم مجدد دستگاه -r --gpu-reset
* اضافه شدن لیستی از فرآیندهای در حال اجرا محاسباتی
* تغییر نام وضعیت قدرت به وضعیت عملکرد. پشتیبانی منسوخ شده در خروجی XML وجود دارد
تنها.
* شماره نسخه DTD را به 2.0 به روز کرد تا با خروجی XML به روز شده مطابقت داشته باشد
با استفاده از خدمات onworks.net از alt-nvidia-361-smi به صورت آنلاین استفاده کنید