์ด๊ฒ์ Ubuntu Online, Fedora Online, Windows ์จ๋ผ์ธ ์๋ฎฌ๋ ์ดํฐ ๋๋ MAC OS ์จ๋ผ์ธ ์๋ฎฌ๋ ์ดํฐ์ ๊ฐ์ ์ฌ๋ฌ ๋ฌด๋ฃ ์จ๋ผ์ธ ์ํฌ์คํ ์ด์ ์ค ํ๋๋ฅผ ์ฌ์ฉํ์ฌ OnWorks ๋ฌด๋ฃ ํธ์คํ ์ ๊ณต์ ์ฒด์์ ์คํํ ์ ์๋ alt-nvidia-361-smi ๋ช ๋ น์ ๋๋ค.
ํ๋ก๊ทธ๋จ:
์ด๋ฆ
nvidia-smi - NVIDIA ์์คํ ๊ด๋ฆฌ ์ธํฐํ์ด์ค ํ๋ก๊ทธ๋จ
๊ฐ์
nvidia-smi [์ต์ 1 [ARG1]] [์ต์ 2 [ARG2]] ...
๊ธฐ์
nvidia-smi(๋ํ NVSMI)๋ ๊ฐ๊ฐ์ ๋ํ ๋ชจ๋ํฐ๋ง ๋ฐ ๊ด๋ฆฌ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค.
Fermi ์ด์ ์ํคํ ์ฒ์ NVIDIA Tesla, Quadro, GRID ๋ฐ GeForce ์ฅ์น
๊ฐ์กฑ๋ค. GeForce Titan ์๋ฆฌ์ฆ ์ฅ์น๋ ๋งค์ฐ ์ ํ๋ ๊ธฐ๋ฅ์ผ๋ก ๋๋ถ๋ถ์ ๊ธฐ๋ฅ์ ์ง์ํฉ๋๋ค.
๋๋จธ์ง Geforce ๋ธ๋๋์ ๋ํด ์ ๊ณต๋ ์ ๋ณด์ ๋๋ค. NVSMI๋ ํฌ๋ก์ค ํ๋ซํผ์ ๋๋ค.
๋ชจ๋ ํ์ค NVIDIA ๋๋ผ์ด๋ฒ ์ง์ Linux ๋ฐฐํฌํ๊ณผ 64๋นํธ๋ฅผ ์ง์ํ๋ ๋๊ตฌ
Windows Server 2008 R2๋ก ์์ํ๋ Windows ๋ฒ์ . ์ธก์ ํญ๋ชฉ์ ์ฌ์ฉํ ์ ์์ต๋๋ค.
stdout์ ํตํด ์ฌ์ฉ์๊ฐ ์ง์ ๋๋ ์คํฌ๋ฆฝํ ์ ์ํด CSV ๋ฐ XML ํ์์ ํตํด ํ์ผ๋ก ์ ๊ณต
๋ชฉ์ .
NVSMI์ ๋ง์ ๊ธฐ๋ฅ์ ๊ธฐ๋ณธ NVML C ๊ธฐ๋ฐ์์ ์ ๊ณต๋ฉ๋๋ค.
๋์๊ด. NVML์ ๋ํ ์์ธํ ๋ด์ฉ์ ์๋ NVIDIA ๊ฐ๋ฐ์ ์น ์ฌ์ดํธ ๋งํฌ๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
NVML ๊ธฐ๋ฐ Python ๋ฐ์ธ๋ฉ๋ ์ฌ์ฉํ ์ ์์ต๋๋ค.
NVSMI์ ์ถ๋ ฅ์ ์ด์ ๋ฒ์ ๊ณผ์ ํธํ์ฑ์ ๋ณด์ฅํ์ง ์์ต๋๋ค. ๊ทธ๋ฌ๋ NVML๊ณผ
Python ๋ฐ์ธ๋ฉ์ ์ด์ ๋ฒ์ ๊ณผ ํธํ๋๋ฉฐ ์์ฑํ ๋ ์ฒซ ๋ฒ์งธ ์ ํ์ด์ด์ผ ํฉ๋๋ค.
NVIDIA ๋๋ผ์ด๋ฒ ๋ฆด๋ฆฌ์ค์์ ์ ์ง ๊ด๋ฆฌํด์ผ ํ๋ ๋ชจ๋ ๋๊ตฌ.
NVML SDK : http://developer.nvidia.com/nvidia-management-library-nvml/
Python ๋ฐ์ธ๋ฉ: http://pypi.python.org/pypi/nvidia-ml-py/
์ต์
์ผ๋ฐ ์ต์
-์๊ฐ, --๋์
์ฌ์ฉ ์ ๋ณด๋ฅผ ์ธ์ํ๊ณ ์ข ๋ฃํฉ๋๋ค.
๊ฐ์ ์ต์
-์, --๋ฆฌ์คํธ-GPUS
์์คํ ์ ๊ฐ NVIDIA GPU๋ฅผ UUID์ ํจ๊ป ๋์ดํฉ๋๋ค.
์ง๋ฌธ ์ต์
-NS, --์ง๋ฌธ
GPU ๋๋ ์ฅ์น ์ ๋ณด๋ฅผ ํ์ํฉ๋๋ค. ํ์๋ ์ ๋ณด์๋ (GPU ATTRIBUTES)
๋๋ (UNIT ATTRIBUTES) ์ด ๋ฌธ์์ ์น์ . ์ผ๋ถ ์ฅ์น ๋ฐ/๋๋ ํ๊ฒฝ์์๋
๊ฐ๋ฅํ ๋ชจ๋ ์ ๋ณด๋ฅผ ์ง์ํฉ๋๋ค. ์ง์๋์ง ์๋ ๋ฐ์ดํฐ๋ "ํด๋น ์์"์ผ๋ก ํ์๋ฉ๋๋ค.
์ฐ์ถ. ๊ธฐ๋ณธ์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํ ๋ชจ๋ GPU ๋๋ ์ฅ์น์ ๋ํ ์ ๋ณด๊ฐ ํ์๋ฉ๋๋ค. ์ฌ์ฉ -i
๋จ์ผ GPU ๋๋ ์ฅ์น๋ก ์ถ๋ ฅ์ ์ ํํ๋ ์ต์ ์ ๋๋ค.
[์ ๋ํ ์ ํ ๊ณผ๋ชฉ]
-์ , --๋จ์
GPU ๋ฐ์ดํฐ ๋์ ๋จ์ ๋ฐ์ดํฐ๋ฅผ ํ์ํฉ๋๋ค. ๋จ์ ๋ฐ์ดํฐ๋ NVIDIA S-class์๋ง ์ฌ์ฉํ ์ ์์ต๋๋ค.
ํ ์ฌ๋ผ ์ธํด๋ก์ .
-NS, --id=์์ด๋
์ง์ ๋ ๋จ์ผ GPU ๋๋ ๋จ์์ ๋ํ ๋ฐ์ดํฐ๋ฅผ ํ์ํฉ๋๋ค. ์ง์ ๋ ID๋ GPU/์ฅ์น์
๋๋ผ์ด๋ฒ๊ฐ ๋ฐํํ๋ ์์ฐ ์ด๊ฑฐํ์ 0๋ถํฐ ์์ํ๋ ์ธ๋ฑ์ค, GPU์ ๋ณด๋ ์ง๋ ฌ
๋ฒํธ, GPU์ UUID ๋๋ GPU์ PCI ๋ฒ์ค ID(XNUMX์ง์๋ก domain:bus:device.function).
์ผ๊ด์ฑ์ ์ํ๋ ์ฌ์ฉ์๋ UUID ๋๋ PCI ๋ฒ์ค ID๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
์ฅ์น ์ด๊ฑฐ ์์๋ ์ฌ๋ถํ ๊ณผ ๋ณด๋ ๊ฐ์ ์ผ๊ด์ฑ์ด ๋ณด์ฅ๋์ง ์์ต๋๋ค.
์ผ๋ จ ๋ฒํธ๋ ๋์ผํ ๋ณด๋์ ์ฌ๋ฌ GPU ๊ฐ์ ๊ณต์ ๋ ์ ์์ต๋๋ค.
-f ํ์ผ, --ํ์ผ๋ช =ํ์ผ
๊ธฐ๋ณธ stdout ๋์ ์ง์ ๋ ํ์ผ๋ก ์ฟผ๋ฆฌ ์ถ๋ ฅ์ ๋ฆฌ๋๋ ์ ํฉ๋๋ค. ์ง์ ๋
ํ์ผ์ ๋ฎ์ด์๋๋ค.
-NS, --xml ํ์
์ฌ๋์ด ์ฝ์ ์ ์๋ ๊ธฐ๋ณธ ํ์ ๋์ XML ์ถ๋ ฅ์ ์์ฑํฉ๋๋ค. GPU ๋ฐ ๋จ์ ์ฟผ๋ฆฌ ๋ชจ๋
์ถ๋ ฅ์ ํด๋น DTD๋ฅผ ๋ฐ๋ฆ ๋๋ค. ๋ค์์ ํตํด ์ฌ์ฉํ ์ ์์ต๋๋ค. --dtd ๊น๋ฐ.
--dtd
์ ํจ๊ป ์ฌ์ฉ -x. XML ์ถ๋ ฅ์ DTD๋ฅผ ํฌํจํฉ๋๋ค.
--๋๋ฒ๊ทธ=ํ์ผ
NVIDIA์ ๋ฒ๊ทธ๋ฅผ ๋ค์ ์ ์ถํ๋ ๋ฐ ์ฌ์ฉํ ์ํธํ๋ ๋๋ฒ๊ทธ ๋ก๊ทธ๋ฅผ ์์ฑํฉ๋๋ค.
-d ์ ํ, --๋์คํ๋ ์ด=์ ํ
์ ํํ ์ ๋ณด๋ง ํ์: MEMORY, UTILIZATION, ECC, TEMPERATURE, POWER, CLOCK,
COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS, PAGE_RETIREMENT, ACCOUNTING ํ๋๊ทธ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
"MEMORY,ECC"์ ๊ฐ์ด ์ผํ์ ๊ฒฐํฉ๋ฉ๋๋ค. ์ต๋, ์ต์ ๋ฐ ํ๊ท ๋ฐ์ดํฐ ์ํ๋ง๋
POWER, UTILIZATION ๋ฐ CLOCK ํ์ ์ ํ์ ๋ํด ๋ฐํ๋ฉ๋๋ค. -u/--unit ๋๋
-x/--xml-ํ์ ํ๋๊ทธ.
-l ๋น์, --๋ฃจํ=SEC
๋จ์ํ ๊ธฐ๋ณธ๊ฐ์ด ์๋ ์ง์ ๋ ๊ฐ๊ฒฉ์ผ๋ก ์ฟผ๋ฆฌ ๋ฐ์ดํฐ๋ฅผ ์ง์์ ์ผ๋ก ๋ณด๊ณ ํฉ๋๋ค.
ํ ๋ฒ. ์ ํ๋ฆฌ์ผ์ด์ ์ ์ฟผ๋ฆฌ ์ฌ์ด์ ์ ์๊ธฐ ์ํ๊ฐ ๋ฉ๋๋ค. Linux ECC ์ค๋ฅ ๋๋ XID์ ๊ฒฝ์ฐ
์ค๋ฅ ์ด๋ฒคํธ๋ ๋ค์๊ณผ ๊ฐ์ ๊ฒฝ์ฐ ์ ์ ๊ธฐ๊ฐ ๋์ ์ธ์๋ฉ๋๋ค. -x ํ๋๊ทธ๊ฐ ์ง์ ๋์ง ์์์ต๋๋ค.
์ธ์ ๋ ์ง Ctrl+C๋ฅผ ๋๋ฅด๋ฉด ๋ฃจํ๊ฐ ์ค๋จ๋๊ณ , ๊ทธ๋ ์ง ์์ผ๋ฉด ๋ฌดํ์ ์คํ๋ฉ๋๋ค.
์ธ์๊ฐ ์ง์ ๋์ง ์์ ๊ฒฝ์ฐ -l ๊ธฐ๋ณธ ๊ฐ๊ฒฉ์ธ 5์ด๊ฐ ์ฌ์ฉ๋ฉ๋๋ค.
์ ํ์ ์ง๋ฌธ ์ต์
ํธ์ถ์๊ฐ ์ฟผ๋ฆฌํ ์์ฑ์ ๋ช ์์ ๋ชฉ๋ก์ ์ ๋ฌํ ์ ์์ต๋๋ค.
[ํ๋ NS]
--์ฟผ๋ฆฌ GPU=
GPU์ ๋ํ ์ ๋ณด์ ๋๋ค. ์ฟผ๋ฆฌํ๋ ค๋ ์์ฑ์ ์ผํ๋ก ๊ตฌ๋ถ๋ ๋ชฉ๋ก์ ์ ๋ฌํฉ๋๋ค. ์
--query-gpu=pci.bus_id, ์ง์์ฑ ๋ชจ๋. ์์ธํ ๋ด์ฉ์ --help-query-gpu๋ฅผ ํธ์ถํ์ญ์์ค.
--์ฟผ๋ฆฌ ์ง์ ์๊ณ=
์ง์๋๋ ์๊ณ ๋ชฉ๋ก์ ๋๋ค. ์์ธํ ๋ด์ฉ์ --help-query-supported-clocks๋ฅผ ํธ์ถํ์ญ์์ค.
--์ฟผ๋ฆฌ-์ปดํจํ -์ฑ=
ํ์ฌ ํ์ฑ ์ปดํจํ ํ๋ก์ธ์ค ๋ชฉ๋ก์ ๋๋ค. ์์ธํ ๋ด์ฉ์ --help-query-compute-apps๋ฅผ ํธ์ถํ์ญ์์ค.
--์ฟผ๋ฆฌ-๊ณ์ -์ฑ=
๊ณ์ฐ๋ ์ปดํจํ ํ๋ก์ธ์ค ๋ชฉ๋ก์ ๋๋ค. ์์ธํ ๋ด์ฉ์ --help-query-account-apps๋ฅผ ํธ์ถํ์ญ์์ค.
--์ฟผ๋ฆฌ-์ํด-ํ์ด์ง=
ํ๊ธฐ๋ GPU ์ฅ์น ๋ฉ๋ชจ๋ฆฌ ํ์ด์ง ๋ชฉ๋ก์ ๋๋ค. --help-query-retired-pages ํธ์ถ
์์ธํ ์ ๋ณด์ ๋๋ค.
[ํ์์ ์ธ]
--ํ์=
์ผํ๋ก ๊ตฌ๋ถ๋ ํ์ ์ต์ ๋ชฉ๋ก:
ยท csv - ์ผํ๋ก ๊ตฌ๋ถ๋ ๊ฐ(ํ์)
ยท noheader - ์ด ๋จธ๋ฆฌ๊ธ์ด ์๋ ์ฒซ ๋ฒ์งธ ์ค ๊ฑด๋๋ฐ๊ธฐ
ยท nounits - ์ซ์ ๊ฐ์ ๋จ์๋ฅผ ์ธ์ํ์ง ์์ต๋๋ค.
[์ ๋ํ ์ด๋ค NS]
-NS, --id=์์ด๋
์ง์ ๋ ๋จ์ผ GPU์ ๋ํ ๋ฐ์ดํฐ๋ฅผ ํ์ํฉ๋๋ค. ์ง์ ๋ id๋ GPU์ 0 ๊ธฐ๋ฐ ์ธ๋ฑ์ค์ผ ์ ์์ต๋๋ค.
๋๋ผ์ด๋ฒ๊ฐ ๋ฐํํ ์์ฐ ์ด๊ฑฐ์์ GPU์ ๋ณด๋ ์ผ๋ จ ๋ฒํธ,
GPU์ UUID ๋๋ GPU์ PCI ๋ฒ์ค ID(XNUMX์ง์๋ก domain:bus:device.function). ๊ทธ๊ฒ์์ด๋ค
์ผ๊ด์ฑ์ ์ํ๋ ์ฌ์ฉ์๋ UUID ๋๋ PCI ๋ฒ์ค ID๋ฅผ ์ฌ์ฉํ ๊ฒ์ ๊ถ์ฅํฉ๋๋ค.
์ด๊ฑฐ ์์๋ ์ฌ๋ถํ ๊ณผ ๋ณด๋ ์ง๋ ฌ ๊ฐ์ ์ผ๊ด์ฑ์ด ๋ณด์ฅ๋์ง ์์ต๋๋ค.
๋์ผํ ๋ณด๋์ ์ฌ๋ฌ GPU ๊ฐ์ ๋ฒํธ๋ฅผ ๊ณต์ ํ ์ ์์ต๋๋ค.
-f ํ์ผ, --ํ์ผ๋ช =ํ์ผ
๊ธฐ๋ณธ stdout ๋์ ์ง์ ๋ ํ์ผ๋ก ์ฟผ๋ฆฌ ์ถ๋ ฅ์ ๋ฆฌ๋๋ ์ ํฉ๋๋ค. ์ง์ ๋
ํ์ผ์ ๋ฎ์ด์๋๋ค.
-l ๋น์, --๋ฃจํ=SEC
๋จ์ํ ๊ธฐ๋ณธ๊ฐ์ด ์๋ ์ง์ ๋ ๊ฐ๊ฒฉ์ผ๋ก ์ฟผ๋ฆฌ ๋ฐ์ดํฐ๋ฅผ ์ง์์ ์ผ๋ก ๋ณด๊ณ ํฉ๋๋ค.
ํ ๋ฒ. ์ ํ๋ฆฌ์ผ์ด์ ์ ์ฟผ๋ฆฌ ์ฌ์ด์ ์ ์๊ธฐ ์ํ๊ฐ ๋ฉ๋๋ค. Linux ECC ์ค๋ฅ ๋๋ XID์ ๊ฒฝ์ฐ
์ค๋ฅ ์ด๋ฒคํธ๋ ๋ค์๊ณผ ๊ฐ์ ๊ฒฝ์ฐ ์ ์ ๊ธฐ๊ฐ ๋์ ์ธ์๋ฉ๋๋ค. -x ํ๋๊ทธ๊ฐ ์ง์ ๋์ง ์์์ต๋๋ค.
์ธ์ ๋ ์ง Ctrl+C๋ฅผ ๋๋ฅด๋ฉด ๋ฃจํ๊ฐ ์ค๋จ๋๊ณ , ๊ทธ๋ ์ง ์์ผ๋ฉด ๋ฌดํ์ ์คํ๋ฉ๋๋ค.
์ธ์๊ฐ ์ง์ ๋์ง ์์ ๊ฒฝ์ฐ -l ๊ธฐ๋ณธ ๊ฐ๊ฒฉ์ธ 5์ด๊ฐ ์ฌ์ฉ๋ฉ๋๋ค.
-์ํ ms, --๋ฃจํ-ms=ms
-l,--loop์ ๋์ผํ์ง๋ง ๋ฐ๋ฆฌ์ด ๋จ์์ ๋๋ค.
์ฅ์น ๋ณ๊ฒฝ ์ต์
[์ด๋ ํ NS]
-์คํ, --์ง์์ฑ ๋ชจ๋=๋ชจ๋
๋์ GPU์ ๋ํ ์ง์์ฑ ๋ชจ๋๋ฅผ ์ค์ ํฉ๋๋ค. (GPU ATTRIBUTES) ์น์
์ง์ ๋ชจ๋์ ๋ํ ์ค๋ช ์ ๋๋ค. ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค. ๋จ์ผ GPU๊ฐ ์๋ ๊ฒฝ์ฐ ๋ชจ๋ GPU์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
๋ฅผ ์ฌ์ฉํ์ฌ ์ง์ ๋ฉ๋๋ค. -i ๋ ผ์. ์ด ์์ ์ ํจ๊ณผ๋ ์ฆ๊ฐ์ ์ ๋๋ค. ํ์ง๋ง,
์ฌ๋ถํ ํด๋ ์ง์๋์ง ์์ต๋๋ค. ๊ฐ ์ฌ๋ถํ ํ ์ง์ ๋ชจ๋๋ ๊ธฐ๋ณธ์ ์ผ๋ก
"์ฅ์ ๊ฐ์๋". Linux์์๋ง ์ฌ์ฉํ ์ ์์ต๋๋ค.
-์ด์ํ, --ecc-config=๊ตฌ์ฑ
๋์ GPU์ ๋ํ ECC ๋ชจ๋๋ฅผ ์ค์ ํฉ๋๋ค. (GPU ATTRIBUTES) ์ค๋ช ์น์
ECC ๋ชจ๋์. ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค. ๋จ์ผ GPU๊ฐ ๋ค์์ ์ฌ์ฉํ์ฌ ์ง์ ๋์ง ์๋ ํ ๋ชจ๋ GPU์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
์ ์, -i ๋ ผ์. ์ด ์ค์ ์ ๋ค์ ์ฌ๋ถํ ํ์ ์ ์ฉ๋๋ฉฐ ์๊ตฌ์ ์ ๋๋ค.
-NS, --reset-ecc-errors=์ ํ
๋์ GPU์ ๋ํ ECC ์ค๋ฅ ์นด์ดํฐ๋ฅผ ์ฌ์ค์ ํฉ๋๋ค. (GPU ATTRIBUTES) ์น์
ECC ์ค๋ฅ ์นด์ดํฐ ์ ํ์ ๋ํ ์ค๋ช . ์ฌ์ฉ ๊ฐ๋ฅํ ์ธ์๋ 0|VOLATILE ๋๋
1|์ง๊ณ. ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค. ๋จ์ผ GPU๊ฐ ๋ค์์ ์ฌ์ฉํ์ฌ ์ง์ ๋์ง ์๋ ํ ๋ชจ๋ GPU์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
์ ์, -i ๋ ผ์. ์ด ์์ ์ ํจ๊ณผ๋ ์ฆ๊ฐ์ ์ ๋๋ค.
-์จ, --์ปดํจํ ๋ชจ๋=๋ชจ๋
๋์ GPU์ ์ปดํจํ ๋ชจ๋๋ฅผ ์ค์ ํฉ๋๋ค. (GPU ATTRIBUTES) ์น์
์ปดํจํ ๋ชจ๋์ ๋ํ ์ค๋ช ์ ๋๋ค. ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค. ๋จ์ผ GPU๊ฐ ์๋ ํ ๋ชจ๋ GPU์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
๋ฅผ ์ฌ์ฉํ์ฌ ์ง์ -i ๋ ผ์. ์ด ์์ ์ ํจ๊ณผ๋ ์ฆ๊ฐ์ ์ ๋๋ค. ๊ทธ๋ฌ๋, ๊ทธ๊ฒ์
์ฌ๋ถํ ํ์๋ ์ง์๋์ง ์์ต๋๋ค. ์ฌ๋ถํ ํ ๋๋ง๋ค ์ปดํจํ ๋ชจ๋๊ฐ "DEFAULT"๋ก ์ฌ์ค์ ๋ฉ๋๋ค.
-DM ์ ํ, --๋๋ผ์ด๋ฒ ๋ชจ๋ธ=์ ํ
-fdm ์ ํ, --force-driver-model=์ ํ
TCC ๋๋ผ์ด๋ฒ ๋ชจ๋ธ์ ํ์ฑํํ๊ฑฐ๋ ๋นํ์ฑํํฉ๋๋ค. Windows ์ ์ฉ. ๊ด๋ฆฌ์ ๊ถํ์ด ํ์ํฉ๋๋ค.
-DM ๋์คํ๋ ์ด๊ฐ ๋ถ์ฐฉ๋๋ฉด ์คํจํ์ง๋ง -fdm ๋๋ผ์ด๋ฒ ๋ชจ๋ธ์ ๊ฐ์ ๋ก ๋ณ๊ฒฝํฉ๋๋ค.
๋จ์ผ GPU๊ฐ ๋ค์์ ์ฌ์ฉํ์ฌ ์ง์ ๋์ง ์๋ ํ ๋ชจ๋ GPU์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค. -i ๋ ผ์. ์ฌ๋ถํ ์
๋ณ๊ฒฝ์ด ๋ฐ์ํ๋ ๋ฐ ํ์ํฉ๋๋ค. ๋ณด๋ค ์ด์ ๊ธฐ์ฌ ๋ชจ๋ธ Windows์ ๋ํ ์์ธํ ๋ด์ฉ์
๋๋ผ์ด๋ฒ ๋ชจ๋ธ.
--gom=๋ชจ๋
GPU ์๋ ๋ชจ๋ ์ค์ : 0/ALL_ON, 1/COMPUTE, 2/LOW_DP GK110 M-class ๋ฐ X-์์ ์ง์๋จ
Kepler ์ ํ๊ตฐ์ Tesla ์ ํ. Quadro ๋ฐ Tesla C ํด๋์ค์์๋ ์ง์๋์ง ์์
์ ํ. LOW_DP ๋ฐ ALL_ON์ GeForce Titan ์ฅ์น์์ ์ง์๋๋ ์ ์ผํ ๋ชจ๋์ ๋๋ค.
๊ด๋ฆฌ์ ๊ถํ์ด ํ์ํฉ๋๋ค. ๋ณด๋ค GPU ์กฐ์ ๋ชจ๋ GOM์ ๋ํ ์์ธํ ๋ด์ฉ์
GOM ๋ณ๊ฒฝ ์ฌํญ์ ์ฌ๋ถํ ํ ์ ์ฉ๋ฉ๋๋ค. ์ฌ๋ถํ ์๊ตฌ ์ฌํญ์
๋ฏธ๋. ์ปดํจํ ์ ์ฉ GOM์ WDDM(Windows ๋์คํ๋ ์ด ๋๋ผ์ด๋ฒ ๋ชจ๋ธ)์ ์ง์ํ์ง ์์ต๋๋ค.
-NS, --gpu ๋ฆฌ์
GPU ์ฌ์ค์ ์ ํธ๋ฆฌ๊ฑฐํฉ๋๋ค. ๋ค์๊ณผ ๊ฐ์ ์ํฉ์์ GPU HW ๋ฐ SW ์ํ๋ฅผ ์ง์ฐ๋ ๋ฐ ์ฌ์ฉํ ์ ์์ต๋๋ค.
๊ทธ๋ ์ง ์์ผ๋ฉด ์์คํ ์ฌ๋ถํ ์ด ํ์ํฉ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ๋๋ธ ๋นํธ ECC ์ค๋ฅ๊ฐ ์๋ ๊ฒฝ์ฐ ์ ์ฉํฉ๋๋ค.
๋ฐ์ํ์ต๋๋ค. ํ์ -i ๋์ ํน์ ์ฅ์น๋ก ์ ํํฉ๋๋ค. ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค. ์์ ์ ์๋ค
์ด ํน์ ์ฅ์น๋ฅผ ์ฌ์ฉํ๋ ๋ชจ๋ ์์ฉ ํ๋ก๊ทธ๋จ(์: CUDA ์์ฉ ํ๋ก๊ทธ๋จ, ๊ทธ๋ํฝ ์์ฉ ํ๋ก๊ทธ๋จ
X ์๋ฒ์ ๊ฐ์ nvidia-smi์ ๋ค๋ฅธ ์ธ์คํด์ค์ ๊ฐ์ ๋ชจ๋ํฐ๋ง ์์ฉ ํ๋ก๊ทธ๋จ). ๊ฑฐ๊ธฐ๋
์์คํ ์ ๋ค๋ฅธ GPU์์ ์คํ๋๋ ์ปดํจํ ์ ํ๋ฆฌ์ผ์ด์ ์ด ๋ ์ ์์ต๋๋ค. ์๋ง
Linux์์ ์คํ๋๋ Fermi ๋ฐ Kepler ์ ํ๊ตฐ์ ์ง์ ์ฅ์น.
GPU ์ฌ์ค์ ์ ๋ชจ๋ ๊ฒฝ์ฐ์ ์๋ํ์ง ์์ ์ ์์ต๋๋ค. ์์ฐ์๋ ๊ถ์ฅ๋์ง ์์ต๋๋ค.
์ด ๋์ ํ๊ฒฝ. ๊ฒฝ์ฐ์ ๋ฐ๋ผ ๋ณด๋์ HW ๊ตฌ์ฑ ์์๊ฐ ์์ ์ ์์ต๋๋ค.
์ฌ์ค์ ์์ฒญ ํ ์ด๊ธฐ ์ํ๋ก ๋๋๋ฆฌ๋ ๋ฐ ์คํจํฉ๋๋ค. ์ด๊ฒ์ ๋
Fermi ์ธ๋ ์ ํ ๋ Kepler์์ ๋ณผ ๊ฐ๋ฅ์ฑ์ด ๋์ผ๋ฉฐ ๋ค์๊ณผ ๊ฐ์ ๊ฒฝ์ฐ ๋ ๋ง์ด ๋ณผ ์ ์์ต๋๋ค.
์ ์ง๋ GPU์์ ์ฌ์ค์ ์ด ์ํ๋๊ณ ์์ต๋๋ค.
์ฌ์ค์ ํ์๋ GPU ์ํ๋ฅผ ๋ ์ด์ ํ์ธํ๊ธฐ ์ ์ ํ์ธํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
์ฌ์ฉํ๋ค. nvidia-healthmon ๋๊ตฌ๋ ์ด ํ ์คํธ์ ์ ํฉํฉ๋๋ค. GPU๊ฐ ๊ฑด๊ฐํ์ง ์์ ๊ฒฝ์ฐ
๋ ธ๋์ ์ ์์ ๊ป๋ค ์ผ์ ์์ ํ ์ฌ์ค์ ์ ์์ํด์ผ ํฉ๋๋ค.
๋ฐฉ๋ฌธ http://developer.nvidia.com/gpu-deployment-kit GDK ๋ฐ nvidia๋ฅผ ๋ค์ด๋ก๋ํ๋ ค๋ฉด
ํฌ์ค๋ชฌ.
-์ , --applications-clocks=MEM_CLOCK,GRAPHICS_CLOCK
์ต๋๊ฐ ์ง์ GPU๋ฅผ ์ ์ํ๋ ์์ผ๋ก ํด๋ญ(์: 2000,800)
GPU์์ ์ ํ๋ฆฌ์ผ์ด์ ์ ์คํํ๋ ๋์ ์๋. Kepler+ ์ ํ๊ตฐ์ Tesla ์ฅ์น ๋ฐ
Maxwell ๊ธฐ๋ฐ GeForce Titan. -acp๋ก ์ ํ์ด ์ํ๋์ง ์๋ ํ ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค.
๋ช ๋ น..
-๋, --์ฌ์ค์ -์์ฉ ํ๋ก๊ทธ๋จ-์๊ณ
์ ํ๋ฆฌ์ผ์ด์ ์๊ณ๋ฅผ ๊ธฐ๋ณธ๊ฐ์ผ๋ก ์ฌ์ค์ ํฉ๋๋ค. Kepler+์ Tesla ์ฅ์น์ฉ
์ ํ๊ตฐ ๋ฐ Maxwell ๊ธฐ๋ฐ GeForce Titan. ์ ํ์ด ์ํ๋์ง ์๋ ํ ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค.
-acp ๋ช ๋ น์ผ๋ก.
-acp, --applications-clocks-permission=๋ชจ๋
์ ํ๋ฆฌ์ผ์ด์ ์๊ณ๋ฅผ ๋ชจ๋ ์ฌ์ฉ์๊ฐ ๋ณ๊ฒฝํ ์ ์๋์ง ์๋๋ฉด ๋ฃจํธ๋ง ๋ณ๊ฒฝํ ์ ์๋์ง ์ฌ๋ถ๋ฅผ ์ ํํฉ๋๋ค. ์ฌ์ฉ ๊ฐ๋ฅ
์ธ์๋ 0|UNRESTRICTED, 1|RESTRICTED์ ๋๋ค. Kepler+ ์ ํ๊ตฐ์ Tesla ์ฅ์น ๋ฐ
Maxwell ๊ธฐ๋ฐ GeForce Titan. ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค.
-pl, --์ ๋ ฅ ์ ํ=POWER_LIMIT
์ต๋ ์ ๋ ฅ ์ ํ์ ์ํธ๋ก ์ง์ ํฉ๋๋ค. ์ ์ ๋ฐ ๋ถ๋ ์์์ ์ซ์๋ฅผ ํ์ฉํฉ๋๋ค. ์ค์ง
Kepler ์ ํ๊ตฐ์์ ์ง์๋๋ ์ฅ์น์์. ๊ด๋ฆฌ์ ๊ถํ์ด ํ์ํฉ๋๋ค. ๊ฐ์น ์๊ตฌ
nvidia-smi์์ ๋ณด๊ณ ํ Min๊ณผ Max Power Limit ์ฌ์ด์ ์์ด์ผ ํฉ๋๋ค.
-์ค์ , --accounting-mode=๋ชจ๋
GPU ๊ณ์ ์ ํ์ฑํํ๊ฑฐ๋ ๋นํ์ฑํํฉ๋๋ค. GPU ํ๊ณ๋ฅผ ์ฌ์ฉํ๋ฉด ์ฌ์ฉ๋์ ์ถ์ ํ ์ ์์ต๋๋ค.
๋จ์ผ ํ๋ก์ธ์ค์ ์๋ช ๋์ ๋ฆฌ์์ค. Kepler์์ ์ง์ํ๋ ๊ธฐ๊ธฐ์์๋ง
๊ฐ์กฑ. ๊ด๋ฆฌ์ ๊ถํ์ด ํ์ํฉ๋๋ค. ์ฌ์ฉ ๊ฐ๋ฅํ ์ธ์๋ 0|DISABLED ๋๋
1|ํ์ฑํ๋จ.
-์นด์, --๋ช ํํ ์ค๋ช ์ฑ
์ง๊ธ๊น์ง ์ค๋ช ๋ ๋ชจ๋ ํ๋ก์ธ์ค๋ฅผ ์ง์๋๋ค. Kepler ์ ํ๊ตฐ์์ ์ง์๋๋ ๊ธฐ๊ธฐ์์๋ง ๊ฐ๋ฅํฉ๋๋ค.
๊ด๋ฆฌ์ ๊ถํ์ด ํ์ํฉ๋๋ค.
--auto-boost-default=๋ชจ๋
๊ธฐ๋ณธ ์๋ ๋ถ์คํธ ์ ์ฑ ์ 0/DISABLED ๋๋ 1/ENABLED๋ก ์ค์ ํ์ฌ ๋ณ๊ฒฝ ์ฌํญ๋ง ์ ์ฉ
๋ง์ง๋ง ๋ถ์คํธ ํด๋ผ์ด์ธํธ๊ฐ ์ข ๋ฃ๋ ํ. Kepler+์ ํน์ Tesla ์ฅ์น์์๋ง
์ ํ๊ตฐ ๋ฐ Maxwell ๊ธฐ๋ฐ GeForce ์ฅ์น. ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค.
--auto-boost-default-force=๋ชจ๋
๊ธฐ๋ณธ ์๋ ๋ถ์คํธ ์ ์ฑ ์ 0/DISABLED ๋๋ 1/ENABLED๋ก ์ค์ ํ์ฌ ๋ณ๊ฒฝ ์ฌํญ์ ์ ์ฉํฉ๋๋ค.
์ฆ์. Kepler+ ์ ํ๊ตฐ ๋ฐ Maxwell ๊ธฐ๋ฐ์ ํน์ Tesla ์ฅ์น์์๋ง
์งํฌ์ค ์ฅ์น. ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค.
--auto-boost-permission=๋ชจ๋
์๋ ๋ถ์คํธ ๋ชจ๋์ ๋ํ ๋น๊ด๋ฆฌ์/๋ฃจํธ ์ ์ด๋ฅผ ํ์ฉํฉ๋๋ค. ์ฌ์ฉ ๊ฐ๋ฅํ ์ธ์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
0|์ ํ ์์, 1|์ ํ๋จ. Kepler+ ์ ํ๊ตฐ์ ํน์ Tesla ์ฅ์น์๋ง ํด๋น๋๋ฉฐ
Maxwell ๊ธฐ๋ฐ GeForce ์ฅ์น. ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค.
[์ ๋ํ ์ ํ ๊ณผ๋ชฉ]
-NS, --id=์์ด๋
์ง์ ๋ ๋จ์ผ GPU๋ฅผ ์์ ํฉ๋๋ค. ์ง์ ๋ id๋ GPU/Unit์ 0 ๊ธฐ๋ฐ ์ธ๋ฑ์ค์ผ ์ ์์ต๋๋ค.
๋๋ผ์ด๋ฒ๊ฐ ๋ฐํํ ์์ฐ ์ด๊ฑฐ, GPU์ ๋ณด๋ ์ผ๋ จ ๋ฒํธ, GPU์
UUID ๋๋ GPU์ PCI ๋ฒ์ค ID(XNUMX์ง์๋ก domain:bus:device.function). ๊ทธ๊ฒ์ ์ถ์ฒํฉ๋๋ค
์ผ๊ด์ฑ์ ์ํ๋ ์ฌ์ฉ์๋ UUID ๋๋ PCI ๋ฒ์ค ID๋ฅผ ์ฌ์ฉํฉ๋๋ค.
์ฌ๋ถํ ์ฌ์ด์ ์์๊ฐ ์ผ๊ด์ฑ์ด ์๋ค๊ณ ๋ณด์ฅ๋์ง ์์ผ๋ฉฐ ๋ณด๋ ์ผ๋ จ ๋ฒํธ๊ฐ
๋์ผํ ๋ณด๋์ ์ฌ๋ฌ GPU ๊ฐ์ ๊ณต์ ํ ์ ์์ต๋๋ค.
UNIT ๋ณ๊ฒฝ ์ต์
-NS, --toggle-led=์ํ
๊ธฐ๊ธฐ ์ ๋ฉด๊ณผ ํ๋ฉด์ LED ํ์๋ฑ ์ํ๋ฅผ ์ง์ ๋ ์์์ผ๋ก ์ค์ ํฉ๋๋ค. ๋ณด๋ค
(UNIT ATTRIBUTES) LED ์ํ์ ๋ํ ์ค๋ช ์ ์น์ ์ ์ฐธ์กฐํ์ญ์์ค. ํ์ฉ๋๋ ์์์
0|๋ น์ ๋ฐ 1|ํฉ์. ๋ฃจํธ๊ฐ ํ์ํฉ๋๋ค.
[์ ๋ํ ์ ํ ๊ณผ๋ชฉ]
-NS, --id=์์ด๋
์ง์ ๋ ๋จ์ผ ๋จ์๋ฅผ ์์ ํฉ๋๋ค. ์ง์ ๋ id๋ ๋จ์์ 0๋ถํฐ ์์ํ๋ ์ธ๋ฑ์ค์ ๋๋ค.
๋๋ผ์ด๋ฒ๊ฐ ๋ฐํํ ์์ฐ ์ด๊ฑฐ์ ๋๋ค.
ํ์ DTD ์ต์
--dtd
๋์คํ๋ ์ด ์ฅ์น ๋๋ ๋จ์ DTD.
[์ ๋ํ ์ ํ ๊ณผ๋ชฉ]
-f ํ์ผ, --ํ์ผ๋ช =ํ์ผ
๊ธฐ๋ณธ stdout ๋์ ์ง์ ๋ ํ์ผ๋ก ์ฟผ๋ฆฌ ์ถ๋ ฅ์ ๋ฆฌ๋๋ ์ ํฉ๋๋ค. ์ง์ ๋
ํ์ผ์ ๋ฎ์ด์๋๋ค.
-์ , --๋จ์
์ฅ์น DTD ๋์ ๋์คํ๋ ์ด ๋จ์ DTD.
ํต๊ณ
GPU์ ๋ํ ํต๊ณ ์ ๋ณด๋ฅผ ํ์ํฉ๋๋ค. ์์ธํ ๋ด์ฉ์ "nvidia-smi stats -h"๋ฅผ ์ฌ์ฉํ์ญ์์ค.
์ ๋ณด. ๋ฆฌ๋ ์ค ์ ์ฉ.
topo
์์คํ ์ ๋ํ ํ ํด๋ก์ง ์ ๋ณด๋ฅผ ํ์ํฉ๋๋ค. ์์ธํ ๋ด์ฉ์ "nvidia-smi topo -h"๋ฅผ ์ฌ์ฉํ์ญ์์ค.
์ ๋ณด. ๋ฆฌ๋ ์ค ์ ์ฉ. NVML์ด ๊ฐ์งํ ์ ์์ง๋ง CPU ์ ํธ๋๊ฐ ์๋ ๋ชจ๋ GPU๋ฅผ ํ์ํฉ๋๋ค.
Kepler ๋๋ ์ต์ ์ํคํ ์ฒ๊ฐ ์๋ GPU์ ๋ํด์๋ง ์ ๋ณด๊ฐ ํ์๋ฉ๋๋ค. ์ฐธ๊ณ : GPU
์ด๊ฑฐํ์ NVML๊ณผ ๋์ผํฉ๋๋ค.
๋ฐฐ์
GPU ๋๋ ์ธ ์ํ๋ฅผ ํ์ํ๊ณ ์์ ํฉ๋๋ค. ์์ธํ ๋ด์ฉ์ "nvidia-smi drain -h"๋ฅผ ์ฌ์ฉํ์ญ์์ค.
๋ฆฌ๋ ์ค ์ ์ฉ.
nvlink
nvlink ์ ๋ณด๋ฅผ ํ์ํฉ๋๋ค. ์์ธํ ๋ด์ฉ์ "nvidia-smi nvlink -h"๋ฅผ ์ฌ์ฉํ์ญ์์ค.
์๊ณ
ํด๋ฌํน ๋์์ ์ฟผ๋ฆฌํ๊ณ ์ ์ดํฉ๋๋ค. ํ์ฌ ์ด๊ฒ์ ๋๊ธฐํ๋ ๋ถ์คํธ์๋ง ํด๋น๋ฉ๋๋ค.
์์ธํ ๋ด์ฉ์ "nvidia-smi clocks --help"๋ฅผ ์ฌ์ฉํ์ญ์์ค.
RETURN VALUE
๋ฐํ ์ฝ๋๋ ์์ ์ ์ฑ๊ณต ๋๋ ์คํจ ์ฌ๋ถ์ ๊ทธ ์ด์ ๋ฅผ ๋ฐ์ํฉ๋๋ค.
์คํจ.
ยท ๋ฐํ ์ฝ๋ 0 - ์ฑ๊ณต
ยท ๋ฐํ ์ฝ๋ 2 - ์ ๊ณต๋ ์ธ์ ๋๋ ํ๋๊ทธ๊ฐ ์๋ชป๋์์ต๋๋ค.
ยท ๋ฐํ ์ฝ๋ 3 - ์์ฒญํ ์์ ์ ๋์ ์ฅ์น์์ ์ฌ์ฉํ ์ ์์ต๋๋ค.
ยท ๋ฐํ ์ฝ๋ 4 - ํ์ฌ ์ฌ์ฉ์๋ ์ด ์ฅ์น์ ์ก์ธ์คํ ์ ์๋ ๊ถํ์ด ์๊ฑฐ๋
์ด ์์ ์ ์ํ
ยท ๋ฐํ ์ฝ๋ 6 - ๊ฐ์ฒด๋ฅผ ์ฐพ๋ ์ฟผ๋ฆฌ๊ฐ ์คํจํ์ต๋๋ค.
ยท ๋ฐํ ์ฝ๋ 8 - ์ฅ์น์ ์ธ๋ถ ์ ์ ์ผ์ด๋ธ์ด ์ ๋๋ก ์ฐ๊ฒฐ๋์ง ์์์ต๋๋ค.
ยท ๋ฐํ ์ฝ๋ 9 - NVIDIA ๋๋ผ์ด๋ฒ๊ฐ ๋ก๋๋์ง ์์
ยท ๋ฐํ ์ฝ๋ 10 - NVIDIA ์ปค๋์ด GPU์์ ์ธํฐ๋ฝํธ ๋ฌธ์ ๋ฅผ ๊ฐ์งํ์ต๋๋ค.
ยท ๋ฐํ ์ฝ๋ 12 - NVML ๊ณต์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฐพ๊ฑฐ๋ ๋ก๋ํ ์ ์์ต๋๋ค.
ยท ๋ฐํ ์ฝ๋ 13 - NVML์ ๋ก์ปฌ ๋ฒ์ ์ ์ด ๊ธฐ๋ฅ์ ๊ตฌํํ์ง ์์ต๋๋ค.
ยท ๋ฐํ ์ฝ๋ 14 - infoROM์ด ์์๋์์ต๋๋ค.
ยท ๋ฐํ ์ฝ๋ 15 - GPU๊ฐ ๋ฒ์ค์์ ๋จ์ด์ง๊ฑฐ๋
์ก์ธ์ค
ยท ๋ฐํ ์ฝ๋ 255 - ๊ธฐํ ์ค๋ฅ ๋๋ ๋ด๋ถ ๋๋ผ์ด๋ฒ ์ค๋ฅ๊ฐ ๋ฐ์ํ์ต๋๋ค.
GPU ATTRIBUTES
๋ค์ ๋ชฉ๋ก์ ์์ ๋ฐํ๋ ๊ฐ๋ฅํ ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์ค๋ช ํฉ๋๋ค. -q ์ฅ์น ์ฟผ๋ฆฌ ์ต์ .
๋ฌ๋ฆฌ ๋ช ์๋์ง ์๋ ํ ๋ชจ๋ ์์น ๊ฒฐ๊ณผ๋ ๋ฐ์ด 10์ด๊ณ ๋จ์๊ฐ ์์ต๋๋ค.
์๊ฐ ๊ธฐ๋ก
nvidia-smi๊ฐ ํธ์ถ๋ ์์ ์ ํ์ฌ ์์คํ ํ์์คํฌํ์ ๋๋ค. ํ์์ "์์ผ
์ ์ผ HH:MM:SS ์ฐ๋".
์ด์ ๊ธฐ์ฌ ๋ฒ์
์ค์น๋ NVIDIA ๋์คํ๋ ์ด ๋๋ผ์ด๋ฒ์ ๋ฒ์ ์ ๋๋ค. ์ด๊ฒ์ ์์ซ์ ๋ฌธ์์ด์ ๋๋ค.
์ฒจ๋ถ GPU
์์คํ ์ NVIDIA GPU ์์ ๋๋ค.
ํ๋ก๋ํธ ์ฑํจ
GPU์ ๊ณต์ ์ ํ ์ด๋ฆ์ ๋๋ค. ์ด๊ฒ์ ์์ซ์ ๋ฌธ์์ด์ ๋๋ค. ๋ชจ๋ ์ ํ.
๋์คํ๋ ์ด ๋ชจ๋
๋ฌผ๋ฆฌ์ ๋์คํ๋ ์ด(์: ๋ชจ๋ํฐ)๊ฐ ํ์ฌ ์ฐ๊ฒฐ๋์ด ์๋์ง ์ฌ๋ถ๋ฅผ ๋ํ๋ด๋ ํ๋๊ทธ
GPU์ ์ปค๋ฅํฐ ์ค ํ๋. "ํ์ฑํ๋จ"์ ์ฐ๊ฒฐ๋ ๋์คํ๋ ์ด๋ฅผ ๋ํ๋ ๋๋ค. "์ฅ์ ๊ฐ์๋"
๋ฌ๋ฆฌ ๋ํ๋ ๋๋ค.
๋์คํ๋ ์ด ์ต๊ทผํ๋
๋์คํ๋ ์ด๊ฐ GPU์์ ์ด๊ธฐํ๋์๋์ง ์ฌ๋ถ๋ฅผ ๋ํ๋ด๋ ํ๋๊ทธ(์: ๋ฉ๋ชจ๋ฆฌ๊ฐ
ํ์๋ฅผ ์ํด ์ฅ์น์ ํ ๋น๋จ). ๋ชจ๋ํฐ๊ฐ ์๋ ๊ฒฝ์ฐ์๋ ๋์คํ๋ ์ด๋ฅผ ํ์ฑํํ ์ ์์ต๋๋ค.
๋ฌผ๋ฆฌ์ ์ผ๋ก ๋ถ์ด ์์ต๋๋ค. "ํ์ฑํ๋จ"์ ํ์ฑ ๋์คํ๋ ์ด๋ฅผ ๋ํ๋ ๋๋ค. "๋นํ์ฑํ๋จ"์
๊ทธ๋ ์ง ์์ผ๋ฉด.
๊ณ ์ง ๋ชจ๋
GPU์ ๋ํด ์ง์์ฑ ๋ชจ๋๊ฐ ํ์ฑํ๋์๋์ง ์ฌ๋ถ๋ฅผ ๋ํ๋ด๋ ํ๋๊ทธ์ ๋๋ค. ๊ฐ์ ๋ค์ ์ค ํ๋์ ๋๋ค.
"ํ์ฑํ๋จ" ๋๋ "๋นํ์ฑํ๋จ". ์ง์์ฑ ๋ชจ๋๊ฐ ํ์ฑํ๋๋ฉด NVIDIA ๋๋ผ์ด๋ฒ๊ฐ ์ ์ง๋ฉ๋๋ค.
X11 ๋๋ nvidia-smi์ ๊ฐ์ ํ์ฑ ํด๋ผ์ด์ธํธ๊ฐ ์๋ ๊ฒฝ์ฐ์๋ ๋ก๋๋ฉ๋๋ค. ์ด๊ฒ์ ์ต์ํ
CUDA ํ๋ก๊ทธ๋จ๊ณผ ๊ฐ์ ์ข ์ ์ฑ ์คํ๊ณผ ๊ด๋ จ๋ ๋๋ผ์ด๋ฒ ๋ก๋ ๋๊ธฐ ์๊ฐ. ์์ํ
๋ชจ๋ CUDA ์ง์ ์ ํ. ๋ฆฌ๋ ์ค ์ ์ฉ.
ํ๊ณ ๋ชจ๋
GPU ๊ฐ์ ๋ํด ๊ณ์ ๋ชจ๋๊ฐ ํ์ฑํ๋์๋์ง ์ฌ๋ถ๋ฅผ ๋ํ๋ด๋ ํ๋๊ทธ๋ ๋ค์ ์ค ํ๋์ ๋๋ค.
ํ๊ณ๊ฐ ํ์ฑํ๋ ์ํ์์ ์คํ ์ค์ธ ๊ฐ ์ปดํจํ ํ๋ก์ธ์ค์ ๋ํด ํต๊ณ๊ฐ ๊ณ์ฐ๋ฉ๋๋ค.
GPU. ํต๊ณ๋ ์๋ช ๊ธฐ๊ฐ ๋์ ๋๋ ํ๋ก์ธ์ค ์ข ๋ฃ ํ์ ์ฟผ๋ฆฌํ ์ ์์ต๋๋ค.
ํ๋ก์ธ์ค๊ฐ ์คํ ์ํ์ ์๋ ๋์ ํ๋ก์ธ์ค์ ์คํ ์๊ฐ์ 0์ผ๋ก ๋ณด๊ณ ๋๊ณ
ํ๋ก์ธ์ค๊ฐ ์ข ๋ฃ๋ ํ ์ค์ ์คํ ์๊ฐ์ผ๋ก ์ ๋ฐ์ดํธ๋ฉ๋๋ค. --help-query-๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
์์ธํ ๋ด์ฉ์ ๊ณ์ ์ฑ์ ์ฐธ์กฐํ์ธ์.
ํ๊ณ ๋ชจ๋ ๋ฒํผ ํฌ๊ธฐ
์ฟผ๋ฆฌํ ์ ์๋ ํ๋ก์ธ์ค ๋ชฉ๋ก์ ๋ณด์ ํ๋ ์ํ ๋ฒํผ์ ํฌ๊ธฐ๋ฅผ ๋ฐํํฉ๋๋ค.
ํ๊ณ ํต๊ณ๋ฅผ ์ํด. ํ๊ณ ์ ๋ณด๊ฐ ์ฒ๋ฆฌํ๋ ์ต๋ ํ๋ก์ธ์ค ์์ ๋๋ค.
๊ฐ์ฅ ์ค๋๋ ํ๋ก์ธ์ค์ ๋ํ ์ ๋ณด๋ฅผ ๋ฎ์ด ์ฐ๊ธฐ ์ ์ ์ ์ฅ๋ฉ๋๋ค.
์๋ก์ด ํ๋ก์ธ์ค์ ๋ํ ์ ๋ณด.
์ด์ ๊ธฐ์ฌ ๋ชจ๋ธ
Windows์์๋ TCC ๋ฐ WDDM ๋๋ผ์ด๋ฒ ๋ชจ๋ธ์ด ์ง์๋ฉ๋๋ค. ๋๋ผ์ด๋ฒ ๋ชจ๋ธ ๋ณ๊ฒฝ ๊ฐ๋ฅ
์ด๋ (-DM) ๋๋ (-fdm) ํ๋๊ทธ. TCC ๋๋ผ์ด๋ฒ ๋ชจ๋ธ์ ์ปดํจํ ์ ์ต์ ํ๋์ด ์์ต๋๋ค.
์์ฉ ํ๋ก๊ทธ๋จ. TCC๋ฅผ ์ฌ์ฉํ๋ฉด IE ์ปค๋ ์คํ ์๊ฐ์ด ๋ ๋นจ๋ผ์ง๋๋ค. WDDM ๋๋ผ์ด๋ฒ ๋ชจ๋ธ
๊ทธ๋ํฝ ์์ฉ ํ๋ก๊ทธ๋จ์ฉ์ผ๋ก ์ค๊ณ๋์์ผ๋ฉฐ ์ปดํจํ ์์ฉ ํ๋ก๊ทธ๋จ์๋ ๊ถ์ฅ๋์ง ์์ต๋๋ค.
Linux๋ ์ฌ๋ฌ ๋๋ผ์ด๋ฒ ๋ชจ๋ธ์ ์ง์ํ์ง ์์ผ๋ฉฐ ํญ์ "N/A" ๊ฐ์ ๊ฐ์ต๋๋ค.
Current ํ์ฌ ์ฌ์ฉ ์ค์ธ ๋๋ผ์ด๋ฒ ๋ชจ๋ธ์ ๋๋ค. Linux์์๋ ํญ์ "ํด๋น ์ฌํญ ์์"์ ๋๋ค.
๋๊ธฐ์ค ๋ค์์ ์ฌ๋ถํ ํ ๋ ์ฌ์ฉํ ๋๋ผ์ด๋ฒ ๋ชจ๋ธ์ ๋๋ค. ํญ์ "ํด๋น ์ฌํญ ์์" ์ผ์ง
๋ฆฌ๋ ์ค.
์ผ๋ จ์ ๋ฒํธ
์ด ๋ฒํธ๋ ๊ฐ ๋ณด๋์ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์ธ์๋ ์ผ๋ จ ๋ฒํธ์ ์ผ์นํฉ๋๋ค. ์ด๋ ์ ์ธ๊ณ์ ์ผ๋ก
๊ณ ์ ํ ๋ณ๊ฒฝํ ์ ์๋ ์์ซ์ ๊ฐ์ ๋๋ค.
GPU UUID
์ด ๊ฐ์ GPU์ ์ ์ญ์ ์ผ๋ก ๊ณ ์ ํ ๋ณ๊ฒฝํ ์ ์๋ ์์ซ์ ์๋ณ์์ ๋๋ค. ๊ทธ๋ ์ต๋๋ค
๋ณด๋์ ๋ฌผ๋ฆฌ์ ๋ ์ด๋ธ๊ณผ ์ผ์นํ์ง ์์ต๋๋ค.
๋ฏธ์ฑ๋ ์ ๋ฒํธ
์ฅ์น์ ๋ถ ๋ฒํธ๋ ๊ฐ GPU์ ๋ํ Nvidia ์ฅ์น ๋ ธ๋ ํ์ผ์ด
ํ์์ /dev/nvidia[๋ถ ๋ฒํธ]์ ๋๋ค. Linux ํ๋ซํผ์์๋ง ์ฌ์ฉํ ์ ์์ต๋๋ค.
VBIOS ๋ฒ์
GPU ๋ณด๋์ BIOS.
๋ฉํฐ GPU ๊ต์ก ์์ํ
์ด GPU๊ฐ multiGPU ๋ณด๋์ ์ผ๋ถ์ธ์ง ์ฌ๋ถ์ ๋๋ค.
๊ต์ก ์์ํ ID
๋๋ผ์ด๋ฒ๊ฐ ํ ๋นํ ๊ณ ์ ํ ๋ณด๋ ID์ ๋๋ค. XNUMX๊ฐ ์ด์์ GPU๊ฐ ๋์ผํ ๋ณด๋ ID๋ฅผ ๊ฐ๋ ๊ฒฝ์ฐ
์์ "MultiGPU" ํ๋๊ฐ true์ด๋ฉด GPU๊ฐ ๋์ผํ ๋ณด๋์ ์๋ ๊ฒ์ ๋๋ค.
์ ๋ณด ๋ฒ์
GPU ๋ณด๋์ ์ ๋ณด ์ ์ฅ์์ ์๋ ๊ฐ ๊ฐ์ฒด์ ๋ฒ์ ๋ฒํธ์ ๋๋ค. ์ ๋ณด๋
GPU์ ๋ํ ๊ตฌ์ฑ ๋ฐ ์ํ ๋ฐ์ดํฐ์ ์๊ณ ์๊ตฌ์ ์ธ ์ ์ฅ์์ ๋๋ค. ๋ชจ๋ ์ ๋ณด ๋ฒ์
ํ๋๋ ์ซ์์ ๋๋ค. ์ผ๋ถ GPU๊ฐ ์๊ธฐ ๋๋ฌธ์ ์ด๋ฌํ ๋ฒ์ ๋ฒํธ๋ฅผ ์๋ ๊ฒ์ด ์ ์ฉํ ์ ์์ต๋๋ค.
๊ธฐ๋ฅ์ ํน์ ๋ฒ์ ์ด์์ ์ ๋ณด์์๋ง ์ฌ์ฉํ ์ ์์ต๋๋ค.
์๋ ํ๋ ์ค ํ๋๋ผ๋ ์ ์ ์๋ ์ค๋ฅ๋ฅผ ๋ฐํํ๋ ๊ฒฝ์ฐ ์ถ๊ฐ ์ ๋ณด ํ์ธ ํ์ธ์
์ํ๋๊ณ ์ ์ ํ ๊ฒฝ๊ณ ๋ฉ์์ง๊ฐ ํ์๋ฉ๋๋ค.
์์ ๋ฒ์ infoROM ์ด๋ฏธ์ง์ ๊ธ๋ก๋ฒ ๋ฒ์ ์ ๋๋ค. VBIOS ๋ฒ์ ๊ณผ ๊ฐ์ ์ด๋ฏธ์ง ๋ฒ์
๋ณด๋์ ํ๋์๋ infoROM์ ์ ํํ ๋ฒ์ ์ ๊ณ ์ ํ๊ฒ ์ค๋ช ํฉ๋๋ค.
์ง์๋๋ ์งํ์ผ ๋ฟ์ธ infoROM ๊ฐ์ฒด ๋ฒ์ ๊ณผ ๋์กฐ
๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค.
OEM ๋ชฉ์ OEM ๊ตฌ์ฑ ๋ฐ์ดํฐ์ ๋ฒ์ ์ ๋๋ค.
ECC ๋ชฉ์ ECC ๊ธฐ๋ก ๋ฐ์ดํฐ์ ๋ฒ์ ์ ๋๋ค.
์ถ๋ ฅ ๋ชฉ์ ์ ์ ๊ด๋ฆฌ ๋ฐ์ดํฐ์ ๋ฒ์ ์ ๋๋ค.
GPU ์กฐ์ ๋ชจ๋
GOM์ ์ฌ์ฉํ๋ฉด GPU ๊ธฐ๋ฅ์ ๋นํ์ฑํํ์ฌ ์ ๋ ฅ ์ฌ์ฉ๋์ ์ค์ด๊ณ GPU ์ฒ๋ฆฌ๋์ ์ต์ ํํ ์ ์์ต๋๋ค.
๊ฐ GOM์ ํน์ ์ฌ์ฉ์ ์๊ตฌ๋ฅผ ์ถฉ์กฑํ๋๋ก ์ค๊ณ๋์์ต๋๋ค.
"All On" ๋ชจ๋์์๋ ๋ชจ๋ ๊ฒ์ด ํ์ฑํ๋๊ณ ์ต๊ณ ์๋๋ก ์คํ๋ฉ๋๋ค.
"๊ณ์ฐ" ๋ชจ๋๋ ์ฐ์ฐ ์์ ๋ง ์คํํ๋๋ก ์ค๊ณ๋์์ต๋๋ค. ๊ทธ๋ํฝ ์์ ์
์์์์ต๋๋ค.
"๋ฎ์ ๋ฐฐ์ ๋ฐ๋" ๋ชจ๋๋ ๊ทธ๋ ์ง ์์ ๊ทธ๋ํฝ ์์ฉ ํ๋ก๊ทธ๋จ์ ์คํํ๋๋ก ์ค๊ณ๋์์ต๋๋ค.
๊ณ ๋์ญํญ ๋ฐฐ์ ๋ฐ๋๊ฐ ํ์ํฉ๋๋ค.
GOM์ (--๊ณฐ) ๊น๋ฐ.
Kepler ์ ํ๊ตฐ์ GK110 M ํด๋์ค ๋ฐ X ํด๋์ค Tesla ์ ํ์์ ์ง์๋ฉ๋๋ค. ์๋๋ค
Quadro ๋ฐ Tesla C ํด๋์ค ์ ํ์์ ์ง์๋ฉ๋๋ค. ๋ฎ์ ๋ฐฐ์ ๋ฐ๋ ๋ฐ ๋ชจ๋ ์ผ๊ธฐ ๋ชจ๋๋
์ง์๋๋ GeForce Titan ์ ํ์ ์ฌ์ฉํ ์ ์๋ ์ ์ผํ ๋ชจ๋์ ๋๋ค.
Current ํ์ฌ ์ฌ์ฉ ์ค์ธ GOM์ ๋๋ค.
๋๊ธฐ์ค ๋ค์์ ์ฌ๋ถํ ํ ๋ ์ฌ์ฉํ GOM์ ๋๋ค.
PCI
์ฅ์น์ ๋ํ ๊ธฐ๋ณธ PCI ์ ๋ณด์ ๋๋ค. ์ด ์ ๋ณด ์ค ์ผ๋ถ๋ ์นด๋๊ฐ
์์คํ ์์ ์ถ๊ฐ/์ ๊ฑฐ/์ด๋. ๋ชจ๋ ์ ํ.
๋ฒ์ค PCI ๋ฒ์ค ๋ฒํธ(XNUMX์ง์)
์ฅ์น PCI ์ฅ์น ๋ฒํธ(XNUMX์ง์)
๋๋ฉ์ธ PCI ๋๋ฉ์ธ ๋ฒํธ(XNUMX์ง์)
์ฅ์น Id PCI ๊ณต๊ธ์ ์ฒด ์ฅ์น ID(XNUMX์ง์)
์๋ธ Id PCI ํ์ ์์คํ ID(XNUMX์ง์)
๋ฒ์ค Id PCI ๋ฒ์ค ID๋ "๋๋ฉ์ธ:๋ฒ์ค:์ฅ์น.๊ธฐ๋ฅ"์ผ๋ก, XNUMX์ง์๋ก ํ์๋ฉ๋๋ค.
GPU (๋งํฌ) ์ ๋ณด
PCIe ๋งํฌ ์์ฑ ๋ฐ ๋ฒ์ค ํญ
Current ํ์ฌ ๋งํฌ ์์ฑ ๋ฐ ๋๋น์ ๋๋ค. GPU๊ฐ
์ฌ์ฉ์ค์ด ์๋๋๋ค.
์ต๊ณ ์ด GPU ๋ฐ ์์คํ ์์ ๊ฐ๋ฅํ ์ต๋ ๋งํฌ ์์ฑ ๋ฐ ๋๋น
๊ตฌ์ฑ. ์๋ฅผ ๋ค์ด GPU๊ฐ ๋ ๋์ PCIe ์ธ๋๋ฅผ ์ง์ํ๋ ๊ฒฝ์ฐ
์์คํ ์ด ์ง์ํ๋ ๊ฒ๋ณด๋ค ๋ง์ผ๋ฉด ์์คํ PCIe ์์ฑ์ด ๋ณด๊ณ ๋ฉ๋๋ค.
๋ค๋ฆฌ Chip
์ฅ์น์ Bridge Chip๊ณผ ๊ด๋ จ๋ ์ ๋ณด์ ๋๋ค. ๋ธ๋ฆฌ์ง ์นฉ ํ์จ์ด๋ง ์์ต๋๋ค.
ํน์ ๋ณด๋์์๋ ์ฌ์ฉํ ์ ์์ผ๋ฉฐ ์ผ๋ถ ์ต์ multiGPU ๋ณด๋์์๋ "N/A"๊ฐ ํ์๋ ์ ์์ต๋๋ค.
ํ์ ๋ธ๋ฆฌ์ง ์นฉ์ ์ ํ์ ๋๋ค. ์กด์ฌํ์ง ์๋ ๊ฒฝ์ฐ N/A๋ก ๋ณด๊ณ ๋ฉ๋๋ค.
ํ์จ์ด ๋ฒ์
๋ธ๋ฆฌ์ง ์นฉ์ ํ์จ์ด ๋ฒ์ ์ ๋๋ค. ์กด์ฌํ์ง ์๋ ๊ฒฝ์ฐ N/A๋ก ๋ณด๊ณ ๋ฉ๋๋ค.
์ฌ์ ์นด์ดํฐ
PCIe ๋ฒ์ค์ ๋ค์ํ ์ค๋ฅ๋ฅผ ๊ธฐ๋กํ๋ ๋ด๋ถ ์นด์ดํฐ์ ๋๋ค.
Tx ์ฒ๋ฆฌ๋
์ง๋ 20ms ๋์ PCIe ๋ฒ์ค๋ฅผ ํตํ GPU ์ค์ฌ ์ ์ก ์ฒ๋ฆฌ๋(MB/s)์ ๋๋ค.
Maxwell ์ํคํ ์ฒ ์ด์์์๋ง ์ง์๋ฉ๋๋ค.
Rx ์ฒ๋ฆฌ๋
GPU ์ค์ฌ์ PCIe ๋ฒ์ค์์ ์ง๋ 20ms ๋์ MB/s ๋จ์์ ์์ ์ฒ๋ฆฌ๋์ ์์ ํฉ๋๋ค. ์ค์ง
Maxwell ์ํคํ ์ฒ ์ด์์์ ์ง์๋ฉ๋๋ค.
๋ถ์ฑ ์๋
ํฌ ์๋ ๊ฐ์ ํ์ฌ ์ฅ์น์ ํฌ์ด ์๋ํ๋ ์ต๋ ์๋์ ๋ฐฑ๋ถ์จ์ ๋๋ค.
์์ ์คํํ ์์ ์ ๋๋ค. ๋ฒ์๋ 0~100%์ ๋๋ค. ์ฐธ๊ณ : ๋ณด๊ณ ๋ ์๋๋ ์๋ํ ๊ฒ์ ๋๋ค.
ํฌ ์๋. ํฌ์ด ๋ฌผ๋ฆฌ์ ์ผ๋ก ์ฐจ๋จ๋์ด ํ์ ํ ์ ์๋ ๊ฒฝ์ฐ ์ด ์ถ๋ ฅ์
์ค์ ํฌ ์๋์ ์ผ์นํฉ๋๋ค. ๋ง์ ๋ถํ์ด ํฌ ์๋์ ์์กดํ๊ธฐ ๋๋ฌธ์ ๋ณด๊ณ ํ์ง ์์ต๋๋ค.
์ฃผ๋ณ ์ธํด๋ก์ ์ ํฌ์ ํตํ ๋๊ฐ. ์ ์ฉ ๊ธฐ๋ฅ์ด ์๋ ๋ชจ๋ ๊ฐ๋ณ ์ ํ์ฉ
ํฌ.
ํผํฌ๋จผ์ค ์ฃผ ์ ๋ถ
GPU์ ํ์ฌ ์ฑ๋ฅ ์ํ์ ๋๋ค. ์ํ ๋ฒ์๋ P0(์ต๋ ์ฑ๋ฅ)์์
P12(์ต์ ์ฑ๋ฅ).
์๊ณ ์กฐ์ ํ ์ด์
ํด๋ก์ ๋น๋๋ฅผ ์ค์ด๋ ์์ธ์ ๋ํ ์ ๋ณด๋ฅผ ๊ฒ์ํฉ๋๋ค. ์๋ง
Kepler ์ ํ๊ตฐ์์ ์ง์๋๋ Tesla ์ฅ์น.
๋ชจ๋ ์ค๋กํ ์ด์ ๊ฐ "๋นํ์ฑ"์ผ๋ก ๋ฐํ๋๋ฉด ์๊ณ๊ฐ ๋ค์๊ณผ ๊ฐ์ด ์คํ๋๊ณ ์์์ ์๋ฏธํฉ๋๋ค.
๊ฐ๋ฅํ ๋์.
์ ํด GPU์์ ์คํ ์ค์ธ ๊ฒ์ด ์๊ณ ํด๋ก์ด ์ ํด ์ํ๋ก ๋จ์ด์ง๊ณ ์์ต๋๋ค.
์ด ์ ํ๊ธฐ๋ ์ดํ ๋ฆด๋ฆฌ์ค์์ ์ ๊ฑฐ๋ ์ ์์ต๋๋ค.
์ดํ๋ฆฌ์ผ์ด์ ์๊ณ ํ๊ฒฝ
GPU ํด๋ญ์ ์ ํ๋ฆฌ์ผ์ด์ ํด๋ญ ์ค์ ์ ์ํด ์ ํ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด ๋ณ๊ฒฝํ ์ ์์ต๋๋ค
nvidia-smi --applications-clocks= ์ฌ์ฉ
SW ์ถ๋ ฅ ์บก SW Power Scaling ์๊ณ ๋ฆฌ์ฆ์ ์์ฒญ๋ ํด๋ญ ์๋๋ก ํด๋ญ์ ์ค์ ๋๋ค.
GPU๊ฐ ๋๋ฌด ๋ง์ ์ ๋ ฅ์ ์๋นํ๊ธฐ ๋๋ฌธ์ ๋๋ค. ์: SW ์ ๋ ฅ ์บก ํ๋๋
nvidia-smi --power-limit=๋ก ๋ณ๊ฒฝ
HW ์ฒ์ฒํ ํด HW Slowdown(์ฝ์ด ํด๋ญ์ 2๋ฐฐ ์ด์ ๊ฐ์)์ด ์๋ ์ค์ ๋๋ค.
์ด๊ฒ์ ๋ค์์ ๋ํ๋ด๋ ์งํ์ ๋๋ค.
* ์จ๋๊ฐ ๋๋ฌด ๋์
* ์ธ๋ถ ์ ์ ๋ธ๋ ์ดํฌ ์ค์ ์ด ํธ๋ฆฌ๊ฑฐ๋ฉ๋๋ค(์: ์์คํ ์ ์์ ์ํด
๊ณต๊ธ)
* ์ ๋ ฅ ์๋ชจ๊ฐ ๋๋ฌด ๋๊ณ Fast Trigger ๋ณดํธ๋ก ์ธํด ํด๋ญ์ด ๊ฐ์ํฉ๋๋ค.
์ ์ ์๋ ๋ค๋ฅธ ๋ถํน์ ์์ธ์ ์๊ณ๋ฅผ ์ค์ด๋ ๊ฒ์ ๋๋ค.
FB ๋ฉ๋ชจ๋ฆฌ ์ฉ๋ฒ
์จ๋ณด๋ ํ๋ ์ ๋ฒํผ ๋ฉ๋ชจ๋ฆฌ ์ ๋ณด. ๋ณด๊ณ ๋ ์ด ๋ฉ๋ชจ๋ฆฌ๋ ECC ์ํ์ ์ํฅ์ ๋ฐ์ต๋๋ค.
ECC๊ฐ ํ์ฑํ๋๋ฉด ์ฌ์ฉ ๊ฐ๋ฅํ ์ด ๋ฉ๋ชจ๋ฆฌ๊ฐ ๋ช ํผ์ผํธ ๊ฐ์ํฉ๋๋ค.
ํ์ ํจ๋ฆฌํฐ ๋นํธ. ๋๋ผ์ด๋ฒ๋ ๋ด๋ถ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ํด ์๋์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์์ฝํ ์๋ ์์ต๋๋ค.
GPU์ ๋ํ ํ์ฑ ์์ ์์ด๋ ์ฌ์ฉํ ์ ์์ต๋๋ค. ๋ชจ๋ ์ ํ.
๊ธ์ก FB ๋ฉ๋ชจ๋ฆฌ์ ์ ์ฒด ํฌ๊ธฐ์ ๋๋ค.
์ฌ์ฉ ๋ ์ฌ์ฉ๋ FB ๋ฉ๋ชจ๋ฆฌ ํฌ๊ธฐ์ ๋๋ค.
๋ฌด๋ฃ FB ๋ฉ๋ชจ๋ฆฌ์ ์ฌ์ฉ ๊ฐ๋ฅํ ํฌ๊ธฐ์ ๋๋ค.
๋ฐ1 ๋ฉ๋ชจ๋ฆฌ ์ฉ๋ฒ
BAR1์ CPU์์ ์ง์ ์ก์ธ์คํ ์ ์๋๋ก FB(์ฅ์น ๋ฉ๋ชจ๋ฆฌ)๋ฅผ ๋งคํํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
๋๋ ํ์ฌ ์ฅ์น(PCIe ๋ฒ์ค์ ํผ์ด ํฌ ํผ์ด).
๊ธ์ก BAR1 ๋ฉ๋ชจ๋ฆฌ์ ์ด ํฌ๊ธฐ์ ๋๋ค.
์ฌ์ฉ ๋ BAR1 ๋ฉ๋ชจ๋ฆฌ์ ์ฌ์ฉ๋ ํฌ๊ธฐ์ ๋๋ค.
๋ฌด๋ฃ BAR1 ๋ฉ๋ชจ๋ฆฌ์ ์ฌ์ฉ ๊ฐ๋ฅํ ํฌ๊ธฐ์ ๋๋ค.
๊ณ์ฐ ๋ชจ๋
์ปดํจํ ๋ชจ๋ ํ๋๊ทธ๋ ๊ฐ๋ณ ๋๋ ์ฌ๋ฌ ์ปดํจํ ์ ํ๋ฆฌ์ผ์ด์ ์ด
GPU์์ ์คํํฉ๋๋ค.
"๊ธฐ๋ณธ๊ฐ"์ ์ฅ์น๋น ์ฌ๋ฌ ์ปจํ ์คํธ๊ฐ ํ์ฉ๋จ์ ์๋ฏธํฉ๋๋ค.
"๋ ์ ํ๋ก์ธ์ค"๋ ์ฅ์น๋น ํ๋์ ์ปจํ ์คํธ๋ง ํ์ฉ๋๋ฉฐ ์ฌ๋ฌ ์ฅ์น์์ ์ฌ์ฉํ ์ ์์์ ์๋ฏธํฉ๋๋ค.
ํ ๋ฒ์ ์ค๋ ๋.
"๊ธ์ง๋จ"์ ์ฅ์น๋น ํ์ฉ๋๋ ์ปจํ ์คํธ๊ฐ ์์์ ์๋ฏธํฉ๋๋ค(์ปดํจํ ์ฑ ์์).
"EXCLUSIVE_PROCESS"๊ฐ CUDA 4.0์ ์ถ๊ฐ๋์์ต๋๋ค. ์ด์ CUDA ๋ฆด๋ฆฌ์ค๋ ํ๋๋ง ์ง์ํ์ต๋๋ค.
CUDA 4.0 ์ด์์์ "EXCLUSIVE_THREAD"์ ํด๋นํ๋ ๋จ๋ ๋ชจ๋์ ๋๋ค.
๋ชจ๋ CUDA ์ง์ ์ ํ์ฉ.
์ด์ฉ
ํ์ฉ๋ฅ ์ ๊ฐ GPU๊ฐ ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์ผ๋ง๋ ๋ฐ์์ง๋ฅผ ๋ณด๊ณ ํ๊ณ ์ด๋ป๊ฒ
๋ง์ ์์ฉ ํ๋ก๊ทธ๋จ์ด ์์คํ ์ GPU๋ฅผ ์ฌ์ฉํ๊ณ ์์ต๋๋ค.
์ฐธ๊ณ : ECC๊ฐ ํ์ฑํ๋ ๊ฒฝ์ฐ ๋๋ผ์ด๋ฒ ์ด๊ธฐํ ์ค์ ๋์ GPU ๋ฐ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
ํ์ฉ๋ ์์น. ์ด๊ฒ์ ์ํ๋๋ ECC ๋ฉ๋ชจ๋ฆฌ ์คํฌ๋ฌ๋น ๋ฉ์ปค๋์ฆ์ผ๋ก ์ธํด ๋ฐ์ํฉ๋๋ค.
๋๋ผ์ด๋ฒ ์ด๊ธฐํ ์ค.
GPU ๊ณผ๊ฑฐ ์ํ ๊ธฐ๊ฐ ๋์ ํ๋ ์ด์์ ์๊ฐ ๋น์จ
์ปค๋์ด GPU์์ ์คํ ์ค์ด์์ต๋๋ค. ์ํ ๊ธฐ๊ฐ์ 1 ์ฌ์ด์ผ ์ ์์ต๋๋ค.
์ ํ์ ๋ฐ๋ผ ์ด ๋ฐ 1/6์ด.
๋ฉ๋ชจ๋ฆฌ ์ง๋ ์ํ ๊ธฐ๊ฐ ๋์ ๊ธ๋ก๋ฒ(๊ธฐ๊ธฐ) ์๊ฐ ๋น์จ
๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ฝ๊ฑฐ๋ ์ฐ๊ณ ์์์ต๋๋ค. ์ํ ๊ธฐ๊ฐ์ 1 ์ฌ์ด์ผ ์ ์์ต๋๋ค.
์ ํ์ ๋ฐ๋ผ ์ด ๋ฐ 1/6์ด.
์ธ์ฝ๋ GPU์ ๋น๋์ค๊ฐ ์ง๋ ์ํ ๊ธฐ๊ฐ ๋์์ ์๊ฐ ๋น์จ
์ธ์ฝ๋๋ฅผ ์ฌ์ฉ ์ค์ด์์ต๋๋ค. ์ํ๋ง ์๋๋ ๊ฐ๋ณ์ ์ด๋ฉฐ ๋ค์์ ์ป์ ์ ์์ต๋๋ค.
nvmlDeviceGetEncoderUtilization() API๋ฅผ ํตํด ์ง์
๋์ฝ๋ GPU์ ๋น๋์ค๊ฐ ์ง๋ ์ํ ๊ธฐ๊ฐ ๋์์ ์๊ฐ ๋น์จ
๋์ฝ๋๋ฅผ ์ฌ์ฉ ์ค์ด์์ต๋๋ค. ์ํ๋ง ์๋๋ ๊ฐ๋ณ์ ์ด๋ฉฐ ๋ค์์ ์ป์ ์ ์์ต๋๋ค.
nvmlDeviceGetDecoderUtilization() API๋ฅผ ํตํด ์ง์
Ecc ๋ชจ๋
ECC ์ง์์ด ํ์ฑํ๋์๋์ง ์ฌ๋ถ๋ฅผ ๋ํ๋ด๋ ํ๋๊ทธ์ ๋๋ค. "ํ์ฑํ" ๋๋
"์ฅ์ ๊ฐ์๋". ECC ๋ชจ๋๋ก ๋ณ๊ฒฝํ๋ ค๋ฉด ์ฌ๋ถํ ํด์ผ ํฉ๋๋ค. Inforom ECC ๊ฐ์ฒด ๋ฒ์ ํ์
1.0 ์ด์.
Current GPU๊ฐ ํ์ฌ ์๋ ์ค์ธ ECC ๋ชจ๋์ ๋๋ค.
๋๊ธฐ์ค ๋ค์ ์ฌ๋ถํ ํ GPU๊ฐ ์๋ํ ECC ๋ชจ๋์ ๋๋ค.
ECC ์ค๋ฅ
NVIDIA GPU๋ ๋ค์ํ ์ ํ์ ECC ์ค๋ฅ์ ๋ํ ์ค๋ฅ ์๋ฅผ ์ ๊ณตํ ์ ์์ต๋๋ค. ์ผ๋ถ ECC ์ค๋ฅ๋
๋จ์ผ ๋นํธ ๋๋ ์ด์ค ๋นํธ(๋จ์ผ ๋นํธ ์ค๋ฅ๊ฐ ์์ ๋๊ณ ์ด์ค ๋นํธ ์ค๋ฅ๊ฐ ์์ ๋จ)
์์ ํ ์ ์์ต๋๋ค. ํ ์ค์ฒ ๋ฉ๋ชจ๋ฆฌ ์ค๋ฅ๋ ์ฌ์ ์ก์ ํตํด ์์ ๊ฐ๋ฅํ๊ฑฐ๋ ์์ ๋ถ๊ฐ๋ฅํ ์ ์์ต๋๋ค.
์ฌ์ ์ก์ด ์คํจํ๋ ๊ฒฝ์ฐ. ์ด๋ฌํ ์ค๋ฅ๋ ๋ ๊ฐ์ง ์๊ฐ ์ฒ๋(ํ๋ฐ์ฑ ๋ฐ
๊ณจ์ฌ). ๋จ์ผ ๋นํธ ECC ์ค๋ฅ๋ HW์ ์ํด ์๋์ผ๋ก ์์ ๋๋ฉฐ ๊ฒฐ๊ณผ๊ฐ ๋ฐ์ํ์ง ์์ต๋๋ค.
๋ฐ์ดํฐ ์์. ๋๋ธ ๋นํธ ์ค๋ฅ๊ฐ ๊ฐ์ง๋์์ง๋ง ์์ ๋์ง ์์์ต๋๋ค. ECC๋ฅผ ์ฐธ์กฐํ์ญ์์ค
๋๋ธ ๋นํธ์ผ ๋ ์ปดํจํ ์ ํ๋ฆฌ์ผ์ด์ ๋์์ ๋ํ ์ ๋ณด๋ ์น ๋ฌธ์
์ค๋ฅ๊ฐ ๋ฐ์ํฉ๋๋ค. ํ๋ฐ์ฑ ์ค๋ฅ ์นด์ดํฐ๋ ๋ง์ง๋ง ์ดํ ๊ฐ์ง๋ ์ค๋ฅ ์๋ฅผ ์ถ์ ํฉ๋๋ค.
๋๋ผ์ด๋ฒ ๋ก๋. ์ง๊ณ ์ค๋ฅ ์๋ ๋ฌด๊ธฐํ ์ง์๋๋ฏ๋ก ์๋ช ์ผ๋ก ์๋ํฉ๋๋ค.
์นด์ดํฐ.
ํ๋ฐ์ฑ ์์ ๋ํ ์ฐธ๊ณ ์ฌํญ: Windows์์๋ ๋ถํ ๋น ํ ๋ฒ์ ๋๋ค. Linux์์๋ ๋ ๋ง์ ์ ์์ต๋๋ค.
์ฆ์. Linux์์ ํ์ฑ ํด๋ผ์ด์ธํธ๊ฐ ์์ ๋ ๋๋ผ์ด๋ฒ๊ฐ ์ธ๋ก๋๋ฉ๋๋ค. ๋ฐ๋ผ์ ๋ง์ฝ
์ง์์ฑ ๋ชจ๋๊ฐ ํ์ฑํ๋์ด ์๊ฑฐ๋ ํญ์ ํ์ฑ ์ํ์ธ ๋๋ผ์ด๋ฒ ํด๋ผ์ด์ธํธ(์: X11)๊ฐ ์๋ ๊ฒฝ์ฐ
Linux๋ ๋ํ ๋ถํ ๋ณ ๋์์ ๋ด ๋๋ค. ๊ทธ๋ ์ง ์์ ๊ฒฝ์ฐ ํ๋ฐ์ฑ ์นด์ดํธ๋ ๊ณ์ฐํ ๋๋ง๋ค ์ฌ์ค์ ๋ฉ๋๋ค.
์ฑ์ด ์คํ๋ฉ๋๋ค.
Fermi ๋ฐ Kepler ์ ํ๊ตฐ์ Tesla ๋ฐ Quadro ์ ํ์ ์ด ECC ์ค๋ฅ๋ฅผ ํ์ํ ์ ์์ต๋๋ค.
์นด์ดํธ๋ฟ๋ง ์๋๋ผ ์นฉ์ ์์น๋ฅผ โโ๊ธฐ๋ฐ์ผ๋ก ํ ์ค๋ฅ ๋ถ์. ์์น๋
์๋์์ ๋ฌ์ฌ ๋์ด์ง. ์ง๊ณ ์ค๋ฅ ์์ ๋ํ ์์น ๊ธฐ๋ฐ ๋ฐ์ดํฐ์๋ Inforom ECC๊ฐ ํ์ํฉ๋๋ค.
๊ฐ์ฒด ๋ฒ์ 2.0. ๋ค๋ฅธ ๋ชจ๋ ECC ์นด์ดํธ์๋ ECC ๊ฐ์ฒด ๋ฒ์ 1.0์ด ํ์ํฉ๋๋ค.
์ฅ์น ๋ฉ๋ชจ๋ฆฌ ์ ์ญ ์ฅ์น ๋ฉ๋ชจ๋ฆฌ์์ ์ค๋ฅ๊ฐ ๊ฐ์ง๋์์ต๋๋ค.
ํ์๊ฐ์ ์ ์ ๋ถ๋ชจ๋ก์์ ๊ทํ์ ์ ํฉ์ฑ์ ๊ฒฐ์ ํ๊ธฐ ์ํด ๋ฏธ๊ตญ ์ด๋ฏผ๊ตญ์ ๋ ์ง์คํฐ ํ์ผ ๋ฉ๋ชจ๋ฆฌ์์ ์ค๋ฅ๊ฐ ๊ฐ์ง๋์์ต๋๋ค.
L1 ์บ์ L1 ์บ์์์ ์ค๋ฅ๊ฐ ๊ฐ์ง๋์์ต๋๋ค.
L2 ์บ์ L2 ์บ์์์ ์ค๋ฅ๊ฐ ๊ฐ์ง๋์์ต๋๋ค.
์กฐ์ง ๋ฉ๋ชจ๋ฆฌ ํ ์ค์ฒ ๋ฉ๋ชจ๋ฆฌ์์ ํจ๋ฆฌํฐ ์ค๋ฅ๊ฐ ๊ฐ์ง๋์์ต๋๋ค.
๊ธ์ก ์ ์ฒด ์นฉ์์ ๊ฐ์ง๋ ์ด ์ค๋ฅ์ ๋๋ค. ์ ํฉ ์ฅ์น ๋ฉ๋ชจ๋ฆฌ, ํ์๊ฐ์
์ ์ ๋ถ๋ชจ๋ก์์ ๊ทํ์ ์ ํฉ์ฑ์ ๊ฒฐ์ ํ๊ธฐ ์ํด ๋ฏธ๊ตญ ์ด๋ฏผ๊ตญ์, L1 ์บ์, L2 ์บ์ ์ ์กฐ์ง ๋ฉ๋ชจ๋ฆฌ.
ํ์ด์ง ํด์ง
NVIDIA GPU๋ ์ ๋ขฐํ ์ ์๋ GPU ์ฅ์น ๋ฉ๋ชจ๋ฆฌ ํ์ด์ง๋ฅผ ํ๊ธฐํ ์ ์์ต๋๋ค. ์ด๊ฒ์ ํ ์ ์์ต๋๋ค
๋์ผํ ํ์ด์ง ๋๋ ์ด์ค ๋นํธ ECC์ ๋ํด ์ฌ๋ฌ ๊ฐ์ ๋จ์ผ ๋นํธ ECC ์ค๋ฅ๊ฐ ๋ฐ์ํ ๋ ๋ฐ์
์ค๋ฅ. ํ์ด์ง๊ฐ ํ๊ธฐ๋๋ฉด NVIDIA ๋๋ผ์ด๋ฒ๋ ๋๋ผ์ด๋ฒ๊ฐ ์๋๋ก ํ์ด์ง๋ฅผ ์จ๊น๋๋ค.
์์ฉ ํ๋ก๊ทธ๋จ ๋ฉ๋ชจ๋ฆฌ ํ ๋น์ด ์ก์ธ์คํ ์ ์์ต๋๋ค.
๋ ๋นํธ ECC ๋ค์์ผ๋ก ์ธํด ํ๊ธฐ๋ GPU ์ฅ์น ๋ฉ๋ชจ๋ฆฌ ํ์ด์ง ์
๋๋ธ ๋นํธ ECC ์ค๋ฅ.
ํ๋์ ๋นํธ ECC ๋ค์์ผ๋ก ์ธํด ํ๊ธฐ๋ GPU ์ฅ์น ๋ฉ๋ชจ๋ฆฌ ํ์ด์ง ์
๋ค์ค ๋จ์ผ ๋นํธ ECC ์ค๋ฅ.
๋๊ธฐ์ค ๋ค์ ์ฌ๋ถํ ์ ํ๊ธฐ ๋ณด๋ฅ ์ค์ธ GPU ์ฅ์น ๋ฉ๋ชจ๋ฆฌ ํ์ด์ง๊ฐ ์๋์ง ํ์ธํฉ๋๋ค.
ํ๊ธฐ ๋ณด๋ฅ ์ค์ธ ํ์ด์ง๋ ์ฌ์ ํ ํ ๋น๋ ์ ์์ผ๋ฉฐ ์ถ๊ฐ๋ก ๋ฐ์ํ ์ ์์ต๋๋ค.
์ ๋ขฐ์ฑ ๋ฌธ์ .
์จ๋
๋ณด๋์ ์๋ ์จ๋ ์ผ์์ ํ๋ ๊ฐ. ๋ชจ๋ ํ๋ ๊ฐ์ C๋์ ๋๋ค. ์ ๋ถ๋ ์๋๋๋ค.
์ ํ์ ๋ชจ๋ ์ฝ๊ธฐ ์ ํ์ ์ง์ํฉ๋๋ค. ํนํ ๋ชจ๋ ํํ์ ์ ํ์
์ผ์ด์ค ํฌ์ ์์กดํ๊ฑฐ๋ ์๋ ๋๊ฐ์ ์ผ๋ฐ์ ์ผ๋ก ์จ๋ ํ๋ ๊ฐ์ ์ ๊ณตํ์ง ์์ต๋๋ค. ๋ณด๋ค
์๋์ ์ ํ ์ฌํญ์ด ์์ต๋๋ค.
GPU ์ฝ์ด GPU ์จ๋. ๋ชจ๋ ๋์คํฌ๋ฆฌํธ ๋ฐ S-ํด๋์ค ์ ํ์ฉ.
์ข ๋ฃ ์จ๋ GPU๊ฐ ์ข ๋ฃ๋๋ ์จ๋์ ๋๋ค.
์ฒ์ฒํ ํด ์จ๋ GPU๊ฐ ์๋๋ฅผ ์ค์ด๊ธฐ ์์ํ๋ ์จ๋
๋ฉ์ง๋ค.
์ถ๋ ฅ ํ๋
์ ๋ ฅ ํ๋ ๊ฐ์ GPU์ ํ์ฌ ์ ๋ ฅ ์ฌ์ฉ๋๊ณผ ์์ธ์ ๋ฐํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
๊ทธ ์ฌ์ฉ๋ฒ์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค. ์ ์ ๊ด๋ฆฌ๊ฐ ํ์ฑํ๋๋ฉด GPU๋ ์ ๋ ฅ ์๋ชจ๋ฅผ ์ ํํฉ๋๋ค.
ํ์ฌ ์ฑ๋ฅ์ ์กฐ์ํ์ฌ ๋ฏธ๋ฆฌ ์ ์๋ ์ ๋ ฅ ์๋ฒจ๋กํ์ ๋ง๊ฒ ๋ถํ
์ํ. ๊ฐ์ฉ์ฑ ์ ํ์ ์๋๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
์ถ๋ ฅ ์ฃผ ์ ๋ถ ์ ์ ์ํ๋ ๋ ์ด์ ์ฌ์ฉ๋์ง ์์ผ๋ฉฐ ์์ ์ฑ๋ฅ ์ํ๋ก ์ด๋ฆ์ด ๋ณ๊ฒฝ๋์์ต๋๋ค.
2.285. XML ํธํ์ฑ์ ์ ์งํ๊ธฐ ์ํด XML ํ์์ ์ฑ๋ฅ ์ํ๋
๋ ๊ณณ์ ๋ชจ๋ ๊ธฐ์ฌ๋์ด ์์ต๋๋ค.
์ถ๋ ฅ
์ ์ ๊ด๋ฆฌ๊ฐ ํ์ฑํ๋์๋์ง ์ฌ๋ถ๋ฅผ ๋ํ๋ด๋ ํ๋๊ทธ์ ๋๋ค. ์ด๋ ํ๋
"์ง์๋จ" ๋๋ "ํด๋น ์ฌํญ ์์". Inforom PWR ๊ฐ์ฒด ๋ฒ์ 3.0 ์ด์์ด ํ์ํฉ๋๋ค.
์ผํ๋ฌ ์ฅ์น.
์ถ๋ ฅ ๊ทธ๋ฆฌ๊ธฐ ์ ์ฒด ๋ณด๋์ ๋ํด ๋ง์ง๋ง์ผ๋ก ์ธก์ ๋ ์ ๋ ฅ ์๋น๋(์ํธ)์ ๋๋ค. ์ค์ง
์ ์ ๊ด๋ฆฌ๊ฐ ์ง์๋๋ ๊ฒฝ์ฐ ์ฌ์ฉํ ์ ์์ต๋๋ค. ์ด ํ๋ ๊ฐ์ ๋ค์๊ณผ ๊ฐ์ด ์ ํํฉ๋๋ค.
+/- 5์ํธ ์ด๋ด. Inforom PWR ๊ฐ์ฒด ๋ฒ์ 3.0 ์ด์์ด ํ์ํฉ๋๋ค.
์ผํ๋ฌ ์ฅ์น.
์ถ๋ ฅ ํ๋ ์ํํธ์จ์ด ์ ๋ ฅ ์ ํ(์ํธ). nvidia-smi์ ๊ฐ์ ์ํํธ์จ์ด๋ก ์ค์ ํฉ๋๋ค.
์ ์ ๊ด๋ฆฌ๊ฐ ์ง์๋๋ ๊ฒฝ์ฐ์๋ง ์ฌ์ฉํ ์ ์์ต๋๋ค. PWR ์ ๋ณด ํ์
๊ฐ์ฒด ๋ฒ์ 3.0 ์ด์ ๋๋ Kepler ์ฅ์น. Kepler ์ฅ์น ์ ์
์ ํ์ -pl,--power-limit= ์ค์์น๋ฅผ ์ฌ์ฉํ์ฌ ์กฐ์ ํ ์ ์์ต๋๋ค.
๊ฐ์ ์ถ๋ ฅ ํ๋
์ ๋ ฅ ๊ด๋ฆฌ ์๊ณ ๋ฆฌ์ฆ์ ์ ๋ ฅ ํ๋(์ํธ)์ ๋๋ค. ์ด ๋ณด๋
์ ๋ ฅ ์๋น๋ ์ ๋ ฅ ๊ด๋ฆฌ ์๊ณ ๋ฆฌ์ฆ์ ์ํด ์กฐ์๋ฉ๋๋ค.
์ด ๊ฐ ์๋์ ์ ์ง๋ฉ๋๋ค. ์ด ์ ํ์ ๋ค์๊ณผ ๊ฐ์ ๋ค์ํ ์ ํ์ ์ต์๊ฐ์ ๋๋ค.
์์ ๋์ด๋ ์ํํธ์จ์ด ์ ํ์ผ๋ก. ์ ์ ๊ด๋ฆฌ๊ฐ ์๋ ๊ฒฝ์ฐ์๋ง ์ฌ์ฉ ๊ฐ๋ฅ
์ง์. ์ผํ๋ฌ ์ฅ์น๊ฐ ํ์ํฉ๋๋ค.
ํ๋ง ์ถ๋ ฅ ํ๋
๊ธฐ๋ณธ ์ ์ ๊ด๋ฆฌ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ ํ๋(์ํธ)์ ๋๋ค. ํ
์ ํ์ ๋๋ผ์ด๋ฒ ์ธ๋ก๋ ํ ๊ธฐ๋ณธ ์ ๋ ฅ ์ ํ์ผ๋ก ๋ค์ ์ค์ ๋ฉ๋๋ค. ์๋ง
Kepler ์ ํ๊ตฐ์์ ์ง์๋๋ ์ฅ์น.
Min ์ถ๋ ฅ ํ๋
์ ๋ ฅ ์ ํ์ ์ค์ ํ ์ ์๋ ์ต์๊ฐ(์ํธ)์ ๋๋ค. ์๋ง
Kepler ์ ํ๊ตฐ์์ ์ง์๋๋ ์ฅ์น.
Max ์ถ๋ ฅ ํ๋
์ ๋ ฅ ์ ํ์ ์ค์ ํ ์ ์๋ ์ต๋๊ฐ(์ํธ)์ ๋๋ค. ์๋ง
Kepler ์ ํ๊ตฐ์์ ์ง์๋๋ ์ฅ์น.
์๊ณ
GPU์ ์ผ๋ถ๊ฐ ์คํ๋๊ณ ์๋ ํ์ฌ ์ฃผํ์์ ๋๋ค. ๋ชจ๋ ํ๋ ๊ฐ์ MHz ๋จ์์ ๋๋ค.
๊ทธ๋ํฝ ์ ๋ก๋ ๊ทธ๋ํฝ(์ ฐ์ด๋) ํด๋ญ์ ํ์ฌ ์ฃผํ์์ ๋๋ค.
SM SM(Streaming Multiprocessor) ํด๋ญ์ ํ์ฌ ์ฃผํ์์ ๋๋ค.
๋ฉ๋ชจ๋ฆฌ ๋ฉ๋ชจ๋ฆฌ ํด๋ญ์ ํ์ฌ ์ฃผํ์.
Video ๋น๋์ค(์ธ์ฝ๋ + ๋์ฝ๋) ํด๋ญ์ ํ์ฌ ์ฃผํ์์ ๋๋ค.
์ดํ๋ฆฌ์ผ์ด์ ์๊ณ
์์ฉ ํ๋ก๊ทธ๋จ์ด ์คํ๋ ์ฌ์ฉ์ ์ง์ ๋น๋์ ๋๋ค. ๋ก ๋ณ๊ฒฝํ ์ ์์ต๋๋ค.
[-ac | --applications-clocks] ์ค์์น.
๊ทธ๋ํฝ ์ ๋ก๋ ๊ทธ๋ํฝ(์ ฐ์ด๋) ํด๋ญ์ ์ฌ์ฉ์ ์ง์ ์ฃผํ์์ ๋๋ค.
๋ฉ๋ชจ๋ฆฌ ๋ฉ๋ชจ๋ฆฌ ํด๋ญ์ ์ฌ์ฉ์ ์ง์ ์ฃผํ์.
ํ๋ง ์ดํ๋ฆฌ์ผ์ด์ ์๊ณ
์์ฉ ํ๋ก๊ทธ๋จ์ด ์คํ๋ ๊ธฐ๋ณธ ๋น๋์ ๋๋ค. ์ ํ๋ฆฌ์ผ์ด์ ์๊ณ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
[-ac | --applications-clocks] ์ค์์น. ์ ํ๋ฆฌ์ผ์ด์ ์๊ณ๋ ๋ค์์ผ๋ก ์ค์ ํ ์ ์์ต๋๋ค.
๊ธฐ๋ณธ๊ฐ์ [-rac | --reset-applications-clocks] ์ค์์น.
๊ทธ๋ํฝ ์ ๋ก๋ ์์ฉ ํ๋ก๊ทธ๋จ ๊ทธ๋ํฝ(์ ฐ์ด๋) ํด๋ญ์ ๊ธฐ๋ณธ ์ฃผํ์์ ๋๋ค.
๋ฉ๋ชจ๋ฆฌ ์ ํ๋ฆฌ์ผ์ด์ ๋ฉ๋ชจ๋ฆฌ ํด๋ญ์ ๊ธฐ๋ณธ ์ฃผํ์.
Max ์๊ณ
GPU์ ์ผ๋ถ๊ฐ ์คํ๋๋๋ก ์ค๊ณ๋ ์ต๋ ์ฃผํ์์ ๋๋ค. ๋ชจ๋ ํ๋ ๊ฐ์ MHz ๋จ์์ ๋๋ค.
Fermi ์ ํ๊ตฐ์ GPU์์ ํ์ฌ P0 ํด๋ญ(ํด๋ญ ์น์ ์ ๋ณด๊ณ ๋จ)์ ๋ค์๊ณผ ๋ค๋ฅผ ์ ์์ต๋๋ค.
๋ช MHz์ ์ต๋ ํด๋ก.
๊ทธ๋ํฝ ์ ๋ก๋ ๊ทธ๋ํฝ(์ ฐ์ด๋) ํด๋ญ์ ์ต๋ ์ฃผํ์.
SM SM(Streaming Multiprocessor) ํด๋ญ์ ์ต๋ ์ฃผํ์.
๋ฉ๋ชจ๋ฆฌ ๋ฉ๋ชจ๋ฆฌ ํด๋ญ์ ์ต๋ ์ฃผํ์.
Video ๋น๋์ค(์ธ์ฝ๋ + ๋์ฝ๋) ํด๋ญ์ ์ต๋ ์ฃผํ์.
์๊ณ ์ ์ฑ
์๋ ๋ถ์คํธ์ ๊ฐ์ ์๋ ํด๋ญ ๋ณ๊ฒฝ์ ๋ํ ์ฌ์ฉ์ ์ง์ ์ค์ .
์๋์ฐจ ์์น ํ์ฌ ์ด GPU์ ๋ํด ์๋ ๋ถ์คํธ ๋ชจ๋๊ฐ ํ์ฑํ๋์ด ์๋์ง(์ผ๊ธฐ) ๋๋
์ด GPU์ ๋ํด ๋นํ์ฑํ๋์์ต๋๋ค(Off). ๋ถ์คํธ๊ฐ ์ง์๋์ง ์๋ ๊ฒฝ์ฐ ํ์(ํด๋น ์์). ์๋
boost๋ ์ ๋ ฅ, ์ด ๋ฐ ํ์ฉ๋๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ๋์ GPU ํด๋ฌํน์ ํ์ฉํฉ๋๋ค.
์๋ ๋ถ์คํธ๊ฐ ๋นํ์ฑํ๋๋ฉด GPU๋ ๋ค์์์ ํด๋ญ์ ์ ์งํ๋ ค๊ณ ์๋ํฉ๋๋ค.
์ ํํ๊ฒ ํ์ฌ ์ ํ๋ฆฌ์ผ์ด์ ํด๋ก ์ค์ (CUDA ์ปจํ ์คํธ๊ฐ
ํ์ฑ). ์๋ ๋ถ์คํธ๊ฐ ํ์ฑํ๋ ์ํ์์ GPU๋ ๊ณ์ ์ ์งํ๋ ค๊ณ ์๋ํฉ๋๋ค.
์ด ํ๋ก์ด์ ์์ง๋ง ์ ์์ด ๊ณต๊ธ๋๋ฉด ๊ธฐํ์ ์ผ๋ก ๋ ๋์ ํด๋ญ์ผ๋ก ๋ถ์คํธ๋ฉ๋๋ค.
์ด ๋ฐ ํ์ฉ ํค๋๋ฃธ์ด ํ์ฉ๋ฉ๋๋ค. ์ด ์ค์ ์ ํ์ ์ง์๋ฉ๋๋ค.
์์ฒญ๋ CUDA ์ปจํ ์คํธ. ์ฑ์์ ์์ฒญํ ์ ์์
NVML ํธ์ถ(NVML SDK ์ฐธ์กฐ)์ ํตํด ๋๋
CUDA ํ๊ฒฝ ๋ณ์ CUDA_AUTO_BOOST.
์๋์ฐจ ์์น ํ๋ง
ํ์ฑํ(์ผ๊ธฐ) ๋๋ ์๋ ๋ถ์คํธ ๋ชจ๋์ ๊ธฐ๋ณธ ์ค์ ์ ๋ํ๋ ๋๋ค.
๋นํ์ฑํ๋จ(๋๊ธฐ). ๋ถ์คํธ๊ฐ ์ง์๋์ง ์๋ ๊ฒฝ์ฐ ํ์(ํด๋น ์์). ์ฑ์ ๋ค์์์ ์คํ๋ฉ๋๋ค.
ํน์ ๋ชจ๋๋ฅผ ๋ช ์์ ์ผ๋ก ์์ฒญํ์ง ์์ ๊ฒฝ์ฐ ๊ธฐ๋ณธ ๋ชจ๋์ ๋๋ค. ๋ฉ๋ชจ:
์๋ ๋ถ์คํธ ์ค์ ์ "์ง์์ฑ ๋ชจ๋"๊ฐ ํ์ฑํ๋ ๊ฒฝ์ฐ์๋ง ์์ ํ ์ ์์ผ๋ฉฐ,
๊ธฐ๋ณธ์ ์ผ๋ก๋ ๊ทธ๋ ์ง ์์ต๋๋ค.
์ง์ ์๊ณ
GPU๊ฐ ์๋ํ ์ ์๋ ๊ฐ๋ฅํ ๋ฉ๋ชจ๋ฆฌ ๋ฐ ๊ทธ๋ํฝ ํด๋ก ์กฐํฉ ๋ชฉ๋ก(
HW ๋ธ๋ ์ดํฌ ๊ฐ์ ํด๋ก ๊ณ ๋ ค). ๋ค์์ ์ ์ผํ ์๊ณ ์กฐํฉ์ ๋๋ค.
--applications-clocks ํ๋๊ทธ์ ์ ๋ฌํ ์ ์์ต๋๋ค. ์ง์๋๋ ์๊ณ๋ -q -d์ผ ๋๋ง ๋์ด๋ฉ๋๋ค.
SUPPORTED_CLOCKS ์ค์์น๊ฐ ์ ๊ณต๋๊ฑฐ๋ XML ํ์์ผ๋ก ์ ๊ณต๋ฉ๋๋ค.
ํ๋ก์ธ์ค
์ฅ์น์ ์ปดํจํ ๋๋ ๊ทธ๋ํฝ ์ปจํ ์คํธ๊ฐ ์๋ ํ๋ก์ธ์ค ๋ชฉ๋ก์ ๋๋ค. ์ปดํจํ ํ๋ก์ธ์ค๋
์์ ํ ์ง์๋๋ ๋ชจ๋ ์ ํ์ ๋ํด ๋ณด๊ณ ๋ฉ๋๋ค. ๊ทธ๋ํฝ ํ๋ก์ธ์ค์ ๋ํ ๋ณด๊ณ ๊ฐ ์ ํ๋จ
Kepler ์ํคํ ์ฒ๋ก ์์ํ๋ ์ง์๋๋ ์ ํ์
๊ฐ ํญ๋ชฉ์ ํ์์ " "
GPU ์์ธ ์ฅ์น์ NVML ์ธ๋ฑ์ค๋ฅผ ๋ํ๋ ๋๋ค.
PID ํ์ฑ ์ปดํจํ ๋๋ ๊ทธ๋ํฝ์ ํด๋นํ๋ ํ๋ก์ธ์ค ID๋ฅผ ๋ํ๋ ๋๋ค.
๋ฌธ๋งฅ.
ํ์ ๊ณ์ฐ ํ๋ก์ธ์ค์ ๊ฒฝ์ฐ "C", ๊ทธ๋ํฝ ํ๋ก์ธ์ค์ ๊ฒฝ์ฐ "G" ๋ฐ "C+G"๋ก ํ์๋ฉ๋๋ค.
Compute ๋ฐ Graphics ์ปจํ ์คํธ๊ฐ ๋ชจ๋ ์๋ ํ๋ก์ธ์ค์ ๊ฒฝ์ฐ.
๋ฐฉ๋ฒ ์ฑํจ Compute ๋๋ Graphics ํ๋ก์ธ์ค์ ํ๋ก์ธ์ค ์ด๋ฆ์ ๋ํ๋ ๋๋ค.
GPU ๋ฉ๋ชจ๋ฆฌ ์ฉ๋ฒ
์ปจํ ์คํธ์ ์ํด ์ฅ์น์์ ์ฌ์ฉ๋ ๋ฉ๋ชจ๋ฆฌ์ ์์ ๋๋ค. ์ฌ์ฉํ ์ ์์
Windows KMD๊ฐ ๋ชจ๋
NVIDIA ๋๋ผ์ด๋ฒ๊ฐ ์๋ ๋ฉ๋ชจ๋ฆฌ.
ํต๊ณ (์คํ์ )
์ ๋ ฅ ์ํ, ์ฌ์ฉ๋ฅ ์ํ, xid ์ด๋ฒคํธ, ํด๋ญ ๋ณ๊ฒฝ๊ณผ ๊ฐ์ GPU ํต๊ณ ๋์ด
์ด๋ฒคํธ ๋ฐ ์๋ฐ ์นด์ดํฐ.
Linux์์ Tesla, GRID ๋ฐ Quadro ๊ธฐ๋ฐ ์ ํ์์ ์ง์๋ฉ๋๋ค.
Kepler ๋๋ ์ต์ GPU๋ก ์ ํ๋ฉ๋๋ค.
๋ค์๊ณผ ๊ฐ์ด CSV ํ์์ผ๋ก ํต๊ณ๋ฅผ ํ์ํฉ๋๋ค.
, , ,
๋จ์์ ํจ๊ป ํ์ํ ์ธก์ ํญ๋ชฉ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
์ ๋ ฅ ์ํ(์ํธ).
GPU ์จ๋ ์ํ(์ญ์จ).
๋ฐฑ๋ถ์จ๋ก ํ์๋๋ GPU, ๋ฉ๋ชจ๋ฆฌ, ์ธ์ฝ๋ ๋ฐ ๋์ฝ๋ ์ฌ์ฉ๋ฅ ์ํ.
Xid ์ค๋ฅ ์ฝ๋์ ํจ๊ป ๋ณด๊ณ ๋ Xid ์ค๋ฅ ์ด๋ฒคํธ. ์ ์ ์๋ xid์ ๋ํ ์ค๋ฅ ์ฝ๋๋ 999์ ๋๋ค.
์ค๋ฅ.
ํ๋ก์ธ์ ๋ฐ ๋ฉ๋ชจ๋ฆฌ ํด๋ก์ MHz ๋จ์๋ก ๋ณ๊ฒฝ๋ฉ๋๋ค.
ns ๋จ์์ ์๋ฐ ์๊ฐ์ด ์๋ ์ ๋ ฅ ์ํ์ผ๋ก ์ธํ ์๋ฐ์ ๋๋ค. (ํ ์ฌ๋ผ ์ ์ฉ)
์๋ฐ ๋ถ์ธ ํ๋๊ทธ(1/0)๊ฐ ์๋ ์ด ์บกํ์ผ๋ก ์ธํ ์๋ฐ์ ๋๋ค. (ํ ์ฌ๋ผ ์ ์ฉ)
๋ฐฐ์ก ์ ์์ฒญ ์ฌํญ:
"#" ์์ ์ค๋ ๋ชจ๋ ํต๊ณ๋ ์ฃผ์์ ๋๋ค.
์ง์๋์ง ์๋ ์ฅ์น๋ "#์ผ๋ก ํ์๋ฉ๋๋ค. , ์ง์๋์ง ์๋ ์ฅ์น".
์ง์๋์ง ์๋ ์ธก์ ํญ๋ชฉ์ " , , N/A, N/A".
์ด/์ ๋ ฅ์ผ๋ก ์ธํ ์๋ฐ์ Tesla ๊ธฐ๋ฐ ์ ํ์๋ง ์ง์๋ฉ๋๋ค. ์ด ์๋ฐ
Tesla K20 ์ด์์ผ๋ก ์ ํ๋ฉ๋๋ค.
์ฅ์น ๋ชจ๋ํฐ๋ง
"nvidia-smi dmon" ๋ช ๋ น์ค์ ํ๋ ์ด์์ GPU(์ต๋ 4๊ฐ ์ฅ์น)๋ฅผ ๋ชจ๋ํฐ๋งํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
์์คํ ์ ์ฐ๊ฒฐํ์ต๋๋ค. ์ด ๋๊ตฌ๋ฅผ ์ฌ์ฉํ๋ฉด ์ฌ์ฉ์๋ ๋น ํ ์ค์ ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
๋ชจ๋ํฐ๋ง ์ฃผ๊ธฐ. ์ถ๋ ฅ์ ๊ฐ๊ฒฐํ ํ์์ด๋ฉฐ ๋ํ์์ผ๋ก ํด์ํ๊ธฐ ์ฝ์ต๋๋ค.
๋ฐฉ๋ฒ. ๋ผ์ธ๋น ์ถ๋ ฅ ๋ฐ์ดํฐ๋ ํฐ๋ฏธ๋ ํฌ๊ธฐ์ ๋ฐ๋ผ ์ ํ๋ฉ๋๋ค. Tesla์์ ์ง์๋๋ฉฐ,
๋ฒ ์ด ๋ฉํ 64์์ Kepler ๋๋ ์ต์ GPU์ฉ GRID, Quadro ๋ฐ ์ ํ๋ GeForce ์ ํ
๋นํธ ๋ฆฌ๋ ์ค. ๊ธฐ๋ณธ์ ์ผ๋ก ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ์๋ ์ ๋ ฅ ์ฌ์ฉ๋, ์จ๋, SM ์๊ณ,
SM, ๋ฉ๋ชจ๋ฆฌ, ์ธ์ฝ๋ ๋ฐ ๋์ฝ๋์ ๋ํ ๋ฉ๋ชจ๋ฆฌ ํด๋ญ ๋ฐ ํ์ฉ๋ ๊ฐ. ๊ทธ๊ฒ์ ๋ํ ๋ ์ ์์ต๋๋ค
ํ๋ ์ ๋ฒํผ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋, bar1 ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋,
์ ๋ ฅ/์ด ์๋ฐ ๋ฐ ์ง๊ณ ๋จ์ผ/์ด์ค ๋นํธ ECC ์ค๋ฅ. ๋ฉํธ๋ฆญ ์ค ํ๋๋ผ๋
์ฅ์น์์ ์ง์๋์ง ์๊ฑฐ๋ ๋ฉํธ๋ฆญ์ ๊ฐ์ ธ์ฌ ๋ ๋ค๋ฅธ ์ค๋ฅ๊ฐ ๋ค์๊ณผ ๊ฐ์ด ๋ณด๊ณ ๋ฉ๋๋ค.
"-"๋ ์ถ๋ ฅ ๋ฐ์ดํฐ์ ์์ต๋๋ค. ์ฌ์ฉ์๋ ๋ํ ๋ชจ๋ํฐ๋ง ๋น๋์ ์๋ฅผ ๊ตฌ์ฑํ ์ ์์ต๋๋ค.
๊ฐ ์คํ์ ๋ํ ๋ชจ๋ํฐ๋ง ๋ฐ๋ณต. ๋ ์ง์ ์๊ฐ์ ํฌํจํ๋ ์ต์ ๋ ์์ต๋๋ค.
๊ฐ ๋ผ์ธ. ์ง์๋๋ ๋ชจ๋ ์ต์ ์ ๋ฐฐํ์ ์ด๋ฉฐ ์ด๋ค ์์๋ก๋ ํจ๊ป ์ฌ์ฉํ ์ ์์ต๋๋ค.
์ฉ๋ฒ:
1) ํ๋ง ๊ณผ ์๋ ์ธ์
์๋น๋์ smi ๋๋ชฌ
์์ฐ ์ด๊ฑฐ(์์
0์ด์ ๋น๋๋ก GPU ์ธ๋ฑ์ค 1). ^C๋ก ์ข ๋ฃ๋ ๋๊น์ง ์คํ๋ฉ๋๋ค.
2) ์ ํ ํ or ๋ฐฐ์ฐ๊ธฐ ์ฅ์น
์๋น๋์ smi ๋๋ชฌ -i <์ฅ์น1,์ฅ์น2, .. , ์ฅ์นN>
์ผํ๋ก ๊ตฌ๋ถ๋ ์ฅ์น ๋ชฉ๋ก์ผ๋ก ์ ํํ ์ฅ์น์ ๋ํ ๊ธฐ๋ณธ ๋ฉํธ๋ฆญ์ ๋ณด๊ณ ํฉ๋๋ค. ๋๊ตฌ
์์ฐ ์ด๊ฑฐ ์๋ ๋ชฉ๋ก์์ ์ง์๋๋ ์ฅ์น๋ฅผ ์ต๋ 4๊ฐ ์ ํํฉ๋๋ค(GPU๋ถํฐ ์์).
์ธ๋ฑ์ค 0).
3) ์ ํ ํต๊ณ ์ be ํ์๋
์๋น๋์ smi ๋๋ชฌ -s
๋ค์ ์ค ํ๋ ์ด์์ด ๋ ์ ์์ต๋๋ค.
p - ์ ๋ ฅ ์ฌ์ฉ๋(์ํธ ๋จ์) ๋ฐ ์จ๋(C ๋จ์)
u - ์ฌ์ฉ๋ฅ (SM, ๋ฉ๋ชจ๋ฆฌ, ์ธ์ฝ๋ ๋ฐ ๋์ฝ๋ ์ฌ์ฉ๋ฅ (%))
c - Proc ๋ฐ Mem ํด๋ญ(MHz)
v - ์ ๋ ฅ ์๋ฐ(%) ๋ฐ ์ด ์๋ฐ(๋ถ์ธ ํ๋๊ทธ๋ก)
m - ํ๋ ์ ๋ฒํผ ๋ฐ Bar1 ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋(MB)
e - ECC(์ง๊ณ๋ ๋จ์ผ ๋นํธ, ์ด์ค ๋นํธ ECC ์ค๋ฅ ์) ๋ฐ PCIe ์ฌ์
์ค๋ฅ
t - PCIe Rx ๋ฐ Tx ์ฒ๋ฆฌ๋(MB/s)(Maxwell ์ด์)
4) ๊ตฌ์ฑ ๋ชจ๋ํฐ๋ง ๋ฐ๋ณต
์๋น๋์ smi ๋๋ชฌ -c <๋ฒํธ of ์ํ>
์ง์ ๋ ์ํ ์์ ๋ํ ๋ฐ์ดํฐ๋ฅผ ํ์ํ๊ณ ์ข ๋ฃํฉ๋๋ค.
5) ๊ตฌ์ฑ ๋ชจ๋ํฐ๋ง ์ฃผํ์
์๋น๋์ smi ๋๋ชฌ -d <์๊ฐ in ์ด>
์ข ๋ฃ๋ ๋๊น์ง ์ง์ ๋ ๋ชจ๋ํฐ๋ง ๊ฐ๊ฒฉ๋ง๋ค ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ํ์ํฉ๋๋ค.
^C.
6) ๋์คํ๋ ์ด ๋ฐ์ดํฐ
์๋น๋์ smi ๋๋ชฌ -o D
YYYYMMDD ํ์์ ๋ ์ง์ ํจ๊ป ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐํฉ๋๋ค.
7) ๋์คํ๋ ์ด ์๊ฐ
์๋น๋์ smi ๋๋ชฌ -o T
HH:MM:SS ํ์์ ์๊ฐ๊ณผ ํจ๊ป ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐํฉ๋๋ค.
8) ๋์๋ง ์ ๋ณด
์๋น๋์ smi ๋๋ชฌ -h
๋ช ๋ น์ค ์ฌ์ฉ์ ๋ํ ๋์๋ง ์ ๋ณด๋ฅผ ํ์ํฉ๋๋ค.
์ ๋ง (์คํ์ )
"nvidia-smi ๋ฐ๋ชฌ"์ ์ฐ๊ฒฐ๋ ํ๋ ์ด์์ GPU๋ฅผ ๋ชจ๋ํฐ๋งํ๊ธฐ ์ํด ๋ฐฑ๊ทธ๋ผ์ด๋ ํ๋ก์ธ์ค๋ฅผ ์์ํฉ๋๋ค.
์์คํ ์. ๋ชจ๋ํฐ๋ง ์ฃผ๊ธฐ๋ง๋ค ์์ฒญ๋ GPU๋ฅผ ๋ชจ๋ํฐ๋งํ๊ณ ํ์ผ์ ๋ก๊ทธ์ธํฉ๋๋ค.
์ฌ์ฉ์๊ฐ ์ ๊ณตํ ๊ฒฝ๋ก ๋๋ /var/log/nvstats/์ ๊ธฐ๋ณธ ์์น์ ์์ถ๋ ํ์.
๋ก๊ทธ ํ์ผ์ nvstats- ํ์์ ์์คํ ๋ ์ง๊ฐ ์ถ๊ฐ๋์ด ์์ฑ๋ฉ๋๋ค.
YYYYMMDD. ๋ก๊ทธ ํ์ผ์ ๋ํ ํ๋ฌ์ ์์ ์ ๋ชจ๋ํฐ๋ง ์ฃผ๊ธฐ๋ง๋ค ์ํ๋ฉ๋๋ค.
๋ฐ๋ชฌ์ ๋ํ /var/run/nvsmi.pid์ ์์ฒด PID๋ฅผ ๊ธฐ๋กํฉ๋๋ค. ๊ธฐ๋ณธ์ ์ผ๋ก ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ๋
์ง์์๋ ์ ๋ ฅ ์ฌ์ฉ๋, ์จ๋, SM ํด๋ญ, ๋ฉ๋ชจ๋ฆฌ ํด๋ญ ๋ฐ ์ฌ์ฉ๋ฅ ๊ฐ์ด ํฌํจ๋ฉ๋๋ค.
SM, ๋ฉ๋ชจ๋ฆฌ, ์ธ์ฝ๋ ๋ฐ ๋์ฝ๋์ฉ. ๋ฐ๋ชฌ ๋๊ตฌ๋ ๋ค์์ ๊ธฐ๋กํ๋๋ก ๊ตฌ์ฑํ ์๋ ์์ต๋๋ค.
ํ๋ ์ ๋ฒํผ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋, bar1 ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋, ์ ๋ ฅ/์ด
์๋ฐ ๋ฐ ์ง๊ณ ๋จ์ผ/์ด์ค ๋นํธ ecc ์ค๋ฅ. ๊ธฐ๋ณธ ๋ชจ๋ํฐ๋ง ์ฃผ๊ธฐ๊ฐ ์ค์ ๋ฉ๋๋ค.
์ต๋ 10์ด์ด๋ฉฐ ๋ช ๋ น์ค์ ํตํด ๊ตฌ์ฑํ ์ ์์ต๋๋ค. Tesla, GRID, Quadro์์ ์ง์๋ฉ๋๋ค.
๋ฒ ์ด๋ฉํ 64๋นํธ Linux์์ Kepler ๋๋ ์ต์ GPU์ฉ GeForce ์ ํ. ๋ฐ๋ชฌ
์คํํ๋ ค๋ฉด ๋ฃจํธ ๊ถํ์ด ํ์ํ๋ฉฐ ๋จ์ผ ์ธ์คํด์ค ์คํ๋ง ์ง์ํฉ๋๋ค.
์ฒด๊ณ. ์ง์๋๋ ๋ชจ๋ ์ต์ ์ ๋ฐฐํ์ ์ด๋ฉฐ ์ด๋ค ์์๋ก๋ ํจ๊ป ์ฌ์ฉํ ์ ์์ต๋๋ค.
์ฉ๋ฒ:
1) ํ๋ง ๊ณผ ์๋ ์ธ์
์๋น๋์ smi ์ ๋ง
๋ฐฑ๊ทธ๋ผ์ด๋์์ ์คํ๋์ด ์๋์์ ์ง์๋๋ ์ต๋ 4๊ฐ์ ์ฅ์น์ ๋ํ ๊ธฐ๋ณธ ๋ฉํธ๋ฆญ์ ๋ชจ๋ํฐ๋งํฉ๋๋ค.
0์ด์ ๋น๋๋ก ์์ฐ ์ด๊ฑฐ(GPU ์ธ๋ฑ์ค 10๋ถํฐ ์์). ์ฐํ ๋ ์ง
๋ก๊ทธ ํ์ผ์ /var/log/nvstats/์ ์์ฑ๋ฉ๋๋ค.
2) ์ ํ ํ or ๋ฐฐ์ฐ๊ธฐ ์ฅ์น
์๋น๋์ smi ์ ๋ง -i <์ฅ์น1,์ฅ์น2, .. , ์ฅ์นN>
๋ฐฑ๊ทธ๋ผ์ด๋์์ ์คํํ์ฌ ์ผํ๋ก ์ ํํ ์ฅ์น์ ๊ธฐ๋ณธ ๋ฉํธ๋ฆญ์ ๋ชจ๋ํฐ๋งํฉ๋๋ค.
๋ถ๋ฆฌ๋ ์ฅ์น ๋ชฉ๋ก. ์ด ๋๊ตฌ๋ ์๋ ๋ชฉ๋ก์์ ์ง์๋๋ ์ฅ์น๋ฅผ ์ต๋ 4๊ฐ ์ ํํฉ๋๋ค.
์์ฐ ์ด๊ฑฐ(GPU ์ธ๋ฑ์ค 0๋ถํฐ ์์).
3) ์ ํ ํต๊ณ ์ be ๋ชจ๋ํฐ๋ง
์๋น๋์ smi ์ ๋ง -s
๋ค์ ์ค ํ๋ ์ด์์ด ๋ ์ ์์ต๋๋ค.
p - ์ ๋ ฅ ์ฌ์ฉ๋(์ํธ ๋จ์) ๋ฐ ์จ๋(C ๋จ์)
u - ์ฌ์ฉ๋ฅ (SM, ๋ฉ๋ชจ๋ฆฌ, ์ธ์ฝ๋ ๋ฐ ๋์ฝ๋ ์ฌ์ฉ๋ฅ (%))
c - Proc ๋ฐ Mem ํด๋ญ(MHz)
v - ์ ๋ ฅ ์๋ฐ(%) ๋ฐ ์ด ์๋ฐ(๋ถ์ธ ํ๋๊ทธ๋ก)
m - ํ๋ ์ ๋ฒํผ ๋ฐ Bar1 ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋(MB)
e - ECC(์ง๊ณ๋ ๋จ์ผ ๋นํธ, ์ด์ค ๋นํธ ECC ์ค๋ฅ ์) ๋ฐ PCIe ์ฌ์
์ค๋ฅ
t - PCIe Rx ๋ฐ Tx ์ฒ๋ฆฌ๋(MB/s)(Maxwell ์ด์)
4) ๊ตฌ์ฑ ๋ชจ๋ํฐ๋ง ์ฃผํ์
์๋น๋์ smi ์ ๋ง -d <์๊ฐ in ์ด>
์ข ๋ฃ๋ ๋๊น์ง ์ง์ ๋ ๋ชจ๋ํฐ๋ง ๊ฐ๊ฒฉ๋ง๋ค ๋ฐ์ดํฐ๋ฅผ ์์งํฉ๋๋ค.
5) ๊ตฌ์ฑ ๊ธฐ๋ก ์๋ฐฐ ๊ท์น์
์๋น๋์ smi ์ ๋ง -p <๊ฒฝ๋ก of ๋๋ ํ ๋ฆฌ>
๋ก๊ทธ ํ์ผ์ ์ง์ ๋ ๋๋ ํ ๋ฆฌ์ ์์ฑ๋ฉ๋๋ค.
6) ๊ตฌ์ฑ ๊ธฐ๋ก ํ์ผ name
์๋น๋์ smi ์ ๋ง -j <๋ฌธ์์ด ์ ์ถ๊ฐ ๊ธฐ๋ก ํ์ผ ์ด๋ฆ>
๋ช ๋ น์ค์ ์ฌ์ฉ์๊ฐ ์ ๊ณตํ ๋ฌธ์์ด๊ณผ ํจ๊ป ๋ก๊ทธ ํ์ผ ์ด๋ฆ์ ์ถ๊ฐํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
7) ๋๋ด๋ค ์ ์, ์ ๋ง
์๋น๋์ smi ์ ๋ง -t
์ด ๋ช ๋ น์ค์ ์ ์ฅ๋ PID(/var/run/nvsmi.pid์ ์์)๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ๋ชฌ์ ์ข ๋ฃํฉ๋๋ค. ๊ทธ๊ฒ
๋ฐ๋ชฌ์ ์ค์งํ๊ธฐ ์ํด ์ต์ ์ ๋คํ๊ณ ์ข ๋ฃ๋ฅผ ๋ณด์ฅํ์ง ์์ต๋๋ค. ์
๋ฐ๋ชฌ์ด ์ข ๋ฃ๋์ง ์์ ๊ฒฝ์ฐ ์ฌ์ฉ์๋ kill์ ์ ์กํ์ฌ ์๋์ผ๋ก ์ข ๋ฃํ ์ ์์ต๋๋ค.
๋ฐ๋ชฌ์ ์ ํธ๋ฅผ ๋ณด๋ ๋๋ค. GPU ์ฌ์ค์ ์์ (nvidia-smi๋ฅผ ํตํด)์ ์ํํ๋ ค๋ฉด ๋ชจ๋ GPU๊ฐ ํ์ํฉ๋๋ค.
๋ฐ๋ชฌ์ ํฌํจํ์ฌ ์ข ๋ฃ๋ ํ๋ก์ธ์ค. ๋ฐ๋ชฌ์ด ์ด๋ ค ์๋ ์ฌ์ฉ์๋ ๋ค์์ ๋ณผ ์ ์์ต๋๋ค.
GPU๊ฐ ์ฌ์ฉ ์ค์ด๋ผ๋ ํจ๊ณผ์ ๋ํ ์ค๋ฅ์ ๋๋ค.
8) ๋์๋ง ์ ๋ณด
์๋น๋์ smi ์ ๋ง -h
๋ช ๋ น์ค ์ฌ์ฉ์ ๋ํ ๋์๋ง ์ ๋ณด๋ฅผ ํ์ํฉ๋๋ค.
์ฌ์ ๋ชจ๋ (์คํ์ )
"nvidia-smi replay" ๋ช ๋ น์ค์ ๋ก๊ทธ ํ์ผ์ ์ ์ฒด ๋๋ ์ผ๋ถ๋ฅผ ์ถ์ถ/์ฌ์ํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
๋ฐ๋ชฌ์ ์ํด ์์ฑ๋ฉ๋๋ค. ๊ธฐ๋ณธ์ ์ผ๋ก ๋๊ตฌ๋ Power
์ฌ์ฉ๋, ์จ๋, SM ์๊ณ, ๋ฉ๋ชจ๋ฆฌ ์๊ณ ๋ฐ SM, ๋ฉ๋ชจ๋ฆฌ,
์ธ์ฝ๋ ๋ฐ ๋์ฝ๋. ์ฌ์ ๋๊ตฌ๋ ํ๋ ์ ๋ฒํผ์ ๊ฐ์ ๋ค๋ฅธ ๋ฉํธ๋ฆญ์ ๊ฐ์ ธ์ฌ ์๋ ์์ต๋๋ค.
๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋, bar1 ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋, ์ ๋ ฅ/์ด ์๋ฐ ๋ฐ ์ง๊ณ ๋จ์ผ/์ด์ค ๋นํธ
ECC ์ค๋ฅ. ์ฌ์ํ ๋ฉํธ๋ฆญ ์ธํธ๋ฅผ ์ ํํ๋ ์ต์ ์ด ์์ต๋๋ค.
์์ฒญ๋ ๋ฉํธ๋ฆญ์ด ์ ์ง ๊ด๋ฆฌ๋์ง ์๊ฑฐ๋ ์ง์๋์ง ์๋ ๊ฒ์ผ๋ก ๊ธฐ๋ก๋๋ฉด "-"๋ก ํ์๋ฉ๋๋ค.
์ถ๋ ฅ. ์ด ๋ชจ๋์์ ์์ฑ๋ ๋ฐ์ดํฐ ํ์์ ์ฌ์ฉ์๊ฐ
์ฅ์น ๋ชจ๋ํฐ๋ง ์ ํธ๋ฆฌํฐ๋ฅผ ๋ํ์์ผ๋ก. ๋ช ๋ น์ค์๋ ํ์ ์ต์ "-f"๊ฐ ํ์ํฉ๋๋ค.
๋ก๊ทธ ํ์ผ ์ด๋ฆ์ ์ ์ฒด ๊ฒฝ๋ก๋ฅผ ์ง์ ํ๊ธฐ ์ํด ์ง์๋๋ ๋ค๋ฅธ ๋ชจ๋ ์ต์ ์
๋ฐฐํ์ ์ด๋ฉฐ ์ด๋ค ์์๋ก๋ ํจ๊ป ์ฌ์ฉํ ์ ์์ต๋๋ค.
์ฉ๋ฒ:
1) ์ง์ ๊ธฐ๋ก ํ์ผ ์ be ์ฌ์
์๋น๋์ smi ์ฌ์ -f <๋ก๊ทธ ํ์ผ ์ด๋ฆ>
์์ถ๋ ๋ก๊ทธ ํ์ผ์์ ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ค๊ณ ์ฌ์ฉ์๊ฐ ํ ์ค์ ๋ณผ ์ ์๋๋ก ํฉ๋๋ค.
์ ์ฅ๋ ๊ฐ ๋ชจ๋ํฐ๋ง ๋ฐ๋ณต์ ๋ํ ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ(ํ์์คํฌํ๊ฐ ์๋ ๊ธฐ๋ณธ ๋ฉํธ๋ฆญ)
๋ก๊ทธ ํ์ผ์์. ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ์ ์๋ก์ด ๋ผ์ธ์ ๊ด๊ณ์์ด XNUMX์ด๋ง๋ค ์ฌ์๋ฉ๋๋ค.
์์ง ๋น์ ์ ์ง๋ ์ค์ ๋ชจ๋ํฐ๋ง ๋น๋. ํ์๋๋ค
ํ์ผ์ ๋๊น์ง ๋๋ ^C์ ์ํด ์ข ๋ฃ๋ ๋๊น์ง.
2) ํํฐ ํต๊ณ ์ be ์ฌ์
์๋น๋์ smi ์ฌ์ -f <๊ฒฝ๋ก ์ ๊ธฐ๋ก ํ์ผ> -s
๋ค์ ์ค ํ๋ ์ด์์ด ๋ ์ ์์ต๋๋ค.
p - ์ ๋ ฅ ์ฌ์ฉ๋(์ํธ ๋จ์) ๋ฐ ์จ๋(C ๋จ์)
u - ์ฌ์ฉ๋ฅ (SM, ๋ฉ๋ชจ๋ฆฌ, ์ธ์ฝ๋ ๋ฐ ๋์ฝ๋ ์ฌ์ฉ๋ฅ (%))
c - Proc ๋ฐ Mem ํด๋ญ(MHz)
v - ์ ๋ ฅ ์๋ฐ(%) ๋ฐ ์ด ์๋ฐ(๋ถ์ธ ํ๋๊ทธ๋ก)
m - ํ๋ ์ ๋ฒํผ ๋ฐ Bar1 ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋(MB)
e - ECC(์ง๊ณ๋ ๋จ์ผ ๋นํธ, ์ด์ค ๋นํธ ECC ์ค๋ฅ ์) ๋ฐ PCIe ์ฌ์
์ค๋ฅ
t - PCIe Rx ๋ฐ Tx ์ฒ๋ฆฌ๋(MB/s)(Maxwell ์ด์)
3) ํ๋ ์ฌ์ ์ ํ or ๋ฐฐ์ฐ๊ธฐ ์ฅ์น
์๋น๋์ smi ์ฌ์ -f <๋ก๊ทธ ํ์ผ> -i <์ฅ์น1,์ฅ์น2, .. , ์ฅ์นN>
์ผํ๋ก ๊ตฌ๋ถ๋ ์ฅ์น์์ ์ ํํ ์ฅ์น ์งํฉ์ผ๋ก ์งํ ๋ณด๊ณ ๋ฅผ ์ ํํฉ๋๋ค.
๋ชฉ๋ก. ์ด ๋๊ตฌ๋ ๋ก๊ทธ ํ์ผ์์ ์ ์ง ๊ด๋ฆฌ๋์ง ์๋ ๋ชจ๋ ์ฅ์น๋ฅผ ๊ฑด๋๋๋๋ค.
4) ์ ํ ์ ์, ์๊ฐ ์ก์ ์ฌ์ด์ ์ด๋ ๋ฐ์ดํฐ is ์ ๊ณ
์๋น๋์ smi ์ฌ์ -f <๋ก๊ทธ ํ์ผ> -b <์์ ์๊ฐ in HH : MM : SS ํ์> -e <๋ ์๊ฐ in
HH : MM : SS ํ์>
์ด ์ต์ ์ ์ฌ์ฉํ๋ฉด ์ง์ ๋ ์๊ฐ ๋ฒ์ ์ฌ์ด์์ ๋ฐ์ดํฐ๋ฅผ ์ ํํ ์ ์์ต๋๋ค. ์ง์
-b ๋๋ -e ์ต์ ์ ์ฌ์ฉํ์ฌ ์๊ฐ์ 0์ผ๋ก ์ง์ ํ๋ฉด ๊ฐ๊ฐ ์์ ๋๋ ์ข ๋ฃ ํ์ผ์ ์๋ฏธํฉ๋๋ค.
5) ๋ฆฌ๋๋ ์ ์ฌ์ ์ ๋ณด ์ a ๊ธฐ๋ก ํ์ผ
์๋น๋์ smi ์ฌ์ -f <๋ก๊ทธ ํ์ผ> -r <์ถ๋ ฅ ํ์ผ ์ด๋ฆ>
์ด ์ต์ ์ ๋ก๊ทธ ํ์ผ์ ์ ๋ ฅ์ผ๋ก ๋ฐ์ ๊ธฐ๋ณธ๊ฐ๊ณผ ๊ด๋ จ๋ ์ ๋ณด๋ฅผ ์ถ์ถํฉ๋๋ค.
์ง์ ๋ ์ถ๋ ฅ ํ์ผ์ ๋ฉํธ๋ฆญ.
6) ๋์๋ง ์ ๋ณด
์๋น๋์ smi ์ฌ์ -h
๋ช ๋ น์ค ์ฌ์ฉ์ ๋ํ ๋์๋ง ์ ๋ณด๋ฅผ ํ์ํฉ๋๋ค.
๋ฐฉ๋ฒ ๋ชจ๋ํฐ๋ง
"nvidia-smi pmon" ๋ช ๋ น์ค์ ์ปดํจํ ๋ฐ ๊ทธ๋ํฝ ํ๋ก์ธ์ค๋ฅผ ๋ชจ๋ํฐ๋งํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
์์คํ ์ ์ฐ๊ฒฐ๋ ํ๋ ์ด์์ GPU(์ต๋ 4๊ฐ ์ฅ์น)์์ ์คํ๋ฉ๋๋ค. ์ด ๋๊ตฌ๋
์ฌ์ฉ์๋ ๋งค ์๊ฐ๋ง๋ค ๊ฐ ์ฅ์น์์ ์คํ ์ค์ธ ๋ชจ๋ ํ๋ก์ธ์ค์ ๋ํ ํต๊ณ๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
๋ชจ๋ํฐ๋ง ์ฃผ๊ธฐ. ์ถ๋ ฅ์ ๊ฐ๊ฒฐํ ํ์์ด๋ฉฐ ๋ํ์์ผ๋ก ํด์ํ๊ธฐ ์ฝ์ต๋๋ค.
๋ฐฉ๋ฒ. ๋ผ์ธ๋น ์ถ๋ ฅ ๋ฐ์ดํฐ๋ ํฐ๋ฏธ๋ ํฌ๊ธฐ์ ๋ฐ๋ผ ์ ํ๋ฉ๋๋ค. Tesla์์ ์ง์๋๋ฉฐ,
๋ฒ ์ด ๋ฉํ 64์์ Kepler ๋๋ ์ต์ GPU์ฉ GRID, Quadro ๋ฐ ์ ํ๋ GeForce ์ ํ
๋นํธ ๋ฆฌ๋ ์ค. ๊ธฐ๋ณธ์ ์ผ๋ก ๊ฐ ํ๋ก์ธ์ค์ ๋ํ ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ์๋ pid, ๋ช ๋ น์ด ํฌํจ๋ฉ๋๋ค.
๋ง์ง๋ง ์ดํ SM, ๋ฉ๋ชจ๋ฆฌ, ์ธ์ฝ๋ ๋ฐ ๋์ฝ๋์ ์ด๋ฆ ๋ฐ ํ๊ท ์ฌ์ฉ ๊ฐ
๋ชจ๋ํฐ๋ง ์ฃผ๊ธฐ. ๋ํ ๊ฐ ํ๋ ์ ๋ฒํผ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ๋ณด๊ณ ํ๋๋ก ๊ตฌ์ฑํ ์ ์์ต๋๋ค.
ํ๋ก์ธ์ค. ์ฅ์น์ ๋ํด ์คํ ์ค์ธ ํ๋ก์ธ์ค๊ฐ ์์ผ๋ฉด ๋ชจ๋ ๋ฉํธ๋ฆญ์ด ๋ณด๊ณ ๋ฉ๋๋ค.
์ฅ์น์ ๋ํด "-"๋ก. ๊ธฐ๊ธฐ ๋๋ ๊ธฐํ ๊ธฐ๊ธฐ์์ ์ง์๋์ง ์๋ ์ธก์ ํญ๋ชฉ์ด ์๋ ๊ฒฝ์ฐ
๋ฉํธ๋ฆญ ๊ฐ์ ธ์ค๊ธฐ ์ค๋ฅ๋ ์ถ๋ ฅ ๋ฐ์ดํฐ์์ "-"๋ก ๋ณด๊ณ ๋ฉ๋๋ค. ์ฌ์ฉ์๋ ๋ํ
๊ฐ ์คํ์ ๋ํ ๋ชจ๋ํฐ๋ง ๋น๋ ๋ฐ ๋ชจ๋ํฐ๋ง ๋ฐ๋ณต ํ์๋ฅผ ๊ตฌ์ฑํฉ๋๋ค. ๊ฑฐ๊ธฐ
๋ํ ๊ฐ ์ค์ ๋ ์ง์ ์๊ฐ์ ํฌํจํ๋ ์ต์ ์ ๋๋ค. ์ง์๋๋ ๋ชจ๋ ์ต์ ์
๋ฐฐํ์ ์ด๋ฉฐ ์ด๋ค ์์๋ก๋ ํจ๊ป ์ฌ์ฉํ ์ ์์ต๋๋ค.
์ฉ๋ฒ:
1) ํ๋ง ๊ณผ ์๋ ์ธ์
์๋น๋์ smi PMON
์ต๋ 4๊ฐ์ ์ง์๋๋ ์ฅ์น์ ๋ํด ๊ฐ ์ฅ์น์์ ์คํ ์ค์ธ ๋ชจ๋ ํ๋ก์ธ์ค๋ฅผ ๋ชจ๋ํฐ๋งํฉ๋๋ค.
0์ด์ ๋น๋๋ก ์์ฐ ์ด๊ฑฐ(GPU ์ธ๋ฑ์ค 1๋ถํฐ ์์). ๊น์ง ์คํ
^C๋ก ์ข ๋ฃ๋ฉ๋๋ค.
2) ์ ํ ํ or ๋ฐฐ์ฐ๊ธฐ ์ฅ์น
์๋น๋์ smi PMON -i <์ฅ์น1,์ฅ์น2, .. , ์ฅ์นN>
์ผํ๋ก ์ ํํ ์ฅ์น์์ ์คํ ์ค์ธ ๋ชจ๋ ํ๋ก์ธ์ค์ ๋ํ ํต๊ณ๋ฅผ ๋ณด๊ณ ํฉ๋๋ค.
๋ถ๋ฆฌ๋ ์ฅ์น ๋ชฉ๋ก. ์ด ๋๊ตฌ๋ ์๋ ๋ชฉ๋ก์์ ์ง์๋๋ ์ฅ์น๋ฅผ ์ต๋ 4๊ฐ ์ ํํฉ๋๋ค.
์์ฐ ์ด๊ฑฐ(GPU ์ธ๋ฑ์ค 0๋ถํฐ ์์).
3) ์ ํ ํต๊ณ ์ be ํ์๋
์๋น๋์ smi PMON -s
๋ค์ ์ค ํ๋ ์ด์์ด ๋ ์ ์์ต๋๋ค.
u - ์ฌ์ฉ๋ฅ (ํ๋ก์ธ์ค์ ๋ํ SM, ๋ฉ๋ชจ๋ฆฌ, ์ธ์ฝ๋ ๋ฐ ๋์ฝ๋ ์ฌ์ฉ๋ฅ (%)).
๋ง์ง๋ง ๋ชจ๋ํฐ๋ง ์ฃผ๊ธฐ ์ดํ ํ๊ท ์ฌ์ฉ๋ฅ ์ ๋ณด๊ณ ํฉ๋๋ค.
m - ํ๋ ์ ๋ฒํผ ์ฌ์ฉ๋(MB). ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ๋ํ ์ฆ๊ฐ์ ์ธ ๊ฐ์ ๋ณด๊ณ ํฉ๋๋ค.
4) ๊ตฌ์ฑ ๋ชจ๋ํฐ๋ง ๋ฐ๋ณต
์๋น๋์ smi PMON -c <๋ฒํธ of ์ํ>
์ง์ ๋ ์ํ ์์ ๋ํ ๋ฐ์ดํฐ๋ฅผ ํ์ํ๊ณ ์ข ๋ฃํฉ๋๋ค.
5) ๊ตฌ์ฑ ๋ชจ๋ํฐ๋ง ์ฃผํ์
์๋น๋์ smi PMON -d <์๊ฐ in ์ด>
์ข ๋ฃ๋ ๋๊น์ง ์ง์ ๋ ๋ชจ๋ํฐ๋ง ๊ฐ๊ฒฉ๋ง๋ค ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ํ์ํฉ๋๋ค.
^C. ๋ชจ๋ํฐ๋ง ๋น๋๋ 1์ด์์ 10์ด ์ฌ์ด์ฌ์ผ ํฉ๋๋ค.
6) ๋์คํ๋ ์ด ๋ฐ์ดํฐ
์๋น๋์ smi PMON -o D
YYYYMMDD ํ์์ ๋ ์ง์ ํจ๊ป ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐํฉ๋๋ค.
7) ๋์คํ๋ ์ด ์๊ฐ
์๋น๋์ smi PMON -o T
HH:MM:SS ํ์์ ์๊ฐ๊ณผ ํจ๊ป ๋ชจ๋ํฐ๋ง ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐํฉ๋๋ค.
8) ๋์๋ง ์ ๋ณด
์๋น๋์ smi PMON -h
๋ช ๋ น์ค ์ฌ์ฉ์ ๋ํ ๋์๋ง ์ ๋ณด๋ฅผ ํ์ํฉ๋๋ค.
ํ ํด๋ก์ง (์คํ์ )
์์คํ ์ GPU์ ๋ํ ํ ํด๋ก์ง ์ ๋ณด, GPU๊ฐ ์๋ก ์ฐ๊ฒฐ๋๋ ๋ฐฉ์ ๋์ด
RDMA๊ฐ ๊ฐ๋ฅํ ์ ๊ฒฉ NIC๋ก
๋ค์ ๋ฒ๋ก์ ํจ๊ป ์ฌ์ฉ ๊ฐ๋ฅํ GPU ๋งคํธ๋ฆญ์ค๋ฅผ ํ์ํฉ๋๋ค.
๋ฒ๋ก :
X = ๋ณธ์ธ
SOC = ๊ฒฝ๋ก๊ฐ ์์ผ ์์ค ๋งํฌ๋ฅผ ํต๊ณผํจ(์: QPI)
PHB = PCIe ํธ์คํธ ๋ธ๋ฆฌ์ง๋ฅผ ํต๊ณผํ๋ ๊ฒฝ๋ก
PXB = ์ฌ๋ฌ PCIe ๋ด๋ถ ์ค์์น๋ฅผ ํต๊ณผํ๋ ๊ฒฝ๋ก
PIX = PCIe ๋ด๋ถ ์ค์์น๋ฅผ ๊ฐ๋ก์ง๋ฅด๋ ๊ฒฝ๋ก
UNIT ATTRIBUTES
๋ค์ ๋ชฉ๋ก์ ์์ ๋ฐํ๋ ๊ฐ๋ฅํ ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์ค๋ช ํฉ๋๋ค. -q -u ๋จ์ ์ฟผ๋ฆฌ ์ต์ .
๋ฌ๋ฆฌ ๋ช ์๋์ง ์๋ ํ ๋ชจ๋ ์์น ๊ฒฐ๊ณผ๋ ๋ฐ์ด 10์ด๊ณ ๋จ์๊ฐ ์์ต๋๋ค.
์๊ฐ ๊ธฐ๋ก
nvidia-smi๊ฐ ํธ์ถ๋ ์์ ์ ํ์ฌ ์์คํ ํ์์คํฌํ์ ๋๋ค. ํ์์ "์์ผ
์ ์ผ HH:MM:SS ์ฐ๋".
์ด์ ๊ธฐ์ฌ ๋ฒ์
์ค์น๋ NVIDIA ๋์คํ๋ ์ด ๋๋ผ์ด๋ฒ์ ๋ฒ์ ์ ๋๋ค. ํ์
"๋ฉ์ด์ ๋๋ฒ. ๋ง์ด๋ ๋๋ฒ".
HIC ์ ๋ณด
์์คํ ์ ์ค์น๋ HIC(ํธ์คํธ ์ธํฐํ์ด์ค ์นด๋)์ ๋ํ ์ ๋ณด์ ๋๋ค.
ํ์จ์ด ๋ฒ์
HIC์์ ์คํ ์ค์ธ ํ์จ์ด ๋ฒ์ ์ ๋๋ค.
์ฒจ๋ถ ๋จ์
์์คํ ์ ์ฐ๊ฒฐ๋ ์ฅ์น์ ์์ ๋๋ค.
ํ๋ก๋ํธ ์ฑํจ
์ฅ์น์ ๊ณต์ ์ ํ ์ด๋ฆ์ ๋๋ค. ์์ซ์ ๊ฐ์ ๋๋ค. ๋ชจ๋ S ํด๋์ค์ฉ
์ ํ๋ณด๊ธฐ.
ํ๋ก๋ํธ Id
์ฅ์น์ ์ ํ ์๋ณ์์ ๋๋ค. ํ์์ ์์ซ์ ๊ฐ์ ๋๋ค.
"ํํธ1-ํํธ2-ํํธ3". ๋ชจ๋ S๊ธ ์ ํ์ ์ ์ฉ๋ฉ๋๋ค.
ํ๋ก๋ํธ ์ผ๋ จ์
๋จ์์ ๋ํ ๋ณ๊ฒฝํ ์ ์๋ ์ ์ญ ๊ณ ์ ์๋ณ์์ ๋๋ค. ์์ซ์ ๊ฐ์ ๋๋ค.
๋ชจ๋ S๊ธ ์ ํ์ ์ ์ฉ๋ฉ๋๋ค.
ํ์จ์ด ๋ฒ์
์ฅ์น์์ ์คํ ์ค์ธ ํ์จ์ด ๋ฒ์ ์ ๋๋ค. ํ์์ "Major-Number.Minor-Number"์ ๋๋ค.
๋ชจ๋ S๊ธ ์ ํ์ ์ ์ฉ๋ฉ๋๋ค.
LED ์ฃผ ์ ๋ถ
LED ํ์๊ธฐ๋ ์ ์ฌ์ ์ธ ๋ฌธ์ ๊ฐ ์๋ ์์คํ ์ ํ๋๊ทธ๋ฅผ ์ง์ ํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค. AMBER์ LED ์์
๋ฌธ์ ๋ฅผ ๋ํ๋ ๋๋ค. ๋ชจ๋ S ํด๋์ค ์ ํ์ ์ ์ฉ๋ฉ๋๋ค.
์์ LED ํ์๊ธฐ์ ์์์ ๋๋ค. "๋ น์" ๋๋ "ํฉ์" ์ค ํ๋์ ๋๋ค.
์์ธ ํ์ฌ LED ์์์ ์ด์ . ์์ธ์ ๋ค์๊ณผ ๊ฐ์ด ๋์ด๋ ์ ์์ต๋๋ค.
"์ ์ ์์", "ํธ์คํธ ์์คํ ์์ ํฉ์์ผ๋ก ์ค์ ", "์ด ์ผ์
์ค๋ฅ", "ํฌ ์ค๋ฅ" ๋ฐ "์จ๋๊ฐ ์๊ณ ํ๊ณ๋ฅผ ์ด๊ณผํจ".
์จ๋
์ฅ์น์ ์ค์ํ ๊ตฌ์ฑ ์์์ ๋ํ ์จ๋ ํ๋ ๊ฐ. ๋ชจ๋ ํ๋ ๊ฐ์ C๋์ ๋๋ค.
๋ชจ๋ ํ๋ ๊ฐ์ ์ฌ์ฉํ ์ ์๋ ๊ฒ์ ์๋๋๋ค. ๋ชจ๋ S-ํด๋์ค ์ ํ์ ์ ์ฉ๋ฉ๋๋ค.
์ญ์ทจ ์ฅ์น ํก์ ๊ตฌ์ ๊ณต๊ธฐ ์จ๋.
๋ฐฐ์ถ ๋จ์ ๋ฐฐ๊ธฐ ์ง์ ์ ๊ณต๊ธฐ ์จ๋.
๊ต์ก ์์ํ ์ฅ์น ๋ณด๋ ์ ์ฒด์ ๊ณต๊ธฐ ์จ๋.
PSU
์ฅ์น ์ ์ ๊ณต๊ธ ์ฅ์น์ ๋ํ ํ๋ ๊ฐ. ๋ชจ๋ S ํด๋์ค ์ ํ์ ์ ์ฉ๋ฉ๋๋ค.
์ฃผ ์ ๋ถ PSU์ ์๋ ์ํ์ ๋๋ค. ์ ์ ๊ณต๊ธ ์ฅ์น ์ํ๋ ๋ค์ ์ค ํ๋์ผ ์ ์์ต๋๋ค.
๋ค์: "์ ์", "๋น์ ์", "๊ณ ์ ์", "ํฌ ๊ณ ์ฅ", "๋ฐฉ์ดํ"
์จ๋", "ํ์ฌ ํ๊ณ", "UV ๊ฒฝ๋ณด ์๊ณ๊ฐ ๋ฏธ๋ง์ ์ ์",
"์ ์ ์", "I2C ์๊ฒฉ ๊บผ์ง ๋ช ๋ น", "MOD_DISABLE ์ ๋ ฅ" ๋๋ "๋จ๋ฝ ํ
์ดํ".
์ ์ PSU ์ ์ ์ค์ (๋ณผํธ).
Current PSU ์ ๋ฅ ์๋ชจ๋(์ํ์ด).
๋ถ์ฑ ์ ๋ณด
์ฅ์น์ ๋ํ ํฌ ํ๋ ๊ฐ. ๊ฐ ํฌ์ ๋ํ ํ๋ ๊ฐ์ด ์ ๊ณต๋ฉ๋๋ค.
๋ง์. ๋ชจ๋ S ํด๋์ค ์ ํ์ ์ ์ฉ๋ฉ๋๋ค.
์ฃผ ์ ๋ถ ํฌ ์ํ("NORMAL" ๋๋ "FAILED").
์๋ ์ ์์ ์ธ ํฌ์ ๊ฒฝ์ฐ ํฌ ์๋(RPM)์ ๋๋ค.
์ฒจ๋ถ GPU
์ฅ์น์ ์ฐ๊ฒฐ๋ ๊ฐ GPU์ ํด๋นํ๋ PCI ๋ฒ์ค ID ๋ชฉ๋ก์ ๋๋ค. ๋ฒ์ค
ID๋ XNUMX์ง์๋ก "domain:bus:device.function" ํ์์ ๊ฐ์ต๋๋ค. ๋ชจ๋ S-ํด๋์ค ์ ํ์ ์ ์ฉ๋ฉ๋๋ค.
๋ ธํธ
Linux์์ ๋ฃจํธ๋ก ์คํํ๋ฉด NVIDIA ์ฅ์น ํ์ผ์ด nvidia-smi์ ์ํด ์์ ๋ ์ ์์ต๋๋ค. ๋ด์ฃผ์ธ์
๋๋ผ์ด๋ฒ README ํ์ผ์ ๊ด๋ จ ์น์ .
XNUMXD๋ดํ์ -a ์ -g ์ธ์๋ ์ด์ ๋ ์ด์ ์ฌ์ฉ๋์ง ์์ต๋๋ค. -q ์ -i, ๊ฐ๊ฐ. ํ๋,
์ด์ ์ธ์๋ ์ด ๋ฆด๋ฆฌ์ค์์ ๊ณ์ ์๋ํฉ๋๋ค.
์ฌ์ฉ ์
์๋น๋์ smi -q
๋ชจ๋ GPU์ ๋ํ ์์ฑ์ ํ ๋ฒ ์ฟผ๋ฆฌํ๊ณ ํ์ค ์ถ๋ ฅ์ ์ผ๋ฐ ํ ์คํธ๋ก ํ์ํฉ๋๋ค.
์๋น๋์ smi --format=csv, ํค๋ ์์ --query-gpu=uuid, ์ง์์ฑ ๋ชจ๋
์์คํ ์ ์๋ ๋ชจ๋ GPU์ UUID ๋ฐ ์ง์์ฑ ๋ชจ๋๋ฅผ ์ฟผ๋ฆฌํฉ๋๋ค.
์๋น๋์ smi -q -d ECC, ์ ์ -i 0 -l 10 -f ์์.๋ก๊ทธ
0์ด ์ฃผ๊ธฐ๋ก GPU 10์ ๋ํ ECC ์ค๋ฅ ๋ฐ ์ ๋ ฅ ์๋น ์ฟผ๋ฆฌ,
๋ฌด๊ธฐํ์ผ๋ก out.log ํ์ผ์ ๊ธฐ๋กํฉ๋๋ค.
"nvidia-smi -c 1 -i GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8"
UUID๊ฐ ์๋ GPU์ ๋ํด ์ปดํจํ ๋ชจ๋๋ฅผ "PROHIBITED"๋ก ์ค์ ํฉ๋๋ค.
"GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8".
์๋น๋์ smi -q -u -x --dtd
๋ชจ๋ ๋จ์์ ๋ํ ์์ฑ์ ํ ๋ฒ ์ฟผ๋ฆฌํ๊ณ DTD๊ฐ ํฌํจ๋ XML ํ์์ผ๋ก ํ์ํ์ฌ
ํ์ค ์ถ๋ ฅ.
์๋น๋์ smi --dtd -u -f nvsmi_unit.dtd
๋จ์ DTD๋ฅผ nvsmi_unit.dtd์ ์๋๋ค.
์๋น๋์ smi -q -d SUPPORTED_CLOCKS
๋ชจ๋ GPU์ ์ง์๋๋ ํด๋ก์ ํ์ํฉ๋๋ค.
์๋น๋์ smi -i 0 --์์ฉ ํ๋ก๊ทธ๋จ-์๊ณ 2500,745
์ ํ๋ฆฌ์ผ์ด์ ํด๋ก์ 2500MHz ๋ฉ๋ชจ๋ฆฌ ๋ฐ 745MHz ๊ทธ๋ํฝ์ผ๋ก ์ค์ ํฉ๋๋ค.
๋ณ๊ฒฝ LOG
=== ์๋ ค์ง ๋ฌธ์ ===
* Linux์์ GOM ๋ณ๊ฒฝ์ด ๋ณด๋ฅ ์ค์ธ ๊ฒฝ์ฐ GPU ์ฌ์ค์ ์ ํธ๋ฆฌ๊ฑฐํ ์ ์์ต๋๋ค.
* Linux์์ GPU ์ฌ์ค์ ์ ๋ณด๋ฅ ์ค์ธ ECC ๋ชจ๋๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ๋ณ๊ฒฝํ์ง ๋ชปํ ์ ์์ต๋๋ค. ์ ์ฒด ์ฌ๋ถํ ์ ๋ค์๊ณผ ๊ฐ์ ์ ์์ต๋๋ค.
๋ชจ๋ ๋ณ๊ฒฝ์ ํ์ฑํํ๋ ๋ฐ ํ์ํฉ๋๋ค.
=== nvidia-smi v346 ์ ๋ฐ์ดํธ์ v352 ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ ===
* GPU๋น ์ ํธ๋๋ฅผ ํ์ํ๊ธฐ ์ํด topo ์ง์ ์ถ๊ฐ
* ์ฃผ์ด์ง ๋ ๋ฒจ์ ๋ํด ์ธ์ GPU๋ฅผ ํ์ํ๊ธฐ ์ํ topo ์ง์ ์ถ๊ฐ
* ์ฃผ์ด์ง ๋ GPU ๊ฐ์ ๊ฒฝ๋ก๋ฅผ ํ์ํ๊ธฐ ์ํด topo ์ง์ ์ถ๊ฐ
* ์คํฌ๋กค ํ์์ ํ๋ก์ธ์ค ๋ชจ๋ํฐ๋ง์ ์ํ "nvidia-smi pmon" ๋ช ๋ น์ค ์ถ๊ฐ
* ๋ฒ๊ทธ ์ ์ถ์ ์ฌ์ฉํ ์ํธํ๋ ๋๋ฒ๊ทธ ๋ก๊ทธ๋ฅผ ์์ฑํ๋ "--debug" ์ต์ ์ถ๊ฐ
NVIDIA๋ก ๋์๊ฐ๊ธฐ
* Windows WDDM ๋ชจ๋์์ ์ฌ์ฉ/์ฌ์ฉ ๊ฐ๋ฅํ ๋ฉ๋ชจ๋ฆฌ ๋ณด๊ณ ์์
* ํ๊ณ ํต๊ณ๋ ์คํ ์ค์ธ ํ๋ก์ธ์ค์ ์ข ๋ฃ๋ ํ๋ก์ธ์ค๋ฅผ ๋ชจ๋ ํฌํจํ๋๋ก ์ ๋ฐ์ดํธ๋ฉ๋๋ค. ๊ทธ๋งํผ
์คํ ์ค์ธ ํ๋ก์ธ์ค์ ์คํ ์๊ฐ์ 0์ผ๋ก ๋ณด๊ณ ๋๊ณ ๋ค์๊ณผ ๊ฐ์ ๊ฒฝ์ฐ ์ค์ ๊ฐ์ผ๋ก ์ ๋ฐ์ดํธ๋ฉ๋๋ค.
ํ๋ก์ธ์ค๊ฐ ์ข ๋ฃ๋ฉ๋๋ค.
=== nvidia-smi v340 ์ ๋ฐ์ดํธ์ v346 ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ ===
* PCIe ์ฌ์ ์นด์ดํฐ ๋ณด๊ณ ์ถ๊ฐ
* nvidia-smi๋ฅผ ํตํ ๊ทธ๋ํฝ ํ๋ก์ธ์ค ๋ณด๊ณ ์ง์ ์ถ๊ฐ
* PCIe ํ์ฉ๋ ๋ณด๊ณ ์ถ๊ฐ
* ์คํฌ๋กค ํ์์ ์ฅ์น ๋ชจ๋ํฐ๋ง์ ์ํ dmon ๋ช ๋ น์ค ์ถ๊ฐ
* ๋ฐฑ๊ทธ๋ผ์ด๋์์ ์คํํ๊ณ ์ฅ์น๋ฅผ ๋ฐ๋ชฌ์ผ๋ก ๋ชจ๋ํฐ๋งํ๋ ๋ฐ๋ชฌ ๋ช ๋ น์ค ์ถ๊ฐ
ํ๋ก์ธ์ค. /var/log/nvstats/์ ๋ ์ง๊ฐ ์ง์ ๋ ๋ก๊ทธ ํ์ผ์ ์์ฑํฉ๋๋ค.
* ๋ฐ๋ชฌ์ด ์์ฑํ ํต๊ณ ํ์ผ์ ์ฌ์/์ถ์ถํ๊ธฐ ์ํ ์ฌ์ ๋ช ๋ น์ค ์ถ๊ฐ
์๋จ
=== nvidia-smi v331 ์ ๋ฐ์ดํธ์ v340 ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ ===
* ์จ๋ ์๊ณ๊ฐ ์ ๋ณด์ ๋ํ ๋ณด๊ณ ๊ฐ ์ถ๊ฐ๋์์ต๋๋ค.
* ๋ธ๋๋ ์ ๋ณด ๋ณด๊ณ ๊ธฐ๋ฅ ์ถ๊ฐ(์: Tesla, Quadro ๋ฑ)
* K40d ๋ฐ K80์ ๋ํ ์ง์์ด ์ถ๊ฐ๋์์ต๋๋ค.
* ์ํ(์ ๋ ฅ, ํ์ฉ๋, ํด๋ก ๋ณ๊ฒฝ)์ ๋ํ ์ต๋, ์ต์ ๋ฐ ํ๊ท ๋ณด๊ณ ๊ธฐ๋ฅ์ด ์ถ๊ฐ๋์์ต๋๋ค.
๋ช ๋ น์ค ์: nvidia-smi -q -d power,utilization, clock
* nvidia-smi ํต๊ณ ์ธํฐํ์ด์ค๋ฅผ ์ถ๊ฐํ์ฌ ์ ๋ ฅ, ์ฌ์ฉ๋ฅ ,
์๊ณ ๋ณ๊ฒฝ, xid ์ด๋ฒคํธ ๋ฐ ๊ฐ๊ฐ์ ์ฒจ๋ถ๋ ์๊ฐ ๊ฐ๋ ์ด ์๋ ์ฑ๋ฅ ์ํ ์นด์ดํฐ
๊ฒฌ๋ณธ. ๋ช ๋ น์ค ์: nvidia-smi stats
* ๋ ์ด์์ GPU์์ ๋ฉํธ๋ฆญ์ ์งํฉ์ ์ผ๋ก ๋ณด๊ณ ํ๊ธฐ ์ํ ์ง์์ด ์ถ๊ฐ๋์์ต๋๋ค. ์ผํ์ ํจ๊ป ์ฌ์ฉ
"-i" ์ต์ ์ผ๋ก ๊ตฌ๋ถํฉ๋๋ค. ์: nvidia-smi -i 0,1,2
* GPU ์ธ์ฝ๋ ๋ฐ ๋์ฝ๋ ํ์ฉ๋ ํ์ ์ง์ ์ถ๊ฐ
* GPUDirect ํต์ ๋งคํธ๋ฆญ์ค๋ฅผ ํ์ํ๊ธฐ ์ํด nvidia-smi topo ์ธํฐํ์ด์ค ์ถ๊ฐ
(์คํ์ )
* ํ์๋๋ GPU ๋ณด๋ ID ๋ฐ ๋ค์ค GPU ๋ณด๋์ธ์ง ์ฌ๋ถ์ ๋ํ ์ง์ ์ถ๊ฐ
* XML ์ถ๋ ฅ์์ โโ์ฌ์ฉ์ ์ ์ ์ค๋กํ ์ด์ ์ ๊ฑฐ
=== nvidia-smi v5.319 ์ ๋ฐ์ดํธ์ v331 ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ ===
* ๋ง์ด๋ ๋ฒํธ ๋ณด๊ณ ๊ธฐ๋ฅ์ด ์ถ๊ฐ๋์์ต๋๋ค.
* ๋ณด๊ณ BAR1 ๋ฉ๋ชจ๋ฆฌ ํฌ๊ธฐ๊ฐ ์ถ๊ฐ๋์์ต๋๋ค.
* ๋ธ๋ฆฌ์ง ์นฉ ํ์จ์ด ๋ณด๊ณ ๊ธฐ๋ฅ์ด ์ถ๊ฐ๋์์ต๋๋ค.
=== nvidia-smi v4.319 ํ๋ก๋์ ๊ณผ v4.319 ์ ๋ฐ์ดํธ ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ ===
* ๊ถํ ์๊ตฌ ์ฌํญ์ ๋ณ๊ฒฝํ๊ธฐ ์ํด ์๋ก์ด --applications-clocks-permission ์ค์์น ์ถ๊ฐ
์ ํ๋ฆฌ์ผ์ด์ ์๊ณ ์ค์ ๋ฐ ์ฌ์ค์ ์ฉ.
=== nvidia-smi v4.304์ v4.319 ํ๋ก๋์ ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ ===
* ๋์คํ๋ ์ด ํ์ฑ ์ํ์ ๋ํ ๋ณด๊ณ ๊ฐ ์ถ๊ฐ๋์๊ณ ์ด๋ป๊ฒ ํ์๋๋์ง ๋ช ํํ ํ๊ธฐ ์ํด ๋ฌธ์๊ฐ ์ ๋ฐ์ดํธ๋์์ต๋๋ค.
๋์คํ๋ ์ด ๋ชจ๋ ๋ฐ ๋์คํ๋ ์ด ํ์ฑ ์ํ์ ๋ค๋ฆ
* ๋ค์ค GPU ๋ณด๋์ ์ผ๊ด์ฑ์ ์ํด nvidia-smi -L์ ํญ์ ๋์ UUID๋ฅผ ํ์ํฉ๋๋ค.
์ผ๋ จ ๋ฒํธ
* ๊ธฐ๊ณ๊ฐ ์ฝ์ ์ ์๋ ์ ํ์ ๋ณด๊ณ ๊ธฐ๋ฅ์ด ์ถ๊ฐ๋์์ต๋๋ค. ์ ์ ํ์ ์ฟผ๋ฆฌ ์ต์ ์น์ ์ ์ฐธ์กฐํ์ญ์์ค.
์๋น๋์-smi -h
* ํ์ด์ง ํ๊ธฐ ์ ๋ณด์ ๋ํ ์ฟผ๋ฆฌ๊ฐ ์ถ๊ฐ๋์์ต๋๋ค. --help-query-retired-pages ๋ฐ -d ์ฐธ์กฐ
PAGE_์ํด
* ์ด๋ฆ์ด ๋ณ๊ฒฝ๋ ํด๋ญ ์ค๋กํ ์ด์ ์ฌ์ฉ์ ์ ์ ํด๋ญ์ ์ ํ๋ฆฌ์ผ์ด์ ํด๋ญ ์ค์ ์ผ๋ก ๋ณ๊ฒฝ
* ์ค๋ฅ ์ ๋ฐํ ์ฝ๋์๋ ๊ฐ ์ค๋ฅ ํด๋์ค์ ๋ํด XNUMX์ด ์๋ ๊ณ ์ ํ ๊ฐ์ด ์์ต๋๋ค. ๋ฐํ ์ฐธ์กฐ
VALUE ์น์
* nvidia-smi -i ์ด์ ๋ฌธ์ ๊ฐ ์๋ ๊ฒฝ์ฐ ์ ์์ ์ธ GPU์์ ์ ๋ณด๋ฅผ ์ฟผ๋ฆฌํ ์ ์์ต๋๋ค.
์์คํ ์ ๋ค๋ฅธ GPU
* ๊ฒฐํจ์ด ์๋ GPU์ GPU ์ธ์ PCI ๋ฒ์ค ID ๋ฌธ์ ๋ฅผ ๊ฐ๋ฆฌํค๋ ๋ชจ๋ ๋ฉ์์ง
* ์๋ก์ด ํ๋๊ทธ --loop-ms๋ ์ด๋น ํ ๋ฒ๋ณด๋ค ๋น ๋ฅธ ์๋๋ก ์ ๋ณด๋ฅผ ์ฟผ๋ฆฌํ ์ ์์ต๋๋ค.
์์คํ ์ฑ๋ฅ์ ๋ถ์ ์ ์ธ ์ํฅ์ ๋ฏธ์นฉ๋๋ค)
* ํ๊ณ ์ ์ฐจ์ ๋ํ ์ฟผ๋ฆฌ๊ฐ ์ถ๊ฐ๋์์ต๋๋ค. --help-query-accounted-apps ๋ฐ -d ์ฐธ์กฐ
ํ๊ณ
* ์ฟผ๋ฆฌ ์ถ๋ ฅ์ ๊ฐ์ ์ ์ ์ ํ ์ถ๊ฐ
=== nvidia-smi v4.304 RC์ v4.304 ํ๋ก๋์ ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ ===
* GPU ์๋ ๋ชจ๋(GOM) ๋ณด๊ณ ๊ธฐ๋ฅ ์ถ๊ฐ
* GPU ์๋ ๋ชจ๋๋ฅผ ์ค์ ํ๋ ์๋ก์ด --gom ์ค์์น ์ถ๊ฐ
=== nvidia-smi v3.295์ v4.304 RC ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ ===
* ์ฌ์ฉ์ ํผ๋๋ฐฑ์ผ๋ก ์ธํด ์ฅํฉํ์ง ์์ ์ถ๋ ฅ ํ์์ด ๋ณ๊ฒฝ๋์์ต๋๋ค. ์์ ๋ณด๋ฅ ์ค์ธ ์ ๋ณด๋ฅผ ์ ๊ฑฐํ์ต๋๋ค.
ํ ์ด๋ธ.
* ์ปค๋ ๋ชจ๋์ด ์์ ๋์ง ์์ ์ด๊ธฐํ์ ์คํจํ ๊ฒฝ์ฐ ์ ์ฉํ ๋ฉ์์ง ์ถ๋ ฅ
์ธํฐ๋ฝํธ
* NVML ๊ณต์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ์์คํ ์ ์์ ๋ ๋ ๋์ ์ค๋ฅ ์ฒ๋ฆฌ
* ์๋ก์ด --applications-clocks ์ค์์น ์ถ๊ฐ
* --display ์ค์์น์ ์ ํํฐ๋ฅผ ์ถ๊ฐํ์ต๋๋ค. -d SUPPORTED_CLOCKS์ ํจ๊ป ์คํํ์ฌ ๊ฐ๋ฅํ ๋์ด
GPU์ ์๊ณ
* ์ฌ์ ๋ฉ๋ชจ๋ฆฌ ๋ณด๊ณ ์ ๋ฐ์ฌ๋ฆผ ํฉ๊ณ ๋ฐ ์ฌ์ฉ ๋ฉ๋ชจ๋ฆฌ์์ ๊ณ์ฐํ๋ฏ๋ก
๊ฐ์น๊ฐ ๋ํด์ง๋
* ์ ์ ๊ด๋ฆฌ ์ ํ ์ ํ ๋ฐ ๊ธฐ๋ณธ ์ ํ์ ๋ํ ๋ณด๊ณ ๊ธฐ๋ฅ ์ถ๊ฐ
* ์๋ก์ด --power-limit ์ค์์น ์ถ๊ฐ
* ํ ์ค์ฒ ๋ฉ๋ชจ๋ฆฌ ECC ์ค๋ฅ ๋ณด๊ณ ์ถ๊ฐ
* ํด๋ญ ์ค๋กํ ์ด์ ๋ณด๊ณ ์ถ๊ฐ
=== nvidia-smi v2.285์ v3.295 ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ ===
* ์คํ ๋ช ๋ น์ ๋ํ ๋ณด๋ค ๋ช ํํ ์ค๋ฅ ๋ณด๊ณ (์: ์ปดํจํ ๋ชจ๋ ๋ณ๊ฒฝ)
* ํ ๋ฒ์ ์ฌ๋ฌ GPU์์ ๋ช ๋ น์ ์คํํ ๋ ํด๋น ์์ ์ค๋ฅ๋ ๊ฒฝ๊ณ ๋ก ์ฒ๋ฆฌ๋ฉ๋๋ค.
* nvidia-smi -i๋ ์ด์ UUID๋ ์ง์ํฉ๋๋ค.
* UUID ํ์์ด UUID ํ์ค๊ณผ ์ผ์นํ๋๋ก ๋ณ๊ฒฝ๋์์ผ๋ฉฐ ๋ค๋ฅธ ๊ฐ์ ๋ณด๊ณ ํฉ๋๋ค.
=== nvidia-smi v2.0์ v2.285 ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ ===
* VBIOS ๋ฒ์ ์ ๋ณด๊ณ ํฉ๋๋ค.
* ๋ฐ์ดํฐ์ ์ผ๋ถ๋ฅผ ํํฐ๋งํ๊ธฐ ์ํด -d/--display ํ๋๊ทธ ์ถ๊ฐ
* PCI ํ์ ์์คํ ID ๋ณด๊ณ ๊ธฐ๋ฅ ์ถ๊ฐ
* M2075 ๋ฐ C2075๋ฅผ ์ง์ํจ์ ๋ํ๋ด๋ ์ ๋ฐ์ดํธ๋ ๋ฌธ์
* -u ์ค์์น๋ฅผ ์ฌ์ฉํ์ฌ HIC HWBC ํ์จ์ด ๋ฒ์ ๋ณด๊ณ
* ํ์ฌ ํด๋ญ ์์ ์ต๋(P0) ํด๋ญ ๋ณด๊ณ
* ์ฅ์น ๋๋ ์ฅ์น DTD๋ฅผ ์ธ์ํ๋ --dtd ํ๋๊ทธ ์ถ๊ฐ
* NVIDIA ๋๋ผ์ด๋ฒ๊ฐ ์คํ๋์ง ์์ ๋ ๋ฉ์์ง ์ถ๊ฐ
* PCIe ๋งํฌ ์์ฑ(์ต๋ ๋ฐ ํ์ฌ) ๋ฐ ๋งํฌ ๋๋น(์ต๋ ๋ฐ
ํ์ฌ์).
* ๋ณด๋ฅ ์ค์ธ ๋๋ผ์ด๋ฒ ๋ชจ๋ธ ๊ฐ์ ธ์ค๊ธฐ๋ ๋น๊ด๋ฆฌ์์์ ์๋ํฉ๋๋ค.
* Windows ๊ฒ์คํธ ๊ณ์ ์์ nvidia-smi ์คํ ์ง์ ์ถ๊ฐ
* -q ๋ช ๋ น ์์ด nvidia-smi๋ฅผ ์คํํ๋ฉด -q ๋์ ์ฅํฉํ์ง ์์ ๋ฒ์ ์ด ์ถ๋ ฅ๋ฉ๋๋ค.
๋์
* -l/--loop= ์ธ์์ ํ์ฑ ์์ (๊ธฐ๋ณธ๊ฐ, 0, ํฐ ๊ฐ)
* pciBusId ํ์ ๋ณ๊ฒฝ(XXXX:XX:XX.X๋ก - ์ด ๋ณ๊ฒฝ ์ฌํญ์ 280์์ ๋ณผ ์ ์์)
* -i ๋ช ๋ น์ ๋ํ busId์ ๊ตฌ๋ฌธ ๋ถ์์ด ๋ ์ ํ์ ์ ๋๋ค. 0:2:0.0 ๋๋
0000:02:00 ๋ฐ ๊ธฐํ ๋ณํ
* "๋๋ผ์ด๋ฒ ๋ฒ์ "๋ ํฌํจํ๋๋ก ๋ฒ์ ๊ด๋ฆฌ ์ฒด๊ณ ๋ณ๊ฒฝ
* XML ํ์์ ์ค๋ฅ ์กฐ๊ฑด์ด ๋ฐ์ํ๋๋ผ๋ ํญ์ DTD๋ฅผ ๋ฐ๋ฆ ๋๋ค.
* ๋จ์ผ ๋ฐ ์ด์ค ๋นํธ ECC ์ด๋ฒคํธ ๋ฐ XID ์ค๋ฅ์ ๋ํ ์ง์ ์ถ๊ฐ(๊ธฐ๋ณธ์ ์ผ๋ก ํ์ฑํ๋จ
-x ํ๋๊ทธ์ ๋ํด -l ํ๋๊ทธ๊ฐ ๋นํ์ฑํ๋จ)
* ์ฅ์น ์ฌ์ค์ -r --gpu-reset ํ๋๊ทธ ์ถ๊ฐ
* ์ปดํจํ ์คํ ํ๋ก์ธ์ค ๋ชฉ๋ก ์ถ๊ฐ
* ์ ์ ์ํ๋ฅผ ์ฑ๋ฅ ์ํ๋ก ๋ณ๊ฒฝํ์ต๋๋ค. XML ์ถ๋ ฅ์ ๋ ์ด์ ์ฌ์ฉ๋์ง ์๋ ์ง์์ด ์์ต๋๋ค.
๋ก ์์ฑ๋์ด์ผ ํฉ๋๋ค.
* ์ ๋ฐ์ดํธ๋ XML ์ถ๋ ฅ๊ณผ ์ผ์นํ๋๋ก DTD ๋ฒ์ ๋ฒํธ๋ฅผ 2.0์ผ๋ก ์ ๋ฐ์ดํธํ์ต๋๋ค.
onworks.net ์๋น์ค๋ฅผ ์ฌ์ฉํ์ฌ ์จ๋ผ์ธ์์ alt-nvidia-361-smi ์ฌ์ฉ