EnglishFrenchSpanyol

Ad


Favicon OnWorks

likwid-perfctr - Dalam Talian di Awan

Jalankan likwid-perfctr dalam penyedia pengehosan percuma OnWorks melalui Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS

Ini ialah arahan likwid-perfctr yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.

JADUAL:

NAMA


likwid-perfctr - konfigurasi dan baca pembilang prestasi perkakasan pada cpus x86

SINOPSIS


likwid-perfctr [-vhHVmaeiMoO] [-c/-C ] [-g or
] [-t ] [-S ] [-s ] [-o
]

DESCRIPTION


likwid-perfctr ialah aplikasi baris arahan yang ringan untuk mengkonfigurasi dan membaca
data pemantauan prestasi perkakasan pada pemproses x86 yang disokong. Ia boleh mengukur sama ada sebagai
pembungkus tanpa menukar aplikasi yang diukur atau dengan fungsi API penanda di dalam
kod, yang akan menghidupkan dan mematikan kaunter. Terdapat kumpulan prakonfigurasi dengan berguna
set peristiwa dan metrik terbitan. Tambahan pula peristiwa sewenang-wenangnya boleh diukur dengan adat
set acara. API penanda boleh mengukur pelbagai kawasan bernama. Keputusan terkumpul pada
berbilang panggilan. Pemproses x86 berikut disokong:

· Intel Teras 2: semua varian. kaunter: PMC[0-1], FIXC[0-2]

· Intel Nehalem: Kaunter: PMC[0-3], FIXC[0-2], UPMC[0-7]

· Intel aku bernafas EX: Kaunter: PMC[0-3], FIXC[0-2], MBOX[0-1]C[0-5], BBOX[0-1]C[0-3],
RBOX[0-1]C[0-7], WBOX[0-5], UBOX0, SBOX[0-1]C[0-3], CBOX[0-9]C[0-4]

· Intel Westmere:
Kaunter: PMC[0-3], FIXC[0-2], UPMC[0-7]

· Intel Westmere EX: Kaunter: PMC[0-3], FIXC[0-2], MBOX[0-1]C[0-5], BBOX[0-1]C[0-3],
RBOX[0-1]C[0-7], WBOX[0-5], UBOX0, SBOX[0-1]C[0-3], CBOX[0-9]C[0-4]

· Intel Berpasir Jambatan: sokongan penuh RAPL. kaunter: PMC[0-3], FIXC[0-2], PWR[0-3]

· Intel Berpasir Bridge EP: sokongan separa untuk sokongan RAPL yang tidak teras dan penuh. kaunter:
PMC[0-3], FIXC[0-2], PWR[0-3]. MBOX[0-3]C[0-3]

· Intel Ivy Jambatan: sokongan penuh RAPL. kaunter: PMC[0-3], FIXC[0-2], PWR[0-3]

· Intel Ivy Bridge EP: sokongan separa untuk sokongan RAPL yang tidak teras dan penuh. kaunter:
PMC[0-3], FIXC[0-2], PWR[0-3], CBOX[0-9]C[0-3], MBOX[0-3]C[0-3], MBOX[0-3]FIX

· Intel Haswell: sokongan penuh RAPL. kaunter: PMC[0-3], FIXC[0-2], PWR[0-3]

· Intel Haswell EP: tiada sokongan uncore, sokongan penuh RAPL. kaunter: PMC[0-3],
FIXC[0-2], PWR[0-3]

· Intel Atom Silvermont: sokongan penuh RAPL. kaunter: PMC[0-1], FIXC[0-2], PWR[0-1]

· Intel Pentium M: Varian Banias dan Dothan. kaunter: PMC[0-1]

· Intel P6: Diuji pada P3.

· AMD K8: semua varian. kaunter: PMC[0-3]

· AMD K10: Pemproses berasaskan Barcelona, ​​Shanghai, Istanbul, MagnyCours. kaunter:
PMC[0-3]

PILIHAN


-v mencetak maklumat versi ke output standard, kemudian keluar.

-h mencetak mesej bantuan kepada output standard, kemudian keluar.

-H mencetak mesej bantuan kumpulan (gunakan bersama-sama dengan suis -g).

-V output verbose semasa pelaksanaan untuk nyahpepijat.

-m dijalankan dalam mod API penanda

-a mencetak kumpulan prestasi yang tersedia untuk pemproses semasa.

-e mencetak kaunter yang tersedia dan acara prestasi pemproses semasa.

-o
simpan semua ouput ke fail dan bukannya stdout. Untuk nama fail berikut
pemegang tempat disokong: %j untuk PBS_JOBID, %r untuk MPI RANK (hanya Intel MPI di
saat ini), %h nama hos dan %p untuk proses pid. Pemegang tempat mestilah
dipisahkan dengan garis bawah sebagai, cth, -o test_%h_%p. Anda mesti menentukan akhiran kepada
nama fail. Untuk txt output dicetak seperti pada fail. Akhiran lain pencetus a
penapis pada output. Penapis yang tersedia ialah csv (nilai dipisahkan koma) dan xml
pada masa ini.

-O Jangan cetak jadual untuk hasil, gunakan CSV yang boleh dihuraikan dengan mudah.

-i mencetak maklumat cpuid tentang pemproses dan pada Pemantauan Prestasi Intel
ciri, kemudian keluar.

-c
tentukan senarai berangka pemproses. Senarai mungkin mengandungi berbilang item,
dipisahkan dengan koma dan julat. Contohnya 0,3,9-11.

-C
tentukan senarai berangka pemproses. Senarai mungkin mengandungi berbilang item,
dipisahkan dengan koma dan julat. Contohnya 0,3,9-11. Varian ini juga akan disematkan
benang ke teras. Penomboran logik juga boleh digunakan.

-g <performance kumpulan> or <performance kategori acara menetapkan rentetan>
nyatakan kumpulan prestasi yang hendak diukur. Ini boleh menjadi salah satu keluaran teg dengan
bendera -a. Juga set acara tersuai boleh ditentukan oleh senarai dipisahkan koma
peristiwa. Setiap acara mempunyai format eventId:register dengan daftar menjadi satu
daripada daftar kaunter prestasi yang disokong seni bina.

-t <frequency of ukuran>
mod garis masa untuk ukuran yang diselesaikan masa, kemungkinan akhiran 's' dan 'ms' seperti
100ms. Output mempunyai format:

<Result benang0> <Result benang1> ...

-S
mod stetoskop dengan tempoh dalam senconds. Boleh digunakan untuk mengukur aplikasi
dari luar.

CONTOH


Kerana likwid-perfctr langkah-langkah pada pemproses dan bukan aplikasi tunggal adalah perlu
untuk memastikan proses dan utas disematkan pada sumber khusus. Anda boleh sama ada pin
aplikasi itu sendiri atau gunakan fungsi pin terbina dalam.

1. Sebagai pembalut dengan kumpulan prestasi:

likwid-perfctr -C 0-2 -g TLB ./cacheBench -n 2 -l 1048576 -i 100 -t Stream

Proses induk disematkan pada pemproses 0, Thread 0 ke pemproses 1 dan Thread 1 ke
pemproses 2.

2. Sebagai pembalut dengan set acara tersuai pada AMD:

likwid-perfctr -C 0-4 -g INSTRUCTIONS_RETIRED_SSE:PMC0,CPU_CLOCKS_UNHALTED:PMC3 ./myApp

Ia dinyatakan bahawa acara itu INSTRUCTIONS_RETIRED_SSE diukur di kaunter PMC0 and
acara CPU_CLOCKS_UNHALTED di kaunter PMC3. Ia mungkin mengira masa jalan bagi
semua benang berdasarkan CPU_CLOCKS_UNHALTED peristiwa. Jika anda mahu ini anda perlu sertakan
acara ini dalam rentetan acara tersuai anda seperti yang ditunjukkan di atas.

3. Sebagai pembalut dengan set acara tersuai pada Intel:

likwid-perfctr -C 0 -g INSTR_RETIRED_ANY:FIXC0,CPU_CLK_UNHALTED_CORE:FIXC1 ./myApp

Pada pemproses Intel peristiwa tetap diukur pada kaunter khusus. Ini adalah
INSTR_RETIRED_ANY , CPU_CLK_UNHALTED_CORE. and CPU_CLK_UNHALTED_REF Jika anda mengkonfigurasi
kaunter tetap ini, likwid-perfctr akan mengira masa jalan dan metrik CPI untuk anda
berjalan.

4. Menggunakan API penanda untuk mengukur bahagian kod anda sahaja (ini boleh digunakan kedua-duanya dengan
kumpulan atau set acara tersuai):

likwid-perfctr -m -C 0-4 -g INSTRUCTIONS_RETIRED_SSE:PMC0,CPU_CLOCKS_UNHALTED:PMC3
./cacheBench

Anda perlu memautkan kod anda dengan liblikwid.a/.so dan menggunakan panggilan API penanda. The
coretan kod berikut menunjukkan panggilan yang diperlukan:

#termasuk

/* hanya satu utas yang memanggil init */
jika (threadId == 0)
{
likwid_markerInit();
}
/* jika anda ingin mengukur aplikasi berulir
* anda perlu memanggil likwid_markerThreadInit() untuk
* penyediaan, contoh dengan OpenMP */
#pragma omp selari
{
likwid_markerThreadInit();
}
PENGHALANG;
likwid_markerStartRegion("Tanda Aras");
/* kod anda untuk diukur ada di sini.*/

likwid_markerStopRegion("Tanda Aras");
PENGHALANG;
/* sekali lagi hanya satu utas boleh menutup penanda */
jika (threadId == 0)
{
likwid_markerClose();
}

5. Menggunakan likwid dalam mod garis masa:

likwid-perfctr -c 0-3 -g FLOPS_DP -t 300ms ./myApp > keluar.txt

Ini akan membacakan pembilang setiap 300ms pada teras fizikal 0-3 dan menulis hasilnya
out.txt. Untuk mod garis masa terdapat likwid-skop aplikasi bahagian hadapan, yang membolehkan
plot langsung acara terpilih. Untuk lebih banyak contoh kod sila lihat likwid WIKI
muka surat. Proses-prosesnya ialah tidak disematkan pada CPU 0-3.

6. Menggunakan likwid dalam mod stetoskop:

likwid-perfctr -c 0-3 -g FLOPS_DP -S 2s

Ini akan memulakan pembilang dan membacanya selepas 2s pada teras fizikal 0-3 dan menulis
keputusan untuk stdout. Proses-prosesnya ialah tidak disematkan pada CPU 0-3.

Gunakan likwid-perfctr dalam talian menggunakan perkhidmatan onworks.net


Pelayan & Stesen Kerja Percuma

Muat turun apl Windows & Linux

Arahan Linux

Ad