İngilizceFransızcaİspanyolca

Ad


OnWorks favicon'u

likwid-perfctr - Bulutta Çevrimiçi

OnWorks ücretsiz barındırma sağlayıcısında likwid-perfctr'yi Ubuntu Online, Fedora Online, Windows çevrimiçi öykünücüsü veya MAC OS çevrimiçi öykünücüsü üzerinden çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen likwid-perfctr komutudur.

Program:

ADI


likwid-perfctr - x86 işlemci üzerindeki donanım performans sayaçlarını yapılandırın ve okuyun

SİNOPSİS


likwid-perfctr [-vhVmaeiMoO] [-c/-C ] [-g or
] [-t ] [-S ] [-s ] [-o
]

TANIM


likwid-perfctr yapılandırmak ve okumak için hafif bir komut satırı uygulamasıdır
desteklenen x86 işlemcilerde donanım performansı izleme verileri. Ya olarak ölçebilir
ölçülen uygulamayı değiştirmeden veya içinde işaretleyici API işlevleriyle sarıcı
sayaçları açıp kapatacak kod. Kullanışlı önceden yapılandırılmış gruplar var
olay kümeleri ve türetilmiş metrikler. Ek olarak isteğe bağlı olaylar özel ile ölçülebilir
olay setleri. İşaretleyici API, birden çok adlandırılmış bölgeyi ölçebilir. Sonuçlar üzerinde toplanır
çoklu aramalar Aşağıdaki x86 işlemciler desteklenir:

· Intel çekirdek 2: tüm varyantlar. Sayaçlar: PMC[0-1], DÜZELTME[0-2]

· Intel Nehalem: Sayaçlar: PMC[0-3], DÜZELTME[0-2], UPMC[0-7]

· Intel Nehalem EX: Sayaçlar: PMC[0-3], DÜZELTME[0-2], MBOX[0-1]C[0-5], BBOX[0-1]C[0-3],
RBOX[0-1]C[0-7], WKUTUSU[0-5], UBOX0, SBOX[0-1]C[0-3], CKUTU[0-9]C[0-4]

· Intel - Westmere:
Sayaçlar: PMC[0-3], DÜZELTME[0-2], UPMC[0-7]

· Intel Westmere EX: Sayaçlar: PMC[0-3], DÜZELTME[0-2], MBOX[0-1]C[0-5], BBOX[0-1]C[0-3],
RBOX[0-1]C[0-7], WKUTUSU[0-5], UBOX0, SBOX[0-1]C[0-3], CKUTU[0-9]C[0-4]

· Intel Kumlu Köprü: tam RAPL desteği. Sayaçlar: PMC[0-3], DÜZELTME[0-2], GÜÇ[0-3]

· Intel Kumlu Briç not: uncore için kısmi destek, tam RAPL desteği. Sayaçlar:
PMC[0-3], DÜZELTME[0-2], PWR[0-3]. MBOX[0-3]C[0-3]

· Intel sarmaşık Köprü: tam RAPL desteği. Sayaçlar: PMC[0-3], DÜZELTME[0-2], GÜÇ[0-3]

· Intel sarmaşık Briç not: uncore için kısmi destek, tam RAPL desteği. Sayaçlar:
PMC[0-3], DÜZELTME[0-2], Güç[0-3], CKUTU[0-9]C[0-3], MBOX[0-3]C[0-3], MBOX[0-3]DÜZELTME

· Intel - tam RAPL desteği. Sayaçlar: PMC[0-3], DÜZELTME[0-2], GÜÇ[0-3]

· Intel Haswell not: uncore desteği yok, tam RAPL desteği. Sayaçlar: PMC[0-3],
DÜZELTME[0-2], GÜÇ[0-3]

· Intel Atom - Silvermont: tam RAPL desteği. Sayaçlar: PMC[0-1], DÜZELTME[0-2], GÜÇ[0-1]

· Intel Pentium M: Banias ve Dothan çeşitleri. Sayaçlar: PMC[0-1]

· Intel P6: P3 üzerinde test edilmiştir.

· AMD K8: tüm varyantlar. Sayaçlar: PMC[0-3]

· AMD K10: Barselona, ​​Şanghay, İstanbul, MagnyCours tabanlı işlemciler. Sayaçlar:
PMC[0-3]

SEÇENEKLER


-v sürüm bilgilerini standart çıktıya yazdırır ve ardından çıkar.

-h standart çıktıya bir yardım mesajı yazdırır ve ardından çıkar.

-H grup yardım mesajını yazdırır (-g anahtarıyla birlikte kullanın).

-V hata ayıklama için yürütme sırasında ayrıntılı çıktı.

-m işaretçi API modunda çalıştır

-a mevcut işlemci için mevcut performans gruplarını yazdırın.

-e mevcut işlemcinin mevcut sayaçlarını ve performans olaylarını yazdırın.

-o
tüm çıktıları stdout yerine bir dosyada saklayın. Dosya adı için aşağıdaki
yer tutucular desteklenir: PBS_JOBID için %j, MPI RANK için %r (yalnızca Intel MPI
an), %h ana bilgisayar adı ve işlem pid için %p. Yer tutucular olmalıdır
alt çizgi ile ayrılır, örneğin -o test_%h_%p. için bir sonek belirtmelisiniz
dosya adı. txt için çıktı, dosyaya olduğu gibi yazdırılır. Diğer son ekler bir tetikler
çıkışı filtreleyin. Kullanılabilir filtreler csv (virgülle ayrılmış değerler) ve xml'dir
Şu an.

-O Sonuçlar için tabloları yazdırmayın, bunun yerine kolayca ayrıştırılabilir CSV kullanın.

-i işlemci ve Intel Performance Monitoring hakkında cpuid bilgilerini yazdırın
özellikleri, ardından çıkın.

-c
işlemcilerin sayısal bir listesini belirtin. Liste birden fazla öğe içerebilir,
virgül ve aralıklarla ayrılır. Örneğin 0,3,9-11.

-C
işlemcilerin sayısal bir listesini belirtin. Liste birden fazla öğe içerebilir,
virgül ve aralıklarla ayrılır. Örneğin 0,3,9-11. Bu varyant aynı zamanda sabitlenir
iplikler çekirdeklere. Ayrıca mantıksal numaralandırmalar da kullanılabilir.

-g <performance grup> or <performance olay set dize>
hangi performans grubunun ölçüleceğini belirtin. Bu, çıktı etiketlerinden biri olabilir
-a bayrağı. Ayrıca özel bir olay seti, virgülle ayrılmış bir liste ile belirtilebilir.
Etkinlikler. Her olay eventId:register biçimindedir ve kayıt birdir
bir mimarinin desteklediği performans sayacı kayıtları.

-t <frequency of ölçümler>
zaman çözümlü ölçümler için zaman çizelgesi modu, olası 's' ve 'ms' gibi son ekler
100ms. Çıktı şu biçime sahiptir:

<Result iş parçacığı0> <Result iş parçacığı1> ...

-S
saniye cinsinden süre ile stetoskop modu. Bir uygulamayı ölçmek için kullanılabilir
dışarıdan.

ÖRNEK


Çünkü likwid-perfctr işlemciler üzerinde önlemler ve tek uygulamalar gerekli değildir
süreçlerin ve iş parçacıklarının özel kaynaklara sabitlenmesini sağlamak için. ya sabitleyebilirsin
uygulamayı kendiniz yapın veya yerleşik pin işlevini kullanın.

1. Performans grubu ile sarıcı olarak:

likwid-perfctr -C 0-2 -g TLB ./cacheBench -n 2 -l 1048576 -i 100 -t dere

Ana işlem işlemci 0'a, İş parçacığı 0'dan işlemci 1'e ve İş parçacığı 1'e sabitlenir.
işlemci 2.

2. AMD'de özel olay ayarlı sarmalayıcı olarak:

likwid-perfctr -C 0-4 -g INSTRUCTIONS_RETIRED_SSE:PMC0,CPU_CLOCKS_UNHALTED:PMC3 ./uygulamam

olay olduğu belirtildi INSTRUCTIONS_RETIRED_SSE sayaçta ölçülür PMC0 ve
Olay CPU_CLOCKS_UNHALTED tezgahta PMC3. Çalışma zamanını hesaplamak mümkündür
dayalı tüm konular CPU_CLOCKS_UNHALTED Etkinlik. Bunu istiyorsan, dahil etmelisin
bu olayı, yukarıda gösterildiği gibi özel olay dizginizde.

3. Intel'de özel olay ayarlı sarmalayıcı olarak:

likwid-perfctr -C 0 -g INSTR_RETIRED_ANY:FIXC0,CPU_CLK_UNHALTED_CORE:FIXC1 ./uygulamam

Intel işlemcilerde sabit olaylar özel sayaçlarda ölçülür. Bunlar
INSTR_RETIRED_ANY , CPU_CLK_UNHALTED_CORE. ve CPU_CLK_UNHALTED_REF yapılandırırsanız
bu sabit sayaçlar, likwid-perfctr için çalışma zamanı ve CPI ölçümlerini hesaplayacaktır.
koşmak.

4. Kodunuzun yalnızca bölümlerini ölçmek için işaretleyici API'sini kullanma (bu, hem
gruplar veya özel olay setleri):

likwid-perfctr -m -C 0-4 -g INSTRUCTIONS_RETIRED_SSE:PMC0,CPU_CLOCKS_UNHALTED:PMC3
./cacheBench

Kodunuzu liblikwid.a/.so'ya bağlamanız ve işaretçi API çağrılarını kullanmanız gerekir. NS
aşağıdaki kod parçası gerekli aramaları gösterir:

#Dahil etmek

/* sadece bir iş parçacığı init'i çağırır */
eğer (threadId == 0)
{
likwid_markerInit();
}
/* dişli bir uygulamayı ölçmek istiyorsanız
* için likwid_markerThreadInit() öğesini çağırmanız gerekir
* hazırlık, OpenMP ile örnek */
#pragma paralel
{
likwid_markerThreadInit();
}
BARİYER;
likwid_markerStartRegion("Benchmark");
/* ölçülecek kodunuz burada.*/

likwid_markerStopRegion("Benchmark");
BARİYER;
/* yine sadece bir iş parçacığı işaretçileri kapatabilir */
eğer (threadId == 0)
{
likwid_markerClose();
}

5. likwid'i zaman çizelgesi modunda kullanma:

likwid-perfctr -c 0-3 -g FLOPS_DP -t 300ms ./uygulamam > out.txt

Bu, 300-0 fiziksel çekirdeklerinde her 3ms'de bir sayaçları okuyacak ve sonuçları
çıkış.txt. Zaman çizelgesi modu için, aşağıdakileri etkinleştiren bir ön uç uygulaması likwid-scope vardır.
seçilen olayların canlı çizimi. Daha fazla kod örneği için likwid WIKI'ye bakın
sayfalar. süreçler değil 0-3 CPU'larına sabitlendi.

6. likwid'i steteskop modunda kullanma:

likwid-perfctr -c 0-3 -g FLOPS_DP -S 2s

Bu, sayaçları başlatacak ve 2 saniye sonra 0-3 fiziksel çekirdeklerinde okuyacak ve yazacaktır.
sonuçlar stdout'a. süreçler değil 0-3 CPU'larına sabitlendi.

onworks.net hizmetlerini kullanarak likwid-perfctr'yi çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

Linux komutları

Ad