Angielskifrancuskihiszpański

Ad


Ulubiona usługa OnWorks

likwid-perfctr - Online w chmurze

Uruchom likwid-perfctr w bezpłatnym dostawcy hostingu OnWorks w systemie Ubuntu Online, Fedora Online, emulatorze online systemu Windows lub emulatorze online systemu MAC OS

Jest to polecenie likwid-perfctr, które można uruchomić w bezpłatnym dostawcy hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS

PROGRAM:

IMIĘ


likwid-perfctr - konfiguruje i odczytuje liczniki wydajności sprzętu na procesorze x86

STRESZCZENIE


likwidacja-perfctr [-vhHVmaeiMoO] [-c/-C ] [-g or
] [-t ] [-S ] [-s ] [-o
]

OPIS


likwidacja-perfctr to lekka aplikacja wiersza poleceń do konfiguracji i odczytu
dane monitorowania wydajności sprzętu na obsługiwanych procesorach x86. Może mierzyć albo jako
wrapper bez zmiany mierzonej aplikacji lub z funkcjami API znaczników wewnątrz
kod, który będzie włączał i wyłączał liczniki. Istnieją wstępnie skonfigurowane grupy z przydatnymi
zestawy zdarzeń i metryki pochodne. Dodatkowo można mierzyć dowolne zdarzenia za pomocą niestandardowego
zestawy wydarzeń. Interfejs API znaczników może mierzyć wiele nazwanych regionów. Wyniki są gromadzone na
wiele połączeń. Obsługiwane są następujące procesory x86:

· Intel rdzeń 2: wszystkie warianty. Liczniki: PMC[0-1], NAPRAWC[0-2]

· Intel Nehalem: Liczniki: PMC[0-3], NAPRAW.[0-2], UPMC[0-7]

· Intel Nehalem EX: Liczniki: PMC[0-3], NAPRAW.[0-2], MBOX[0-1]C[0-5], BBOX[0-1]C[0-3],
RBOX[0-1]C[0-7], SKRZYNKA [0-5], UBOX0, SBOX[0-1]C[0-3], CBOX[0-9]C[0-4]

· Intel Westmere:
Liczniki: PMC[0-3], NAPRAW.[0-2], UPMC[0-7]

· Intel Westmere EX: Liczniki: PMC[0-3], NAPRAW.[0-2], MBOX[0-1]C[0-5], BBOX[0-1]C[0-3],
RBOX[0-1]C[0-7], SKRZYNKA [0-5], UBOX0, SBOX[0-1]C[0-3], CBOX[0-9]C[0-4]

· Intel Sandy Most: pełne wsparcie RAPL. Liczniki: PMC[0-3], NAPRAW.[0-2], PWR[0-3]

· Intel Sandy Most PE: częściowe wsparcie dla uncore, pełne wsparcie dla RAPL. Liczniki:
PMC[0-3], NAPRAW.[0-2], PWR[0-3]. MBOX[0-3]C[0-3]

· Intel Bluszcz Most: pełne wsparcie RAPL. Liczniki: PMC[0-3], NAPRAW.[0-2], PWR[0-3]

· Intel Bluszcz Most PE: częściowe wsparcie dla uncore, pełne wsparcie dla RAPL. Liczniki:
PMC[0-3], NAPRAW.[0-2], PWR[0-3], CBOX[0-9]C[0-3], MBOX[0-3]C[0-3], MBOX[0-3]NAPRAW

· Intel Haswella: pełne wsparcie RAPL. Liczniki: PMC[0-3], NAPRAW.[0-2], PWR[0-3]

· Intel Haswell PE: brak obsługi uncore, pełne wsparcie RAPL. Liczniki: PMC[0-3],
NAPRAW.[0-2], PWR[0-3]

· Intel Atom Silvermont: pełne wsparcie RAPL. Liczniki: PMC[0-1], NAPRAW.[0-2], PWR[0-1]

· Intel Pentium M: Warianty Banias i Dothan. Liczniki: PMC[0-1]

· Intel P6: Testowane na P3.

· AMD K8: wszystkie warianty. Liczniki: PMC[0-3]

· AMD K10: Procesory oparte na Barcelonie, Szanghaju, Stambule i MagnyCours. Liczniki:
PMC[0-3]

OPCJE


-v wypisuje informacje o wersji na standardowe wyjście, a następnie kończy działanie.

-h wypisuje komunikat pomocy na standardowe wyjście, a następnie kończy działanie.

-H wypisuje wiadomość pomocy grupowej (używaj razem z przełącznikiem -g).

-V szczegółowe dane wyjściowe podczas wykonywania w celu debugowania.

-m uruchomić w trybie API znaczników

-a wydrukuj dostępne grupy wydajności dla bieżącego procesora.

-e wydrukuj dostępne liczniki i zdarzenia wydajnościowe bieżącego procesora.

-o
przechowuj wszystkie dane wyjściowe w pliku zamiast na stdout. Dla nazwy pliku następująca
obsługiwane są symbole zastępcze: %j dla PBS_JOBID, %r dla MPI RANK (tylko Intel MPI w
w tej chwili), %h nazwa hosta i %p dla pid procesu. Elementy zastępcze muszą być
oddzielone podkreśleniem, np. -o test_%h_%p. Należy określić przyrostek do
Nazwa pliku. W przypadku txt dane wyjściowe są drukowane w takiej postaci, w jakiej znajdują się w pliku. Inne przyrostki wyzwalają a
filtr na wyjściu. Dostępne filtry to csv (wartości oddzielone przecinkami) i xml
w tym momencie.

-O Nie drukuj tabel z wynikami, zamiast tego użyj łatwego do analizy pliku CSV.

-i wydrukuj informacje o procesorze o procesorze i o monitorze wydajności Intel
funkcje, a następnie wyjdź.

-c
podać liczbową listę procesorów. Lista może zawierać wiele pozycji,
oddzielone przecinkami i zakresami. Na przykład 0,3,9-11.

-C
podać liczbową listę procesorów. Lista może zawierać wiele pozycji,
oddzielone przecinkami i zakresami. Na przykład 0,3,9-11. Ten wariant również zostanie przypięty
gwinty do rdzeni. Można także stosować numerację logiczną.

-g <performance grupa> or <performance wydarzenie zestaw ciąg>
określić, którą grupę wydajności należy zmierzyć. Może to być jeden z tagów wyjściowych
flaga -a. Również niestandardowy zestaw zdarzeń można określić za pomocą listy rozdzielonej przecinkami
wydarzenia. Każde zdarzenie ma format eventId:register, przy czym rejestr jest jeden
rejestrów liczników wydajności obsługiwanych przez architekturę.

-t <frequency of pomiary>
tryb osi czasu dla pomiarów rozdzielonych czasowo, możliwe przyrostki typu „s” i „ms”.
100 ms. Dane wyjściowe mają format:

<Result wątek0> <Result wątek1> ...

-S
tryb stetoskopu z czasem trwania w sekundach. Może być używany do pomiaru aplikacji
z zewnątrz.

PRZYKŁAD


Bo likwidacja-perfctr konieczne są środki dotyczące procesorów, a nie pojedynczych aplikacji
aby mieć pewność, że procesy i wątki są przypięte do dedykowanych zasobów. Możesz albo przypiąć
aplikację samodzielnie lub skorzystaj z wbudowanej funkcjonalności pinów.

1. Jako opakowanie z grupą wydajnościową:

likwidacja-perfctr -C 0-2 -g TLB ./cacheBench -n 2 -l 1048576 -i 100 -t Strumień

Proces nadrzędny jest przypięty do procesora 0, wątek 0 do procesora 1, a wątek 1 do
procesor 2.

2. Jako opakowanie z niestandardowym zestawem zdarzeń na AMD:

likwidacja-perfctr -C 0-4 -g INSTRUCTIONS_RETIRED_SSE:PMC0,CPU_CLOCKS_UNHALTED:PMC3 ./mojaAplikacja

Określono, że wydarzenie INSTRUCTIONS_RETIRED_SSE mierzy się na liczniku PMC0 i
wydarzenie CPU_CLOCKS_UNHALTED na blacie PMC3. Możliwe jest obliczenie czasu działania
wszystkie wątki oparte na CPU_CLOCKS_UNHALTED wydarzenie. Jeśli tego chcesz, musisz to uwzględnić
to zdarzenie w niestandardowym ciągu zdarzenia, jak pokazano powyżej.

3. Jako opakowanie z niestandardowym zestawem zdarzeń na platformie Intel:

likwidacja-perfctr -C 0 -g INSTR_RETIRED_ANY:FIXC0,CPU_CLK_UNHALTED_CORE:FIXC1 ./mojaAplikacja

W procesorach Intel stałe zdarzenia są mierzone na dedykowanych licznikach. To są
INSTR_RETIRED_ANY , Procesor_CLK_UNHALTED_CORE. i CPU_CLK_UNHALTED_REF Jeśli skonfigurujesz
te stałe liczniki, likwidacja-perfctr obliczy czas działania i wskaźniki CPI dla Twojego
uruchomić.

4. Używanie API znaczników do pomiaru tylko części kodu (można tego używać zarówno z
grupy lub niestandardowe zestawy zdarzeń):

likwidacja-perfctr -m -C 0-4 -g INSTRUCTIONS_RETIRED_SSE:PMC0,CPU_CLOCKS_UNHALTED:PMC3
./cacheBench

Musisz połączyć swój kod z biblioteką liblikwid.a/.so i użyć wywołań API znaczników. The
następujący fragment kodu pokazuje niezbędne wywołania:

#włączać

/* tylko jeden wątek wywołuje init */
jeśli (Identyfikator wątku == 0)
{
likwid_markerInit();
}
/* jeśli chcesz zmierzyć aplikację wielowątkową
* musisz wywołać funkcję likwid_markerThreadInit() for
* przygotowanie, przykład z OpenMP */
#pragma omp równoległa
{
likwid_markerThreadInit();
}
BARIERA;
likwid_markerStartRegion("Benchmark");
/* Twój kod do zmierzenia znajduje się tutaj.*/

likwid_markerStopRegion("Benchmark");
BARIERA;
/* znowu tylko jeden wątek może zamknąć znaczniki */
jeśli (Identyfikator wątku == 0)
{
likwid_markerClose();
}

5. Korzystanie z likwid w trybie osi czasu:

likwidacja-perfctr -c 0-3 -g FLOPS_DP -t 300ms ./mojaAplikacja > out.txt

Spowoduje to odczytanie liczników co 300 ms na rdzeniach fizycznych 0-3 i zapisanie wyników
out.txt. Dla trybu osi czasu dostępna jest aplikacja frontendowa likwid-scope, która umożliwia
śledzenie na żywo wybranych wydarzeń. Więcej przykładów kodu znajdziesz na likwid WIKI
strony. Procesy są nie przypięty do procesorów 0-3.

6. Korzystanie z likwid w trybie stetoskopu:

likwidacja-perfctr -c 0-3 -g FLOPS_DP -S 2s

Spowoduje to uruchomienie liczników i odczytanie ich po 2 sekundach na rdzeniach fizycznych 0-3 i zapis
wyniki na standardowe wyjście. Procesy są nie przypięty do procesorów 0-3.

Skorzystaj z likwid-perfctr online, korzystając z usług onworks.net


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

Komendy systemu Linux

Ad