ইংরেজিফরাসিস্প্যানিশ

Ad


অনওয়ার্কস ফেভিকন

likwid-perfctr - ক্লাউডে অনলাইন

উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটরের মাধ্যমে OnWorks ফ্রি হোস্টিং প্রদানকারীতে likwid-perfctr চালান

এটি হল likwid-perfctr কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।

কার্যক্রম:

NAME এর


likwid-perfctr - x86 cpus-এ হার্ডওয়্যার কর্মক্ষমতা কাউন্টার কনফিগার করুন এবং পড়ুন

সাইনোপিসিস


likwid-perfctr [-vhHVmaeiMoO] [-c/-C ] [-g or
] [-t ] [-S ] [-s ] [-o
]

বর্ণনাঃ


likwid-perfctr কনফিগার এবং পড়ার জন্য একটি লাইটওয়েট কমান্ড লাইন অ্যাপ্লিকেশন
সমর্থিত x86 প্রসেসরগুলিতে হার্ডওয়্যার কর্মক্ষমতা পর্যবেক্ষণ ডেটা। এটা হিসাবে পরিমাপ করতে পারেন
পরিমাপ করা অ্যাপ্লিকেশন পরিবর্তন না করে বা ভিতরে মার্কার API ফাংশন সহ মোড়ক
কোড, যা কাউন্টার চালু এবং বন্ধ করবে। দরকারী সঙ্গে প্রাক কনফিগার করা গ্রুপ আছে
ইভেন্ট সেট এবং প্রাপ্ত মেট্রিক্স। অতিরিক্তভাবে নির্বিচারে ঘটনা কাস্টম দিয়ে পরিমাপ করা যেতে পারে
ইভেন্ট সেট মার্কার API একাধিক নামযুক্ত অঞ্চল পরিমাপ করতে পারে। ফলাফল উপর সঞ্চিত হয়
একাধিক কল। নিম্নলিখিত x86 প্রসেসর সমর্থিত:

· ইন্টেল মূল 2: সব বৈকল্পিক. কাউন্টার: PMC[0-1], FIXC[0-2]

· ইন্টেল নেহালেম: কাউন্টার: PMC[0-3], FIXC[0-2], UPMC[0-7]

· ইন্টেল Nehalem গো EX: কাউন্টার: PMC[0-3], FIXC[0-2], MBOX[0-1]C[0-5], BBOX[0-1]C[0-3],
RBOX[0-1]C[0-7], WBOX[0-5], UBOX0, SBOX[0-1]C[0-3], CBOX[0-9]C[0-4]

· ইন্টেল ওয়েস্টমেয়ার:
কাউন্টার: PMC[0-3], FIXC[0-2], UPMC[0-7]

· ইন্টেল Westmere গো EX: কাউন্টার: PMC[0-3], FIXC[0-2], MBOX[0-1]C[0-5], BBOX[0-1]C[0-3],
RBOX[0-1]C[0-7], WBOX[0-5], UBOX0, SBOX[0-1]C[0-3], CBOX[0-9]C[0-4]

· ইন্টেল বেলে সেতু: সম্পূর্ণ RAPL সমর্থন। কাউন্টার: PMC[0-3], FIXC[0-2], PWR[0-3]

· ইন্টেল বেলে সেতু ইপি: আনকোর, সম্পূর্ণ RAPL সমর্থনের জন্য আংশিক সমর্থন। কাউন্টার:
PMC[0-3], FIXC[0-2], PWR[0-3]। MBOX[0-3]C[0-3]

· ইন্টেল চিরহরিৎ লতাবিশেষ সেতু: সম্পূর্ণ RAPL সমর্থন। কাউন্টার: PMC[0-3], FIXC[0-2], PWR[0-3]

· ইন্টেল চিরহরিৎ লতাবিশেষ সেতু ইপি: আনকোর, সম্পূর্ণ RAPL সমর্থনের জন্য আংশিক সমর্থন। কাউন্টার:
PMC[0-3], FIXC[0-2], PWR[0-3], CBOX[0-9]C[0-3], MBOX[0-3]C[0-3], MBOX[0-3]ফিক্স

· ইন্টেল হাসওয়েল: সম্পূর্ণ RAPL সমর্থন। কাউন্টার: PMC[0-3], FIXC[0-2], PWR[0-3]

· ইন্টেল Haswell ইপি: কোন আনকোর সমর্থন, সম্পূর্ণ RAPL সমর্থন. কাউন্টার: PMC[0-3],
FIXC[0-2], PWR[0-3]

· ইন্টেল পরমাণু সিলভারমন্ট: সম্পূর্ণ RAPL সমর্থন। কাউন্টার: PMC[0-1], FIXC[0-2], PWR[0-1]

· ইন্টেল পেন্টিয়াম M: বানিয়াস এবং দোথান ভেরিয়েন্ট। কাউন্টার: PMC[0-1]

· ইন্টেল P6: P3 এ পরীক্ষা করা হয়েছে।

· এএমডি কে 8: সব বৈকল্পিক. কাউন্টার: PMC[0-3]

· এএমডি কে 10: বার্সেলোনা, সাংহাই, ইস্তাম্বুল, ম্যাগনিকোর্স ভিত্তিক প্রসেসর। কাউন্টার:
PMC[0-3]

বিকল্প


-v স্ট্যান্ডার্ড আউটপুটে সংস্করণ তথ্য মুদ্রণ করে, তারপর প্রস্থান করে।

-h স্ট্যান্ডার্ড আউটপুটে একটি সাহায্য বার্তা প্রিন্ট করে, তারপর প্রস্থান করে।

-H গ্রুপ সহায়তা বার্তা প্রিন্ট করে (-জি সুইচের সাথে একসাথে ব্যবহার করুন)।

-V ডিবাগিংয়ের জন্য কার্যকর করার সময় ভার্বোস আউটপুট।

-m মার্কার API মোডে চালান

-a বর্তমান প্রসেসরের জন্য উপলব্ধ কর্মক্ষমতা গোষ্ঠী মুদ্রণ করুন।

-e বর্তমান প্রসেসরের উপলব্ধ কাউন্টার এবং কর্মক্ষমতা ইভেন্ট মুদ্রণ করুন।

-o
stdout এর পরিবর্তে একটি ফাইলে সমস্ত আউটপুট সংরক্ষণ করুন। ফাইলের নামের জন্য নিম্নলিখিত
স্থানধারক সমর্থিত: PBS_JOBID-এর জন্য %j, MPI RANK-এর জন্য %r (শুধুমাত্র ইন্টেল MPI-এ
মুহূর্ত), %h হোস্টনাম এবং প্রসেস পিডের জন্য %p। স্থানধারক হতে হবে
আন্ডারস্কোর দ্বারা পৃথক করা হয়েছে যেমন, -o test_%h_%p। আপনি একটি প্রত্যয় নির্দিষ্ট করতে হবে
ফাইলের নাম। txt-এর জন্য ফাইলের মতো আউটপুট প্রিন্ট করা হয়। অন্যান্য প্রত্যয় ট্রিগার a
আউটপুটে ফিল্টার করুন। উপলব্ধ ফিল্টারগুলি হল csv (কমা দ্বারা পৃথক করা মান) এবং xml৷
এখন.

-O ফলাফলের জন্য সারণী প্রিন্ট করবেন না, পরিবর্তে সহজে পার্সযোগ্য CSV ব্যবহার করুন।

-i প্রসেসর এবং ইন্টেল পারফরম্যান্স মনিটরিং সম্পর্কে cpuid তথ্য মুদ্রণ করুন
বৈশিষ্ট্য, তারপর প্রস্থান করুন।

-c
প্রসেসরের একটি সংখ্যাসূচক তালিকা নির্দিষ্ট করুন। তালিকায় একাধিক আইটেম থাকতে পারে,
কমা, এবং ব্যাপ্তি দ্বারা বিভক্ত। উদাহরণস্বরূপ 0,3,9-11।

-C
প্রসেসরের একটি সংখ্যাসূচক তালিকা নির্দিষ্ট করুন। তালিকায় একাধিক আইটেম থাকতে পারে,
কমা, এবং ব্যাপ্তি দ্বারা বিভক্ত। উদাহরণস্বরূপ 0,3,9-11। এই বৈকল্পিক এছাড়াও পিন হবে
কোর থেকে থ্রেড. এছাড়াও লজিক্যাল নাম্বারিং ব্যবহার করা যেতে পারে।

-g <কর্মক্ষমতা গ্রুপ> or <কর্মক্ষমতা ঘটনা সেট স্ট্রিং>
কোন কর্মক্ষমতা গোষ্ঠী পরিমাপ করতে হবে তা নির্দিষ্ট করুন। এই ট্যাগ আউটপুট এক হতে পারে
একটি পতাকা। এছাড়াও একটি কাস্টম ইভেন্ট সেট একটি কমা দ্বারা পৃথক করা তালিকা দ্বারা নির্দিষ্ট করা যেতে পারে
ঘটনা প্রতিটি ইভেন্টের ফরম্যাট ইভেন্ট আইডি: রেজিস্টারের সাথে রেজিস্টারটি একটি
একটি আর্কিটেকচার সমর্থিত কর্মক্ষমতা কাউন্টার রেজিস্টার।

-t <ফ্রিকোয়েন্সি of পরিমাপ>
সময়ের সমাধান পরিমাপের জন্য টাইমলাইন মোড, সম্ভাব্য প্রত্যয় 's' এবং 'ms' এর মতো
100ms আউটপুট ফর্ম্যাট আছে:

<ফলাফল থ্রেড0> <ফলাফল থ্রেড1> ...

-S
সেকেন্ডে সময়কাল সহ স্টেথোস্কোপ মোড। একটি অ্যাপ্লিকেশন পরিমাপ ব্যবহার করা যেতে পারে
বাইরে থেকে.

EXAMPLE টি


কারণ likwid-perfctr প্রসেসরের উপর পরিমাপ করা এবং একক অ্যাপ্লিকেশন নয় এটি প্রয়োজনীয়
প্রসেস এবং থ্রেডগুলি ডেডিকেটেড রিসোর্সে পিন করা হয়েছে তা নিশ্চিত করতে। আপনি হয় পিন করতে পারেন
অ্যাপ্লিকেশন নিজেই বা বিল্টইন পিন কার্যকারিতা ব্যবহার করুন.

1. কর্মক্ষমতা গোষ্ঠীর সাথে মোড়ক হিসাবে:

likwid-perfctr -C 0-2 -g টিএলবি ./cacheBench -n 2 -l 1048576 -i 100 -t প্রবাহ

প্যারেন্ট প্রসেসটি প্রসেসর 0, থ্রেড 0 প্রসেসর 1 এবং থ্রেড 1 এ পিন করা হয়েছে
প্রসেসর 2।

2. এএমডিতে কাস্টম ইভেন্ট সেট সহ মোড়ক হিসাবে:

likwid-perfctr -C 0-4 -g INSTRUCTIONS_RETIRED_SSE:PMC0,CPU_CLOCKS_UNHALTED:PMC3 ./myApp

এটা উল্লেখ করা হয় যে ঘটনা INSTRUCTIONS_RETIRED_SSE কাউন্টারে পরিমাপ করা হয় PMC0 এবং
ঘটনা CPU_CLOCKS_UNHALTED কাউন্টারে PMC3. এর রানটাইম গণনা করা সম্ভব
উপর ভিত্তি করে সব থ্রেড CPU_CLOCKS_UNHALTED ঘটনা আপনি যদি এটি চান তাহলে আপনাকে অন্তর্ভুক্ত করতে হবে
উপরে দেখানো হিসাবে আপনার কাস্টম ইভেন্ট স্ট্রিং এই ইভেন্ট.

3. ইন্টেলে কাস্টম ইভেন্ট সেট সহ মোড়ক হিসাবে:

likwid-perfctr -C 0 -g INSTR_RETIRED_ANY:FIXC0,CPU_CLK_UNHALTED_CORE:FIXC1 ./myApp

ইন্টেল প্রসেসরে নির্দিষ্ট ইভেন্টগুলি ডেডিকেটেড কাউন্টারে পরিমাপ করা হয়। এইগুলো
INSTR_RETIRED_ANY , CPU_CLK_UNHALTED_CORE এবং CPU_CLK_UNHALTED_REF আপনি যদি কনফিগার করেন
এই স্থির কাউন্টার, likwid-perfctr আপনার জন্য রানটাইম এবং CPI মেট্রিক্স গণনা করবে
চালানো।

4. আপনার কোডের শুধুমাত্র অংশগুলি পরিমাপ করতে মার্কার API ব্যবহার করে (এটি উভয়ের সাথে ব্যবহার করা যেতে পারে
গ্রুপ বা কাস্টম ইভেন্ট সেট):

likwid-perfctr -m -C 0-4 -g INSTRUCTIONS_RETIRED_SSE:PMC0,CPU_CLOCKS_UNHALTED:PMC3
./cacheBench

আপনাকে liblikwid.a/.so এর সাথে আপনার কোড লিঙ্ক করতে হবে এবং মার্কার API কলগুলি ব্যবহার করতে হবে৷ দ্য
নিম্নলিখিত কোড স্নিপেট প্রয়োজনীয় কল দেখায়:

#অন্তর্ভুক্ত

/* শুধুমাত্র একটি থ্রেড init কল করে */
যদি (থ্রেডআইডি == 0)
{
likwid_markerInit();
}
/* যদি আপনি একটি থ্রেডেড অ্যাপ্লিকেশন পরিমাপ করতে চান
* আপনাকে likwid_markerThreadInit() এর জন্য কল করতে হবে
* প্রস্তুতি, OpenMP সহ উদাহরণ */
#pragma omp সমান্তরাল
{
likwid_markerThreadInit();
}
বাধা;
likwid_markerStartRegion("বেঞ্চমার্ক");
/* আপনার পরিমাপ করা কোড এখানে আছে।*/

likwid_markerStopRegion("বেঞ্চমার্ক");
বাধা;
/* আবার শুধুমাত্র একটি থ্রেড মার্কার বন্ধ করতে পারে */
যদি (থ্রেডআইডি == 0)
{
likwid_markerClose();
}

5. টাইমলাইন মোডে likwid ব্যবহার করা:

likwid-perfctr -c 0-3 -g FLOPS_DP -t 300ms ./myApp > out.txt

এটি ফিজিক্যাল কোর 300-0-এ প্রতি 3ms পরে কাউন্টারগুলি পড়বে এবং ফলাফলগুলি লিখবে
out.txt. টাইমলাইন মোডের জন্য একটি ফ্রন্টএন্ড অ্যাপ্লিকেশন likwid-স্কোপ আছে, যা সক্ষম করে
নির্বাচিত ইভেন্টের লাইভ প্লটিং। আরো কোড উদাহরণের জন্য likwid WIKI দেখুন
পৃষ্ঠাগুলি প্রক্রিয়াগুলো হলো না 0-3 CPU-তে পিন করা হয়েছে।

6. স্টেথোস্কোপ মোডে likwid ব্যবহার করা:

likwid-perfctr -c 0-3 -g FLOPS_DP -S 2s

এটি কাউন্টারগুলি শুরু করবে এবং 2-0 ফিজিক্যাল কোরে 3s পরে সেগুলি পড়বে এবং লিখবে
ফলাফল stdout. প্রক্রিয়াগুলো হলো না 0-3 CPU-তে পিন করা হয়েছে।

onworks.net পরিষেবা ব্যবহার করে likwid-perfctr অনলাইন ব্যবহার করুন


বিনামূল্যে সার্ভার এবং ওয়ার্কস্টেশন

উইন্ডোজ এবং লিনাক্স অ্যাপ ডাউনলোড করুন

লিনাক্স কমান্ডগুলি

Ad