1. හැඳින්වීම
Ubuntu හි GPU එකක් භාවිතා කරන විට, එහි තත්ත්වය නිවැරදිව නිරීක්ෂණය කිරීම අත්යවශ්ය වේ. ගැඹුරු ඉගෙනුම් හෝ රූප රේඛා නිර්මාණ වැනි වැඩබර පරිසරයන්හි, GPU භාවිතය සහ ධාවක අනුවාදයන් තේරුම් ගැනීම අනිවාර්ය වේ. මෙම ලිපියේ, NVIDIA GPU කළමනාකරණ මෙවලම වන nvidia-smi භාවිතා කරන ආකාරය පැහැදිලි කරමින්, Ubuntu හි GPU තොරතුරු පරීක්ෂා කිරීමේ ක්රම හඳුන්වා දෙමු.
2. nvidia-smi සමඟ GPU තොරතුරු පරීක්ෂා කිරීම
nvidia-smi යනු NVIDIA GPU ගැන භාවිතය, මතක භාවිතය සහ අනෙකුත් විස්තරාත්මක තොරතුරු නිරීක්ෂණය කිරීමට උපකාරී වන කමාන්ඩ්-ලයින් මෙවලමකි. රියල්-ටයිම් GPU ක්රියාකාරිත්වය පරීක්ෂා කිරීම හෝ විස්තරාත්මක භාවිත මට්ටම් ලබා ගැනීම සඳහා විශේෂයෙන් ප්රයෝජනවත් වේ.
මූලික භාවිතය
GPU භාවිතය සහ මතක භාවිතය රියල්-ටයිම් නිරීක්ෂණය කිරීමට පහත කමාන්ඩ් භාවිතා කළ හැක:
nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1
මෙම කමාන්ඩ් මඟින් GPU භාවිතය, මතක භාවිතය, සහ ලබා ගත හැකි මතකය ඇතුළත් විස්තරාත්මක තොරතුරු ලබා ගත හැක. -l විකල්පය මගින් තාක්ෂණික අන්තරය (තත්පර) සකස් කළ හැක.
දර්ශන ආකෘතිය සහ ගොනු ප්රතිදානය
පෙරනිමි ලෙස, ප්රතිඵල ටේබල් ආකෘතියෙන් පෙන්වයි, නමුත් CSV ලෙස ප්රතිදානය ලබා ගත හැකි අතර, ගොනුවකට සුරකින්න අවශ්ය නම් -f විකල්පය භාවිතා කරන්න.
nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /path/to/output.csv
මෙම ක්රමය මඟින් GPU භාවිත ලොග් ගොනුවක් සුරකිමින් පසුකාලීන විශ්ලේෂණය කළ හැක.
3. nvidia-smi සමඟ ක්රියාවලි තොරතුරු ලබා ගැනීම
nvidia-smi මඟින් GPU භාවිතා කරන වත්මන් ක්රියාවලි පිළිබඳ තොරතුරු ලබා ගැනීමටද හැක. මෙය එක් එක් ක්රියාවලිය කෙතරම් GPU සම්පත් භාවිතා කරයිදැයි හඳුනා ගැනීමට උපකාරී වේ.
ක්රියාවලි තොරතුරු ලබා ගැනීම
GPU භාවිතා කරන ක්රියාවලිවල PID සහ මතක භාවිතය පෙන්වීමට පහත කමාන්ඩ් භාවිතා කරන්න:
nvidia-smi --query-compute-apps=pid,process_name,used_memory --format=csv,noheader
මෙම කමාන්ඩ් සක්රිය GPU ක්රියාවලි ලැයිස්තුව ලබා දී, එක් එක් ක්රියාවලියේ මතක භාවිතය පෙන්වයි.
nvidia-smi pmon උප-ඇණවුම
nvidia-smi මෙවලමේ pmon උප-ඇණවුමද ඇත, එය විස්තරාත්මක GPU ක්රියාවලි නිරීක්ෂණය සපයයි.
nvidia-smi pmon --delay 10 -s u -o DT
මෙය නියමිත අන්තරයකදී GPU ක්රියාවලි තොරතුරු පෙන්වයි. --delay විකල්පය තාක්ෂණික අන්තරය (තත්පර) නියම කරයි, සහ ඔබට අවශ්ය තොරතුරු තෝරා ගත හැක.
4. NVIDIA ධාවක ස්ථාපනය සහ තහවුරු කිරීම
Ubuntu හි NVIDIA GPU භාවිතා කිරීමට, නිවැරදි NVIDIA ධාවකය ස්ථාපනය කළ යුතුය. පහත පියවර මඟින් ස්ථාපනය සහ තහවුරු කිරීම සිදු කරමු.
ධාවක ස්ථාපනය
ඔබේ පද්ධතියට සුදුසු NVIDIA ධාවකය පහත කමාන්ඩ් මඟින් ස්ථාපනය කරන්න:
sudo apt install nvidia-driver-510
ස්ථාපනය අවසන් වූ පසු, පද්ධතිය නැවත ආරම්භ කරන්න.
ස්ථාපනය තහවුරු කිරීම
නැවත ආරම්භ කිරීමෙන් පසු, ධාවකය නිසි ලෙස ස්ථාපිත වී ඇතිදැයි පරීක්ෂා කිරීමට පහත කමාන්ඩ් ක්රියාත්මක කරන්න:
nvidia-smi
ධාවක අනුවාදය සහ CUDA අනුවාදය පෙන්වෙනවා නම්, ස්ථාපනය සාර්ථකයි.
5. TensorFlow සමඟ GPU ක්රියාකාරිත්වය තහවුරු කිරීම
GPU ක්රියාකාරිත්වය TensorFlow භාවිතයෙන් පරීක්ෂා කර තහවුරු කළ හැක, එය යන්ත්ර ඉගෙනුම් පද්ධතියකි.
Anaconda ස්ථාපනය
පළමුව Anaconda ස්ථාපනය කර, ඔබේ පරිසරය සකසන්න:
bash ./Anaconda3-2022.05-Linux-x86_64.sh
conda update -n base conda
conda update anaconda
conda update -y --all
conda install tensorflow-gpu==2.4.1
TensorFlow හි GPU හඳුනා ගැනීම පරීක්ෂා කිරීම
ඊළඟට, TensorFlow GPU හඳුනා ගනීදැයි පරීක්ෂා කරන්න:
from tensorflow.python.client import device_lib
device_lib.list_local_devices()
GPU උපාංගය ලැයිස්තුවේ පෙන්වෙනවා නම්, TensorFlow GPU හඳුනා ගැනීමට සාර්ථකයි.
6. GPU නිරීක්ෂණය සහ ලොග් කිරීම
nvidia-smi මඟින් රියල්-ටයිම් GPU නිරීක්ෂණය සහ ලොග් රෙකෝඩ් කිරීම සිදු කළ හැක. මෙය කාලයත් සමඟ GPU භාවිතය නිරීක්ෂණය කර, කාර්ය සාධනය වැඩිදියුණු කිරීමට උපකාරී වේ.
පරිකාලික නිරීක්ෂණය
පරිකාලික නිරීක්ෂණය සකස් කිරීමට, යාවත්කාලීන අන්තරය නියම කිරීමට -l විකල්පය භාවිතා කරන්න, සහ විකල්ප ලෙස දත්ත ගොනුවකට ලොග් කරන්න:
nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /var/log/gpu.log
Python බැඳීම් මගින් වැඩසටහන් කළමනාකරණය
nvidia-smi Python බැඳීම් (nvidia-ml-py) ලබා දේ, එමඟින් ඔබට වැඩසටහන් මගින් GPU තොරතුරු ලබා ගත හැක. මෙය Python ස්ක්රිප්ට් වලින් වඩාත් අභිරුචි නිරීක්ෂණය සහ පාලනය සක්රිය කරයි.
7. නිගමනය
nvidia-smi Ubuntu හි NVIDIA GPU භාවිතය පරීක්ෂා කිරීම සහ කළමනාකරණය සඳහා ශක්තිමත් මෙවලමකි. මෙම ලිපිය මූලික භාවිතය, ක්රියාවලී නිරීක්ෂණය, ධාවක ස්ථාපනය, සහ TensorFlow GPU සත්යාපනය පිළිබඳ විස්තර කරයි. GPU කාර්ය සාධනය උපරිම කර ගැනීමට සහ ඔබේ පද්ධතිය සුදුසු කර ගැනීමට මෙම තාක්ෂණ භාවිතා කරන්න.