LIBRISTO
LIBROAMANTO
υποχρεωτικό
Γίνετε μέλος μιας κοινότητας βιβλιόφιλων από όλο τον κόσμο και επωφεληθείτε από πολλά προνόμια. Δημιουργία δωρεάν λογαριασμού
0
Δωρεάν αποστολή με Box Now άνω των 69.99 €
DHL courier 9.99 Σημείο Elta 3.99 Elta 4.49 ACS 4.99 Σημείο ACS 4.99 Box Now 3.99

HPC Observability

Production Monitoring, Profiling, and Site Reliability for Linux Clusters, GPUs, and Parallel Storage at Scale

Γλώσσα ΑγγλικήΑγγλική
Βιβλίο Χαρτόδετο
Βιβλίο HPC Observability M. Edwards
Κωδικός Libristo: 52747456
ΕΕκδοτικός οίκος Independently published, Μάιος 2026
HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance... Πλήρης περιγραφή
? points 55 b Νέα Νέα
22.49
Αναμενόμενος εφοδιασμός σε αποθέματα Έκδοση 02. 06. 2026
Ελλάδα Παράδοση στην Ελλάδα

Έως 30 ημέρες για επιστροφή

HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance computing systems running reliably at scale. It brings together the operational knowledge scattered across vendor documentation, conference papers, and forum threads into a practical framework for turning HPC telemetry into actionable insight.

Modern HPC environments - Slurm clusters, GPU-dense AI systems, Lustre and GPFS storage, InfiniBand and Slingshot fabrics - generate more data than any team can manually interpret. The result is wasted node-hours, failed simulations, hidden storage bottlenecks, fabric congestion, and GPU failures that surface only after days of runtime.

This book provides a complete operational approach to HPC observability through a five-layer model covering hardware, operating systems, schedulers, applications, storage, and networks. Readers learn how to build metrics pipelines for clusters from hundreds to tens of thousands of nodes; monitor GPUs with DCGM; profile MPI and OpenMP applications with PAPI and Score-P; diagnose storage and network slowdowns; create useful dashboards and alerts; and run effective incident response and post-mortems.

Drawing on peer-reviewed research and real production experience, the book includes original diagrams, practical workflows, reference material, Prometheus alert examples, and a step-by-step lab environment for learning on a laptop.

Written in the voice of a senior HPC engineer rather than an academic text, HPC Observability assumes readers already understand the fundamentals and focuses instead on the operational realities of running large-scale Linux, AI, and research-computing infrastructure.

Ηθοποιός & Πολύγλωσση
EWA KASP για
Αναπαραγωγή βίντεο
Ewa Kasp
το Libristo διαθέτει τη μεγαλύτερη επιλογή ξενόγλωσσων βιβλίων. Γι' αυτό αγοράζω τα βιβλία μου εδώ.

Πληροφορίες για το βιβλίο

Πλήρες όνομα HPC Observability
Συγγραφέας M. Edwards
Γλώσσα Αγγλική
Βιβλιοδεσία Βιβλίο - Χαρτόδετο
Ημερομηνία έκδοσης 2026
Αριθμός σελίδων 164
EAN 9798198765443
Κωδικός Libristo 52747456
ΕΕκδοτικός οίκος Independently published
Βάρος 397
Διαστάσεις 216 x 280 x 9
Χαρίστε αυτό το βιβλίο σήμερα
Είναι εύκολο
1 Προσθέστε το βιβλίο στο καλάθι σας και επιλέξτε παράδοση ως δώρο 2 Ως ανταμοιβή θα σας στείλουμε ένα κουπόνι 3 Το βιβλίο θα φτάσει στη διεύθυνση του παραλήπτη

Είσοδος

Συνδεθείτε στο λογαριασμό σας Δεν έχετε ακόμη λογαριασμό στο Libristo; Δημιουργήστε τον τώρα!

 
υποχρεωτικό
υποχρεωτικό

Δεν έχετε λογαριασμό; Αποκτήστε τα οφέλη ενός λογαριασμού Libristo!

Με έναν λογαριασμό Libristo, θα έχετε τον απόλυτο έλεγχο.

Δημιουργία λογαριασμού Libristo
Σύμβουλος βιβλίων Libroamiko
Γεια σας, είμαι ο Libroamiko, μπορώ να βοηθήσω;