I team di monitoraggio della rete possono ora attingere a Internet of Things, rete a livello di software e servizi basati su cloud per garantire il massimo tempo di attività e prestazioni di rete ottimali. Tuttavia, adattarsi a queste tecnologie significherebbe definire nuove pratiche per l'integrazione dell'architettura legacy, riprogettare il flusso di lavoro di monitoraggio e valutare il toolkit per migliorare la gestione della rete completa e stratificata. Questa guida è stata progettata per aiutare i team di monitoraggio della rete a ridefinire il loro modus operandi per avere una pratica NMS più efficace, basata sui dati, efficiente e reattiva.

Monitoraggio della rete: best practice

La necessità stessa di avere una pratica di monitoraggio della rete definita cresce nella necessità di aggiornarla nel tempo. Man mano che le reti diventano complesse, interconnesse e integrate nel core business, le dipendenze delle diverse funzioni aziendali rendono il tempo di attività della rete fondamentale per la produttività. I team, le persone e le operazioni lavoreranno ogni minuto partendo dal presupposto che la rete sarà attiva e funzionante. Avere problemi di rete anche in episodi più piccoli può erodere la collaborazione tra i team, ridurre la fiducia dei clienti e causare danni evidenti ai profitti dell'azienda.

Pertanto, poiché le reti sono diventate più dense e complesse, la necessità di avere un approccio adattivo e basato sull'euristica per il loro monitoraggio è diventata solo più critica. Ecco come puoi riconfigurare le tue pratiche NMS per una migliore comprensione della rete e, infine, una gestione più efficace della rete:

1. Definizione di un problema: definizione delle prestazioni di rete medie.

Il primo passo per capire se la rete funziona ai livelli progettati è disporre di un benchmark quantitativo per confrontare le prestazioni della rete esistente con le prestazioni di rete ideali. La sfida sta nella definizione: quali dovrebbero essere le prestazioni di rete ideali?

Gli amministratori di rete possono osservare le prestazioni della rete da poche settimane a pochi mesi a diversi livelli di attività aziendale. Alla fine del periodo di osservazione, l'amministratore di rete avrà un benchmark medio delle prestazioni di rete. Questo può essere utilizzato per stabilire una soglia di prestazioni in tutta la rete.

L'impostazione della soglia è solo una parte della soluzione. L'altra parte si concentra sulla ricezione di avvisi non appena la soglia è stata superata.

In questo modo, le prestazioni medie di base di un nodo o elemento nella rete possono fungere da proxy per mostrare problemi in qualche altra parte della rete. Ad esempio, se l'utilizzo della CPU cresce a un ritmo aggressivo rispetto all'utilizzo di base, vale la pena studiare alcune modifiche nella rete. Tale linea di base aiuta gli amministratori di rete a diventare proattivi per risolvere un problema, invece di essere reattivi e aspettare che qualcuno sollevi un reclamo. Si risparmia più tempo e risorse che sarebbero stati necessari per gestire i tempi di inattività e gestire i clienti in attesa sulla linea.

2. Definizione della proprietà del problema per accelerare le risoluzioni.

Il primo passo imposta lo slancio del secondo. Una volta stabilita la linea di base, gli avvisi arrivano. Ora, tutto ciò che devi fare è definire chi dovrebbe essere informato a che punto.

Questo è un passaggio fondamentale nel controllo di MTTR. Spesso, le aziende con grandi team IT finiscono per ricevere gli avvisi al momento giusto, ma la soluzione non viene fornita per molto tempo. Ciò può essere dovuto a diversi motivi: priorità errate, tecnici allocati in modo errato e così via. Molte di queste sfide possono essere diffuse anche prima che si presentino, semplicemente creando una gerarchia di proprietà attraverso la rete. Questa gerarchia decide chi deve essere avvisato in base a un avviso in arrivo che indica una violazione della soglia.

Questo esercizio riduce il divario tra il monitoraggio degli allarmi e l'azione di conseguenza. Poiché la proprietà sulla rete è già stata divisa, l'approccio di avviso basato su regole aiuta gli amministratori di rete a concentrarsi sul problema in questione invece di essere distratti da una coorte di problemi che potrebbero non essere in grado di risolvere.

3. Generazione di report sensibili ai livelli.

La comunicazione attraverso una rete complessa è spesso dettata da un modello di interconnessione di sistema aperto. Ciò consente ai team di concentrarsi sull'interoperabilità del sistema invece di concentrarsi sulla tecnologia sottostante. La stessa priorità deve avvenire in termini di generazione di report.

Il flusso di dati può non riuscire in qualsiasi punto o punti del sistema. Il sistema di monitoraggio dovrebbe essere in grado di rilevare e segnalare i guasti tra diverse tecnologie. In sostanza, il sistema di monitoraggio della rete dovrebbe essere flessibile per rilevare errori a livello fisico, livello di collegamento dati, inoltro di pacchetti di rete, comunicazione da host a host, sessioni, sintassi e applicazioni.

Pertanto, il sistema di monitoraggio della rete che comprende la varia natura dei nodi e degli elementi nella rete e contrassegna ogni avviso con la fonte giusta può aiutare il team NSM ad avviare i protocolli di risoluzione dei problemi in modo efficiente. Problemi che sono sul punto di essere rilevati poiché i problemi possono essere rilevati nelle prime fasi del processo.

4. Risoluzione del problema della dipendenza della disponibilità dei dati NMS dal tempo di attività della rete.

In genere, i team di monitoraggio della rete preferiscono avere NMS all'interno della rete per una raccolta dati efficiente e un reporting più rapido. Tuttavia, questo crea una dipendenza malsana tra l'NMS e la rete. Se la rete dovesse riscontrare un errore e si spegnesse, il team non avrebbe accesso ai dati incorporati nell'NMS, non importa quanto siano sofisticati. L'alta disponibilità (HA) può risolvere questo problema assicurando che l'NMS sia in esecuzione anche se la rete è in stato di inattività per qualsiasi motivo. Sebbene l'HA possa sembrare una misura secondaria, può salvarti dal problema circolare dei tempi di inattività della rete.

5. Disponibilità dei dati in una sequenza temporale.

Solo la disponibilità di avvisi su una sequenza temporale può aiutare a filtrare i problemi dai problemi e aiutare il processo RCA. Ottenere una notifica e risolverla è l'idea quotidiana del monitoraggio. Tuttavia, disporre di un archivio di avvisi con la giusta fonte del problema contrassegnata può aiutare a costruire sistemi intelligenti che aiutano ad accelerare il processo di risoluzione. Le tue pratiche di monitoraggio della rete dovrebbero avere i dati disponibili per le ultime ore, giorni, settimane e mesi per darti un quadro visivamente accessibile di come un problema di rete è aggravato.

6. Avere una visione unificata.

Man mano che le aziende crescono, le loro pratiche di monitoraggio della rete devono adattarsi a loro. Una piccola impresa con una configurazione di rete dedicata e il team in loco non andrà incontro a crisi immediate poiché uno strumento di base può generare rapporti sull'intera rete. Man mano che le aziende crescono, aggiungono nuovi nodi alla rete sotto forma di nuovi uffici in diverse sedi e infrastrutture cloud. Il tuo sistema di monitoraggio della rete deve essere progettato in modo da permetterti di avere una visione centralizzata dell'intera rete, disponibile in modo accessibile su un'unica piattaforma. Questo ti darà una chiara comprensione delle tendenze di rete su larga scala e di come ogni nodo della rete interagisce con gli altri nodi della rete.

In conclusione

Alcuni team di monitoraggio della rete potrebbero ritenere che, sebbene queste migliori pratiche siano progettate per una maggiore efficacia del monitoraggio della rete, possono essere "chiedere troppo" in termini di risorse assegnate all'NMS. Questo problema può essere facilmente risolto con uno strumento progettato sulla base di queste migliori pratiche.

Motadata porta ciascuna delle migliori pratiche come sue caratteristiche native. È possibile avere rapporti basati su livelli, HA, record storici e una vista federata dell'intera rete, comprese diverse posizioni, nodi e risorse IT in un unico posto. Non dovrai dedicare più tempo alla riprogettazione del processo di monitoraggio della rete. Le funzionalità di Motadata rendono il tuo processo più reattivo, efficiente e sistematico da solo.