Для компаний стало критически важным измерять и отслеживать эффективность предоставления услуг в быстро меняющемся цифровом мире. Однако, когда программное обеспечение для управления инцидентами измеряет различные показатели и отслеживает время безотказной работы и время простоя, небольшой сбой в системе может нарушить бизнес-процессы, что обходится в миллионы долларов.
MTTR, MTBF, MTTF и MTTA — это сокращения некоторых наиболее важных показателей управления инцидентами. В области Управление ИТ-услугами, эти аббревиатуры помогают организациям планировать свои ресурсы, чтобы гарантировать, что они могут позаботиться о проблемах, вызванных сбоями аппаратного и программного обеспечения. Полные формы следующие:
- Среднее время ремонта
- Среднее время между сбоями
- Среднее время до отказа
- Среднее время подтверждения
Давайте углубимся в каждую метрику.
Что такое среднее время ремонта (MTTR)?
Среднее время восстановления (MTTR) - это среднее время, необходимое для восстановления системы и восстановления ее полной функциональности. Расчет MTTR начинается после начала ремонта и продолжается до полного восстановления нарушенных служб, включая любое необходимое время тестирования.
В сфере управления ИТ-услугами буква R в слове MTTR не всегда означает ремонт. Это также может означать восстановление, ответ или решение. Хотя все эти показатели соответствуют друг другу, они имеют свои собственные значения, поэтому всегда рекомендуется уточнять, какой MTTR следует использовать. Кратко рассмотрим, что означает каждый из них.
- Среднее время восстановления (MTTR) - это среднее время, необходимое для восстановления после поломки устройства или системы. Это охватывает весь процесс от отключения из-за простоя до момента, когда система снова станет полностью работоспособной. MTTR - хороший индикатор для измерения скорости общего процесса восстановления.
- Среднее время ответа (MTTR) - это среднее время, необходимое для восстановления после сбоя системы с момента получения первого предупреждения о сбое, не включая задержку в системе предупреждений. Этот MTTR обычно используется в сфере кибербезопасности для измерения эффективности команды в отражении системных атак.
- Среднее время решения (MTTR) представляет собой среднее время, затрачиваемое на полное устранение неисправности системы, включая время, необходимое для обнаружения неисправности, диагностики проблемы и решения проблемы, убедившись, что неисправность больше не повторится. Этот показатель MTTR в основном используется для измерения процесса разрешения непредвиденных инцидентов, а не запросов на обслуживание.
Как вы рассчитываете MTTR?
Поскольку MTTR - это показатель управления инцидентами, который ИТ-команды используют для отслеживания ремонта, предприятиям следует стремиться к тому, чтобы значение MTTR было как можно ниже. Это достижимо за счет повышения производительности бригад, выполняющих ремонтные работы. MTTR можно рассчитать следующим образом:
MTTR = общее время, затраченное на ремонт в течение заданного периода/количество ремонтов
Предположим, что в системе было 6 сбоев, и обслуживание, необходимое для восстановления системы до полной функциональности, заняло 3 часа, что составляет 180 минут. Итак, MTTR будет,
MTTR = 180/6 = 30 минут
Это означает, что MTTR организации составляет 30 минут, то есть время, которое в среднем организация тратит на каждый простой.
Что такое среднее время наработки на отказ (MTBF)?
Среднее время наработки на отказ (MTBF) - это среднее время, прошедшее между ремонтируемым отказом оборудования и его следующим возникновением. Среднее время безотказной работы измеряет доступность и надежность, поэтому чем выше значение MTBF, тем надежнее система.
Среднее время безотказной работы - это показатель, который помогает клиентам принимать обоснованные решения о том, когда обновлять систему или вводить оборудование в эксплуатацию. Если после фазы профилактического обслуживания среднее время безотказной работы улучшилось, это говорит о повышении надежности оборудования. Увеличение MTBF также демонстрирует эффективность процессов обслуживания.
Как вы рассчитываете MTBF?
MTBF - это время, прошедшее от одного отказа до следующего. Математически это можно рассчитать следующим образом:
Среднее время безотказной работы = общее время безотказной работы между отказами / общее количество отказов
Предположим, система отлично работает 13 часов. В течение этого периода произошло 3 отказа, в результате чего общее время простоя составило 1 час. Итак, MTBF будет,
Среднее время безотказной работы = (13-1) / 3 = 4 часа
Эта цифра означает, что сбой в системе происходит каждые 4 часа, что приводит к отключению системы и убыткам для организации. Отслеживание этого показателя может помочь спланировать стратегии, которые могут сократить время простоя.
Поскольку MTBF используется для отслеживания надежности, оно отражает только непредвиденные простои и не учитывает возможные простои во время планового обслуживания.
Как мы упоминали ранее, MTBF используется для отслеживания отказов в ремонтируемых системах. Для отслеживания отказов, требующих замены системы, используется показатель, называемый «Среднее время до отказа» (MTTF).
Что такое среднее время до отказа (MTTF)?
Средняя наработка до отказа (MTTF) - это среднее время, прошедшее между неисправимыми отказами оборудования. MTTF измеряет надежность неремонтопригодных систем и показывает время, в течение которого система, как ожидается, будет функционировать до полного отказа.
MTTF - важный показатель, используемый для измерения срока службы заменяемого или неремонтопригодного оборудования, такого как клавиатуры, батареи, настольные телефоны, мыши и т. Д. Исторические данные о MTTF каждого типа оборудования позволяют ИТ-специалистам поэтапно планировать устаревание.
Поскольку метрика используется для определения того, как долго обычно прослужит система, определение того, превосходит ли новая версия системы старую, также поможет понять ожидаемый срок службы и время планирования проверок системы.
Как вы рассчитываете MTTF?
Среднее время безотказной работы является основным показателем надежности оборудования, не подлежащего ремонту, поэтому цель состоит в том, чтобы увеличить срок службы актива. Более короткий MTTF приводит к частым простоям и сбоям. Для расчета MTTF используйте следующую формулу:
MTTF = общее количество часов работы / общее количество отказов
Предполагая, что мы должны исследовать три идентичные системы, пока все они не откажутся. Первая система проработала 14 часов, вторая - 16 часов, а третья - 12 часов. MTTF в этом случае будет,
MTTF = (14 + 16 + 12) / 3 = 14 часов.
Это означает, что данный тип системы в среднем необходимо заменять каждые 14 часов, чтобы предотвратить более длительные простои и последующие повреждения.
Что такое среднее время подтверждения (MTTA)?
Среднее время подтверждения (MTTA) — это среднее время, необходимое организации для ответа на жалобы, сбои или инциденты во всех отделах. Метрика управления инцидентами MTTA используется для отслеживания реакции группы поддержки и эффективности системы оповещения.
Медленное реагирование может снизить эффективность сотрудников, когда внутренние системы сталкиваются с проблемами и стоит организациям денег. Отслеживая и минимизируя MTTA, организации могут оптимизировать свои процессы, повысить удовлетворенность клиентов и увеличить прибыль.
Как вы рассчитываете MTTA?
MTTA - полезная мера для контроля скорости отклика. Если команда слишком долго отвечает и страдает от усталости от предупреждений, этот показатель поможет выявить проблему. Для расчета MTTA используйте следующее математическое представление:
MTTA = общее время, прошедшее между предупреждением и подтверждением / общее количество инцидентов
Допустим, в организации произошло 5 инцидентов, и между предупреждением и подтверждением для всех инцидентов прошло в общей сложности 30 минут, тогда MTTA будет
MTTA = 30/5 = 6 минут
Это означает, что MTTA для организации составляет 6 минут, и организация должна работать над сокращением этого времени, чтобы оптимизировать процесс разрешения проблем.
Заключение
Подводя итог, можно сказать, что среднее время восстановления (MTTR) - это мера, с помощью которой вы можете увидеть, как быстро вы можете вернуть неисправное оборудование в рабочее состояние. Среднее время наработки на отказ (MTBF) дает вам представление о том, насколько эффективна ваша группа поддержки в минимизации или предотвращении надвигающихся инцидентов. Используя метрическую среднюю наработку до отказа (MTTF), вы можете определить срок службы системы или оборудования. Наконец, среднее время для подтверждения (MTTA) - ценный показатель, с помощью которого вы можете отслеживать реакцию вашей группы ИТ-поддержки.
Теперь, когда вы понимаете эти метрики инцидентов в деталях, вы поймете, что каждая метрика предлагает разные точки зрения. При одновременном использовании эти мощные показатели могут дать более глубокое представление о том, как ваша группа поддержки управляет перебоями в обслуживании, и помочь вам снизить потери из-за неэффективности и проблем с качеством. Чтобы узнать больше о том, какие другие показатели управления услугами вы должны отслеживать, прочитайте нашу статью 7 важных показателей службы поддержки для измерения.