Статьи

10 KPI в IT, которые важно отслеживать

KPI сервиса Мониторинг Чек-листы
Сейчас сложно представить компанию, которая не использует IT решения. Но, с внедрением или масштабированием IT инфраструктуры, важно правильно оценивать её работу. Своевременный сбор актуальных ключевых показателей поможет не только оценить эффективность этих действий, но и составить план дальнейшего развития.
Выбор показателей, который помогут правильно оценить работу IT-структуры, является важным этапом на пути к её эффективному развитию и правильному формированию целей.
Будучи лидером инноваций в бизнес-процессах, IT-решения помогают в таких задачах как кибербезопасность, соответствие требованиям инфраструктуры, защита активов, оптимизация производительности и многие другие.

Вот небольшой список KPI, который поможет оценить работу сотрудников и эффективность IT-системы:

1. Процент проектов в выполненных в срок, в рамках бюджета и в соответствии со спецификацией
2. Среднее время обработки проблемы
3. Окупаемость инвестиций в IT
4. Расходы на IT: бюджет и фактические траты
5. Количество сотрудников IT-поддержки для конечных пользователей
6. Среднее время безотказной работы (MTBF)
7. Среднее время ремонта/восстановления (MTTR)
8. Целевая точка восстановления (RPO)
9. Целевое время восстановления (RTO)
10. Время простоя и время работы

1. Процент проектов в выполненных в срок, в рамках бюджета и в соответствии со спецификацией

Самый распространённый способ оценки эффективности бизнеса – количества проектов, выполненных в соответствии с заданием. Для этого потребуется форма отчетности, в котором сотрудники смогут предоставлять информацию о ходе работы над проектом. По ней можно будет оценить проект и своевременно скорректировать работу над ним.
Рекомендуемый интервал отслеживания: ежемесячно и ежеквартально.

2. Среднее время обработки проблемы

Этот KPI помогает оценить временные затраты команды на решение задачи. Количество выполненных задач, за определенный период времени, можно оценивать для группы или для отдельного сотрудника. Это поможет выявить слабые места и своевременно скорректировать работу.
Рекомендуемый интервал отслеживания: еженедельно и ежемесячно.

3. Окупаемость инвестиций в IT

Оценка эффективности расходов на IT кажется довольно простой метрикой: больше доходов, меньше расходов. Но надо не забывать про такие показатели как сэкономленное время, процент привлеченных и удовлетворенных клиентов и другие пункты, напрямую не связанные с инвестициями.
Формула расчёта является отношением выгоды от инвестиций к их размерам. Чем больше это значение, тем выше рентабельность. Хотя большее вниманием надо уделять инвестициям, у которых этот показатель растёт со временем.
Рекомендуемый интервал отслеживания: ежемесячно и ежегодно

4. Расходы на IT: бюджет и фактические траты

KPI помогает оценит оправданность затрат сравнивая запланированный бюджет с реальными затратами. Это позволит своевременно выявить перерасход ресурсов или их нехватку и скорректировать бюджет.
Рассчитать можно поделив суммарные затраты на запланированный бюджет за период.
Рекомендуемый интервал отслеживания: ежемесячно и ежеквартально.

5. Количество сотрудников IT-поддержки для конечных пользователей

Этот KPI позволяет оценить количество сотрудников, которое необходимо для решения проблемы одного клиента. Тут нет какого-то референсного значения, оно будет уникально для каждого проекта. Но чем больше сотрудников участвует в решении, тем быстрее оно будет найдено. Это особенно важно при масштабировании процессов.
Рассчитать можно отношением количества сотрудников к количеству обращений, усредненным за определенный период времени.
Рекомендуемый интервал отслеживания: ежедневно и еженедельно.

6. Среднее время безотказной работы (MTBF)

Время между сбоями — это среднее значение между отказом системы и её восстановлением. Чем выше этот показатель, тем более устойчива система к таким сбоям как отказ системы, проблемы с подключением или простой.
Рассчитывается отношением количества часов безотказной работы и количеству сбоев.

7. Среднее время ремонта/восстановления (MTTR)

Это среднее время, которое тратится на восстановление компонентов, устройств или системы. Также можно рассчитывать время до восстановления. Т.е. интервал от обнаружения неисправности до её устранения. Любой из этих KPI позволит оценить время на возвращение системы к нормальному функционированию.
Среднее время на ремонт рассчитывается суммарным временем ремонта, разделенным на количество сбоев, за определенный период времени.
Среднее время до восстановления рассчитывается как отношение времени, в течении которого система была неисправна, к количеству таких неисправностей, за определенный период времени.

8. Целевая точка восстановления (RPO)

Этот KPI оценивает максимальное количество информации, которое вы можете потерять при отказе системы. Например, если отказ произошел в 5 часов, и вы хотите восстановить всю информацию, начиная с 4 часов, то RPO составляет 1 час. Для этого показателя есть пороговое значение, уникальное для каждого бизнеса, при котором потеря данных будет критичной. Для более приоритетных задач следует поддерживать низкое значение этого показателя. Подбирая значения этого показателя, следует учитывать такие факторы как:
- максимальный объем информации, который можно потерять
- отраслевые особенности: медицинские или финансовые операции, которые вы должны регулярно обновлять
- хранение данных: локально или на облачном сервисе
- стоимость потери операций и информации
- стоимость внедрения системы аварийного восстановления
- соответствие системы аварийного восстановления требованиям к потерям и доступности данных

9. Целевое время восстановления (RTO)

Вместе с RPO, целевое время восстановления играет колоссальную роль в разработке плана аварийного восстановления. RTO показывает сколько у вас есть времени на восстановление, до наступления критический последствий. Он может включать в себя время простоя, потерю информации или недоступность сервиса.
Как и в случае с RPO, тут нет универсального значения и более важные компоненты должны иметь меньшее значение.

10. Время простоя и время работы

Время простоя — это интервал времени, когда система не функционирует. Время работы – это интервал, в котором система не находится в простое. Например, если ваша система, в течении суток, не функционировала в 1 час, то период работы будет составлять 23 часа или примерно 96%.
Показатель на уровне 99,9% оптимален для большинства предприятий и позволяет снизить риск потери данных, снижения производительности и возможной потери клиентов.
Формула расчёта времени работы за определенный период времени: суммарное время работы минус время простоя, разделенное на суммарное время работы.
Многие компании рассчитывают время работы и время простоя отдельно, чтобы получить два независимых показателя.

Зачем отслеживать значения KPI?

Старая поговорка гласит: нельзя управлять тем, что нельзя измерить.
Эти метрики будут полезны только если вы понимаете зачем их нужно отслеживать. Расставив приоритеты для этих метрик исходя из ваших уникальных задач, вы сможете сфокусировать своё внимание на тех областях, которые требуют улучшения, а также сможете повысить эффективность управления.
Правильные показатели KPI используют подтвержденные фактами данные для измерения прогресса ваших целей. Например, время работы является одним из самых распространенных KPI. Сравнивая показатели месяц за месяцем и год за годом, вы получаете более четкое представление о развитии IT-структуры.
Показатели KPI, подходящие именно для вашего бизнеса, помогут принять верное решение, добиться поставленных стратегических целей и найти наиболее рациональный путь для развития. Сосредоточение внимания на уникальных показателях позволит быстрее вернуть инвестиции и сократить расходы, что важно сейчас как никогда.