Эксплуатация системы

 

Сотрудники, ответственные за эксплуатацию системы должны обладать необходимыми техническими навыками, знаниями и опытом для поддержания соответствия системы корпоративным политикам, в особенности корпоративной политике информационной безопасности.

 

На основе предложенной ниже информации должны быть составлены должностные инструкции и переданы ответственным сотрудникам. Сотруднику необходимо выдать хронологически размеченный журнал эксплуатации, где отмечены все планово проводимые работы для отметки произведенных работ, результатов, встреченных в процессе сложностей, номеров заявок в техподдержку производителя и личной подписи.

Журнал эксплуатации предназначен для контроля исполнения ответственными сотрудниками возложенных на них обязанностей, цель которых - обеспечение высокой доступности сервисов системы, уверенность в ее надежности, грамотности и готовности сотрудников к качественному проведению любых работ не требующих привлечения разработчика.

Журнал может быть передан разработчику для аудиторской оценки действий сотрудников, внесения корректив в задачи и расписание, превращения личного опыта сотрудников в решения по развитию функционала и документации.

 

Объекты и задачи эксплуатации, рекомендуемая периодичность обслуживания.

п/п

Объект

Задачи

Рекомендуемая периодичность

1. Физический уровень

1.1

Источник бесперебойного питания

Проверка состояния батареи, уровня нагрузки. Тестирование переключения питания на батарею.

отслеживание еженедельно, тестирование 1 раз в 6 месяцев.

1.2

Хранилища данных

Проверка информации о накопителях, температуры воздуха в шкафу с накопителями, проверка наличия и установка обновлений для контроллеров, при использовании накопителя с аккумуляторной защитой активных данных - периодическая замена старого аккумулятора. Проверка параметров контроллера (запрещено использовать экспериментальные или опасные для целостности данных согласно инструкциям производителя режимы кэширования).

параметры - разово при настройке и после обновлений прошивки, состояние - еженедельно.

1.3

Сервер

Стандартные проверки, рекомендованные производителем (важнейшее - температура, полная исправность компонентов системы вентиляции, исправность средства аварийного оповещения о неисправности компонентов сервера (HP iLO и т.п.) и корректность настроек), чистка от пыли, надежность крепления кабелей ко всем используемым портам, проверка журналов оповещения.

чистка от пыли - по состоянию, минимум раз в 3 года.

1.4

Окружение/размещение

Поддержание в порядке кабелей (размещение, наклейки, отсутствие опасных перегибов и свободных провисаний, кабели сети и питания должны быть зафиксированы в портах соответствующими устройствами), температуры серверного помещения, проверка журнала и списка доступа в помещение

Еженедельно

2. Сеть

2.1

Адресация, маршрутизация

Необходимо создать и поддерживать актуальной карту технологической  сети, связывающей основной сервер биллинга со всеми подсистемами от ближайших серверов обработки до источников данных и ПК пользователей, подключающихся к системе (включая отражение всех точек маршрутизации в рамках сети оператора связи).

При каждом изменении конфигурации сети, добавлении/удалении серверов + проверка актуальности 1 раз в 2 года

2.2

Защита

Обеспечение сетевой защиты, ведение перечня правил Firewall-ов, список IP адресов имеющих доступ к портам 22 и 1521 сервера биллинга должен быть и не изменяться без согласования с ответственными за информационную безопасность сотрудниками.

Поддерживать актуальность правил при изменениии конфигурации сети и подключении новых сотрудников.

3. База данных

3.1

Состояние

Список процессов, потребление ОЗУ, раздел подкачки, количество соединений, автозагрузка, лог-файлы работы СУБД

Ежедневно, при включенном мониторинге - 1 раз в 3 месяца

3.2

Место в разделах диска, табличных пространствах, структура хранения

Контроль свободного места, прогноз необходимости расширения, описание структуры хранения файлов  (рекомендуется с указанием примерной скорости доступа к диску в каждом разделе для обоснования размещения).

Еженедельно, при включенном мониторинге - 1 раз в 2 месяца.

3.3

Состояние резервной копии

Контроль работы задания резервного копирования (по информации RMAN и фактического наличия файлов копий), при необходимости корректировка расписания, политики и режимов копирования. Контроль свободного места.

Ежеквартально

4. Подсистема сбора и обработки

4.1

Состояние

Список процессов, автозагрузка, права в папках, контроль поступления, контроль корректности данных, задания cron.

Еженедельно

4.2

Место и размер

Оценка оптимальности размещения данных, использования трафика.

При настройке каждого нового источника.

4.3

Политика хранения

Описание политики хранения, правил замещения одноименных файлов ПТД, контроль переноса данных на другие хранилища.

Контроль 1 раз в 3 месяца.

5. Обеспечение отказоустойчивости

5.1

База и резервные копии

Проверка целостности, тестовое развертывание

1 раз в год

5.2

Настройки сервисов

Централизованное хранение настроек, оценка их достаточности и актуализация процедуры внепланового развертывания сервисов на других серверах.

При любом изменении настроек + проверка через неделю после их изменения

6. Взаимодействие с сотрудниками и поддержкой

6.1

Контактные лица

Своевременное оповещение службы поддержки об изменениях контактных данных, актуализация списка сотрудников с указанием отдела и зоны ответственности

В течении недели с момента проведения указанных изменений, заблаговременное сообщение об увольняющихся сотрудниках.

6.2

Контроль заявок

Проверка требующих отклика заявок, при большом их количестве обозначение приоритетов решения. Проверка проставляемых сотрудниками категорий заявки.

Ежедневно при наличии открытых заявок.