Цитата |
---|
ASKarabanov пишет:
Прикладной сервер перезагружается раз в неделю. Индексы в базу не добавлялись точно. В логах вообще нет следов каких-либо ошибок. Только начало парсинга письма перед каждым зависанием (я там выше скрин прикладывал). Я не могу чётко сопоставить начало зависаний с какими-то работами. За последние 4 месяца я довольно сильно лопатил СД. Например, открыл регистрацию заявок по мэйлу для всех отправителей, а не только для зарегистрированных в системе. Менял форму окна самой заявки, добавлял новые поля, менял логику имэйл команд, добавлял DB и UI правила. Однако, после всех этих изменений система какое-то время работала нормально (за исключением известной проблемы с генерацией множества сессий после изменений формы заявки). Но после того, как я переустановил на сервере яву и службу сервера HPOVSD, СД зависло пока только один раз несколько недель назад и с той поры ведёт себя спокойно. Вроде бы. |
Понятно, у нас это называется отыскать точку изменения, как одно из решений могу посоветовать поставить систему на детализированный визуальный мониторинг.
Если проблема еще остается актуально, контролировать лучше Online, SQL, APP, прикладную архитектуру.
Перезапуск служб системы нужно поставить на ежедневный перезапуск, один раз в сутки. Сам Up-time сервера можно постепенно увеличить, доведя время до одного месяца.
По блоку изменений могу сказать в общем, мы применяем практику внесения изменений через блок «Изменения», каждое изменение архитектуры, правил, форм, вносится точка изменения. Сейчас планируем постепенно прийти к точке пакетных изменений, собирать изменения за неделю и обновлять продуктивный сервер один раз в неделю (пакетом).
Еще в практику мы сделали свой мониторинг системы, берется чистая БД, берется лог файл, из него берем проблемные точки, и записываем их в базу. Далее берем highcharts и стром живой график нагрузки системы или выводим ошибки, блокировки, кол.лицензий. И в момент сбоя смотрим в графиках на все ключевые показатели системы. Тогда выявить проблему становиться гораздо легче, скажем утечка памяти сразу будет видна в графике. Либо иная проблема, в любом случае визуально контролировать сервера проще, т.к. всегда можно отмотать все показатели на проблемное время.