Недозапуск apache (Active: failed), firewalld и других служб на VDS сервере FirstVDS

По какой-то причине после ребута моей виртуалки CentOS7 со стороны платформы виртуализации FirstVDS критичные службы (apache/httpd, firewall-cmd/firewalld, недозапуск systemd) автоматически могут не завестись. При этом при ребуте виртуалки вручную из консоли или через web-интерфейс управления все ок.

~$ uptime 
14:42:50 up 4:59, 1 user, load average: 0.00, 0.01, 0.05 

~$ pstree 
systemd─┬─NetworkManager───2*[{NetworkManager}] 
├─agetty 
├─auditd───{auditd} 
├─crond 
├─dbus-daemon 
├─mysqld_safe───mysqld───21*[{mysqld}] 
├─rsyslogd───{rsyslogd} 
├─sshd───sshd───sshd───bash───pstree 
├─systemd-journal 
├─systemd-logind 
└─systemd-udevd

Вариант 1 light ;)
~$ sudo service httpd status
Redirecting to /bin/systemctl status httpd.service
● httpd.service - The Apache HTTP Server
 Loaded: loaded (/usr/lib/systemd/system/httpd.service; enabled; vendor preset: disabled)
 Active: failed (Result: signal) since Sun 2016-09-04 12:07:50 MSK; 1h 49min ago
 Docs: man:httpd(8)
 man:apachectl(8)
 Process: 670 ExecStart=/usr/sbin/httpd $OPTIONS -DFOREGROUND (code=killed, signal=KILL)
 Main PID: 670 (code=killed, signal=KILL)
 Status: "Total requests: 0; Current requests/sec: 0; Current traffic: 0 B/sec"

Sep 04 12:04:53 weril.me systemd[1]: Starting The Apache HTTP Server...
Sep 04 12:06:20 weril.me systemd[1]: httpd.service start operation timed out. Terminating.
Sep 04 12:07:50 weril.me systemd[1]: httpd.service stop-final-sigterm timed out. Killing.
Sep 04 12:07:50 weril.me systemd[1]: httpd.service: main process exited, code=killed, status=9/KILL
Sep 04 12:07:50 weril.me systemd[1]: Failed to start The Apache HTTP Server.
Sep 04 12:07:50 weril.me systemd[1]: Unit httpd.service entered failed state.
Sep 04 12:07:50 weril.me systemd[1]: httpd.service failed.

Вариант 2 hard ;)
~$ systemctl status firewall-cmd
Failed to get properties: Activation of org.freedesktop.systemd1 timed out

В таких случаях помогает рестарт конкретных служб или полная перезагрузка сервера.

~$ sudo reboot
~$ sudo service httpd restart

~$ pstree 
systemd─┬─NetworkManager───2*[{NetworkManager}] 
├─agetty 
├─auditd───{auditd} 
├─crond 
├─dbus-daemon 
├─firewalld───{firewalld} 
├─httpd───5*[httpd] 
├─master─┬─pickup 
│ └─qmgr 
├─mysqld_safe───mysqld───21*[{mysqld}] 
├─polkitd───5*[{polkitd}] 
├─rsyslogd───{rsyslogd} 
├─sshd───sshd───sshd───bash───pstree 
├─systemd-journal 
├─systemd-logind 
├─systemd-udevd 
├─tuned───4*[{tuned}] 
└─wpa_supplicant 

Недозапуск firewalld это вообще опасная тема т.к. после этого порт MySQL БД становится доступен снаружи. Конечно, учетки там нету под что-то отличное от 127.0.0.1, но лучше, когда БД закрыта еще на уровне сети для внешнего мира.

~$ nmap 80.87.194.88
Starting Nmap 6.40 ( http://nmap.org ) at 2016-10-19 23:08 MSK
Nmap scan report for weril.me (80.87.194.88)
Host is up (0.0024s latency).
Not shown: 996 closed ports
PORT      STATE    SERVICE
80/tcp    open     http
443/tcp   open     https
3306/tcp  open     mysql
49152/tcp filtered unknown

mysql> SELECT User,Host FROM mysql.user;
+-----------+-----------+
| User | Host |
+-----------+-----------+
| root | 127.0.0.1 |
| root | ::1 |
| root | localhost |
| wordpress | localhost |
+-----------+-----------+
4 rows in set (0.00 sec)

Самое интересное. Обратился в ТП FirstVDS.

Что понравилось:

  • отвечают очень быстро
  • проблему подтвердили

Не понравилось:

  • просили root пароль + порт для доступа по SSH к VDS. Неужели нет никакой эмуляции терминала со стороны хост-машины? Это KVM вообще или что?
  • получил комментарий что все так и должно быть – были проблемы на родительской “ноде”, ее перезагружали и поэтому перезагружались виртуалки. Делать что-то для избежания подобных ситуаций, судя по переписке, не собираются – вы сами отвечаете за корректный запуск служб в своих контейнерах. Аргумент, что все службы настроены корректно и перезапускаются в стандартных ситуациях перезагрузки нормально, видимо, им недостаточен. Так же аргументы в молоко что проблема уже далеко не в первый раз и они должны после своих работ минимизировать вероятность таких случаев.
  • пытались впарить облачный VDS, который стоит в 6 раз дороже базового VDS, которым я пользуюсь, и по сути никак ситуацию не улучшит т.к. проблема ПОСЛЕ плановых работ и наталкивался я на нее тоже всегда после них, а не во время.
  • порекомендовали сделать мониторинг служб и их авто-рестарт. В целом это правильно и я это сделаю, но учитывая что ВСЕ рестарты которые я делал до этого из-за глюков после ребута сервера – это как будто меня взяли в штат FirstVDS и я чиню, да еще и через костыль, их баги с недозагрузкой. Издевательство.

В целом остались негативные впечатления после общения с ТП. Подумаю насчет переезда как деньги закончатся.

 

UPD: багу порешали, продолжаю пользоваться FirstVDS, тут подробнее.

Leave a Reply