По какой-то причине после ребута моей виртуалки CentOS7 со стороны платформы виртуализации FirstVDS критичные службы (apache/httpd, firewall-cmd/firewalld, недозапуск systemd) автоматически могут не завестись. При этом при ребуте виртуалки вручную из консоли или через web-интерфейс управления все ок.
~$ uptime 14:42:50 up 4:59, 1 user, load average: 0.00, 0.01, 0.05 ~$ pstree systemd─┬─NetworkManager───2*[{NetworkManager}] ├─agetty ├─auditd───{auditd} ├─crond ├─dbus-daemon ├─mysqld_safe───mysqld───21*[{mysqld}] ├─rsyslogd───{rsyslogd} ├─sshd───sshd───sshd───bash───pstree ├─systemd-journal ├─systemd-logind └─systemd-udevd Вариант 1 light ;) ~$ sudo service httpd status Redirecting to /bin/systemctl status httpd.service ● httpd.service - The Apache HTTP Server Loaded: loaded (/usr/lib/systemd/system/httpd.service; enabled; vendor preset: disabled) Active: failed (Result: signal) since Sun 2016-09-04 12:07:50 MSK; 1h 49min ago Docs: man:httpd(8) man:apachectl(8) Process: 670 ExecStart=/usr/sbin/httpd $OPTIONS -DFOREGROUND (code=killed, signal=KILL) Main PID: 670 (code=killed, signal=KILL) Status: "Total requests: 0; Current requests/sec: 0; Current traffic: 0 B/sec" Sep 04 12:04:53 weril.me systemd[1]: Starting The Apache HTTP Server... Sep 04 12:06:20 weril.me systemd[1]: httpd.service start operation timed out. Terminating. Sep 04 12:07:50 weril.me systemd[1]: httpd.service stop-final-sigterm timed out. Killing. Sep 04 12:07:50 weril.me systemd[1]: httpd.service: main process exited, code=killed, status=9/KILL Sep 04 12:07:50 weril.me systemd[1]: Failed to start The Apache HTTP Server. Sep 04 12:07:50 weril.me systemd[1]: Unit httpd.service entered failed state. Sep 04 12:07:50 weril.me systemd[1]: httpd.service failed. Вариант 2 hard ;) ~$ systemctl status firewall-cmd Failed to get properties: Activation of org.freedesktop.systemd1 timed out
В таких случаях помогает рестарт конкретных служб или полная перезагрузка сервера.
~$ sudo reboot ~$ sudo service httpd restart ~$ pstree systemd─┬─NetworkManager───2*[{NetworkManager}] ├─agetty ├─auditd───{auditd} ├─crond ├─dbus-daemon ├─firewalld───{firewalld} ├─httpd───5*[httpd] ├─master─┬─pickup │ └─qmgr ├─mysqld_safe───mysqld───21*[{mysqld}] ├─polkitd───5*[{polkitd}] ├─rsyslogd───{rsyslogd} ├─sshd───sshd───sshd───bash───pstree ├─systemd-journal ├─systemd-logind ├─systemd-udevd ├─tuned───4*[{tuned}] └─wpa_supplicant
Недозапуск firewalld это вообще опасная тема т.к. после этого порт MySQL БД становится доступен снаружи. Конечно, учетки там нету под что-то отличное от 127.0.0.1, но лучше, когда БД закрыта еще на уровне сети для внешнего мира.
~$ nmap 80.87.194.88 Starting Nmap 6.40 ( http://nmap.org ) at 2016-10-19 23:08 MSK Nmap scan report for weril.me (80.87.194.88) Host is up (0.0024s latency). Not shown: 996 closed ports PORT STATE SERVICE 80/tcp open http 443/tcp open https 3306/tcp open mysql 49152/tcp filtered unknown mysql> SELECT User,Host FROM mysql.user; +-----------+-----------+ | User | Host | +-----------+-----------+ | root | 127.0.0.1 | | root | ::1 | | root | localhost | | wordpress | localhost | +-----------+-----------+ 4 rows in set (0.00 sec)
Самое интересное. Обратился в ТП FirstVDS.
Что понравилось:
- отвечают очень быстро
- проблему подтвердили
Не понравилось:
- просили root пароль + порт для доступа по SSH к VDS. Неужели нет никакой эмуляции терминала со стороны хост-машины? Это KVM вообще или что?
- получил комментарий что все так и должно быть – были проблемы на родительской “ноде”, ее перезагружали и поэтому перезагружались виртуалки. Делать что-то для избежания подобных ситуаций, судя по переписке, не собираются – вы сами отвечаете за корректный запуск служб в своих контейнерах. Аргумент, что все службы настроены корректно и перезапускаются в стандартных ситуациях перезагрузки нормально, видимо, им недостаточен. Так же аргументы в молоко что проблема уже далеко не в первый раз и они должны после своих работ минимизировать вероятность таких случаев.
- пытались впарить облачный VDS, который стоит в 6 раз дороже базового VDS, которым я пользуюсь, и по сути никак ситуацию не улучшит т.к. проблема ПОСЛЕ плановых работ и наталкивался я на нее тоже всегда после них, а не во время.
- порекомендовали сделать мониторинг служб и их авто-рестарт. В целом это правильно и я это сделаю, но учитывая что ВСЕ рестарты которые я делал до этого из-за глюков после ребута сервера – это как будто меня взяли в штат FirstVDS и я чиню, да еще и через костыль, их баги с недозагрузкой. Издевательство.
В целом остались негативные впечатления после общения с ТП. Подумаю насчет переезда как деньги закончатся.
UPD: багу порешали, продолжаю пользоваться FirstVDS, тут подробнее.