终于知道阿里云服务器突然重启的原因了

vps网友提供 09-14 讨论归档 62

我们在阿里云有 8 台 ECS

其中一些服务器 突然重启过, 这种事情一共有三次。

第一次 是去年十一假期, 当时服务器刚上线, 一些配置还没写入到 /etc/rc.local 中
如果服务器重启,那么我们的服务是没有自动启动的。

还好,当时旅游是 十月一号下午出去, 上午服务器重启了,用户反映无法登录。
最后及时把问题处理了。

后面 所有机器都配置了 /etc/rc.local , 重启也不怕了
但是 第二次,第三次重启 还是造成了 两分钟左右的服务不可用。

前几次都提过工单, 但是后面都不了了之。
昨晚这次重启, 又提交过一次工单

阿里云客服首先是 引导我去买他们的 SSD 云盘。

然后我把 syslog 给他们看,

他们终于说出了实情:

售后工程师 :您好,是由于物理机异常发生了宕机迁移操作导致的

真是蛋疼!!!

下个项目 还是上 ucloud 吧!

本文由 vps网友提供,转载请注明出处

本文链接: https://www.vpsvsvps.com/discuss/a/1676471698318168064.html

标签:
twl007
09-14

@yp2800 卧槽 这个问题还没解决啊! 我 11 年开始用的时候就有了 那时候扯皮工程师就说是我们的问题 问题我们程序屁都没动啊 为了这个问题车皮好久 经常莫名其妙的就 100% 根本找不到原因 但是说是阿里云的问题我们又不可能拿到物理机的证据 阿里云也不给 巨坑无比

xuhaoyangx
09-14

一直觉得阿里的不是云, qingcloud 的还不错,只不过青云的挂掉几率比阿里还高

9hills
09-14

@jianyunet 现在提供的云主机不都是 vps 么,宿主机挂了都是换台机器启动。

9hills
09-14

@chenshaoju 目前提供的公有云,私有云。纯粹的 VM 是没有不间断宕机迁移这个功能的。

你想想也不可能啊,磁盘可以用中心 or 分布式存储来保证一样。进程状态你总不能实时同步过去吧。。

只能在上层架构上做容错和冗余

9hills
09-14

@wzxjohn VMWare 的 HA 也不是对单个 VM 就能无间断中断。

它也是有多个 VM (一般 2 个),挂一个换台宿主机启动,只要不是全挂,就是 zero downtime

chenshaoju
09-14

@9hills 不知道

wzxjohn
09-14

@9hills VMWare ESXi 的 HA 就支持。

9hills
09-14

@chenshaoju 哪个云服务支持不间断宕机迁移?

xzchina
09-14

阿里云就是垃圾

leassy
09-14

楼主是在打广告吗
有需要的可以找我,天翼云 8 折
哈哈,逃~~~

chenshaoju
09-14

@jianyunet 不发表意见,我没用过阿里云的服务……

jianyunet
09-14

@chenshaoju 我感觉他家的 ecs 其实就是 vps ,不是单纯镜像

yexm0
09-14

目测阿里是堕落到跟搬瓦工比在线时间了

yp2800
09-14

据我使用经验,母机有时候监控突然物理机 cpu100%,有可能是超负荷了,或者多 cpu 之间有时负载不匀,导致虚拟机不响应,死掉了,如果对虚拟机状态有监控的话,一般会发现死机前系统运行的很稳定一个状态

zzxworld
09-14

用他家主要也就是为了备案方便。

knightdf
09-14

为啥不用 aws

chenshaoju
09-14

所以……这并不是什么云服务器,只是 VPS 而已?

cyl5753
09-14

ECS 的问题真是多啊,之前碰到 CPU 总是 100%的问题客服最终也没搞定。

lucifer9
09-14

三台恰好都在一个物理机上确实挺悲剧的

nonoroazoro
09-14

秒懂。