Bug #2722
SHL15 C3电力FEPwin91.5-6和atsFEPwin91.7-8专项主备测试均发现1#机强抢主机的问题--据说是设计漏洞--又叠加win系统socket建立慢--所以出现概率较高
0%
Description
电力FEPwin3.0.1(10.43/44.91.5-6)和atsFEPwin3.0.1(10.43/44.91.7-8)
停1#机,2#机变为主==正确
1#机起来后,会强抢2#机的主,2#机会被剔出变成备机,1#机变为主机;==XXX错误,应该保持2#机为主不动,1#机成为备机
例如:电力2#机10.43.91.6的log目录下的smart.log.8显示20221121 0:24:25 2#机变为主
smart.log.3 显示20221121 0:25:51 1#机变为主,2#机被提出成为备机
History
Updated by yufeng wu about 2 years ago
20221121现场拿回的4台机器FEP环境日志:
\\192.168.2.250\upload\M15\0备份\15FEPbak20221121
Updated by yufeng wu about 2 years ago
91.6log
1)20221121 0:24:25 停1#机,此时2#机变为主OK
2)20221121 0:25:51 1#机启动,强抢变为主,2#机被成为备机(WARN - 存在多个主机,本机切换为备机)
3)20221121 0:26:49 2#机重启主程序,0:27:24 INFO - 连接伙伴机[10.43.91.5] 成功,但2#机自己还作为主机继续运行,且00:27:26 - INFO - 组装 DI数据 num=2048......自己组装向自认为的“1#备机”发同步数据
同时,2022-11-21 00:27:34 - ERROR - 本机为主机,接收到数据!数据丢弃
2022-11-21 00:27:34 - WARN - 存在多个主机,本机切换为备机
跑一段后降级成为备机
现场100%问题必现,公司单网测试,偶尔复现出。
关注点:
1)主备机新的审核策论设计审查
2)debian系统下的FEP程序是否也有同样问题
3)主机定期向备机的3000端口握手成功后,就立即发同步数据策略设计,是否有漏洞审查
Updated by yufeng wu about 2 years ago
- Subject changed from SHL15 C3电力FEPwin91.5-6和atsFEPwin91.7-8专项主备测试均发现1#机强抢主机的问题 to SHL15 C3电力FEPwin91.5-6和atsFEPwin91.7-8专项主备测试均发现1#机强抢主机的问题--据说是设计漏洞--又叠加win系统socket建立慢--所以出现概率较高
Updated by yufeng wu over 1 year ago
- Status changed from New to Resolved
3.0.5解决抢主问题
上海15#线91.5-6和91.7-8已上线投用