问题可能已经解决,是一个很老的bug,太长不读 TL;DR,看这里,8168网卡装了8169驱动会不稳定:
https://docs.hetzner.com/robot/dedicated-server/operating-systems/realtek-r8169-r8168-nic/
https://bbs.archlinux.org/viewtopic.php?id=242325
如题,你们的机器会遇到么,持续跑满1g上行带宽,大概三小时到三天之后会随机死机,顺便可能会出个加拿大 ks-le-1 960g*2 1g ipv6 上行,无ECC,无ipmi,可以面板安装Windows再自行激活,硬件都没问题,可能网卡有问题,也可能是我不会用。暂时还没决定。续费到2月一号了。 push出,ie区账号,不包账号。
暂停出,我又要折腾一会了,不跑满上行不会死机,剩余价值160,续费到了2月一号,溢价30,190出。其实可以确定很多KS机器都有问题的,只是他们没有跑满上行,只是按照OVH的标准,在救援模式下能跑过所有测试就不算有问题,实际上我windows烤鸡更靠谱,AIDA64全选烤鸡几小时都没问题
有大佬说估计是BIOS需要更正选项(可能是节能选项),还不确定,确定了我将具体的贴出来,注意了,不要自行更新BIOS,我才发现BIOS不知道哪次被机房的人刷回旧版的了... 顺便一说可以在Windows下更新BIOS,然后估计很大概率会卡住重启不了,要机房人员干预,大概耗时半小时到一两小时(看运气),方法是下载AI SUITE II,兼容模式安装,然后跑asus update,是更新BIOS的
AI suite 链接https://dlcdnets.asus.com/pub/ASUS/misc/utils/AI_SuiteII_Win8-1_VER20012_VER10512.zip
190是目前的底价,没人要我就跑会BT...暂停出,我要折腾一会
官方认定硬件是否有故障的方法:
https://www.infski.com/455.html
https://docs.ovh.com/gb/en/dedicated/ovh-rescue/
BIOS已经更新到最新(又被机房的人刷回去了),除了ipv6上行带宽,具体测试可以参考:
https://hostloc.com/thread-1101968-1-1.html
lspci | grep Eth
03:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 09)
# ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## #
Thu 15 Dec 2022 12:17:08 PM UTC
Basic System Information:
---------------------------------
Uptime : 0 days, 20 hours, 43 minutes
Processor: Intel(R) Xeon(R) CPU E3-1245 V2 @ 3.40GHz
CPU cores: 4 @ 2381.219 MHz
AES-NI : ✔ Enabled
VM-x/AMD-V : ✔ Enabled
RAM : 31.1 GiB
Swap : 1024.0 MiB
Disk : 1.7 TiB
Distro : Debian GNU/Linux 11 (bullseye)
Kernel : 5.10.0-19-amd64
fio Disk Speed Tests (Mixed R/W 50/50):
---------------------------------
Block Size | 4k (IOPS) | 64k (IOPS)
------ | --- ----| ---- ----
Read | 284.21 MB/s(71.0k) | 423.58 MB/s (6.6k)
Write | 284.96 MB/s(71.2k) | 425.81 MB/s (6.6k)
Total | 569.18 MB/s (142.2k) | 849.39 MB/s(13.2k)
| |
Block Size | 512k (IOPS) | 1m (IOPS)
------ | --- ----| ---- ----
Read | 408.16 MB/s (797) | 396.01 MB/s (386)
Write | 429.85 MB/s (839) | 422.38 MB/s (412)
Total | 838.02 MB/s (1.6k) | 818.40 MB/s (798)
iperf3 Network Speed Tests (IPv4):
---------------------------------
Provider | Location (Link) | Send Speed | Recv Speed | Ping
----- | ----- | ---- | ---- | ----
Clouvider | London, UK (10G) | 90.7 Mbits/sec| 151 Mbits/sec | 76.5 ms
Scaleway | Paris, FR (10G) | 91.2 Mbits/sec| 90.3 Mbits/sec| 83.5 ms
NovoServe | North Holland, NL (40G) | 90.4 Mbits/sec| 607 Mbits/sec | 82.8 ms
Uztelecom | Tashkent, UZ (10G) | 83.9 Mbits/sec| 83.3 Mbits/sec| 188 ms
Clouvider | NYC, NY, US (10G) | 95.2 Mbits/sec| 461 Mbits/sec | 8.23 ms
Clouvider | Dallas, TX, US (10G) | 93.7 Mbits/sec| 252 Mbits/sec | 40.9 ms
Clouvider | Los Angeles, CA, US (10G) | 91.5 Mbits/sec| 67.4 Mbits/sec| 69.3 ms
iperf3 Network Speed Tests (IPv6):
---------------------------------
Provider | Location (Link) | Send Speed | Recv Speed | Ping
----- | ----- | ---- | ---- | ----
Clouvider | London, UK (10G) | 824 Mbits/sec | 212 Mbits/sec | 76.5 ms
Scaleway | Paris, FR (10G) | 859 Mbits/sec | 202 Mbits/sec | 83.4 ms
NovoServe | North Holland, NL (40G) | 785 Mbits/sec | 612 Mbits/sec | 82.8 ms
Uztelecom | Tashkent, UZ (10G) | 694 Mbits/sec | 247 Mbits/sec | 188 ms
Clouvider | NYC, NY, US (10G) | 921 Mbits/sec | busy | 8.42 ms
Clouvider | Dallas, TX, US (10G) | 907 Mbits/sec | 277 Mbits/sec | 40.9 ms
Clouvider | Los Angeles, CA, US (10G) | 870 Mbits/sec | 81.9 Mbits/sec| 69.2 ms
# dmidecode 3.3
Getting SMBIOS data from sysfs.
SMBIOS 2.7 present.
Handle 0x0002, DMI type 2, 15 bytes
Base Board Information
Manufacturer: ASUSTeK COMPUTER INC.
Product Name: P8H77-M
Version: Rev X.0x
Serial Number: xxxxxx
Asset Tag: To be filled by O.E.M.
Features:
Board is a hosting board
Board is replaceable
Location In Chassis: To be filled by O.E.M.
Chassis Handle: 0x0003
Type: Motherboard
Contained Object Handles: 0
热议
推荐楼 招财猫 3天前
9快9包邮的话 我排个队
推荐楼 oldpoor 昨天10:53
草,我昨天测试了一下。发现我加拿大ks-le-1也有这个问题...
网络占用多时间长也会死机,挂pt qt跑上传。 ...
我试了一下,Windows长时间跑满网络也会死机,实在是...服了,我再找找客服,快找客服,别便宜了他们,整天跑满就死机
有空看看你的主板和BIOS?具体方法我主贴里面好像有
和Linux一样,没什么奇怪的log,他就是死,看来也不是Linux的驱动或者系统问题
推荐楼 weiai 前天10:45
谢谢指导,老板大气,你不说我实在是想不到!我实在没想到是这个问题,我还特意更新了BIOS ...
之前处理的tk:
peration details:
The server is frozen and doesn't responds to ping requests.
We have rebooted the server.
We also applied a fix in your BIOS that should prevent random freezes.
The server is booted on disk and is on the login screen. Ping OK and services are up.
If you need any further information regarding this intervention, please do not hesitate to contact our technical support.
The OVHcloud Team
推荐楼 weiai 前天10:28
我跟你说为啥,你让他们把bios设置下节能模式关了,就行了
推荐楼 0.0 3天前
同出一台, lz优先
3楼 jamesbond 3天前
能push的话我排个队
5楼 oldpoor 3天前
9快9包邮的话 我排个队
排上了,你在队尾,能push,60s一个帖子,懒得回复两个了
6楼 oldpoor 3天前
更新了主板信息 有兴趣的可以看看你们的主板
7楼 oldpoor 前天00:11
睡前顶一顶
8楼 coxpc 前天08:02
去救援模式跑个测试呗,参考:https://www.infski.com/455.html
如果硬件出问题发工单让他们给你换硬件。
9楼 oldpoor 前天09:35
去救援模式跑个测试呗,参考:https://www.infski.com/455.html
如果硬件出问题发工单让他们给你换硬件。 ...
硬件都没问题,只是跑满上行三小时到三天后会随机死机,可见不止这台有问题的,因为他们的都跑不了1g上行 OVH不会换的,他说他不换
Kindly note, we don't have the ability to access your Dedicated Server directly and in any case would not be allowed to. You may consider contacting an OVH partner for support using the following link for further asisstance:
https://partner.ovhcloud.com/en-gb/programs/
10楼 小刀 前天10:00
请问后台安装win,是自己添加 lincence,添加模板吗
12楼 ziyo 前天10:08
oldpoor 发表于 2022-12-16 09:35
硬件都没问题,只是跑满上行三小时到三天后会随机死机,可见不止这台有问题的,因为他们的都跑不了1g上行 ...
我的是刷pt跑几分钟就赖邮件说故障了,然后机房检查没啥问题,重启一下完事….然后重复跑pt重复故障…
13楼 oldpoor 前天10:14
我之前有个ks和你一样,网络占用多之后就间断性死机,只能硬重启。跑救援模式测试测出来是cpu有问题,发 ...
我的救援模式烤鸡没问题,Windows下烤鸡几个钟也没问题,他救援模式就烤鸡cpu半小时,反正他的机器... 比online灵车,比hetzner灵车,online和hz我都没试过抽中坏机器,虽然hz也用华硕hhh
14楼 coxpc 前天10:15
我的救援模式烤鸡没问题,Windows下烤鸡几个钟也没问题,他救援模式就烤鸡cpu半小时,反正他的机器... 比 ...
那可能是真倒霉 祝早出
15楼 oldpoor 前天10:15
我的是刷pt跑几分钟就赖邮件说故障了,然后机房检查没啥问题,重启一下完事….然后重复跑pt重复故障… ...
快看看你的主板是什么主板哈哈哈,对了,有时候没死机,假如你开了监控,他ping不通你的ipv4(带宽跑满了),他也会以为你机器出问题了,然后机房的人kvm连接鼠标键盘过来看看机器还有没有活着,做个记录,然后活着就软重启,死了就硬重启,我都已经熟了
16楼 coxpc 前天10:17
我的是刷pt跑几分钟就赖邮件说故障了,然后机房检查没啥问题,重启一下完事….然后重复跑pt重复故障… ...
你这种可以去面板把监控关了,或者选择不干预
17楼 oldpoor 前天10:20
请问后台安装win,是自己添加 lincence,添加模板吗
好累,等等再说,卡60s了,我休息一下再回你
https://www.有图比.com/watch?v=J5hPEHk8O-Q&t=77s
操作流程和这个视频几乎一样,只是界面不同
18楼 oldpoor 前天10:21
你这种可以去面板把监控关了,或者选择不干预
是的,早就关了干预,他的判断并不准确
19楼 weiai 前天10:28
我跟你说为啥,你让他们把bios设置下节能模式关了,就行了
20楼 oldpoor 前天10:31
我跟你说为啥,你让他们把bios设置下节能模式关了,就行了
居然还有这样的!我去让他弄一下,折腾死我了,为了替换这个机器,我又搞了其他机器,现在是一团糟,谢谢大佬指教!是BIOS哪里的节能模式,我正在翻说明书!
22楼 oldpoor 前天10:43
你的看着和我的症状是一样,烤鸡 和压榨性能都不会死机,就是空闲跑网络就G了
你就说 不定时死机,让处 ...
谢谢指导,老板大气,你不说我实在是想不到!我实在没想到是这个问题,我还特意更新了BIOS
23楼 weiai 前天10:45
谢谢指导,老板大气,你不说我实在是想不到!我实在没想到是这个问题,我还特意更新了BIOS ...
之前处理的tk:
peration details:
The server is frozen and doesn't responds to ping requests.
We have rebooted the server.
We also applied a fix in your BIOS that should prevent random freezes.
The server is booted on disk and is on the login screen. Ping OK and services are up.
If you need any further information regarding this intervention, please do not hesitate to contact our technical support.
The OVHcloud Team
24楼 小刀 前天10:49
好累,等等再说,卡60s了,我休息一下再回你
https://www.有图比.com/watch?v=J5hPEHk8O-Q&t=77s
操作流 ...
感谢,祝早出
25楼 coxpc 前天10:53
谢谢指导,老板大气,你不说我实在是想不到!我实在没想到是这个问题,我还特意更新了BIOS ...
蹲个后续。
我也没往这方面想,玩机玩少了,比不上大佬
26楼 oldpoor 前天10:55
蹲个后续。
我也没往这方面想,玩机玩少了,比不上大佬
确实比不上,我也在学习,实在没想到这个问题,我找到BIOS选项了,等等贴出来
27楼 oldpoor 前天11:11
之前处理的tk:
peration details:
嗯,谢谢分享,我怀疑是这个选项,我先让OVH那边自己看看吧
2.4.3 EPU Power Saving Mode [Disabled]本項目用來開啟或關閉 EPU 省電功能。設置值有:[Disabled] [Enabled]EPU Setting [Auto]本項目只有在您將【EPU Power Saving Mode】項目設置為 [Enabled] 時才會
出現,用來選擇 EPU 省電模式。設置值有:[Auto] [Light Power Saving Mode][Medium Power Saving Mode] [Max Power Saving Mode]
28楼 ziyo 前天11:57
coxpc 发表于 2022-12-16 10:17
你这种可以去面板把监控关了,或者选择不干预
哦?还能这样,应该就是他们检测ping有问题,所以去查看,然后给重启了…
29楼 ziyo 前天14:09
oldpoor 发表于 2022-12-16 10:15
快看看你的主板是什么主板哈哈哈,对了,有时候没死机,假如你开了监控,他ping不通你的ipv4(带宽跑满了 ...
这个应该就是破案关键,下载也好,上传也好,它检测不到了就给你去重启了…
30楼 oldpoor 前天20:31
蹲个后续。
我也没往这方面想,玩机玩少了,比不上大佬
不太行,不知道是不是加拿大的机房的人不太会,没帮我更新到BIOS,也没有帮我调整到BIOS选项,不过EPU默认确实是禁用的,不知道有没有其他节能选项,感觉凉凉
32楼 ziyo 前天21:54
改成你点评的“Enabled without proactive intervention”后你试过没?周日MT大包出来我试试看
33楼 oldpoor 前天22:15
改成你点评的“Enabled without proactive intervention”后你试过没?周日MT大包出来我试试看 ...
这个的意思是监控开启,但是不会主动干预你的机器,不会帮你重启
34楼 coxpc 昨天09:46
不太行,不知道是不是加拿大的机房的人不太会,没帮我更新到BIOS,也没有帮我调整到BIOS选项,不过EPU默 ...
草,我昨天测试了一下。发现我加拿大ks-le-1也有这个问题...
网络占用多时间长也会死机,挂pt qt跑上传。
35楼 0.0 昨天10:38
草,我昨天测试了一下。发现我加拿大ks-le-1也有这个问题...
网络占用多时间长也会死机,挂pt qt跑上传。 ...
大佬你是上传多久死机的? 我也测试一下, 刚挂上十多分钟
36楼 oldpoor 昨天10:53
草,我昨天测试了一下。发现我加拿大ks-le-1也有这个问题...
网络占用多时间长也会死机,挂pt qt跑上传。 ...
我试了一下,Windows长时间跑满网络也会死机,实在是...服了,我再找找客服,快找客服,别便宜了他们,整天跑满就死机
有空看看你的主板和BIOS?具体方法我主贴里面好像有
和Linux一样,没什么奇怪的log,他就是死,看来也不是Linux的驱动或者系统问题
37楼 0.0 昨天11:01
我试了一下,Windows长时间跑满网络也会死机,实在是...服了,我再找找客服,快找客服,别便宜了他们,整 ...
38楼 coxpc 昨天11:59
我试了一下,Windows长时间跑满网络也会死机,实在是...服了,我再找找客服,快找客服,别便宜了他们,整 ...
晚点我去救援模式跑iperf3看看,麻了
39楼 bingda733 昨天12:02
他死机不是bios的问题,是intel的82579v网卡驱动和linux内核冲突
可以试试
ethtool -K 网卡 tso off gso off
40楼 oldpoor 昨天12:09
他死机不是bios的问题,是intel的82579v网卡驱动和linux内核冲突
可以试试
ethtool -K 网卡 tso off gso of ...
回头试试,谢谢大佬指教,但是我Windows也会死机... 我的是华硕主板,realtek集成网卡,并不是Intel的,什么log也没有,和Linux下情况差不多。
42楼 WZ-Software 昨天12:26
续费啥价格啊
43楼 oldpoor 昨天12:28
windows可以电源模式设置成高性能试试
好,我试试!谢谢
44楼 oldpoor 昨天20:52
https://docs.hetzner.com/robot/dedicated-server/operating-systems/realtek-r8169-r8168-nic/
https://bbs.archlinux.org/viewtopic.php?id=242325
还不确定是否是这个问题,正在测试了 孩子们快来试试 @coxpc @0.0 还有谁我忘记了
45楼 0.0 昨天21:02
https://docs.hetzner.com/robot/dedicated-server/operating-systems/realtek-r8169-r8168-nic/
https://b ...
我中午那会满上行跑了2小时, 没出啥问题
46楼 coxpc 昨天21:38
https://docs.hetzner.com/robot/dedicated-server/operating-systems/realtek-r8169-r8168-nic/
https://b ...
我也跑了4个多小时的上行,救援模式下。之前好像是我瞎捯饬内核的缘故网络崩了,重装了一下ubuntu 20.04。暂时还没出问题。等下次万一间歇性发作我再试试看
47楼 oldpoor 1小时前
可能修好了,暂时结帖
48楼 coxpc 半小时前
可能修好了,暂时结帖
现在用的什么系统?参考一下
49楼 oldpoor 半小时前
现在用的什么系统?参考一下
用debian ubuntu arch的话,都一样的,用Windows,如楼上大佬所说的,开个高性能模式防止休眠,OVH机房的人也有说,我忘记了
申明:本文内容由网友收集分享,仅供学习参考使用。如文中内容侵犯到您的利益,请在文章下方留言,本站会第一时间进行处理。
评论前必须登录!
立即登录 注册