基于百卡集群的功能验证与性能分析 验证平台对百卡规模集群的完整支撑能力 精准捕捉 AI 训练负载下的网络性能瓶颈 输出可量化的性能数据,为架构优化提供依据
硬件模拟:400Gbps 高速链路,传输延迟 250ns 队列配置:TxBuffer Intra/Inter 队列容量 5000 包 负载条件:单 Card 发送 29,168 个 flow,模拟 GPT/LLAMA 模型 TP/DP 并行训练流量
| Name | Name | Last commit date | ||
|---|---|---|---|---|
基于百卡集群的功能验证与性能分析 验证平台对百卡规模集群的完整支撑能力 精准捕捉 AI 训练负载下的网络性能瓶颈 输出可量化的性能数据,为架构优化提供依据
硬件模拟:400Gbps 高速链路,传输延迟 250ns 队列配置:TxBuffer Intra/Inter 队列容量 5000 包 负载条件:单 Card 发送 29,168 个 flow,模拟 GPT/LLAMA 模型 TP/DP 并行训练流量