-
Notifications
You must be signed in to change notification settings - Fork 557
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Euler2.0分布式训练遇到的问题 #295
Comments
|
比如对于这个cora的数据集,在启动分布式训练的时候,zk_addr,zk_path,应该怎么填呢?因为以前没有部署过分布式训练的东西,想学习一下,是否可以提供一个完整的例子呢? |
具体参考一下zk的文档,需要启动zk,euler需要启动的zk_addr 和 一个指定的zk_path |
好的,我查一下,谢谢了 |
你的第二个问题是要把一个json文件切分成多个json文件,还是要切分成多个二进制文件? |
把一个文件,切分成多个二进制文件
把一个文件切分成多个二进制文件 |
那分布式的时候怎样保证哪些服务器处理那些二进制数据文件? |
取模 |
我使用cora的数据,在单机上跑通了graphsage模型。
使用中间生成的json文件(convert_data.json),执行了下面的命令
sh gen_partitioned_data.sh ./cora/convert_data.json ./cora/meta ./temp/ 2 0
请问
1、 这里的meta文件是在起什么作用?因为我看在cora的处理中,meta是空的。
2、在只有一个json文件的时候,执行这一个命令是否就可以把数据分成了2两个part
3、在接下来启动分布式训练的时候,zk_addr,zk_path,module,应该怎么填呢?分别起了什么样的作用。
The text was updated successfully, but these errors were encountered: