咨询关于分布式AI任务


(youmin) #1

大佬好!有时候我希望通过自定义运行模块,跑2个远程任务,当我开始跑之后,可以关闭网页/电脑吗?
目前我自己测试的是开着策略页面的时候它会再跑,但是关机之后,隔段时间再打开,它还是会出现关闭网页之前的日志,并没有新日志,策略状态也处于停止或者假死状态,需要通过重启内核才能重新开始跑。
是我使用方法出问题了吗?还是分布式AI任务必须要开着浏览器窗口?


(adhaha111) #2

您好,您关闭浏览器后,它是会接着跑的,模型等都会进行训练,但前端的日志等是不会进行更新的,建议您开着浏览器观察其进度,也可以将各个进度保存到文件中


(youmin) #3

那比如我跑了一个预期要一天的,我得开着电脑?有时候得伶着电脑到处跑,肯定要睡眠模式的。
重开网页后,如何判断这个分布式任务是否远程跑完了?直接去read自定义运行模块的results吗?


(adhaha111) #4

对的,您可以运行后关闭浏览器,重开网页后再去读相应模块的结果就行


(youmin) #5

谢谢谢谢