问答交流

关于使用集群或者单机高并发加速超参搜索的问题

由niitsune创建,最终由small_q 被浏览 19 用户

更新:

将作业分布式运行参数设置为False,CPU占用率有相当明显的上升,并且能够设置比较大的并发作业数。猜测作业分布式运行参数说明中的“集群”为某个官方集群,勾选该选项,可能是将作业托管至某个官方集群中运行,高级AI任务位也是指的该集群托管作业的并发数(虽然买了也没给我开通并发作业权限,能退钱嘛?)。






原问题

1.超参搜索模块:

Q1:使用K0 1C/6G和K4 32C/64G环境资源在默认参数设置下,后者并没有明显的加速效果,检查CPU占用率发现几乎没有占用。该如何充分利用单机CPU性能?

Q2: 我购买高级AI任务位,并且多次重启开发环境。运行超参模块时,依旧提示我只有1个任务位,要求购买资源。

Q3:在该模块的传参下,有作业分布式运行的参数。该如何使用FAI集群去加速超参搜索?

2.自动超参搜索模块:

Q1:运行在单机模式下,依旧提示需要传入Faas集群ID。而且在bigquant上并没有找到有关Faas集群的文档,尝试传入FAI集群的token,提示ID 不正确



\