-
Notifications
You must be signed in to change notification settings - Fork 51
Description
alibaba cloud를 대상으로 K8sCluster 생성 후 K8sNodeGroup 생성시 오류가 발생하였고 CB-SP의 상세 로그를 보면 다음과 같습니다.
[CB-SPIDER].[ERROR]: 2025-04-01 15:14:40 ClusterHandler.go:496, github.com/cloud-barista/cb-spider/cloud-control-manager/cloud-driver/drivers/alibaba/resources.(*AlibabaClusterHandler).AddNodeGroup() - Failed to Add NodeGroup: SDKError:
StatusCode: 400
Code: InvalidSystemDisk.Category.NotSupport
Message: code: 400, System disk category is not supported request id: <nil>
Data: {"code":"InvalidSystemDisk.Category.NotSupport","message":"System disk category is not supported","statusCode":400}
[CB-SPIDER].[ERROR]: 2025-04-01 15:14:40 ClusterManager.go:1218, github.com/cloud-barista/cb-spider/api-runtime/common-runtime.AddNodeGroup() - Failed to Add NodeGroup: SDKError:
StatusCode: 400
Code: InvalidSystemDisk.Category.NotSupport
Message: code: 400, System disk category is not supported request id: <nil>
Data: {"code":"InvalidSystemDisk.Category.NotSupport","message":"System disk category is not supported","statusCode":400}
k8sNodeGroupDynamic API의 k8sNodeGroupDynamicReq Body는 다음과 같습니다.
{
"commonImage": "alibaba+ap-northeast-2+alibabacloudlinux3.2104",
"commonSpec": "alibaba+ap-northeast-2+ecs.g6e.xlarge",
"name": "k8sng02"
}
상기 k8sNodeGroupDynamicReq Body를 아래와 같이 변경하면 오류가 발생되지 않습니다.
{
"commonImage": "alibaba+ap-northeast-2+alibabacloudlinux3.2104",
"commonSpec": "alibaba+ap-northeast-2+ecs.g6e.xlarge",
"RootDiskType": "cloud_efficiency",
"RootDiskSize": "40",
"name": "k8sng02"
}
대략적인 원인으로 추정해보면 assets/cloudspec.csv
에 기재된 ALIBABA의 대부분의 Spec에 대한 rootDiskType이 cloud_essd
로 지정되어 있고, 이를 기본값으로 CB-SP로 요청하고 있어서 그런 것으로 생각됩니다.
cb-tumblebug/assets/cloudspec.csv
Lines 1 to 2 in e5648d3
providerName,regionName,cspSpecName,costPerHour,evaluationScore01,evaluationScore02,evaluationScore03,evaluationScore04,evaluationScore05,evaluationScore06,evaluationScore07,evaluationScore08,evaluationScore09,evaluationScore10,rootDiskType,rootDiskSize,acceleratorType,acceleratorModel,acceleratorCount,acceleratorMemoryGB,description,infraType | |
ALIBABA,ap-northeast-2,ecs.g6e.large,0.12122,78.43,,,,,,,,,,cloud_essd,40,,,,,,vm |
시험한 값으로 설정했다고 하더라도 CSP의 리전별로 지원하는 rootDiskType이 변경되면 항시 발생할 수 있는 문제일 수도 있겠습니다.
해당 값을 default 등(GPU 사용의 경우 default로 설정되어 있음)으로 설정하여 CB-SP 드라이버에서 이에 대한 처리가 가능하도록 유도하는 것도 대안이 될 수 있을 것 같습니다.
AlibabaCloud의 API문서 상 default 값이 설정되어 있긴 한데, 미설정시 해당 default 값으로 진행되는지는 추가 확인이 필요한 상황입니다.(CreateClusterNodePool, CreateInstance)