Skip to content

[Alibaba:K8sCluster] Specific RootDiskType in assets/cloudspec.csv #1985

@sykim-etri

Description

@sykim-etri

alibaba cloud를 대상으로 K8sCluster 생성 후 K8sNodeGroup 생성시 오류가 발생하였고 CB-SP의 상세 로그를 보면 다음과 같습니다.

[CB-SPIDER].[ERROR]: 2025-04-01 15:14:40 ClusterHandler.go:496, github.com/cloud-barista/cb-spider/cloud-control-manager/cloud-driver/drivers/alibaba/resources.(*AlibabaClusterHandler).AddNodeGroup() - Failed to Add NodeGroup: SDKError:
   StatusCode: 400
   Code: InvalidSystemDisk.Category.NotSupport
   Message: code: 400, System disk category  is not supported request id: <nil>
   Data: {"code":"InvalidSystemDisk.Category.NotSupport","message":"System disk category  is not supported","statusCode":400}
 
[CB-SPIDER].[ERROR]: 2025-04-01 15:14:40 ClusterManager.go:1218, github.com/cloud-barista/cb-spider/api-runtime/common-runtime.AddNodeGroup() - Failed to Add NodeGroup: SDKError:
   StatusCode: 400
   Code: InvalidSystemDisk.Category.NotSupport
   Message: code: 400, System disk category  is not supported request id: <nil>
   Data: {"code":"InvalidSystemDisk.Category.NotSupport","message":"System disk category  is not supported","statusCode":400}

k8sNodeGroupDynamic API의 k8sNodeGroupDynamicReq Body는 다음과 같습니다.

{
  "commonImage": "alibaba+ap-northeast-2+alibabacloudlinux3.2104",
  "commonSpec": "alibaba+ap-northeast-2+ecs.g6e.xlarge",
  "name": "k8sng02"
}

상기 k8sNodeGroupDynamicReq Body를 아래와 같이 변경하면 오류가 발생되지 않습니다.

{
  "commonImage": "alibaba+ap-northeast-2+alibabacloudlinux3.2104",
  "commonSpec": "alibaba+ap-northeast-2+ecs.g6e.xlarge",
  "RootDiskType": "cloud_efficiency",
  "RootDiskSize": "40",
  "name": "k8sng02"
}

대략적인 원인으로 추정해보면 assets/cloudspec.csv에 기재된 ALIBABA의 대부분의 Spec에 대한 rootDiskType이 cloud_essd로 지정되어 있고, 이를 기본값으로 CB-SP로 요청하고 있어서 그런 것으로 생각됩니다.

providerName,regionName,cspSpecName,costPerHour,evaluationScore01,evaluationScore02,evaluationScore03,evaluationScore04,evaluationScore05,evaluationScore06,evaluationScore07,evaluationScore08,evaluationScore09,evaluationScore10,rootDiskType,rootDiskSize,acceleratorType,acceleratorModel,acceleratorCount,acceleratorMemoryGB,description,infraType
ALIBABA,ap-northeast-2,ecs.g6e.large,0.12122,78.43,,,,,,,,,,cloud_essd,40,,,,,,vm

시험한 값으로 설정했다고 하더라도 CSP의 리전별로 지원하는 rootDiskType이 변경되면 항시 발생할 수 있는 문제일 수도 있겠습니다.

해당 값을 default 등(GPU 사용의 경우 default로 설정되어 있음)으로 설정하여 CB-SP 드라이버에서 이에 대한 처리가 가능하도록 유도하는 것도 대안이 될 수 있을 것 같습니다.

AlibabaCloud의 API문서 상 default 값이 설정되어 있긴 한데, 미설정시 해당 default 값으로 진행되는지는 추가 확인이 필요한 상황입니다.(CreateClusterNodePool, CreateInstance)

@seokho-son @powerkimhub @hanizang77

Metadata

Metadata

Assignees

No one assigned

    Labels

    bugSomething isn't working

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions