scaleway
diff --git a/‎go.mod
+1-1 b/‎go.mod
+1-1
diff --git a/‎go.sum
+2-2 b/‎go.sum
+2-2
diff --git a/‎internal/namespaces/get_commands.go
+2 b/‎internal/namespaces/get_commands.go
+2
diff --git a/‎internal/namespaces/llm_inference/v1beta1/custom.go
+22 b/‎internal/namespaces/llm_inference/v1beta1/custom.go
+22
diff --git a/‎internal/namespaces/llm_inference/v1beta1/custom_deployment.go
+169 b/‎internal/namespaces/llm_inference/v1beta1/custom_deployment.go
+169
diff --git a/‎internal/namespaces/llm_inference/v1beta1/custom_deployment_test.go
+54 b/‎internal/namespaces/llm_inference/v1beta1/custom_deployment_test.go
+54
diff --git a/‎internal/namespaces/llm_inference/v1beta1/custom_endpoint.go
+46 b/‎internal/namespaces/llm_inference/v1beta1/custom_endpoint.go
+46
diff --git a/‎internal/namespaces/llm_inference/v1beta1/custom_endpoint_test.go
+48 b/‎internal/namespaces/llm_inference/v1beta1/custom_endpoint_test.go
+48
@@ -24,7 +24,7 @@ require (
 	github.com/moby/buildkit v0.11.6
 	github.com/opencontainers/go-digest v1.0.0
 	github.com/pkg/errors v0.9.1
-	github.com/scaleway/scaleway-sdk-go v1.0.0-beta.25.0.20240328145934-63d5da1a64df
+	github.com/scaleway/scaleway-sdk-go v1.0.0-beta.25.0.20240329105646-c0ed2d3750f9
 	github.com/skratchdot/open-golang v0.0.0-20200116055534-eef842397966
 	github.com/spf13/cobra v1.8.0
 	github.com/spf13/pflag v1.0.5
 
@@ -425,8 +425,8 @@ github.com/rogpeppe/go-internal v1.11.0/go.mod h1:ddIwULY96R17DhadqLgMfk9H9tvdUz
 github.com/russross/blackfriday/v2 v2.1.0/go.mod h1:+Rmxgy9KzJVeS9/2gXHxylqXiyQDYRxCVz55jmeOWTM=
 github.com/sabhiram/go-gitignore v0.0.0-20210923224102-525f6e181f06 h1:OkMGxebDjyw0ULyrTYWeN0UNCCkmCWfjPnIA2W6oviI=
 github.com/sabhiram/go-gitignore v0.0.0-20210923224102-525f6e181f06/go.mod h1:+ePHsJ1keEjQtpvf9HHw0f4ZeJ0TLRsxhunSI2hYJSs=
-github.com/scaleway/scaleway-sdk-go v1.0.0-beta.25.0.20240328145934-63d5da1a64df h1:6GfqcKcUj896FRN7j5BnhL5+mtocxlsTQMqiqhOAn00=
-github.com/scaleway/scaleway-sdk-go v1.0.0-beta.25.0.20240328145934-63d5da1a64df/go.mod h1:fCa7OJZ/9DRTnOKmxvT6pn+LPWUptQAmHF/SBJUGEcg=
+github.com/scaleway/scaleway-sdk-go v1.0.0-beta.25.0.20240329105646-c0ed2d3750f9 h1:ytq3dM17GsFlK8REuRMMr0+pwqj84824pXLw8m1ruW8=
+github.com/scaleway/scaleway-sdk-go v1.0.0-beta.25.0.20240329105646-c0ed2d3750f9/go.mod h1:fCa7OJZ/9DRTnOKmxvT6pn+LPWUptQAmHF/SBJUGEcg=
 github.com/sclevine/spec v1.4.0 h1:z/Q9idDcay5m5irkZ28M7PtQM4aOISzOpj4bUPkDee8=
 github.com/sclevine/spec v1.4.0/go.mod h1:LvpgJaFyvQzRvc1kaDs0bulYwzC70PbiYjC4QnFHkOM=
 github.com/secure-systems-lab/go-securesystemslib v0.4.0 h1:b23VGrQhTA8cN2CbBw7/FulN9fTtqYUdS5+Oxzt+DUE=
 
@@ -42,6 +42,7 @@ import (
 	"github.com/scaleway/scaleway-cli/v2/internal/namespaces/vpc/v2"
 	"github.com/scaleway/scaleway-cli/v2/internal/namespaces/vpcgw/v1"
 	webhosting "github.com/scaleway/scaleway-cli/v2/internal/namespaces/webhosting/v1alpha1"
+	llm_inference "github.com/scaleway/scaleway-cli/v2/internal/namespaces/llm_inference/v1beta1"
 )
 
 // Enable beta in the code when products are in beta
@@ -94,6 +95,7 @@ func GetCommands() *core.Commands {
 		ipam.GetCommands(),
 		jobs.GetCommands(),
 		serverless_sqldb.GetCommands(),
+		llm_inference.GetCommands(),
 	)
 
 	//if beta {}
 
@@ -0,0 +1,22 @@
+package llm_inference
+
+import (
+	llm_inference "github.com/scaleway/scaleway-sdk-go/api/llm_inference/v1beta1"
+	"github.com/scaleway/scaleway-cli/v2/internal/human"
+	"github.com/scaleway/scaleway-cli/v2/internal/core"
+)
+
+func GetCommands() *core.Commands {
+	cmds := GetGeneratedCommands()
+
+	human.RegisterMarshalerFunc(llm_inference.DeploymentStatus(""), human.EnumMarshalFunc(deployementStateMarshalSpecs))
+
+	human.RegisterMarshalerFunc(llm_inference.Deployment{}, DeploymentMarshalerFunc)
+	human.RegisterMarshalerFunc([]*llm_inference.Model{}, ListModelMarshalerFunc)
+
+	cmds.MustFind("llm-inference", "deployment", "create").Override(deploymentCreateBuilder)
+	cmds.MustFind("llm-inference", "deployment", "delete").Override(deploymentDeleteBuilder)
+	cmds.MustFind("llm-inference", "endpoint", "create").Override(endpointCreateBuilder)
+
+	return cmds
+}
@@ -0,0 +1,169 @@
+package llm_inference
+
+import (
+	"strings"
+	llm_inference "github.com/scaleway/scaleway-sdk-go/api/llm_inference/v1beta1"
+	"time"
+	"github.com/scaleway/scaleway-cli/v2/internal/human"
+	"github.com/scaleway/scaleway-cli/v2/internal/core"
+	"reflect"
+	"github.com/scaleway/scaleway-sdk-go/scw"
+	"context"
+	"github.com/fatih/color"
+	"net/http"
+	"errors"
+)
+
+const (
+	deploymentActionTimeout = 40 * time.Minute
+)
+
+var (
+	deployementStateMarshalSpecs = human.EnumMarshalSpecs{
+		llm_inference.DeploymentStatusCreating:  &human.EnumMarshalSpec{Attribute: color.FgBlue},
+		llm_inference.DeploymentStatusDeploying: &human.EnumMarshalSpec{Attribute: color.FgBlue},
+		llm_inference.DeploymentStatusDeleting:  &human.EnumMarshalSpec{Attribute: color.FgBlue},
+		llm_inference.DeploymentStatusError:     &human.EnumMarshalSpec{Attribute: color.FgRed},
+		llm_inference.DeploymentStatusReady:     &human.EnumMarshalSpec{Attribute: color.FgGreen},
+		llm_inference.DeploymentStatusLocked:    &human.EnumMarshalSpec{Attribute: color.FgRed},
+	}
+)
+
+func DeploymentMarshalerFunc(i interface{}, opt *human.MarshalOpt) (string, error) {
+	type tmp llm_inference.Deployment
+	deployment := tmp(i.(llm_inference.Deployment))
+	opt.Sections = []*human.MarshalSection{
+		{
+			FieldName: "Endpoints",
+			Title:     "Endpoints",
+		},
+	}
+	str, err := human.Marshal(deployment, opt)
+	if err != nil {
+		return "", err
+	}
+	return str, nil
+}
+
+func deploymentCreateBuilder(c *core.Command) *core.Command {
+	c.ArgSpecs.GetByName("node-type").AutoCompleteFunc = autocompleteDeploymentNodeType
+	type llmInferenceEndpointSpecCustom struct {
+		*llm_inference.EndpointSpec
+		IsPublic bool `json:"is-public"`
+	}
+
+	type llmInferenceCreateDeploymentRequestCustom struct {
+		*llm_inference.CreateDeploymentRequest
+		Endpoints []*llmInferenceEndpointSpecCustom `json:"endpoints"`
+	}
+
+	c.ArgSpecs.AddBefore("endpoints.{index}.private-network.private-network-id", &core.ArgSpec{
+		Name:     "endpoints.{index}.is-public",
+		Short:    "Will configure your public endpoint if true",
+		Required: false,
+		Default:  core.DefaultValueSetter("false"),
+	})
+
+	c.ArgsType = reflect.TypeOf(llmInferenceCreateDeploymentRequestCustom{})
+
+	c.WaitFunc = func(ctx context.Context, argsI, respI interface{}) (interface{}, error) {
+		api := llm_inference.NewAPI(core.ExtractClient(ctx))
+		return api.WaitForDeployment(&llm_inference.WaitForDeploymentRequest{
+			DeploymentId:  respI.(*llm_inference.Deployment).ID,
+			Region:        respI.(*llm_inference.Deployment).Region,
+			Status:        respI.(*llm_inference.Deployment).Status,
+			Timeout:       scw.TimeDurationPtr(deploymentActionTimeout),
+			RetryInterval: core.DefaultRetryInterval,
+		})
+	}
+	c.Interceptor = func(ctx context.Context, argsI interface{}, runner core.CommandRunner) (interface{}, error) {
+		deploymentCreateCustomRequest := argsI.(*llmInferenceCreateDeploymentRequestCustom)
+		deploymentRequest := deploymentCreateCustomRequest.CreateDeploymentRequest
+		if deploymentCreateCustomRequest.Endpoints == nil {
+			publicEndpoint := &llm_inference.EndpointSpecPublic{}
+			endpoint := llm_inference.EndpointSpec{
+				Public:         publicEndpoint,
+				PrivateNetwork: nil,
+				DisableAuth:    false,
+			}
+			deploymentRequest.Endpoints = append(deploymentRequest.Endpoints, &endpoint)
+			return runner(ctx, deploymentRequest)
+		}
+		for _, endpoint := range deploymentCreateCustomRequest.Endpoints {
+			publicEndpoint := &llm_inference.EndpointSpecPublic{}
+			if !endpoint.IsPublic {
+				publicEndpoint = nil
+			}
+			privateNetwork := &llm_inference.EndpointSpecPrivateNetwork{}
+			if endpoint.EndpointSpec == nil {
+				privateNetwork = nil
+			} else {
+				privateNetwork.PrivateNetworkID = endpoint.PrivateNetwork.PrivateNetworkID
+			}
+			endpoint := llm_inference.EndpointSpec{
+				Public:         publicEndpoint,
+				PrivateNetwork: privateNetwork,
+				DisableAuth:    endpoint.DisableAuth,
+			}
+			deploymentRequest.Endpoints = append(deploymentRequest.Endpoints, &endpoint)
+		}
+
+		return runner(ctx, deploymentRequest)
+	}
+
+	return c
+}
+
+func deploymentDeleteBuilder(c *core.Command) *core.Command {
+	c.WaitFunc = func(ctx context.Context, argsI, respI interface{}) (interface{}, error) {
+		api := llm_inference.NewAPI(core.ExtractClient(ctx))
+		deployment, err := api.WaitForDeployment(&llm_inference.WaitForDeploymentRequest{
+			DeploymentId:  respI.(*llm_inference.Deployment).ID,
+			Region:        respI.(*llm_inference.Deployment).Region,
+			Status:        respI.(*llm_inference.Deployment).Status,
+			Timeout:       scw.TimeDurationPtr(deploymentActionTimeout),
+			RetryInterval: core.DefaultRetryInterval,
+		})
+		if err != nil {
+			notFoundError := &scw.ResourceNotFoundError{}
+			responseError := &scw.ResponseError{}
+			if errors.As(err, &responseError) && responseError.StatusCode == http.StatusNotFound || errors.As(err, &notFoundError) {
+				return &core.SuccessResult{
+					Resource: "deployment",
+					Verb:     "delete",
+				}, nil
+			}
+			return nil, err
+		}
+		return deployment, nil
+	}
+	return c
+}
+
+var completeListNodeTypesCache *llm_inference.ListNodeTypesResponse
+
+func autocompleteDeploymentNodeType(ctx context.Context, prefix string, request any) core.AutocompleteSuggestions {
+	req := request.(*llm_inference.CreateDeploymentRequest)
+	suggestions := core.AutocompleteSuggestions(nil)
+
+	client := core.ExtractClient(ctx)
+	api := llm_inference.NewAPI(client)
+
+	if completeListNodeTypesCache == nil {
+		res, err := api.ListNodeTypes(&llm_inference.ListNodeTypesRequest{
+			Region: req.Region,
+		})
+		if err != nil {
+			return nil
+		}
+		completeListNodeTypesCache = res
+	}
+
+	for _, nodeType := range completeListNodeTypesCache.NodeTypes {
+		if strings.HasPrefix(nodeType.Name, prefix) {
+			suggestions = append(suggestions, nodeType.Name)
+		}
+	}
+
+	return suggestions
+}
@@ -0,0 +1,54 @@
+package llm_inference
+
+import (
+	"github.com/scaleway/scaleway-cli/v2/internal/core"
+	"testing"
+	"github.com/scaleway/scaleway-cli/v2/internal/namespaces/vpc/v2"
+)
+
+func Test_DeploymentCreate(t *testing.T) {
+	cmds := GetCommands()
+
+	t.Run("Single public endpoint", core.Test(&core.TestConfig{
+		Commands:  cmds,
+		Cmd:       "scw llm-inference deployment create node-type=H100 model-name=wizardlm/wizardlm-70b-v1.0:fp8 accept-eula=true",
+		Check:     core.TestCheckGolden(),
+		AfterFunc: core.ExecAfterCmd("scw llm-inference deployment delete deployment-id={{ .CmdResult.ID }}"),
+	}))
+	t.Run("Deployment with wait flag", core.Test(&core.TestConfig{
+		Commands:  cmds,
+		Cmd:       "scw llm-inference deployment create model-name=meta/llama-2-7b-chat:fp16 node-type=L4 accept-eula=true -w",
+		Check:     core.TestCheckGolden(),
+		AfterFunc: core.ExecAfterCmd("scw llm-inference deployment delete deployment-id={{ .CmdResult.ID }}"),
+	}))
+}
+
+func Test_CreateDeploymentPrivateEndpoint(t *testing.T) {
+	cmds := GetCommands()
+	cmds.Merge(vpc.GetCommands())
+	t.Skip("Out of stock")
+	t.Run("Create Deployment Private Endpoint", core.Test(&core.TestConfig{
+		Commands:   cmds,
+		BeforeFunc: createPN(),
+		Cmd:        "scw llm-inference deployment create model-name=meta/llama-2-7b-chat:fp16 node-type=L4 accept-eula=true endpoints.0.private-network.private-network-id={{ .PN.ID }}",
+		Check: core.TestCheckCombine(
+			core.TestCheckGolden(),
+		),
+		AfterFunc: core.AfterFuncCombine(
+			core.ExecAfterCmd("scw llm-inference endpoint delete {{ .CmdResult.ID }}"),
+			deletePrivateNetwork(),
+			deleteDeployment(),
+		),
+	}))
+}
+
+func Test_DeploymentDelete(t *testing.T) {
+	cmds := GetCommands()
+
+	t.Run("Delete deployment with wait flag", core.Test(&core.TestConfig{
+		Commands:   cmds,
+		BeforeFunc: createDeploymentPublicEndpoint(),
+		Cmd:        "scw llm-inference deployment delete deployment-id={{ .DEPLOYMENT.ID }} -w",
+		Check:      core.TestCheckGolden(),
+	}))
+}
@@ -0,0 +1,46 @@
+package llm_inference
+
+import (
+	"github.com/scaleway/scaleway-cli/v2/internal/core"
+	"reflect"
+	llm_inference "github.com/scaleway/scaleway-sdk-go/api/llm_inference/v1beta1"
+	"context"
+)
+
+func endpointCreateBuilder(c *core.Command) *core.Command {
+	type llmInferenceEndpointSpecCustom struct {
+		*llm_inference.EndpointSpec
+		IsPublic bool `json:"is-public"`
+	}
+
+	type createEndpointRequestCustom struct {
+		*llm_inference.CreateEndpointRequest
+		Endpoint *llmInferenceEndpointSpecCustom `json:"endpoint"`
+	}
+
+	c.ArgSpecs.AddBefore("endpoint.private-network.private-network-id", &core.ArgSpec{
+		Name:     "endpoint.is-public",
+		Short:    "Will configure your public endpoint if true",
+		Required: false,
+		Default:  core.DefaultValueSetter("false"),
+	})
+
+	c.ArgsType = reflect.TypeOf(createEndpointRequestCustom{})
+
+	c.Interceptor = func(ctx context.Context, argsI interface{}, runner core.CommandRunner) (interface{}, error) {
+		createEndpointCustomRequest := argsI.(*createEndpointRequestCustom)
+		createEndpointreq := createEndpointCustomRequest.CreateEndpointRequest
+		endpoint := createEndpointCustomRequest.Endpoint
+		if endpoint.IsPublic {
+			publicEndpoint := &llm_inference.EndpointSpecPublic{}
+			endpointToCreate := llm_inference.EndpointSpec{
+				Public:         publicEndpoint,
+				PrivateNetwork: nil,
+				DisableAuth:    endpoint.DisableAuth,
+			}
+			createEndpointreq.Endpoint = &endpointToCreate
+		}
+		return runner(ctx, createEndpointreq)
+	}
+	return c
+}
@@ -0,0 +1,48 @@
+package llm_inference
+
+import (
+	"github.com/scaleway/scaleway-cli/v2/internal/core"
+	"github.com/scaleway/scaleway-cli/v2/internal/namespaces/vpc/v2"
+	"testing"
+)
+
+func Test_createEndpoint(t *testing.T) {
+	cmds := GetCommands()
+	cmds.Merge(vpc.GetCommands())
+
+	t.Skip("No stock to run test")
+
+	t.Run("Create Private Endpoint", core.Test(&core.TestConfig{
+		Commands: cmds,
+		BeforeFunc: core.BeforeFuncCombine(
+			createPN(),
+			createDeploymentPublicEndpoint(),
+		),
+		Cmd: "scw llm-inference endpoint create deployment-id={{ .DEPLOYMENT.ID }} endpoint.private-network.private-network-id={{ .PN.ID }}",
+		Check: core.TestCheckCombine(
+			core.TestCheckGolden(),
+		),
+		AfterFunc: core.AfterFuncCombine(
+			core.ExecAfterCmd("scw llm-inference endpoint delete {{ .CmdResult.ID }}"),
+			deletePrivateNetwork(),
+			deleteDeployment(),
+		),
+	}))
+
+	t.Run("Create Public Endpoint", core.Test(&core.TestConfig{
+		Commands: cmds,
+		BeforeFunc: core.BeforeFuncCombine(
+			createPN(),
+			createDeploymentPrivateEndpoint(),
+		),
+		Cmd: "scw llm-inference endpoint create deployment-id={{ .DEPLOYMENT.ID }} endpoint.is-public=true",
+		Check: core.TestCheckCombine(
+			core.TestCheckGolden(),
+		),
+		AfterFunc: core.AfterFuncCombine(
+			core.ExecAfterCmd("scw llm-inference endpoint delete {{ .CmdResult.ID }}"),
+			deletePrivateNetwork(),
+			deleteDeployment(),
+		),
+	}))
+}
Original file line number	Diff line number	Diff line change
`@@ -42,6 +42,7 @@ import (`
`42`	`42`	`"github.com/scaleway/scaleway-cli/v2/internal/namespaces/vpc/v2"`
`43`	`43`	`"github.com/scaleway/scaleway-cli/v2/internal/namespaces/vpcgw/v1"`
`44`	`44`	`webhosting "github.com/scaleway/scaleway-cli/v2/internal/namespaces/webhosting/v1alpha1"`
	`45`	`+ llm_inference "github.com/scaleway/scaleway-cli/v2/internal/namespaces/llm_inference/v1beta1"`
`45`	`46`	`)`
`46`	`47`
`47`	`48`	`// Enable beta in the code when products are in beta`
`@@ -94,6 +95,7 @@ func GetCommands() *core.Commands {`
`94`	`95`	`ipam.GetCommands(),`
`95`	`96`	`jobs.GetCommands(),`
`96`	`97`	`serverless_sqldb.GetCommands(),`
	`98`	`+ llm_inference.GetCommands(),`
`97`	`99`	`)`
`98`	`100`
`99`	`101`	`//if beta {}`