argoproj · sarabala1979 · Mar 18, 2019 · Mar 14, 2019 · Mar 14, 2019 · Mar 14, 2019
diff --git a/cmd/argo/commands/get.go b/cmd/argo/commands/get.go
@@ -8,12 +8,13 @@ import (
 	"strings"
 	"text/tabwriter"
 
+	"github.com/argoproj/argo/errors"
+	wfv1 "github.com/argoproj/argo/pkg/apis/workflow/v1alpha1"
+	"github.com/argoproj/argo/util/file"
 	"github.com/argoproj/pkg/humanize"
 	"github.com/ghodss/yaml"
 	"github.com/spf13/cobra"
 	metav1 "k8s.io/apimachinery/pkg/apis/meta/v1"
-
-	wfv1 "github.com/argoproj/argo/pkg/apis/workflow/v1alpha1"
 )
 
 const onExitSuffix = "onExit"
@@ -36,6 +37,10 @@ func NewGetCommand() *cobra.Command {
 			if err != nil {
 				log.Fatal(err)
 			}
+			err = CheckAndDecompress(wf)
+			if err != nil {
+				log.Fatal(err)
+			}
 			printWorkflow(wf, output)
 		},
 	}
@@ -45,6 +50,21 @@ func NewGetCommand() *cobra.Command {
 	return command
 }
 
+func CheckAndDecompress(wf *wfv1.Workflow) error {
+	if wf.Status.CompressedNodes != "" {
+		nodeContent, err := file.DecodeDecompressString(wf.Status.CompressedNodes)
+		if err != nil {
+			return errors.InternalWrapError(err)
+		}
+		err = json.Unmarshal([]byte(nodeContent), &wf.Status.Nodes)
+		if err != nil {
+			log.Fatal(err)
+		}
+		wf.Status.CompressedNodes = ""
+	}
+	return nil
+}
+
 func printWorkflow(wf *wfv1.Workflow, outFmt string) {
 	switch outFmt {
 	case "name":

diff --git a/cmd/argo/commands/list.go b/cmd/argo/commands/list.go
@@ -134,6 +134,10 @@ func countPendingRunningCompleted(wf *wfv1.Workflow) (int, int, int) {
 	pending := 0
 	running := 0
 	completed := 0
+	err := CheckAndDecompress(wf)
+	if err != nil {
+		log.Fatal(err)
+	}
 	for _, node := range wf.Status.Nodes {
 		tmpl := wf.GetTemplate(node.TemplateName)
 		if tmpl == nil || !tmpl.IsPodType() {

diff --git a/cmd/argo/commands/logs.go b/cmd/argo/commands/logs.go
@@ -27,7 +27,7 @@ import (
 
 	log "github.com/sirupsen/logrus"
 	"github.com/spf13/cobra"
-	"k8s.io/api/core/v1"
+	v1 "k8s.io/api/core/v1"
 )
 
 type logEntry struct {
@@ -136,6 +136,11 @@ func (p *logPrinter) PrintPodLogs(podName string) error {
 // Prints logs for workflow pod steps and return most recent log timestamp per pod name
 func (p *logPrinter) printRecentWorkflowLogs(wf *v1alpha1.Workflow) map[string]*time.Time {
 	var podNodes []v1alpha1.NodeStatus
+	err := CheckAndDecompress(wf)
+	if err != nil {
+		log.Warn(err)
+		return nil
+	}
 	for _, node := range wf.Status.Nodes {
 		if node.Type == v1alpha1.NodeTypePod && node.Phase != v1alpha1.NodeError {
 			podNodes = append(podNodes, node)
@@ -193,6 +198,11 @@ func (p *logPrinter) printLiveWorkflowLogs(workflowName string, wfClient workflo
 	defer cancel()
 
 	processPods := func(wf *v1alpha1.Workflow) {
+		err := CheckAndDecompress(wf)
+		if err != nil {
+			log.Warn(err)
+			return
+		}
 		for id := range wf.Status.Nodes {
 			node := wf.Status.Nodes[id]
 			if node.Type == v1alpha1.NodeTypePod && node.Phase != v1alpha1.NodeError && streamedPods[node.ID] == false {

diff --git a/cmd/argo/commands/watch.go b/cmd/argo/commands/watch.go
@@ -45,6 +45,8 @@ func watchWorkflow(name string) {
 		select {
 		case next := <-watchIf.ResultChan():
 			wf, _ = next.Object.(*wfv1.Workflow)
+			err := CheckAndDecompress(wf)
+			errors.CheckError(err)
 		case <-ticker.C:
 		}
 		if wf == nil {

diff --git a/pkg/apis/workflow/v1alpha1/types.go b/pkg/apis/workflow/v1alpha1/types.go
@@ -477,6 +477,9 @@ type WorkflowStatus struct {
 	// A human readable message indicating details about why the workflow is in this condition.
 	Message string `json:"message,omitempty"`
 
+	// Compressed and base64 decoded Nodes map
+	CompressedNodes string `json:"compressedNodes,omitempty"`
+
 	// Nodes is a mapping between a node ID and the node's status.
 	Nodes map[string]NodeStatus `json:"nodes,omitempty"`
 

diff --git a/util/file/fileutil.go b/util/file/fileutil.go
@@ -0,0 +1,97 @@
+package file
+
+import (
+	"archive/tar"
+	"bytes"
+	"compress/gzip"
+	"encoding/base64"
+	"io"
+	"io/ioutil"
+	"os"
+	"strings"
+
+	log "github.com/sirupsen/logrus"
+)
+
+// IsFileOrDirExistInGZip return true if file or directory exists in GZip file
+func IsFileOrDirExistInGZip(sourcePath string, gzipFilePath string) bool {
+
+	fi, err := os.Open(gzipFilePath)
+
+	if os.IsNotExist(err) {
+		return false
+	}
+	defer close(fi)
+
+	fz, err := gzip.NewReader(fi)
+	if err != nil {
+		return false
+	}
+	tr := tar.NewReader(fz)
+	for {
+		hdr, err := tr.Next()
+		if err == io.EOF {
+			break
+		}
+		if err != nil {
+
+			return false
+		}
+		if hdr.FileInfo().IsDir() && strings.Contains(strings.Trim(hdr.Name, "/"), strings.Trim(sourcePath, "/")) {
+			return true
+		}
+		if strings.Contains(sourcePath, hdr.Name) && hdr.Size > 0 {
+			return true
+		}
+	}
+	return false
+}
+
+//Close the file
+func close(f io.Closer) {
+	err := f.Close()
+	if err != nil {
+		log.Warnf("Failed to close the file/writer/reader. %v", err)
+	}
+}
+
+// CompressEncodeString will return the compressed string with base64 encoded
+func CompressEncodeString(content string) string {
+	return base64.StdEncoding.EncodeToString(CompressContent([]byte(content)))
+}
+
+// DecodeDecompressString will return  decode and decompress the
+func DecodeDecompressString(content string) (string, error) {
+
+	buf, err := base64.StdEncoding.DecodeString(content)
+	if err != nil {
+		return "", err
+	}
+	dBuf, err := DecompressContent(buf)
+	if err != nil {
+		return "", err
+	}
+	return string(dBuf), nil
+}
+
+// CompressContent will compress the byte array using zip writer
+func CompressContent(content []byte) []byte {
+	var buf bytes.Buffer
+	zipWriter := gzip.NewWriter(&buf)
+
+	_, err := zipWriter.Write(content)
+	if err != nil {
+		log.Warnf("Error in compressing: %v", err)
+	}
+	close(zipWriter)
+	return buf.Bytes()
+}
+
+// DecompressContent will return the uncompressed content
+func DecompressContent(content []byte) ([]byte, error) {
+
+	buf := bytes.NewReader(content)
+	gZipReader, _ := gzip.NewReader(buf)
+	defer close(gZipReader)
+	return ioutil.ReadAll(gZipReader)
+}
diff --git a/util/file/fileutil_test.go b/util/file/fileutil_test.go
@@ -0,0 +1,21 @@
+package file
+
+import (
+	"testing"
+
+	"github.com/stretchr/testify/assert"
+)
+
+// TestResubmitWorkflowWithOnExit ensures we do not carry over the onExit node even if successful
+func TestCompressContentString(t *testing.T) {
+	content := "{\"pod-limits-rrdm8-591645159\":{\"id\":\"pod-limits-rrdm8-591645159\",\"name\":\"pod-limits-rrdm8[0]." +
+		"run-pod(0:0)\",\"displayName\":\"run-pod(0:0)\",\"type\":\"Pod\",\"templateName\":\"run-pod\",\"phase\":" +
+		"\"Succeeded\",\"boundaryID\":\"pod-limits-rrdm8\",\"startedAt\":\"2019-03-07T19:14:50Z\",\"finishedAt\":" +
+		"\"2019-03-07T19:14:55Z\"}}"
+
+	compString := CompressEncodeString(content)
+
+	resultString, _ := DecodeDecompressString(compString)
+
+	assert.Equal(t, content, resultString)
+}
diff --git a/workflow/controller/controller.go b/workflow/controller/controller.go
@@ -243,6 +243,16 @@ func (wfc *WorkflowController) processNextItem() bool {
 	}
 
 	woc := newWorkflowOperationCtx(wf, wfc)
+	//Decompress the node if it is compressed
+
+	err = woc.checkAndDecompress()
+	if err != nil {
+		log.Warnf("Failed to decompress  '%s' to workflow object: %v", key, err)
+		woc.markWorkflowFailed(fmt.Sprintf("invalid spec: %s", err.Error()))
+		woc.persistUpdates()
+		wfc.throttler.Remove(key)
+		return true
+	}
 	woc.operate()
 	if woc.wf.Status.Completed() {
 		wfc.throttler.Remove(key)

diff --git a/workflow/controller/operator.go b/workflow/controller/operator.go
@@ -24,6 +24,7 @@ import (
 	"github.com/argoproj/argo/errors"
 	wfv1 "github.com/argoproj/argo/pkg/apis/workflow/v1alpha1"
 	"github.com/argoproj/argo/pkg/client/clientset/versioned/typed/workflow/v1alpha1"
+	"github.com/argoproj/argo/util/file"
 	"github.com/argoproj/argo/util/retry"
 	"github.com/argoproj/argo/workflow/common"
 	"github.com/argoproj/argo/workflow/util"
@@ -72,6 +73,9 @@ var (
 // for before requeuing the workflow onto the workqueue.
 const maxOperationTime time.Duration = 10 * time.Second
 
+//maxWorkflowSize is the maximum  size for workflow.yaml
+const maxWorkflowSize int = 1024 * 1024
+
 // newWorkflowOperationCtx creates and initializes a new wfOperationCtx object.
 func newWorkflowOperationCtx(wf *wfv1.Workflow, wfc *WorkflowController) *wfOperationCtx {
 	// NEVER modify objects from the store. It's a read-only, local cache.
@@ -275,9 +279,17 @@ func (woc *wfOperationCtx) persistUpdates() {
 		return
 	}
 	wfClient := woc.controller.wfclientset.ArgoprojV1alpha1().Workflows(woc.wf.ObjectMeta.Namespace)
-	_, err := wfClient.Update(woc.wf)
+	err := woc.checkAndCompress()
 	if err != nil {
-		woc.log.Warnf("Error updating workflow: %v", err)
+		woc.log.Warnf("Error compressing workflow: %v", err)
+	}
+	if woc.wf.Status.CompressedNodes != "" {
+		woc.wf.Status.Nodes = nil
+	}
+
+	_, err = wfClient.Update(woc.wf)
+	if err != nil {
+		woc.log.Warnf("Error updating workflow: %v %s", err, apierr.ReasonForError(err))
 		if argokubeerr.IsRequestEntityTooLargeErr(err) {
 			woc.persistWorkflowSizeLimitErr(wfClient, err)
 			return
@@ -450,11 +462,24 @@ func (woc *wfOperationCtx) podReconciliation() error {
 	}
 
 	for _, pod := range podList.Items {
+		origNodeStatus := *woc.wf.Status.DeepCopy()
 		performAssessment(&pod)
 		err = woc.applyExecutionControl(&pod)
 		if err != nil {
 			woc.log.Warnf("Failed to apply execution control to pod %s", pod.Name)
 		}
+		err = woc.checkAndCompress()
+		if err != nil {
+			woc.wf.Status = origNodeStatus
+			nodeNameForPod := pod.Annotations[common.AnnotationKeyNodeName]
+			woc.log.Warnf("%v", err)
+			woc.markNodeErrorClearOuput(nodeNameForPod, err)
+			err = woc.checkAndCompress()
+			if err != nil {
+				woc.markWorkflowError(err, true)
+			}
+		}
+
 	}
 
 	// Now check for deleted pods. Iterate our nodes. If any one of our nodes does not show up in
@@ -1138,6 +1163,14 @@ func (woc *wfOperationCtx) markNodePhase(nodeName string, phase wfv1.NodePhase,
 	return node
 }
 
+// markNodeErrorClearOuput is a convenience method to mark a node with an error and clear the output
+func (woc *wfOperationCtx) markNodeErrorClearOuput(nodeName string, err error) *wfv1.NodeStatus {
+	nodeStatus := woc.markNodeError(nodeName, err)
+	nodeStatus.Outputs = nil
+	woc.wf.Status.Nodes[nodeStatus.ID] = *nodeStatus
+	return nodeStatus
+}
+
 // markNodeError is a convenience method to mark a node with an error and set the message from the error
 func (woc *wfOperationCtx) markNodeError(nodeName string, err error) *wfv1.NodeStatus {
 	return woc.markNodePhase(nodeName, wfv1.NodeError, err.Error())
@@ -1576,3 +1609,61 @@ func expandSequence(seq *wfv1.Sequence) ([]wfv1.Item, error) {
 	}
 	return items, nil
 }
+
+// getSize return the entire workflow json string size
+func (woc *wfOperationCtx) getSize() int {
+	nodeContent, err := json.Marshal(woc.wf)
+	if err != nil {
+		return -1
+	}
+
+	compressNodeSize := len(woc.wf.Status.CompressedNodes)
+
+	if compressNodeSize > 0 {
+		nodeStatus, err := json.Marshal(woc.wf.Status.Nodes)
+		if err != nil {
+			return -1
+		}
+		return len(nodeContent) - len(nodeStatus)
+	}
+	return len(nodeContent)
+}
+
+// checkAndCompress will check the workflow size and compress node status if total workflow size is more than maxWorkflowSize.
+// The compressed content will be assign to compressedNodes element and clear the nodestatus map.
+func (woc *wfOperationCtx) checkAndCompress() error {
+
+	if woc.wf.Status.CompressedNodes != "" || (woc.wf.Status.CompressedNodes == "" && woc.getSize() >= maxWorkflowSize) {
+
+		nodeContent, err := json.Marshal(woc.wf.Status.Nodes)
+		if err != nil {
+			return errors.InternalWrapError(err)
+		}
+		buff := string(nodeContent)
+		woc.wf.Status.CompressedNodes = file.CompressEncodeString(buff)
+
+	}
+	if woc.wf.Status.CompressedNodes != "" && woc.getSize() >= maxWorkflowSize {
+		return errors.InternalError(fmt.Sprintf("Workflow is longer than maximum allowed size. Size=%d", woc.getSize()))
+	}
+	return nil
+}
+
+// checkAndDecompress will decompress the compressednode and assign to workflow.status.nodes map.
+func (woc *wfOperationCtx) checkAndDecompress() error {
+	if woc.wf.Status.CompressedNodes != "" {
+		nodeContent, err := file.DecodeDecompressString(woc.wf.Status.CompressedNodes)
+		if err != nil {
+			return errors.InternalWrapError(err)
+		}
+		var tempNodes map[string]wfv1.NodeStatus
+
+		err = json.Unmarshal([]byte(nodeContent), &tempNodes)
+		if err != nil {
+			woc.log.Warn(err)
+			return err
+		}
+		woc.wf.Status.Nodes = tempNodes
+	}
+	return nil
+}
diff --git a/workflow/executor/docker/docker.go b/workflow/executor/docker/docker.go
@@ -7,7 +7,7 @@ import (
 	"strings"
 	"time"
 
-	"github.com/argoproj/argo/workflow/util/file"
+	"github.com/argoproj/argo/util/file"
 
 	"github.com/argoproj/argo/util"