Fix 'Join to Kubernetes cluster' task #2805

atsikham · 2021-12-20T15:01:57Z

Copying is handled by Ansible's 'copy' module. From documentation:

If yes, the remote file will be replaced when contents are different than the source.

So no checksums are checked, only condition removed.

przemyslavic · 2021-12-29T08:26:43Z

/azp run

przemyslavic · 2021-12-29T11:33:33Z

@atsikham
It doesn't solve the issue described in the task #1175.

Deployed k8s cluster (1 master + 1 node)
Executed kubeadm reset on master node
Ran epicli apply again and it failed:

2021-12-29T11:27:03.6324390Z[38;21m11:27:03 INFO cli.engine.ansible.AnsibleCommand - TASK [kubernetes_node : Join to Kubernetes cluster] ****************************
2021-12-29T11:27:04.6504789Z[31;21m11:27:04 ERROR cli.engine.ansible.AnsibleCommand - fatal: [ci-pkiazurcentcanal-kubernetes-node-vm-0]: FAILED! => {"changed": true, "cmd": "kubeadm join  --config /etc/kubeadm/kubeadm-join-node.yml\n", "delta": "0:00:00.392559", "end": "2021-12-29 11:27:04.577311", "msg": "non-zero return code", "rc": 1, "start": "2021-12-29 11:27:04.184752", "stderr": "error execution phase preflight: [preflight] Some fatal errors occurred:\n\t[ERROR FileAvailable--etc-kubernetes-kubelet.conf]: /etc/kubernetes/kubelet.conf already exists\n\t[ERROR Port-10250]: Port 10250 is in use\n\t[ERROR FileAvailable--etc-kubernetes-pki-ca.crt]: /etc/kubernetes/pki/ca.crt already exists\n[preflight] If you know what you are doing, you can make a check non-fatal with `--ignore-preflight-errors=...`\nTo see the stack trace of this error execute with --v=5 or higher", "stderr_lines": ["error execution phase preflight: [preflight] Some fatal errors occurred:", "\t[ERROR FileAvailable--etc-kubernetes-kubelet.conf]: /etc/kubernetes/kubelet.conf already exists", "\t[ERROR Port-10250]: Port 10250 is in use", "\t[ERROR FileAvailable--etc-kubernetes-pki-ca.crt]: /etc/kubernetes/pki/ca.crt already exists", "[preflight] If you know what you are doing, you can make a check non-fatal with `--ignore-preflight-errors=...`", "To see the stack trace of this error execute with --v=5 or higher"], "stdout": "[preflight] Running pre-flight checks", "stdout_lines": ["[preflight] Running pre-flight checks"]}
2021-12-29T11:27:04.6649538Z[38;21m11:27:04 INFO cli.engine.ansible.AnsibleCommand - 
2021-12-29T11:27:04.6650931Z[38;21m11:27:04 INFO cli.engine.ansible.AnsibleCommand - TASK [kubernetes_node : Join to cluster with ignores] **************************
2021-12-29T11:29:05.9094641Z[31;21m11:29:05 ERROR cli.engine.ansible.AnsibleCommand - fatal: [ci-pkiazurcentcanal-kubernetes-node-vm-0]: FAILED! => {"changed": true, "cmd": "kubeadm join  --config /etc/kubeadm/kubeadm-join-node.yml  --ignore-preflight-errors all\n", "delta": "0:02:00.670749", "end": "2021-12-29 11:29:05.816895", "msg": "non-zero return code", "rc": 1, "start": "2021-12-29 11:27:05.146146", "stderr": "\t[WARNING FileAvailable--etc-kubernetes-kubelet.conf]: /etc/kubernetes/kubelet.conf already exists\n\t[WARNING Port-10250]: Port 10250 is in use\n\t[WARNING FileAvailable--etc-kubernetes-pki-ca.crt]: /etc/kubernetes/pki/ca.crt already exists\nerror execution phase kubelet-start: error uploading crisocket: timed out waiting for the condition\nTo see the stack trace of this error execute with --v=5 or higher", "stderr_lines": ["\t[WARNING FileAvailable--etc-kubernetes-kubelet.conf]: /etc/kubernetes/kubelet.conf already exists", "\t[WARNING Port-10250]: Port 10250 is in use", "\t[WARNING FileAvailable--etc-kubernetes-pki-ca.crt]: /etc/kubernetes/pki/ca.crt already exists", "error execution phase kubelet-start: error uploading crisocket: timed out waiting for the condition", "To see the stack trace of this error execute with --v=5 or higher"], "stdout": "[preflight] Running pre-flight checks\n[preflight] Reading configuration from the cluster...\n[preflight] FYI: You can look at this config file with 'kubectl -n kube-system get cm kubeadm-config -o yaml'\n[kubelet-start] Writing kubelet configuration to file \"/var/lib/kubelet/config.yaml\"\n[kubelet-start] Writing kubelet environment file with flags to file \"/var/lib/kubelet/kubeadm-flags.env\"\n[kubelet-start] Starting the kubelet\n[kubelet-start] Waiting for the kubelet to perform the TLS Bootstrap...\n[kubelet-check] Initial timeout of 40s passed.", "stdout_lines": ["[preflight] Running pre-flight checks", "[preflight] Reading configuration from the cluster...", "[preflight] FYI: You can look at this config file with 'kubectl -n kube-system get cm kubeadm-config -o yaml'", "[kubelet-start] Writing kubelet configuration to file \"/var/lib/kubelet/config.yaml\"", "[kubelet-start] Writing kubelet environment file with flags to file \"/var/lib/kubelet/kubeadm-flags.env\"", "[kubelet-start] Starting the kubelet", "[kubelet-start] Waiting for the kubelet to perform the TLS Bootstrap...", "[kubelet-check] Initial timeout of 40s passed."]}
2021-12-29T11:29:05.9296216Z[38;21m11:29:05 INFO cli.engine.ansible.AnsibleCommand - 
2021-12-29T11:29:05.9297310Z[38;21m11:29:05 INFO cli.engine.ansible.AnsibleCommand - TASK [kubernetes_node : Display kubeadm join stderr if any] ********************
2021-12-29T11:29:05.9885416Z[38;21m11:29:05 INFO cli.engine.ansible.AnsibleCommand - ok: [ci-pkiazurcentcanal-kubernetes-node-vm-0] => {
2021-12-29T11:29:05.9887711Z[31;21m11:29:05 ERROR cli.engine.ansible.AnsibleCommand -     "msg": "Joined with warnings\n['\\t[WARNING FileAvailable--etc-kubernetes-kubelet.conf]: /etc/kubernetes/kubelet.conf already exists', '\\t[WARNING Port-10250]: Port 10250 is in use', '\\t[WARNING FileAvailable--etc-kubernetes-pki-ca.crt]: /etc/kubernetes/pki/ca.crt already exists', 'error execution phase kubelet-start: error uploading crisocket: timed out waiting for the condition', 'To see the stack trace of this error execute with --v=5 or higher']\n"
2021-12-29T11:29:05.9897007Z[38;21m11:29:05 INFO cli.engine.ansible.AnsibleCommand - }
2021-12-29T11:29:06.0065788Z[38;21m11:29:06 INFO cli.engine.ansible.AnsibleCommand - 
2021-12-29T11:29:06.0066806Z[38;21m11:29:06 INFO cli.engine.ansible.AnsibleCommand - TASK [kubernetes_node : Mark node regardless of join result] *******************
2021-12-29T11:29:06.0535320Z[38;21m11:29:06 INFO cli.engine.ansible.AnsibleCommand - ok: [ci-pkiazurcentcanal-kubernetes-node-vm-0]
2021-12-29T11:29:06.0564255Z[38;21m11:29:06 INFO cli.engine.ansible.AnsibleCommand - 
2021-12-29T11:29:06.0572498Z[38;21m11:29:06 INFO cli.engine.ansible.AnsibleCommand - PLAY RECAP *********************************************************************
2021-12-29T11:29:06.0579407Z[38;21m11:29:06 INFO cli.engine.ansible.AnsibleCommand - ci-pkiazurcentcanal-kubernetes-master-vm-0 : ok=9    changed=0    unreachable=0    failed=0    skipped=2    rescued=0    ignored=0   
2021-12-29T11:29:06.0584014Z[38;21m11:29:06 INFO cli.engine.ansible.AnsibleCommand - ci-pkiazurcentcanal-kubernetes-node-vm-0 : ok=37   changed=1    unreachable=0    failed=1    skipped=12   rescued=1    ignored=0   
2021-12-29T11:29:06.0587266Z[38;21m11:29:06 INFO cli.engine.ansible.AnsibleCommand - ci-pkiazurcentcanal-repository-vm-0 : ok=1    changed=0    unreachable=0    failed=0    skipped=0    rescued=0    ignored=0

przemyslavic · 2021-12-29T12:08:03Z

✔️ Executed kubeadm reset on each node and it succeeded.
The question is, do we want the reset of each node to be somehow automated when something broke, or users should be responsible for it before running apply again.

Also task #2669 seems to be related.

…m/epiphany into bugfix/kubeadm-join-1175

przemyslavic · 2021-12-30T10:38:14Z

/azp run

ansible/playbooks/roles/kubernetes_node/tasks/node-join.yml

przemyslavic · 2021-12-30T19:37:00Z

Tested scenario:

Deployed k8s cluster: 1 master + 1 node
Ran kubeadm reset on master node
Executed epicli apply again and it succeedeed
Tested on AWS Ubuntu/RHEL/CentOS

Issue #2828 created

atsikham added 2 commits December 20, 2021 15:59

Remove condition for pki file

a711a76

Update changelog

d2aafb7

atsikham marked this pull request as ready for review December 20, 2021 23:23

seriva previously approved these changes Dec 21, 2021

View reviewed changes

cicharka previously approved these changes Dec 21, 2021

View reviewed changes

Merge branch 'develop' into bugfix/kubeadm-join-1175

a0ec053

atsikham dismissed stale reviews from cicharka and seriva via a0ec053 December 28, 2021 13:25

seriva previously approved these changes Dec 28, 2021

View reviewed changes

to-bar previously approved these changes Dec 28, 2021

View reviewed changes

to-bar assigned atsikham Dec 28, 2021

atsikham added 2 commits December 30, 2021 11:18

Attempt to use reset before join

8a456ab

Merge branch 'bugfix/kubeadm-join-1175' of https://github.com/atsikha…

49fa803

…m/epiphany into bugfix/kubeadm-join-1175

atsikham dismissed stale reviews from to-bar and seriva via 49fa803 December 30, 2021 10:19

atsikham requested review from seriva, cicharka and to-bar December 30, 2021 14:47

to-bar previously requested changes Dec 30, 2021

View reviewed changes

ansible/playbooks/roles/kubernetes_node/tasks/node-join.yml Show resolved Hide resolved

seriva approved these changes Dec 30, 2021

View reviewed changes

przemyslavic approved these changes Dec 30, 2021

View reviewed changes

atsikham mentioned this pull request Dec 31, 2021

K8s improvements #2828

Closed

10 tasks

atsikham requested review from to-bar and removed request for cicharka and to-bar December 31, 2021 08:33

atsikham merged commit 1020603 into hitachienergy:develop Dec 31, 2021

przemyslavic mentioned this pull request Jan 3, 2022

[BUG] Task 'Join to Kubernetes cluster' may fail when Ansible vault already exists #1175

Closed

10 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fix 'Join to Kubernetes cluster' task #2805

Fix 'Join to Kubernetes cluster' task #2805

atsikham commented Dec 20, 2021 •

edited

Loading

przemyslavic commented Dec 29, 2021

przemyslavic commented Dec 29, 2021

przemyslavic commented Dec 29, 2021 •

edited

Loading

przemyslavic commented Dec 30, 2021

przemyslavic commented Dec 30, 2021 •

edited

Loading

Fix 'Join to Kubernetes cluster' task #2805

Fix 'Join to Kubernetes cluster' task #2805

Conversation

atsikham commented Dec 20, 2021 • edited Loading

przemyslavic commented Dec 29, 2021

przemyslavic commented Dec 29, 2021

przemyslavic commented Dec 29, 2021 • edited Loading

przemyslavic commented Dec 30, 2021

przemyslavic commented Dec 30, 2021 • edited Loading

atsikham commented Dec 20, 2021 •

edited

Loading

przemyslavic commented Dec 29, 2021 •

edited

Loading

przemyslavic commented Dec 30, 2021 •

edited

Loading