Что делать, если возникает ошибка на master ноде Kubernetes в Яндекс облаке при использовании kubespray?

Как устранить ошибку, возникающую при выполнении команды ansible-playbook в конце процесса развертывания кластера Kubernetes с использованием Terraform и Kubespray?
  • 4 июля 2024 г. 15:32
Ответы на вопрос 2
Если возникает ошибка на master ноде Kubernetes при использовании kubespray в Яндекс облаке, рекомендуется следовать следующим шагам:

1. Проверить логи ошибки на master ноде Kubernetes, чтобы понять причину возникновения ошибки. Обычно логи находятся в /var/log/messages или /var/log/containers.

2. Проверить конфигурацию kubespray и Terraform, чтобы исключить возможные ошибки в настройках.

3. Попробовать перезапустить развертывание кластера Kubernetes с помощью kubespray, возможно ошибка была единоразовым сбоем.

4. Если ошибка повторяется, обратитесь к документации kubespray и обсудите проблему на форуме или сообществе Kubernetes, возможно кто-то уже сталкивался с подобной проблемой и сможет помочь в ее устранении.

Для устранения ошибки, возникающей при выполнении команды ansible-playbook в конце процесса развертывания кластера Kubernetes с использованием Terraform и Kubespray, можно попробовать следующие шаги:

1. Проверить версии и зависимости ansible, Terraform и Kubespray, убедившись, что они совместимы между собой.

2. Пересоздать инфраструктуру с помощью Terraform, чтобы избежать возможных проблем с конфигурацией.

3. Проверить логи выполнения команды ansible-playbook на всех нодах Kubernetes, чтобы понять, на каком этапе происходит ошибка.

4. Обновить ansible, Terraform и Kubespray до последних версий, чтобы устранить возможные проблемы с устаревшими пакетами.

Если указанные шаги не помогли устранить ошибку, рекомендуется обратиться к документации kubespray, подробно изучить логи выполнения команды ansible-playbook и обсудить проблему на форуме или сообществе Kubernetes для получения дополнительной помощи.
Спасибо всем! 
нашел в чем причина была.
Terraform (OpenTofu) создавал hosts.yaml по шаблону
```
all:
hosts:%{ for idx, master in masters }
master:
ansible_host: ${master.network_interface[0].nat_ip_address}
ip: ${master.network_interface[0].ip_address}
access_ip: ${master.network_interface[0].nat_ip_address}%{ endfor }%{ for idx, worker in workers }
worker-${idx + 1}:
ansible_host: ${worker.network_interface[0].nat_ip_address}
ip: ${worker.network_interface[0].ip_address}
access_ip: ${worker.network_interface[0].nat_ip_address}%{ endfor }
children:
kube_control_plane:
hosts:%{ for idx, master in masters }
${master.name}:%{ endfor }
kube_node:
hosts:%{ for idx, worker in workers }
${worker.name}:%{ endfor }
etcd:
hosts:%{ for idx, master in masters }
${master.name}:%{ endfor }
k8s_cluster:
children:
kube_control_plane:
kube_node:
calico_rr:
hosts: {}
```
убрал строчки access_ip: ${master.network_interface[0].nat_ip_address} и access_ip: ${worker.network_interface[0].nat_ip_address} и все без ошибок поднялось
Похожие вопросы