k8s集群备份与迁移

科技   2024-10-29 19:37   黑龙江  
本文以最新版的velero1.14.1为例,分享部署指引及实战经验,备份和还原操作是简单,但是有些细节不了解清楚,有可能会造成大事故,本篇文章将带你了解需要注意的细节。
01

什么是 Velero?


    Velero 是一个用Go语言开发的开源工具,用于 Kubernetes 集群的备份、恢复、灾难恢复和迁移。

02

Velero备份工作流程


当用户发起velero backup create时,会执行如下四个动作:

  1. velero客户端调用Kubernetes API创建自定义资源并存储到etcd;

  2. Backup Controller通过Kubernetes API监听到新创建的backup对象,并验证;

  3. Backup Controller开始执行备份,通过Kubernetes API查询查询和收集需要备份的资源;

  4. Backup Controller调用Minio的S3接口上传备份数据。

03

安装步骤


    velero在卸载的时候会把所在命名空间的资源清空,所以需要独立部署,在实战中,我们会把minio和velero隔离命名空间进行部署。

下载地址

# velerowget https://github.com/vmware-tanzu/velero/releases/download/v1.14.1/velero-v1.14.1-linux-amd64.tar.gz# miniogit clone https://github.com/yilingyi/minio.git

minio安装
  • 修改minio中的values.yaml,有两处storageClass需要根据实际名称进行替换

  • 然后执行helm指令进行部署

helm install minio ./ -f values.yaml -n minio --create-namespace
  • 完成部署后,登录console(默认账号密码是minioadmin)创建bucket,命名为velero

velero安装
  • 在bucket创建后,紧接着解压velero,并在目录下创建S3存储桶凭证credentials-velero,示例如下

[default]aws_access_key_id=minioadminaws_secret_access_key=minioadmin


  • 然后执行如下指令进行安装,需要注意的是,在首次备份期间需要关注集群的IO负载情况,如果负载较高,可以适当调低node agent的cpu和内存资源:

cd velero-v1.14.1-linux-amd64cp velero /usr/bin/velero install \    # 指定存储提供商,minio用的是s3,所以这里是aws    --provider aws \    # 指定aws插件    --plugins registry.cn-hangzhou.aliyuncs.com/yilingyi/velero-plugin-for-aws:v1.10.1 \    # 指定velero镜像    --image registry.cn-hangzhou.aliyuncs.com/yilingyi/velero:v1.14.1 \    # 限制agent CPU和内存资源    --node-agent-pod-cpu-limit 2 \    --node-agent-pod-mem-limit 2048Mi \    # 指定命名空间    --namespace velero \    # 指定bucket名称    --bucket velero \    # 默认以文件形式备份持久化卷    --default-volumes-to-fs-backup \    # 启用node agent 进行备份和恢复操作,--use-restic已启用,从v1.10开始默认使用kopia备份    --use-node-agent \    # 指定S3存储桶凭证    --secret-file ./credentials-velero \    # 禁用卷快照功能,只使用文件系统级别的备份    --use-volume-snapshots=false \    # 配置备份存储位置的详细信息,其中<minio-api-url>填写minio的api地址,如172.33.0.2:9000    --backup-location-config region=minio,s3ForcePathStyle="true",s3Url=http://<minio-api-url>

04

常用指令


备份

  • 备份所有资源

velero backup create <BACKUP_NAME>
示例
velero backup create my-buckup
  • 常用参数

--include-namespaces 备份指定的命名空间--include-resources  备份指定的资源,常用的有deployment,pods,services,secrets,configmaps--exclude-namespace  排除命名空间--exclude-resources  排除资源--ttl                备份过期时间,默认为720h,即30天
  • 如果想要排除更细粒度的资源,可以给资源打上标签velero.io/exclude-from-backup=true排除备份,如

kubectl label pv my-pv velero.io/exclude-from-backup=true
  • 查看备份列表

velero get backups
  • 查看备份任务详情/进度

velero backup describe <BACKUP_NAME> --detail

还原

  • 还原所有资源

velero restore create --from-backup <BACKUP_NAME>
  • 常用参数

--include-namespaces 备份指定的命名空间--include-resources  备份指定的资源,常用的有deployment,pods,services,secrets,configmaps--exclude-namespace  排除命名空间--exclude-resources  排除资源
  • 查看还原列表

velero get restores
  • 查看还原详情/进度

velero restore describe <RESTORE_NAME> --detail

定时任务

  • 可以设置定时备份任务

velero schedule create <SCHEDULE_NAME> --schedule="0 1 * * *" --include-namespaces <NAMESPACES> --ttl 240
示例
velero schedule create daily-backup --schedule="0 1 * * *" --include-namespaces argocd,blackbox,chaosblade --ttl 240
  • 查看定时任务

velero get schedules

其他指令

  • velero卸载
velero uninstall


05

k8s集群迁移


    在目标集群安装velero,安装参数的s3url(“s3Url=http://<minio-api-url>”)指向源集群的minio,在完成部署后,方可进行备份浏览和还原,但需要注意以下两个细节:
  1. 还原到目标集群的备份数据中不要包含kube-system命名空间的资源,避免冲突
  2. 如果storageClass的名称发生变更,需要进行映射

将下面文件保存为velero-sc.yaml,将<target-sc>修改为目标集群的storageClass名称,并通过kubectl apply -f velero-sc.yaml执行映射,然后再进行数据还原。

apiVersion: v1kind: ConfigMapmetadata:  name: change-storage-class-config  namespace: velero  labels:    velero.io/plugin-config: ""    velero.io/change-storage-class: RestoreItemActiondata:  cfs-v4: <target-sc>
06

结语


velero使kubernetes的备份、还原和迁移更加灵活和简单,本次分享就到这里,谢谢!
参考链接
https://min.io/docs/minio/linux/index.html

https://cloudcasa.io/blog/getting-to-know-velero-backup-and-important-velero-resources-that-you-can-utilise/

欢迎关注我的公众号「DevOps和k8s全栈技术」

DevOps和k8s全栈技术
专注于DevOps,Kubernetes,Linux,Docker,istio,微服务,Spring Cloud,python,go,数据库,Nginx,Tomcat,云计算等技术分享~
 最新文章