提问者:小点点

顶点AI自动再训练


我正在尝试创建一个启用了监控的顶点AIendpoint,当部署的模型之一性能下降时,它可以触发顶点AI管道执行。但是,顶点AI不提供任何内置功能来执行此操作。是否有方法捕获顶点AI监控抛出的警报并触发管道?


共1个答案

匿名用户

  1. 顶点AI模型监视作业记录为Cloud Logging 1的一部分。
  2. 您可以使用基于日志的警报2对这些日志做出反应。为此,您需要配置PubSub 3的通知通道
  3. 根据这些PubSub消息,您可以触发Cloud Function 4
  4. 云函数可以启动顶点AI管道运行来重新训练模型5

https://cloud.google.com/vertex-ai/docs/model-monitoring/using-model-monitoring#cloud-logging-info

https://cloud.google.com/logging/docs/alerting/log-based-alerts

https://cloud.google.com/monitoring/api/ref_v3/rest/v3/projects.notificationChannels#NotificationChannel

https://cloud.google.com/functions/docs/calling/pubsub

https://cloud.google.com/vertex-ai/docs/reference/rest/v1/projects.locations.pipelineJobs/create