我需要在顶点AI中训练一个自定义的OCR。我的数据有裁剪图像的文件夹,每个图像是一行,还有一个包含2列的csv文件:图像名称和图像中的文本。但是当我尝试将其导入顶点AI的数据集中时,我看到图像数据集只支持分类,分割,目标检测。所有数据集都有固定数量的标签,但是我的数据有无限数量的标签(如果我们将图像中的文本视为标签),所以所有类型都不符合我的要求。我可以使用顶点AI进行训练吗,以及如何做到这一点?
由于顶点AI托管数据集不支持OCR应用程序,您可以使用顶点人工智能的训练和预测服务训练和部署自定义模型。
我发现了一篇关于从零开始构建OCR系统的好文章,这个OCR系统分2步实现
请注意,本文不受Google Cloud的官方支持。
在本地测试模型后,您可以使用自定义模型训练服务在顶点AI上训练相同的模型。请按照此代码库获取有关训练和部署自定义模型的分步说明。
训练完成后,可以使用VertexAI提供的预构建容器或基于您的需求的自定义容器部署模型进行推理。您还可以在同步请求的批量预测和异步请求的在线预测之间进行选择。