提问者:小点点

谷歌顶点AIAutoML-无法指定模式CSV数据集


我在顶点AI/数据集中基于一些CSV文件创建了表格数据集。然而,当我尝试在AutoML中使用这些数据集进行训练和预测时,没有办法指定字段的数据类型。在文档中,我找不到如何进行“转换”。理论上它支持以下类型:

  • 文本
  • 分类
  • 数字
  • 时间戳

在BigQuery表的情况下,获取数据类型是非常明显的,因为它是由表的模式明确指定的。然而,在CSV文件的情况下,有时找出字段的类型并不明显,实际上在我的情况下,有时AutoML猜测不正确。任何想法如何为CSV文件明确指定数据类型?


共1个答案

匿名用户

顶点AI的谷歌云PythonSDK不支持列数据类型的转换。目前只能通过云控制台完成。

将数据导入顶点AI数据集中并创建训练管道后,它会自动检测和分析提供的CSV文件,并提供有关各种数据类型的信息,如下图所示。数据类型的转换发生在数据导入之后。

如果VertexAI错误地识别了数据类型,我们可以使用下拉菜单将其更改为所需的数据类型,如下图所示。请参阅此视频以获取有关使用VertexAI构建和训练模型的演示。