Google Dataflow能否生成Parquet文件

提问者：小点点

Google Dataflow能否生成Parquet文件

Google Dataflow能否生成Parquet文件作为ETL转换的输出。

输入---

共2个答案

匿名用户

自2019年2月2.10引入parquetio以来，Cloud Dataflow一直支持编写Parquet。来自文档

with beam.Pipeline() as p:
  records = p | 'Read' >> beam.Create(
    [{'name': 'foo', 'age': 10}, {'name': 'bar', 'age': 20}]
  )
  _ = records | 'Write' >> beam.io.WriteToParquet(filename,
  pyarrow.schema(
      [('name', pyarrow.binary()), ('age', pyarrow.int64())]
  )
)

匿名用户

云数据流没有生成Parquet文件的内置方法，但是根据ParquetAPI的快速浏览，实现基于文件的自定义数据流接收器应该相对容易（参见“FileBasedSink”）。

相关问题

使用djs v13播放本地音乐文件
在不下载文件的情况下使用YouTube的机器人播放音乐
创建一个不和谐机器人来播放. mp3文件
如何使用pygame自动完成歌曲后播放文件中的下一首歌曲
如何防止Spring Boot将危险控制器包含在生产配置文件中？
如何使用Gradle解压Jar文件时出现文件夹？
Gradle不包含要jar的资源文件夹[重复]
gradle任务和groovy文件上的导入
在jpack中复制Maven依赖文件和运行时
如何查看为C函数生成的汇编代码？[重复]
为什么clang为这个涉及幂的简单函数生成比gcc快得多的代码？
如何访问在网格窗格中生成的单元格？
JavaFX从FXML文件编辑Gridpane
在飞碟PDF生成器中使用主字体和回退字体
使用飞碟生成的pdf不显示指定字体的文本
飞碟/iTextPDF找不到css文件
生成多语言的PDF与飞行Saurce？
使用Kafka在应用程序上打开太多文件时出错
R-光栅函数NAs值在ASCII文件中低于-9999
将文件转换为iso-8859-1（从utf-8可以，但在us-ascii文件上失败）

Google Dataflow能否生成Parquet文件

共2个答案

相关问题

热门标签

微信关注