BigQuery Table a Pub Sub Topic在Apache Beam中不起作用PythonSDK？Streaming Sink的静态源

提问者：小点点

BigQuery Table a Pub Sub Topic在Apache Beam中不起作用PythonSDK？Streaming Sink的静态源

我的基本要求是创建一个从BigQuery Table读取的管道，然后将其转换为JSON并将其传递到PubSub主题。

起初，我从Big Query中读取并尝试将其写入Pub Sub Topic，但收到异常错误，称批处理管道不支持“Pub Sub”。所以我尝试了一些解决方法和

我能够在python中解决这个问题

 
  从BigQuery阅读-

p = beam.Pipeline(options=options)

json_string_output =   (
                          p
                          | 'Read from BQ' >> beam.io.ReadFromBigQuery(
                                query='SELECT * FROM '\
                                 '`project.dataset.table_name`',
                                 use_standard_sql=True)
                          | 'convert to json' >> beam.Map(lambda record: json.dumps(record))
                          | 'Write results' >> beam.io.WriteToText(outputs_prefix)
                      )

p.run()

 
  然后从那里运行一个普通的python脚本从文件中读取它的行并将其传递到PubSub Topic

 # create publisher
    publisher = pubsub_v1.PublisherClient()

    with open(input_file, 'rb') as ifp:
        header = ifp.readline()  
        # loop over each record
        for line in ifp:
            event_data = line   # entire line of input file is the message
            print('Publishing {0} to {1}'.format(event_data, pubsub_topic))
            publisher.publish(pubsub_topic, event_data)

Python工作代码仓库

我无法找到在单个ApacheBeam Pipeline中集成这两个脚本的方法。




             共1个答案


                        

                
                    匿名用户

                




                
					
因为您的管道没有任何无界PCollection，它将自动以批处理模式运行。您可以使用--流命令行标志强制管道以流式模式运行。


		      
                相关问题
                

																                
					
										   Android：在模块jefied-play-services-测量和jefied-play-services-测量-impl中发现重复类
										   在Hashmap中查找匹配的键/值对
										   如何迭代Hashmap并与同一Hashmap中的其他键进行组合以比较它们的对象
										   HashCode-如果相等的对象碰巧在同一个桶中散列会发生什么？
										   如何防止对数组中类对象的重复引用？
										   如何以及何时在HashMap中完成重新散列
										   在hashmap或hashtable中重新散列的成本
										   HashMap如何识别内部数组中的哪些位置包含元素？
										   当HashMap增加其大小时，HashMap中值的索引会发生什么？
										   @BeforeClass在ktor测试类中不工作
										   Jest vanilla JavaScript JSDOM刷新失败，切换beforeAll到before每一个后的第二次测试中断
										   在笑话中，定义全局变量是否与在BeforeAll中定义相同？
										   静态编程语言中@BeforeAll的正确解决方法是什么
										   线程“main”java. lang.NoClassDefFoundError中的异常：在Intellij[Spring boot]中
										   线程“main”java. lang.NoClassDefFoundError中的异常：org/apache/log4j/ProvisionNode
										   log4j2 java. lang.NoClassDefFoundError：org/apache/log/log4j/LogManager
										   异步管道是否从服务中定义并从组件变量指向的可观察对象取消订阅？
										   结合主体时不更新在模板中的异步管道可观察
										   组件中的Angular 2重复订阅
										   应该在ngOnDestroy（）中将Angular组件变量设置为null吗？

BigQuery Table a Pub Sub Topic在Apache Beam中不起作用PythonSDK？Streaming Sink的静态源

共1个答案

相关问题

热门标签

微信关注