Python CSV编写器自动限制每个文件的行并创建新文件

提问者：小点点

Python CSV编写器自动限制每个文件的行并创建新文件

我试图让以下工作：

import csv
csv_record_counter = 1
csv_file_counter = 1

while csv_record_counter <= 1000000:
    with open('some_csv_file_' + str(csv_file_counter) + '.csv', 'w') as csvfile:
        output_writer = csv.writer(csvfile, lineterminator = "\n")
        output_writer.writerow(['record'])
        csv_record_counter += 1
while not csv_record_counter <= 1000000:
    csv_record_counter = 1
    csv_file_counter += 1

问题：当记录增加到1000000以上时，不会创建后续文件。脚本将继续向原始文件中添加记录。

共3个答案

匿名用户

我喜欢在导出数据之前对其进行批处理。

def batch(iterable, n=1):
    length = len(iterable)
    for ndx in range(0, length, n):
        yield iterable[ndx:min(ndx + n, length)]

headers = []  # Your headers
products = []  # Milions of products go here
batch_size = int(len(db_products) / 4)  # Example
# OR in your case, batch_size = 1000000000

for idx, product_batch in enumerate(batch(products, batch_size)):
    with open('products_{}.csv'.format(idx + 1), 'w') as csvfile:
        writer = csv.DictWriter(csvfile, fieldnames=headers)
        writer.writeheader()
        for product in product_batch:     
            writer.writerow(product)

参考资料：

如何在常量大小的块中分割迭代
在for循环中访问索引？
Python逐行写入CSV

匿名用户

首先缩进你的第二个同时循环，并删除“不是”。然后使用for-而不是whing-循环来创建csvs。此外，不要忘记重置csv_record_counter。

import csv
csv_record_counter = 1

rows = #Your number of rows to process

additional_file = 1 if rows/1000000 % 2 != 0 else 0

for csv_file in range(1, int(rows/1000000) + 1 + additional_file): #Set rows as your maximum number of rows / This will return your number of csv to create
    with open('some_csv_file_' + str(csv_file) + '.csv', 'w') as csvfile:
        output_writer = csv.writer(csvfile, lineterminator = "\n")
        output_writer.writerow(['record'])
        csv_record_counter = 1 #Remove your "+"
        while csv_record_counter <= 1000000: #Remove your "not"
            csv_record_counter += 1
            output_writer.writerow("your record")

编辑：添加了附加的_文件

匿名用户

尝试writefile。使用编写器后刷新（）。writerow（）

该flush语句将清除缓冲区，使RAM可以自由完成新任务。

当处理大量行时，缓冲区将被任务填满，直到当前运行的代码退出，缓冲区才会被清除。

所以，每次使用write语句在文件中写入内容时，最好手动清除缓冲区


		      
                相关问题
                

																                
					
										   如何迭代Hashmap并与同一Hashmap中的其他键进行组合以比较它们的对象
										   使用Junit重新运行失败的测试
										   异步管道会自动取消订阅可观察，如果我改变可观察？
										   AngularJS-$销毁是否删除事件侦听器？
										   Angular： in ngOnInit（）当我重新加载组件时，我的rxjs Fucntion不会运行
										   您是否需要取消订阅Angular中的路由器参数？
										   Angular2路由器（@angular2/router），如何设置默认路由？
										   如何编写一个函数，使超文本传输协议请求并返回请求的结果？
										   订阅的自定义完成方法是否会自行取消订阅？
										   组件被销毁和重访后，订阅在ngOnInit函数中运行
										   @组件的Angular@取消订阅装饰器
										   Spring：404错误仅以vo类作为Spring控制器中的参数
										   使用REST创建Jira问题API
										   编译器如何为类分配内存？
										   sizeof（）值是由编译器还是链接器决定的？
										   为什么C函数可以创建可变长度的数组？
										   如何禁用RBP帧指针寄存器优化GCC时使用-O*？
										   ARM帧指针寄存器（r11）不断变化
										   如何在clang中禁用自动“通过指针”优化？
										   为什么x86架构使用两个堆栈寄存器（esp； ebp）？

Python CSV编写器自动限制每个文件的行并创建新文件

共3个答案

相关问题

热门标签

微信关注