Home [Python] multiprocessing Pool
Post
Cancel

[Python] multiprocessing Pool

파이썬에서 큰 리스트가 주어졌을때, 리스트를 multiprocessing을 통해 처리하는 방법, 리스트에 파일 경로가 포함되어 있다면 각 파일별로 프로세스가 처리

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import multiprocessing as np

def get_stats(filepath):
    stats = {}
    with open(filepath) as f:
        # read file
    return stats


filepaths = []
n_procs = 4
p = mp.Pool(n_procs)
proc_results = p.map(get_stats, filepaths)
p.close()
p.join()

# merge proc_results
This post is licensed under CC BY 4.0 by the author.

[Pyspark] Wilson Score UDF

[Python] Pandas에서 특정 컬럼 제외하고 나머지 선택