2012-02-17 12 views
11

私は、ループのトリプルネストを高速化するためにPythonのitertoolsモジュールを使用しようとしています。以下のテストコードがitertools'製品の方法および出力を標準トリプルネストされたループを比較:Python itertools - 遅い?

ネストされたループ時間を= 2.35023秒

Itertoolsループ時間は= 2.67766秒

私は何かが足りないのですか?

import numpy 
import itertools 
import time 

n = 128 
a = numpy.arange(n**3).reshape((n,n,n)) 
b = numpy.zeros((n,n,n)) 
c = numpy.zeros((n,n,n)) 

t = time.time() 
for i in range(n): 
    for j in range(n): 
     for k in range(n): 
      b[i,j,k] = a[i,j,k] 
print 'Nested loop time = %g secs' % (time.time() - t) 

t = time.time() 
for (i,j,k) in itertools.product(range(n), repeat=3): 
    c[i,j,k] = a[i,j,k] 
print 'Itertools loop time = %g secs' % (time.time() - t) 
それは itertools.productのように見えるん
+0

「私に何か不足していますか?」あなたが見逃しているように見えるのは、誰もitertools.product()のアイデアはループのネストをスピードアップすることではないということです。 –

+3

@Sven Marnach 9.7。 itertools - 効率的なループのためのイテレーターを作成する関数... http://docs.python.org/library/itertools.html –

答えて

9

が大きいnの値に対して遅い:楽しみのためにも

 
In [40]: print _39 
from itertools import product 

def itertools_product(n): 
    for ijk in product(range(n), repeat=3): 
     pass 

In [41]: %timeit itertools_product(128) 
10 loops, best of 3: 115 ms per loop 

In [42]: %timeit itertools_product(10) 
10000 loops, best of 3: 59.2 us per loop 

In [43]: %timeit itertools_product(300) 
1 loops, best of 3: 1.47 s per loop 

、リスト内包とジェネレータ式:

 
In [24]: print _23 
from itertools import product 

def nested_loops(n): 
    for i in range(n): 
     for j in range(n): 
      for k in range(n): 
       pass 

def itertools_product(n): 
    for (i,j,k) in product(range(n), repeat=3): 
     pass 


In [25]: %timeit nested_loops(128) 
10 loops, best of 3: 68.6 ms per loop 

In [26]: %timeit itertools_product(128) 
10 loops, best of 3: 162 ms per loop 

In [27]: %timeit nested_loops(10) 
10000 loops, best of 3: 84.5 us per loop 

In [28]: %timeit itertools_product(10) 
10000 loops, best of 3: 79.8 us per loop 

In [30]: %timeit nested_loops(300) 
1 loops, best of 3: 833 ms per loop 

In [31]: %timeit itertools_product(300) 
1 loops, best of 3: 2.07 s per loop 

タプルのアンパックなし:

 
def list_comprehension_product(n): 
    range_n = range(n) 
    for (i,j,k) in [ (i, j, k) for i in range_n for j in range_n for k in range_n ]: 
     pass 

def generator_expression_product(n): 
    range_n = range(n) 
    for (i,j,k) in ((i, j, k) for i in range_n for j in range_n for k in range_n): 
     pass 

In [51]: %timeit list_comprehension_product(128) 
1 loops, best of 3: 583 ms per loop 

In [52]: %timeit generator_expression_product(128) 
1 loops, best of 3: 480 ms per loop 

これらのベンチマークはpython --versionで実行されました:

2.6.7 (r267:88850, Jul 31 2011, 19:30:54) 
[GCC 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2335.15.00)]
+1

はい、大きな範囲では遅くなるようです。そしてそれはあなたがそれがより速くなりたいところです - そうですか? – repoman

5

第二のループは、恐らくはタプル開梱の、最初よりも遅いように思えるん。あなたがそれを行う必要はありません、と私はそれがこのようにそれを行うにはより高速な第二のループを作る見つける:numpyので、もちろん

for ijk in itertools.product(range(n), repeat=3): 
    c[ijk] = a[ijk] 

、あなたはすべての要素をループ避けたい、と代わりに使用します一度に配列全体に対してnumpy操作を実行します。そうすれば、すべてのループなどがC言語で行われているため、大幅なスピードアップが可能になります。

+0

これはnumpyに関連したくありませんでした。すばやく3重のインデックス作成ができるようにnumpyを使用しました。トリプル引数を持つ関数への呼び出しだったかもしれません... – repoman

関連する問題