1
Google BigQueryを使用してgithubアーカイブから共同作業者のログイン、リポジトリ言語、名前をクエリしようとしています。次のクエリは、GROUP BYを除外してもうまく動作しますが、GROUP BYを使用すると、グーグルのbigqueryからタイムアウトするまで、クエリは永遠に続きます。 Google BigQueryにはDISTINCTがないので、私はDISTINCTとしてGROUP BYを使用して、繰り返しの行を取得しないようにしています。ここで私が使用しているクエリは:Google BigQuery GROUP BYタイムアウト
SELECT
a1.actor_attributes_login,
a2.actor_attributes_login,
a1.repository_language,
a1.repository_name,
FROM
[githubarchive:year.2014] AS a1
LEFT JOIN
[githubarchive:year.2014] AS a2
ON
a1.repository_name = a2.repository_name
WHERE
a1.actor_attributes_login != a2.actor_attributes_login
AND a1.actor_attributes_location = "California"
AND (a1.repository_language = "Java"
OR a1.repository_language = "Python")
GROUP BY
a1.actor_attributes_login,
a2.actor_attributes_login,
a1.repository_language,
a1.repository_name
LIMIT
10000
ああ伝説!最初のインナーセレクトの名前をa1に変更する必要がありました。これはこのテーブルで2つのテーブルに使用されているため、曖昧であるが偉大なこと以外は却下されます。ありがとう! –