2016-04-11 15 views
0

HRデータを扱う組織(60 GB +毎日)。大規模なクエリの照会

組織階層データを効率的にクエリする方法。クエリしたいと思うとします -

a)組織ツリーにはどのレベルですか? b)ある人に対して何人の直接報告者および間接報告者が存在するか。 Aには2人の直接報告者(BとC)があり、B/Cにはそれぞれ10人の直接報告者がいます。次に、このケースでは、A = 20の総間接報道官とA = 22の総報道員

どのフレームワークがこれに最も適していますか? Cypher Query Language、Spark GraphX、Spark GraphDFなどを提供するNeo4jに行くべきでしょうか?

いくつかの簡単なコード例が大いに役立ちます。両方のための

答えて

1

使用サイファー -

a)の従業員は、トップボスに関連する編成である場所を見つけるために:

MATCH (e:Employee {empid: "ID"})-[r:REPORTS_TO*]->(boss:Employee) 
return e, r, boss 

b)の直接的および間接的なレポートです従業員を見つけるには従業員:

MATCH (e:Employee {empid: "ID"})<-[r:REPORTS_TO*1..2]-(sub:Employee) 
return e, r, sub 
関連する問題