一、BasicDBObject
整個聚合查詢是統計用戶的各種狀態下的用戶數量為場景:
1.篩選條件:
date為查詢日期:
BasicDBObject Query = new BasicDBObject(); Query.put("time",new BasicDBObject("$gte", date + " 00:00:00") .append("$lte", date + " 23:59:59"));如果有多個條件:直接加Query.put("status", 0);
如果有OR篩選:
BasicDBList values = new BasicDBList();values.add(new BasicDBObject("status", new BasicDBObject("$exists",false)));values.add(new BasicDBObject("status", 0));Query.put("$or", values);其中new BasicDBObject("$exists",false)) 就是“status”不存在(mongodb文檔可不等於實體的字段)
2.拼接match
DBObject Match = new BasicDBObject("$match", Query);將上一步的Query放入macth篩選中
3.拼接分組條件
此步相當於SQL的Group By
BasicDBObject GroupBy = new BasicDBObject();// 分組條件GroupBy.put("userId", "$userId");//根據用戶ID來分組同第一步的篩選一樣,如果有多個分組可直接添加在後面:GroupBy.put("status", "$status");
4.分組後查詢
首先把分組拼接上:
DBObject Select = new BasicDBObject("_id", GroupBy);如果我們要對分組後的數據進行操作:(這裡是用戶的統計數量)
Select.put("count", new BasicDBObject("$sum", 1));5.拼接$group
DBObject Group = new BasicDBObject("$group", Select);至此。我們拼接,mongodb的語句到此結束
下面我們開始查詢操作:
import com.mongodb.AggregationOutput;import org.springframework.data.mongodb.core.MongoTemplate;AggregationOutput Output = mongoTemplate.getCollection("這裡是mongodb的數據表名") .aggregate(Match, Group);讀取查詢結果:
Iterable<DBObject> map = Output.results();//遍歷mapfor (DBObject dbObject : map) { //這裡讀取到的map為{"_id":{"userId":1,"status"0}}... Map<String, Object> resultMap = (Map<String, Object>) dbObject.get("_id"); //這裡截取掉.0 Integer userId = Integer.parseInt(CommUtil.toString(ausgMap.get("userId")).replace(".0","")); //在這裡我們就可以對我們的數據進行操作了; Integer count = Integer.parseInt(CommUtil.toString(dbObject.get("count"))); }二、DBObject
不多說,如果大家覺得第一種方法特別長篇大論,那麼下面我給大家帶來一種代碼更簡潔的聚合查詢:
直接上代碼吧。
1.注意導入的包:
import com.mongodb.DBObject; import com.mongodb.util.JSON;
2.$macth:
(beginDay-查詢開始日期;endDay-查詢結束日期)
DBObject match = (DBObject) JSON.parse("{$match:{'status':'1','time': {$gte:'"+beginDay+"',$lte:'"+endDay+"'}}}");3.$group:
(以userId分組,統計用戶數量,累加amout字段值,取amout字段最大值)
DBObject group = (DBObject) JSON.parse("{$group:{_id:'$userId', count:{$sum:1},total:{$sum:'$amount'},maxSigle:{$max:'$amount'}}}");條件拼接完,開始查詢:
List<DBObject> list = new ArrayList<DBObject>();list.add(match); list.add(group);AggregationOutput Output = mongoTemplate.getCollection("表名").aggregate(list);遍歷結果就不用在說了。上面已經詳細描述了
第二種方法是不是比一種方式簡單多了。但是比較考驗自身對mongodb語句熟悉性。
【擴展】
接著上面的方法進行擴展
//status 為0或者為1 ; type 不為11;time在beginDay ~ endDay時間段內DBObject match = (DBObject) JSON.parse("{$match:{'status':{$in:['0','1']}, type:{$ne:11},'time':{$gte:'"+beginDay+"',$lte:'"+endDay+"'}}}");//以用戶Id分組,統計查詢次數,取最後一次time的時間DBObject group = (DBObject) JSON.parse("{$group:{_id:'$userId', count:{$sum:1},lastTime:{$max:'$time'} }}");//在上一步統計出的結果中篩選次數大於100的數據DBObject groupMatch = (DBObject) JSON.parse("{$match:{count:{$gte:100}}}");//$project----查詢結果中需要顯示哪些字段,顯示則設置為1。如下需要不顯示_id 域(字段),則需如下指定://db.集合名.aggregate( [ { $project : { _id: 0, count: 1 , lastSuccTime: 1 } } ] )DBObject project = (DBObject) JSON.parse("{$project:{_id:1,count:1,lastSuccTime:1}}");DBObject sort = (DBObject) JSON.parse("{$sort:{'count':-1}}");//排序List<DBObject> list = new ArrayList<DBObject>();list.add(match);list.add(group);list.add(groupMatch);list.add(project);list.add(sort);AggregationOutput catchOutPut = mongoTemplate.getCollection("表名") .aggregate(list);//查詢結果三、BasicDBObject+腳本語句
BasicDBObject groupIndex = new BasicDBObject();BasicDBObject distinctQuery = new BasicDBObject();distinctQuery.put("userId", new BasicDBObject("$in", userIds));//UserIds數組BasicDBObject initIndex = new BasicDBObject();initIndex.put("count", 0);//給count賦初值// 腳本(doc代表數據庫的數據.prev代表查詢結果//prev.count這裡的count就是上一步initIndex的count)String reduce = "function(doc, prev) {if(doc.status==0){prev.count+= 1;};}";List<Map<String, Object>> basicDBList = (List<Map<String, Object>>) mongoTemplate. getCollection("Collection").group(groupIndex, distinctQuery, initIndex, reduce, null);最後循環遍歷List即可得到結果【PS:group這種聚合方式有個限制條件--->超過20000數據就會報錯】
以上就是我在普通業務處理中用到mongodb聚合處理。如果有更好的方法或是有需要改進的地方,歡迎大家給我留言~