1.数据
org(350条记录):
id name 1 name1 2 name2 3 name3 .... 350 name350
record(355W记录,其中count(distinct id)=1.3W,id+orgid具有唯一性, record.orgid=org.id):
orgid id 1 1 2 1 12 1 .... 3 2 4 2 5 6 ....
2.需求
请给出数量最多的ORG.ID清单X,record中某个ID下的ORGID均包含在清单X中时(可以比清单更多),则把这个ID加入组号为GROUP_X的数组,如果GROUP_X中数组个数能够达到1.3W的75%,则这份清单X就是需要的数据。
个人感觉用暴力循环计算量太大了,有没有什么更好的办法。