请教厉害大神~~
比如一个有500条records的dataset里面需要按4个变量的值的出现频率比例筛选出25个records, 尽量满足各个变量中不同的值出现比率
比如说:
性别:男 68%
女 32%
地区:
东北: 10%
西北: 34%
华北: 51%
华南: 5%
年纪:
1- 30 岁: 23%
30 - 60 岁: 46%
60 - 90 岁: 20%
90+ : 11%
最高学历:
小学:9%
中学: 35%
大学: 39%
硕士以上:17%
我实际中的task有16个变量而且细分程度很高 , 想请教大神们有什么好的思路能选出25个records尽量满足这些百分比条件。