对于一般模型影响不大,但对于回归模型而言,容易易导致回归系数标准误降低,使得对应p值减小。
重复值过多,样本随机误差降低,造成参数的贡献程度会被高估。
一般代码为:drop_duplicates(inplace=True)
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝