如何编写R函数以匹配和合并2个文件(如VLOOKUP)
匹配和合并2个文件是我发现我一直都在做的任务。从历史上看,我曾在MS Excel中使用VLOOKUP并解决了所有限制。最后,我硬着头皮写了一个R函数,该函数可以更快,更灵活地完成技巧。
(图像由编辑器添加,来源)
什么是VLOOKUP?
在深入探讨它之前,让我们看一下Excel的VLOOKUP函数如何工作,以便清楚地知道我们在R中正在复制什么。VLOOKUP用于根据匹配值将数据从一个数据集复制到另一个数据集。在这种情况下,“数据集”可以引用列,表,工作表等。例如,您可能有一个工作表包含客户的联系信息。在您的电子邮件程序中,您有一个电子邮件地址列表,其中包含对电子邮件活动执行的操作。现在,您要将联系人数据与电子邮件打开/单击数据结合在一起。使用VLOOKUP,您可以按每个数据集中的“电子邮件”列进行匹配,并将打开/单击数据复制到联系人数据中。
例:
那么,为什么不只使用VLOOKUP?
好问题。如果您只在此处和那里以及相对较小的数据集上执行VLOOKUP,那么花时间在R中编写函数可能就没有意义。但是,如果您发现自己经常使用VLOOKUP,或者在一个项目中需要多个VLOOKUP,通过现在花一点时间开发R函数,可以长期节省大量时间。
VLOOKUP也有一些可以用R克服的限制。首先,VLOOKUP只从左到右读取,因此您必须确保查找值(要匹配的内容)在要复制的数据的左侧。其次,VLOOKUP公式一次只能处理一列。如果您需要复制多列,则需要多个VLOOKUP公式。VLOOKUP也可能导致性能问题。大型数据集中的多个VLOOKUP可能会使速度变慢或使Excel崩溃。除了提高效率外,R函数还可以克服所有这些问题。
为什么选择R?
好吧...这是我的教程,我选择了R。这里的参数并不是专门针对pro-R的,它是自动功能与手动工作的参数。因此,如果您喜欢使用Python,请使用Python。使用您想要的任何语言。就是说,如果您经常使用数据,并且正在寻找一种学习语言,R就是很好的选择。它易于学习,免费且功能强大。正如您将在这里看到的,即使您是R的新手,本教程也将非常容易遵循和实施。
1