在几千英里之外的印度班加罗尔,卡拉躲在卧室的角落里工作,这是她的临时家庭办公室。琼和卡拉做着相同的工作,为互联网公司做单词和图片的分类和标记。不同的是,卡拉从一家外包公司手中接活,这家公司为通用人类关联系统(UHRS)提供人力。UHRS是微软公司自建的供内部使用的平台,跟MTurk很像。卡拉43岁,拥有电气工程学士学位,她是家庭主妇,也是两个十几岁孩子的母亲。卡拉把两个孩子叫进房间,指着LED显示屏上一大段话中的一个单词问他们:“这个词是什么意思?是你们不该说的东西吗?”卡拉大声朗读这段话,两个孩子咯咯地笑了起来。他们在取笑卡拉读“小妞电影”(Chick flick)时的发音。两个孩子一致决定,不,这句话不包含成人内容。卡拉在屏幕上点击“否”,窗口就会刷新,出现一个新的短语让孩子们理解。“他们比我更有资格鉴别这些词,”卡拉笑着说,“他们帮助我为其他家庭维持干净和安全的互联网。”卡拉经常找不到足够多的任务,每周的工作时间不到15个小时,但她几乎每天都会登入UHRS,看看是否有新的任务是她有资格做的。卡拉的坚持和运气已经得到了回报。由于她已经学会如何快速浏览和申领任务,所以可以利用做饭和检查孩子作业之间的空闲时间,用卡拉的话来说,她感觉这些时间“富有成效”,因为她通过网络搜寻她关心的额外收入。
有很多新工作依赖于琼和卡拉这样的人,内容审核——从筛查新闻提要和搜索结果,到评判相应内容的争议,从而帮助科技和传媒公司判断哪些内容可以保留,哪些内容需要删除——只是其中一个例子。社交媒体公司试图确保数十亿网站用户每天得到家庭友好型的信息,因此内容审查是普遍存在的,通常也是时效性很强的任务。像琼和卡拉这样的人,有太多网页、照片以及各种语言的推文需要评估。
谷歌、微软、Facebook和Twitter等公司使用软件自动删除尽可能多的“不适合在工作场合出现的内容”。但这些由机器学习和人工智能驱动的软件过滤系统并不完美。它们不能百分百地区别拇指和阴茎,更别提仇恨言论和讽刺了。还记得2012年美国总统大选的经典时刻吗?当时共和党总统候选人米特·罗姆尼(Mitt Romney)说了句“满载女性的活页夹!”,惹恼网民。Twitter需要工人做琼那样的工作,从而及时判断为什么包含在话题标签中的让人摸不着头脑的一句话会飙升到热门话题的最前列。是黑客干的吗?是出故障了吗?真的有人在疯狂地刷Twitter吗?目前的人工智能系统还无法可靠地辨别上述问题。而按需工作指明了一种方向,可以把计算能力与人类的创造力和活力结合起来。
琼、卡拉以及数百万和她们一样的工人在人工智能失灵时介入,本书讲述的就是他们的故事。我们想当然地以为系统是自动的,但他们才是在幕后推动系统的人类。现代的人工智能系统不仅需要人类回答不熟悉的或有难度的问题,最开始还需要人类帮助它们学习如何回答问题。例如,搜索“驼背沙发”的图片,你会得到一大堆靠背呈曲线的沙发。必应、谷歌这样的搜索引擎并不能和我们人类一样看到或理解图像。家具爱好者不到一秒钟就能找出一件漂亮的带曲线靠背的沙发,这种沙发像驼背沙发一样可以让很多人坐在上面。搜索引擎背后的人工智能系统最开始必须输入至少几百张曲线靠背沙发的图片,每张图片都标记为“驼背沙发”。然后,当搜索引擎遇到一张新的沙发图片时,它会运行一种所谓的“分类算法”,这种算法本质上就是在检查,相比于没有被标记为“驼背”的沙发,这张新图片是否更适合被标记为“驼背”沙发。那么,最初的一系列带有标签的图片,也就是所谓的训练数据,是从哪里来的呢?来自贾斯汀。引导大家接单的任务描述不会超过两句话,贾斯汀这样的工人必须在几秒钟内申请工作,否则就会被其他愿意接手的人捷足先登。贾斯汀是个全职爸爸,带着两个年幼的儿子,孩子上学前和午睡时是他工作的时间。他大方地承认,一开始并不知道驼背沙发是什么。“在回答这些问题之前,我必须在谷歌上花很多时间,弄清楚这些术语的含义。”
许多企业提供这样的付费项目,其中猫途鹰(TripAdvisor)、Match.com、谷歌、Twitter、Facebook和微软知名度较高。像贾斯汀这样的人按任务获得报酬,一天24小时,每周7天。每天都有新的企业出现,他们的商业模式依赖于世界各地的工人,这些工人通过软件响应公开选拔,在幕后完成这些工作。这些企业把日常活动外包给独立工人,而不是交给正式雇员。他们利用幽灵工作回答客户的在线咨询,编辑产品评论,或者完成几乎不需要雇员全职参与的工作。