当前位置:首页 > 网文选读 > 文摘阅读

假如算法有“偏见”

网络6年前 (2020-06-20)文摘阅读984

 

作者:方师师 摘自:《新华日报》2020年1月10日
 

  当互联网时代到来时,无数人预言互联网会让知识的获取更容易、让偏见与隔阂被打破、让世界变得更平等。然而,在互联网与人工智能加速发展的今天,偏激的观点、人群之间的隔阂在网络力量的助推下势头不减。这是为什么?

  在生活中人们会发现,使用百度搜索引擎搜索关键词,搜索结果页面的前几个链接会把搜索者引向百度自家的“百家号”;出差订酒店的时候,不同的人用不同的手机打开同一个App,看到的价格很可能不一样;我的一个朋友在腾讯公司上班,他晚上加完班打车回家,如果把起点定在公司门口,比起定在公司旁百米左右的便利店,价格会高20%。这些现象说明了一个问题:跟日常生活紧密联系在一起的互联网算法,本身并不是非常“确切”的,算法中存在着某种“偏见”。

  什么是算法?这个词刚诞生的时候并没有什么宏大的内涵。公元820年,阿拉伯数学家提出“算法”,当时它指的是“解决具体问题的一个方法”。随着纯数学理论向应用数学理论迁移,算法进入各种各样的应用数学领域,后来又被计算机科学、社会学、法学、政策学等领域借用,逐渐开始指向某种复杂的社会技术系统。这几年,算法为大家所熟知,很可能是因为它指向了更为具体的内容:算法决策服务。比如,浏览网站时,它会给我们推荐各种各样的商品;打开资讯类App,它会推荐新闻或者短视频;打开地图软件,它会规划前往目的地的路线……算法完成了一个将信息、算法和人三者联系在一起的闭环。

  这个闭环的最终目的,是帮助人从海量的信息当中打捞出最有意义、最有用的内容。和人做决策相比,算法确实具有更客观、更公正、效率更高的优点。但是如果算法出现错误,就有可能造成风险。而且很多时候,我们在使用各种各样的App时,并不知道算法正在偷偷地帮我们做决策,这种隐蔽性意味着一旦它在重要领域出错,人们往往来不及补救。

  那么算法到底存在哪些隐患?首先是技术层面的代码错误。当年,计算机科学先驱格蕾丝·霍珀在使用机电式计算机马克2号时出现设备故障。而导致这次故障的,竟是一只被卡在继电器中的虫子(bug)。此后,“bug”成为计算机领域的专业术语,意指漏洞。在生活中,程序员之间会相互调侃,比如程序员A看到B在写代码,也许就走过去用戏谑的语气说:“又在写bug呀。”这是因为人和技术之间的磨合始终处于探索阶段,程序当中出現错误很常见,无法保证万无一失。

  第二个隐患是算法偏差。大家在浏览网站、看视频、使用各类应用的时候,会发现这些网站好像非常“懂”自己,所推荐的内容刚好就是自己喜欢的。这其实是一个概率问题。可以想象这样一个场景:有一个不透明的袋子,里面有很多小球,小球的总数未知,小球的颜色也未知。如何搞清楚这个不透明的袋子里小球的颜色分布呢?对算法来讲,我们就是不透明的袋子,我们各种各样的兴趣爱好就是袋子里面的小球。算法可以根据“已知小球”制定模型,去推测我们对什么事物感兴趣。已知条件越多,算法的准确率越高,但也不能保证百发百中。

  第三个隐患是技术偏向。我们现在使用的手机设备、社交网络等已经取代了之前很多的媒介形式。加拿大媒介理论家马歇尔·麦克卢汉认为,人类经历了口语时代、书写时代和电子媒介时代。口语时代时,人是部落化的生存状态,彼此都是认识的。到了书写时代,人和人之间在空间上就被隔离开了。现在到了电子媒介时代,尤其到了算法与社交媒体、互联网、移动互联网相结合的时候,人尽管在现实空间中相隔甚远,却在互联网这个虚拟空间里联系紧密,很容易沉浸在自己所选择、所构建的小世界中无法自拔。这种情况也更容易滋生极端的情绪和思维。

  第四个隐患是社会偏见。微软推出过一个AI聊天机器人Tay,它仅在推特上线一天就被下架了。因为在上架之前,微软的程序员希望Tay在开放性的互动中产生自己的观点、意愿,没有限制它的语言模式和交往模式。结果这个机器人在与人对话的过程中快速地“学”会了辱骂人类和发表关于种族歧视的言论。从这个案例可以看出,开放环境中的数据里存在着大量的偏见和错误认知,放任机器去学习这样的数据,我们无法保证它会变得更睿智、客观。吊诡之处在于,由于大多数人对科学技术的信任,当算法给出一个看似科学的结果,而这个结论恰恰符合了固有的成见时,我们不会去质疑算法有没有问题,反而会用这个结果去巩固成见。

  面对算法“偏见”,人类应该怎么办?学界对AI技术价值观讨论的大体结论是,我们要纠偏,以此把算法变得更加人性化。也有学者提出,当人类认为算法应该去除“偏见”的时候,应该问的是,人性是什么。这个问题会触及更深的思考。在社会心理学当中有这样的一个量表,它的纵坐标是experience(代表人类对于外部世界的感知和体验),横坐标是agency(代表的是控制、把握,一些更加机械化的具有指标性质的东西)。人类处于这张坐标图的右上角,机器人处于中间偏下的位置,由此可以看出,人类对experience的要求非常高,人性处于一种不完备、不完美的状态。那么,既然我们自己本身存在着许多不完美之处,为什么还要要求算法变得和我们一样?

  这个问题也许不会有答案,算法的“偏见”不仅是技术的问题,更是社会的、历史的问题。可以确定的是,在未来,算法和人类势必处于一种共栖共生的关系当中。也许,我们要问的,不是“算法有偏见吗”,而是如何定义“偏见”。判断“偏见”的标准从何而来?对人性是不是应该有一些反思?既然没有办法一劳永逸地解决问题,那么我们的思考方式可能需要一些转变。

  (孤山夜雨摘自《新华日报》2020年1月10日,勾犇图)

无忧岛网旗下自媒体平台有 (原无忧岛资讯)无忧岛数码家电 欢迎您的关注。

分享给朋友:

相关文章

麦克纳马拉去了哪里

作者:凌 河    来源:《解放日报》2009年12月4日 我念小学的时候,正值越战。记得那时节,在报上读到一张照片,标题是“麦克纳马拉黯然下台”,那…

电影制片人是做什么的

作者:[美]马蒂?西蒙斯 译者 庞启帆    来源:《青年参考》2010年1月16日 编剧,当然是写剧本的。演员,当然是扮演剧中人物的。导演,毫无疑问…

“懒人密码”排行榜

作者:御景嫣    来源:《青年参考》2010年1月26日 爱上网的人可能面临这样的难题,如何记住一堆账号和密码。不少人为了方便,干脆设定“12345…

游戏与发明

作者:韩东    来源:《南方周末》 中国人现在很牛,自我感觉良好,动不动就要和人家比,承认差距,但觉得差距不大,只要假以时日就可以迎头赶上。并且借一…

名人

    作者:亦舒    来源:《意绵绵》 群众不自学地要求名人品性、样貌十全十美。 否则不会有这样的评语:“原来他是…

提问2010

作者:郭振玺    来源:《提问2010–中国百姓关注的十大民生问题》 提问1:2010,我口袋里的钱会贬值吗 2009年12月初的一天,吃过早饭,…

最穷的慈善家

作者:洪立    来源:《外滩画报》总第382期 像斯坦·布洛克这样的奇人,世界上很难找到第二个。 这位74岁的英国老汉,是一个绝对的赤贫者:没有收…

把权力关进笼子

作者:乐天    来源:《大科技·百科新说》 要做到权力制衡,最重要的不是民主,而是“共和”。共和制是这个世界上最普遍的制度,不论是社会主义、资本主义…

革新中国教育十二策

作者:刘庚子    来源:《南方周末》2010年6月3日 编者按:作者为北京师范大学哲学博士,山东大学经济学院客座教授,校董,曾办过学校。教育领域存在…

花语

作者:吕游    来源:《青年博览》 1.小麦花开放大约5分钟,是世界上寿命最短的花,但它结出来的果实,却养育了世界上千千万万的人,千百年来谁也离不开…

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。