如果计算机能理解我们在网上输入的文字,并将其转换成一种表达其真实含义的语言,会发生什么?对来自社交媒体的数据进行分析可以洞悉我们的真实动机和感受此类深层次的问题,而不仅仅是数据统计。
法国哲学家Pierre Lévy从上世纪90年代开始致力于阐述网络空间,目前是渥太华大学的集体智慧加拿大研究主席,他正在研发一种能做到这点的软件。他用一种他称之为超语言的语言,为一整本法语词典做了注释,之所以称其为超语言, 因为其形容的词句本身就组成一种语言 ——信息经济元语言( the Information Economy MetaLanguage, IEML)。剩下的工作就是编码将其变为一个自动系统。
IEML的原理是,将特定语言中的每个词语用符号表示,这些符号的排列组合可以在代表几个象限的含义: 虚空,虚拟,实际,实物,存在和符号( empty, virtual, actual, things, beings, and signs) 。识别并计算这些符号的算法用IEML文本构建起一个语义网络,并计算出此段文本和其它文本的关系。编写一种软件将自然语言转成这种代码,让计算机通过这种代码互动,线上传播的本质和我们分析它所能得到的结果会彻底改变。
从美国国家保密局到网络广告主的每个人无疑会喜欢这种能力,因为它使得代理能够自行搜索网页理解意义。但是在人工智能方面,计算机之间能相互就真实意义进行交流会带来哪些影响呢?
在第九届研讨会上Lévy介绍了IEML之后,我找到了他以期进一步感受这个理论从而找出答案。
您能稍微和我介绍一下互联网集体智慧的意指么?
好的。集体智慧根植于动物,众所周知蜜蜂和蚂蚁的集体智慧。社会性动物也有集体智慧。它们释放信号告知彼此危险和食物所在。但是在人类的例子中,我们的集体智慧更加强大,因为我们有语言,我们有技术,我们有复杂的社会机构。这是更高层次的集体智慧,从根本上说,这种智慧基于符号操作。
在人类历史上,一旦出现增强我们操作符号能力的媒介,集体智慧也会得到增强。现在,我们处在操作算法符号的阶段,但是这一新时期才刚刚开始。我致力于利用这一新媒介来增进集体智慧。
关于集体智慧有很多误解。首先是集体智慧是创造出来的,但并不是,集体智慧已经存在了。第二个应当避免的观点是,集体智慧是群体思维。集体智慧和群体思维恰恰相反。在哲学意义上,集体智慧是多样性和奇异性的整合,而不是Kurzweilian。这不是整齐划一, 这是一起思考。
最后,最常见的错误是「哈,集体智慧?但是网上有这么多蠢东西。」一个哲学家曾经对我说,你可以想象一下,「更像是集体愚昧!」那么我要说,群体智慧不是愚蠢的反面,是人工智能的反面。
有人说:「我们要让计算机更聪明,」他们得到了所有的资助。但是如何使得人类更聪明呢?集体智慧就是一个让人类在计算机的帮助下变得更聪明的研究项目,而不是让计算机变得比人类更聪明。这是集体智慧真正的定义。
你已经注意到,一个问题有个长长的答案,所以好好选择你的问题 。
有些人担心有朝一日人工智能会灭绝人类,对此您怎么看?
我不同意。就因为许多名人这么说,不意味着我们应该滥调重提。我强烈反对。计算机或者智能软件,或者人工智能程序永远不会掌权。绝不。如果没有人维护它们,它们就会解体。从技术上讲这不现实。
而且,用这种方式来拒绝承担责任真是微妙。这些机器由人制造出来,这些软件由人类编程设计。它们是我们意志、意图的载体。它们没有意志和意图,它们只是延伸了我们的意图、思想。它们没有任何责任。
那如果人类知识被编码入机器呢?
你应该学过哲学吧。
好的。所以柏拉图的《斐得若》是非常重要的对话篇。他提出了和你一样的内容,但是不是关于机器,而是写作。他说:「什么,你要把我们所知道的全部信息放进图书馆?」因此,在图书馆里,假设是亚历山大图书馆,人类知识全部汇编于此,我们不再需要教授了。所有人都失业了。好怕怕!你要知道,18世纪巴黎有3000人专制运水。然后水管发明了,啊,他们丢了工作,好怕怕!
因此,不,我不觉得我们应当以如此消极的方式看待算法。我自己,曾经并且依旧在研究人工智能。我也设计过专家系统。我采访一组专家,试图理解他们的专业知识。然后,我以一种创造性的方式将他们的知识加以正式组织,形成层次规则,这样算法能够理解调用。他们没有因此而变得过时。恰恰相反,他们成为这一专家系统的主人。一旦他们在我的帮助下建立起这个系统,他们就自维持了。将他们的实践知识通过这个组织加以传播非常有益。
就像印刷或者写作,它们有利于知识传播。将知识转化成软件的形式是传播知识的好方法。应当加以鼓励而不是畏惧。
IEML如何让人们借助计算机这个工具变得更聪敏呢?
你有万维网这个巨大的数据库。它们在物理层面上共享一个地址系统,你可以通过服务器的地址达到所有信息,但是没有通用的分类系统。图书馆之所有有价值是因为它的分类系统,否则你怎么能找到正确的文件呢?
我们有许多种不同的分类法,我们有本体论,我们有许多方法给语言分类,不同的自然语言内部分类又不一样。实际上,当你不知道你在找什么的时候,信息搜集变得相当苦难。当你知道你在找什么的时候,谷歌很实用。但是当你试图驾驭知识的时候,就变得有点困难了。
一个很好的解决办法是求助维基百科,但它和19世纪大英百科全书的组织方式一样,基于相同的划分和分类。这些跨学科区分不是真实存在的,自然语言也是个问题。
我的想法是,采用一个通用的分类系统,得像自然语言一样灵活,当你想描述一份文件的时候,言无不尽。你不必遵守任何必须这样或者那样的规定。但是所有的描述都使用同一种语言,你也无需学习这种语言,因为你可以用自然语言和其交流。这种语言有一个奇妙的属性,即它是一个算法代码,每个短语都可以显示其内部语义网络,而且它也会计算某一个文本和其他相关文本之间的语义关系。
如果你用这个系统(所有的数据按照语义关系加以组织)进行数据分类,数据管理,并且在网上描述你在做什么,就会出现新思想。人们共同创造了这些思想,一起创造了思想组织的方式,通过他们的交流,思想的生态圈就此涌现。这就是关于自反的集体智慧我所宣扬的东西,集体智慧已经存在了,尤其是在互联网上,但是我们真的不太清楚我们在共同做点什么。
你熟悉这张著名的互联网图片,巨大网络上的连结像神经元,看看这些色彩。节点代表理位置,连结代表节点间的流量,但是你不知道其中的真正含义。我们将要实现的是实现一种地图,,节点代表思想,而连结代表计算。这意义重大。
许多人混淆计算和数量。不是这样的。计算在谈数量,甚至数学也在谈数量。如果我们能将这些结构关系数学化,我们就能计算语义关系。但是我们需要正确的代码。
我还有一个问题。你在建立组织信息的学说,这看上去会从根本上改变互联网上信息的搜集和编码。这会使得操作这个系统的所有人在一样层面上就互联网上的数据获得前所未有的洞察,你认为这里存在政治考量吗?
当然了。目前分析大数据的权力掌握在一些强大的实体手中,这些跨国公司,谷歌,Facebook……我不知道。国家安全局(NSA),国家通讯总局(GCHQ)……
这些政府和大企业。他们是使用这些大数据算法的主要人群,他们看上去掌握了很多,但其实没那多深度见解。我知道这背后是什么,主要是数据。数据可以为你提供信息,但真没有那么多。
在政治层面上,我的想法是给人民赋权,这种想法和上世纪70年代硅谷的激进分子如出一辙,他们想给每人一台电脑。他们做到了。现在每个人都有计算能力。每个人都应当有分析理解大数据的能力。这是主要观点之一。
如何做到呢?有两种主要工具。首先是语言自身,其次是实现语言的软件,这个软件必须是开放的免费的。这将在第三版GPL许可证下发布(著名的自由软件许可证)。正如Richard Stallman告诉我的,IEML每步行动都是透明的。
不是每个人都能为IEML字典出力的,因为你需要专业知识——语言能力,数学能力等等,但是这一层面上的所有事情都将是透明的而不是隐藏的。新标签的创立等等将向所有人开放。当然,按照定义,给数据赋予语义标签的应用将是完全免费而开放的 。
我不知道此外我能做什么。你不能强迫人们免费,但是你能为他们提供工具。我最多帮到这里。
机器之心,最专业的前沿科技媒体和产业服务平台,每日提供优质产业资讯与深度思考,欢迎关注微信公众号「机器之心」(almosthuman2014),或登录机器之心网站www.almosthuman.cn查看更多精彩内容。
|