今天受邀回答了知乎科技的问题,以下是我的回答,感谢知乎,大家有一个很不错的关于知识的分享交流平台。
个人的理解和观点如下仅供参考:
首先自然语言是一种智能信息载体,人类的语言博大精深,全世界不同的语系语言纷繁绚丽,就拿汉语和英语来说,历史长河中人类智慧的结晶主要用自然语言通过书籍进行传承。
自然语言的魅力不仅在于其传达日常的信息,更在于其表达的模糊性和多样性,一千个读者眼里有一千个哈姆雷特,从而可以说语言是一种博大精深的艺术。华夏五千年的四书五经(虽然没有系统读过),莎士比亚的悲喜剧,还有无数经典的中外小说琳琅满目不计其数,文史哲这类的鸿篇巨制也是目不暇接。而计算机的编程语言是一种更加规范和约束性的语言范式,没有二义性,是对计算过程的准确定义和描述。
基于深度学习的自然语言模型如基于transformer架构的GPT模型等通过大量的语料库对语言之间文字的上下文相关性进行统计学习来对语言的规律进行建模。大模型是基于人类反馈的强化学习进行的统计训练,也是基于大量的问答数据进行的统计学习。强化学习从生物的刺激响应的特性(巴普洛夫条件反射实验)中获得启发,因此如chatgpt和其他开源大模型的表现一样,从输入输出来看拥有一定的智能。
但是智能的载体不限于语言,从我个人的理解,智能的出现可能是历史进程中长时间的生物进化过程中出现的,从单细胞到多细胞,从植物到动物,特别是智人的出现,耳聪目明,心灵手巧,人类首先可能是通过眼睛观察世界,耳朵倾听世界(还有触觉嗅觉味觉感知通道)来不断加深对世界的了解和不断的归纳总结并且通过不断发展的手段将这些了解记录传承下来,使得文明的程度得到持续积累和进步。
因此个人的观点,智能的数字空间载体是信息(是一种数字和抽象的表达,如自然语言,数学公式语言等),信息可以是传统的各种语言文字,也可以是数字图像、语音、图形等多媒体富媒体形式,智能的物理空间载体是纸张,磁盘,电磁波以及人脑的记忆等等,智能的载体是其物理空间载体和数字空间载体的融合,所以可以说智能的载体是个很宽泛宏大的范畴,智能本身也是深邃和没有止境的,就如浩瀚无边的宇宙一样。
所以现有的大模型基于自然语言的智能其表现出的智能程度还是有较大局限的,所以有多模态的数据加入进来,但是现在多模态的融合好像还没有发展的很好。而且人类的智能发展经历了久远时代的积累,而机器表现出的智能才仅仅很短的时间,李飞飞教授也好像说过,从类比来看,机器的智能还处于前牛顿时代。所以期待人类和机器都能够不断的相互学习中迭代进步,人类的技术发展可以给机器赋予情感,成为彼此的朋友。
References
Leave a Reply