Category: Digital Industry and Frontier Technologies

  • 数字化教育产业发展的一点想法

    教育是利国利民的大事,是国家后续的现代化建设的关键因素,关乎人才的培养,关乎每一个人得到良好的发展。百年大计,教育为本。这是多年来在学校的墙壁上的宣传标语。其实教育的效益没有那么慢,20年的从家庭到学校到社会的的精心投入和培育,就基本可以成才,延续三代以上良好的教育,整个社会的发展风貌肯定会大不同。虽然教育也是一种延迟满足的行业投入,但是事关国家民族的更好可持续发展,应该引起相关管理决策部门的更大重视,这里主要从数字化教育作为一个产业来说说数字化教育发展的一点思考。 教育是一个人全面发展的培养过程,德智体美劳都很重要,之前可能强调的更多的是智育和筛选,但是其他的几个方面的重要性也特别重要,每个人的合理发展都很重要,这里从个人和教育机构两方面说说数字化教育的方方面面。 一、从个性化学习的角度。1、关于智育,可能主要是文化课的教育上面,好的教学资源如优秀的老师的课程可以大范围传播,自适应的学习系统可以记录每一个同学的学习过程中的动态学习过程,擅长的和显得不足的地方都有统计和分析并作出自适应的调整,如错题集的分析和继续基于此上面的学习就是一种自适应的学习过程。2、关于体育健康,也是可以做一些记录的,比如同学们参加跑步的次数,跑步的成绩都可以用数字化的方式记录下来,以及身体的体检记录和状况等,这些都是一个人成长过程中身体素质的信息记录,对后续个人的健康管理也很重要;3、关于德美劳,学生个人自己,家长和学校以及经营相关业务的公司都可以做出一定的设计和行动,如参加公益活动,参加组织的夏令营等以及记录其感想等等可以数字化记录下来;4、关于心里健康和发展,可以通过学习过程的学生的行为和心里状态的记录和跟踪,运用教育学心理学的相关理论进行分析和总结,给出每个同学的相关行为和心里发展的更好的建议和指导。5、关于推荐系统,可以建立相关个人全面成长的理论和分析方法,给出当前每个人在全面发展方面的行动和策略建议,如学习某项新技能,要多以一点体育运动等;6、特殊方面的技能才能教育,如计算机艺术机器人等的特长竞赛教育,也可以线上和线下相结合。 二、从教育机构的教学活动运营角度。1、作为教育机构如学校本身运营的数字化系统,如学校有数字化校园,各种办公和学习辅助系统如邮件校历教室管理校友信息等信息管理系统;2、学生的学习和相关身心健康等指标分析,既有整体性的了解和也有个体情况的细节把握,做到因材施教更好的个性化学习;3、校园安全,低碳校园等教学环境辅助系统;4、好的教学资源分发系统以及支持学生创新和发展的社团和相关资源的使用等的教学辅助系统等。 现代社会知识信息增长速度很快,根据科技经济社会发展的需要,每个人能力不是先天就固化下来的,而是需要养成成长性思维,不断进步以不断满足社会发展的需要。要建立终身学习型的社会,教育就不仅仅局限于学校和课堂,数字化教育系统可以陪伴每个人的一生,甚至可以考虑是一个人一生的成长辅助系统,不仅仅关乎知识技能的学习,可以从更广的视角来看,是个人全面发展的智能助手。 关于数字化教育的技术方面和具体的应用以及工程技术方面的设计开发和部署等,希望后面有机会和相关同仁去探讨和合作,形成产业的联合体也是挺有意义的一件事。

  • 再说虚拟现实和AI技术

    计算机图形学出现以后,虚拟现实作为一个应用发展方向得到了很好的发展,一些前言的数字化技术如智能眼镜,元宇宙等都用到了虚拟现实技术。如实时街景地图,云上citywalk,分子结构和运动,宇宙星体运行可视化,通过虚拟增强现实等实现更好的人机交互都是很好的应用场景。 虚拟和现实是我们的世界的两个相互耦合的时空,虚拟一般指在物理世界不存在的,比如头脑想象的场景,如做梦等现象。在文学中一般的情节也是虚拟和通过精心构造的,在现实世界不一定发生过,或是对现实世界发生事务的一种再演绎。而现实世界一般是指我们的物质世界。如实际发生的一系列事件,自然的山水田园等等。 在以往,虚拟和现实一般的边界是比较清晰的,我们很容易就能判别,但是由于人工智能技术的发展,虚拟和现实的边界就不再那么清晰。很多时候我们已经不能区分数字化的内容“真假”,举例就能很好的理解和说明。比如现在的生成式AI技术,图像,视频以及语音和知识问答,文档自动撰写等都可以通过AI技术进行生成,而生成的这些数字化的内容和通过现实世界进行采样数字化的内容已经不能判别出处。虚拟的生成和现实世界的数字化变得混淆不清,有利也有弊。有利的地方可以举例说明:1、通过虚拟生成可以构造近乎真实场景的数据来反哺其他AI应用场景,如智能驾驶;2、通过虚拟生成可以在生物制药和分子设计等方面有很多的应用,可以加快相关行业的科技发展速度;3、通过自动问答系统可以解决垂直行业的知识问答系统或一些较为程式化重复性的文案撰写等工作或一些知识型智力性的设计和实现工作,解放更多的人力去从事更有人类情怀和远大目标的事情。不利的地方也可以举例说明:1、生成的数字的音视频图像内容不少的人们不能辨别真假,如果被别有用心的人们加以利用,则会带来经济和社会的一定程度的紊乱,人们日常的行为和决策难度会变大;2、通过虚拟生成的文档或相关内容可能会使得人们对技术工具的依赖加深,有些人们可能会变得懒惰,不再进行合理的脑力劳作去收获成果,这些人群的整体发展可能会出现退化;3、通过AI生成的内容的正确性质量可能参差不齐,现在尚未实现自主AI,AI大脑的多样化没有人类大脑的多样化这样庞杂,同一个AI大脑生成的模型可能会存在同质性的问题,这些都可能会给数字空间带来一定的质量问题。 这些虚拟生成的利弊可能是AI伦理需要考虑的问题,虚拟和现实存在着相互的融合和改变,关于数字化产业方面的发展方向就是一个很重要的经济社会议题。与经济效益和社会治理都有关系,AI的发展的方向和重点应该是解决人类命运的重大问题,需要相关决策部门和技术管理部门认真考虑制订相关的政策以规范AI的发展和应用场景。

  • 关于人工智能产业学院的一点发展思考

    学校要发展人工智能产业学院,今年有幸申请下来了云计算专业,后续还会打算申请信息安全专业和人工智能专业。当然从想法设计到执行实现还有一段不短的路程要走,而且设计和现实也很难完全同步,需要动态的去调整步伐,以希最终有一个不错的结果。 从我个人来看,前面的领导们这样的设计是合理的(我后面才过来)。首先云计算和信息安全作为数字化产业的底层软硬件基座,作为基础设施来服务于人工智能的产业应用,现在的产业化发展也要紧跟时代步伐,做出一定的特色,为经济的转型和新时期的现代化这道开放的大考题做出我们自己的思路和解答。如教育安全农业环保等绿色产业可以作为优先发展方向。而且在这些方向上有我们的相关一些熟悉的老师朋友同学和同事们,希望能有深度合作和融合发展的机会。这样从整个数字化产业的层次架构来说,就形成了相对比较完整的体系。 可以这样考虑,云计算和信息安全作为基础,和教育教学同步即服务于社会也服务于我们自己的上层的人工智能应用产业,而人工智能应用产业我们可以考虑和上述的垂直绿色应用方向相结合,有机会和大家一起共同发展形成产业共同体去考虑怎么产业化,并将产业化的应用反哺后续的人工智能应用专业。形成产教融合相辅相成的强调产业经济和社会效益的人工智能产业学院。 是个很不错的设想,希望后面能有机会和相关老师朋友同学同事们一起找到融合发展的平衡点,深度合作互惠互利,一步步去好好实现。

  • 万物互联延展了我们的生活空间

    openharmony为面向万物互联时代的新一代全领域的智能终端操作系统。我的理解,以后可以只要是某个人使用的设备,如手机、智能汽车、智能家电、智能大屏和电视、智能机器人以及智能手环等所有硬件设备都可以共享个人数据。 比如这样一个场景,一部在智能电视上没有看完的电视剧,由于上班比较紧急了,就在路上让车子自己开着智能驾驶然后继续从暂停的地方开始看,走的时候家里的灯忘了关,智能家居的感知系统发出了通知,你在车上顺便关掉了。同时想着晚上比较晚才回家但是想喝点热粥,于是你告诉机器人去给智能电饭锅配好食材预定好开始煮粥的时间。这一切都可以随时随地进行,跨越了传统的限制,给生活带来了便利。 openharmony应该可以达到个人设备间的充分互联,打造一个广阔延展区域的智能化个人及家庭空间。第四次工业革命下新的数字化技术浪潮将会给人类带来久远的福音,让我们一起行动并期待着! 今天参加了openharmony生态开发者大会,期待openharmony的openatom基金会不断成长和跨越,期待相关核心单位乘风破浪,勇毅前行,我们也会尽量紧跟步伐,继续努力。

  • 周末充电

    今天有幸再到交大的校园参加相关工程技术培训,再次在双创中心感受科技力量。 上次在双创中心老师的介绍下了解了F1方程式赛车的制作,包括使用catia软件进行模型设计,机电部分等等,最终在团队的协作下制造出赛车参加相关比赛,赛车手也是来自内部团队成员。整个过程下来同学们对于汽车制造的过程基本上了解熟悉的差不多了,对于汽车方向的同学面向后续的深造和就业都是很强的竞争力的体现。 今天在双创中心又看到了另一个很有意思的项目:robotcup,机器人世界杯。以下是从同学那里了解的相关信息,不一定完全正确,希望后面又机会再去了解一些细节。 该robotcup双方机器人团队各11个robot,通过挂在赛场上方的摄像头和赛场边上的视觉感知信号处理得出每个robot的位置等信息,然后模拟器通过运动状态去对每个robot的路径做出规划决策,模拟器再将规划决策结果信号发给每个单独的robot进行决策执行。整个robot即有巧妙的机械设计,也有嵌入式芯片和机电的结合。整个项目团队好几十人,来自不同的专业方向,去合作将不同的专业方向融合为一个机器人足球赛系统。其中模拟器是群体智能决策的核心关键部件,据同学介绍也是采用强化学习去做的(感觉和我之前介绍的flappybird有点像但复杂度要高很多),思路也有让机器人在场上比赛收集数据的部分(episode experience replay,收集模拟效果好的数据)。 创新创业是时代发展的动力和引擎,不管是在某一个领域的原创性的创新,还是将多个方向的技术进行集成创新去解决现实的问题,都是能推动社会进一步发展向前的生产力,希望自己也继续努力出一份力。 References

  • 智能的载体是自然语言吗?

    今天受邀回答了知乎科技的问题,以下是我的回答,感谢知乎,大家有一个很不错的关于知识的分享交流平台。 个人的理解和观点如下仅供参考: 首先自然语言是一种智能信息载体,人类的语言博大精深,全世界不同的语系语言纷繁绚丽,就拿汉语和英语来说,历史长河中人类智慧的结晶主要用自然语言通过书籍进行传承。 自然语言的魅力不仅在于其传达日常的信息,更在于其表达的模糊性和多样性,一千个读者眼里有一千个哈姆雷特,从而可以说语言是一种博大精深的艺术。华夏五千年的四书五经(虽然没有系统读过),莎士比亚的悲喜剧,还有无数经典的中外小说琳琅满目不计其数,文史哲这类的鸿篇巨制也是目不暇接。而计算机的编程语言是一种更加规范和约束性的语言范式,没有二义性,是对计算过程的准确定义和描述。 基于深度学习的自然语言模型如基于transformer架构的GPT模型等通过大量的语料库对语言之间文字的上下文相关性进行统计学习来对语言的规律进行建模。大模型是基于人类反馈的强化学习进行的统计训练,也是基于大量的问答数据进行的统计学习。强化学习从生物的刺激响应的特性(巴普洛夫条件反射实验)中获得启发,因此如chatgpt和其他开源大模型的表现一样,从输入输出来看拥有一定的智能。 但是智能的载体不限于语言,从我个人的理解,智能的出现可能是历史进程中长时间的生物进化过程中出现的,从单细胞到多细胞,从植物到动物,特别是智人的出现,耳聪目明,心灵手巧,人类首先可能是通过眼睛观察世界,耳朵倾听世界(还有触觉嗅觉味觉感知通道)来不断加深对世界的了解和不断的归纳总结并且通过不断发展的手段将这些了解记录传承下来,使得文明的程度得到持续积累和进步。 因此个人的观点,智能的数字空间载体是信息(是一种数字和抽象的表达,如自然语言,数学公式语言等),信息可以是传统的各种语言文字,也可以是数字图像、语音、图形等多媒体富媒体形式,智能的物理空间载体是纸张,磁盘,电磁波以及人脑的记忆等等,智能的载体是其物理空间载体和数字空间载体的融合,所以可以说智能的载体是个很宽泛宏大的范畴,智能本身也是深邃和没有止境的,就如浩瀚无边的宇宙一样。 所以现有的大模型基于自然语言的智能其表现出的智能程度还是有较大局限的,所以有多模态的数据加入进来,但是现在多模态的融合好像还没有发展的很好。而且人类的智能发展经历了久远时代的积累,而机器表现出的智能才仅仅很短的时间,李飞飞教授也好像说过,从类比来看,机器的智能还处于前牛顿时代。所以期待人类和机器都能够不断的相互学习中迭代进步,人类的技术发展可以给机器赋予情感,成为彼此的朋友。 References

  • AI是工具还是硅基生命?

    自从去年差不多这个时候chatgpt诞生以来,generative AI的能力一步步迭代进步的速度很快,AI的未来甚至超乎一般人的想象,AI伦理的问题也随之成为讨论的热点。 从我个人的观点来看,AI是一种高级工具,人类的文明是从发明工具开始的,从早期的石器,到后来的青铜器,火药,指南针,望远镜,蒸汽机,发电机等,工具的效能也不能升级,工具的先进程度衡量了文明的发展程度。 人类虽然聪明过人,比如在数学物理推导,精确的物理实验等。但人类很多的能力是不如计算机的,比如数值的计算能力和速度,感知的数值精确度。一般人们只能模糊感知到远近,大概几十米上百米等,但不能感知到具体的距离的数字值。还有拿智能驾驶应用来说,现在可以在车身周围安装8个摄像头,形成360度全感知,而人类的视角大概估计在120-150度之间。所以说计算机和AI等先进工具是人类本身能力局限的延申,使得人们能变得更加神通广大。 因此我个人的观点,最近的AI agent的概念还是挺不错的,以后每个人都可以配备一个自己的AI助手,辅助个人个性化的解决生活中的各种问题和局限,人类可以做更加创造性的事务,而AI助手可以将人们从一些机械性的程式化的工作中解放出来,实现高效和谐的分工合作。 现在是AI较快发展的时期,高水平的机器人等方面的高科技从业者也很多,进步速度很快,甚至有些进步超乎了一般人的想象,在AI工具的辅助下,写文章,写论文等都将变的很高效,但是这些工作很多时候很多部分是要求高度思考和创造性的,如果让AI去做,人类自身的智能可能将会退化,甚至有些方向的文章用AI去写是不道德的,比如让基层民警去写歌颂社会美德的小文章,如果用AI合适吗? 所以还是规范化一下AI的使用,可以让其高效收集汇总信息,做程式化的劳动等。将人们集中在更高精尖的劳动,更创造性的劳动上面。 以后AI可能将会变得有自主性,希望能更好的更主动的帮助人类解决生活中的繁琐的一些事务,成为人类的相互协作和进步的好朋友。

  • Q-Learning

    今天新闻中关于OpenAI的Q*算法的介绍,现在看上去还是有点神秘的,之前接触过强化学习的相关内容,对Q-learning有所了解,也基本看通过一个简单的游戏的算法的实现细节(参考引文1)。深度强化学习和人脑的学习有较大的相似之处,机器学习的算法发明者还是从人类本身的学习中去总结经验和规律,将其进行数学形式化,确实了不起。发明了的AI算法从另一角度也会给更多的人们思考人类的生物智能提供了窗口,使得我们更好的对我们自己的智能进行反思。 Q-network learning解决了一些状态数量巨大的情况下的智能决策问题,满足我们很多场景中的状态不好进行枚举可数的情形,如很多的游戏场景,状态可以理解为当前或最近几帧的图像,不太好用Q-table进行描述,而神经网络如cnn对图像任务表现已经比较出色,自然会想到用cnn网络进行建模,输入为图像或组合,解决了不好显示定义状态(状态数太大)的问题。 强化学习中一个关键的方程为贝尔曼方程,也是一种递归定义,巧妙解决了价值函数的定义,具体细节可以参考引文3。 强化学习训练起来也不是很容易,有很多工程上技术问题需要解决,如大规模集群计算(高效的高速带宽大算力计算集群)以及大量的较为高质量的数据都很关键。不是一件容易的事情,需要专业人员摸索和积累经验。这方面经验不是很足。 强化学习中还有一个epsilon参数的定义,估计也是从人类的学习中去总结提炼出来的,是关于行为是采用经验保守还是进行探索冒险的这种比例机制问题。比如小孩子先验知识比较少,探索的时候更多些,年纪越大积累的更多的经验,认知也比较丰富了,这时需要的探索的事情就自然会少些。所以在强化学习算法的训练过程中,这个比例也是需要调整的。 OpenAI的大模型技术确实发展的挺快,在推理上可能有比较大的进展,人类对于AI的应用和使用确实要制定更加合理规范的规则。AI的未来还是有很多的可能性,期待给人来带来更多的福祉。 References

  • 马尔可夫性

    马尔可夫性是一种当前的状态只与前一时刻的状态相关,而与前一时刻之前的状态无关的性质(在前一刻状态已知的情况下与再之前的状态没有直接关系了)。马尔可夫性在应用数学里边也有一些应用,这里边说两个: 1、马尔可夫决策过程是强化学习的基础内容,该过程可以简要描述为:当前时刻的状态s下执行某个行为a后转移到另一个状态s‘的概率,并且获得收益r,整个过程可以建模为状态的集合S,行为的集合A,状态转移矩阵和收益R。马尔可夫决策过程解决的是在当前状态下执行什么行为能取得较好的收益,属于决策智能的基础算法。 2、HMM,隐马尔可夫模型,是一种时序模型,HMM最成功的应用是在语音识别上,李开复老师的语音识别用的就是这个算法。 3、扩散模型,当前主要的生成式模型算法,在图像可控生成方面有很成功的应用,如开源模型Stable Diffusion。 和马尔可夫性的理想假设类似,现有的很多算法都是解决实际问题的一种简化和近似,如朴素贝叶斯算法(如应用在邮件分类上)也是这样,对现实问题做了强假设理想化处理,但是在工程上,在特定领域和特定条件下能较好解决问题,也就有了用武之地。 但感觉我们的现实世界的运行是不满足这种马尔可夫性的,主要在于人类的智能的学习非常复杂,人类学习实践活动更有可能是复杂的非严格的单向时序关系,而是多个时序关系的叠加,比如从现在来看过去不同时刻的事情都会直接影响现在,就拿阅读这件事来说,将经典的思想进行学习吸收从而影响到决策和践行就可以认为是很久过去的认知结果(思想)影响到现在和未来,这种影响是从思想的诞生到后面一直累计影响的,有间接的有直接的,但也都有一定的概率性。从上面的实际例子场景可以感受到人类文明的生活空间的演化发展更像是某种程度多历史路径的积分影响,而且人与人之间(人类的社交网络本身也是很复杂的)也通过交互存在着相互的影响。所有总体上来说人的行为决策是一个非常复杂的智能决策结果,有待我们更进一步更多的认识和发现。 附:于2025/06/11做了第一次修订

  • 行业数字化+私有云架构模式

    今天去拜访参观了交大的更多的单位,有一个初步的感受就是各个行业的数字化可以进行一定的应用模式抽象,形成行业的私有云架构(IAAS, PAAS, SAAS)的产品系统体系,这样同样的行业可能可以省去更多的重复的研发活动。 云计算底层的IAAS层差别不大,主要是硬件基础设施(计算节点,GPU,网络,存储等硬件资源设施)+云操作系统等底层软件环境。PAAS层可能差异比较大,如音视频流媒体服务的音视频的RTC服务中间件,智能驾驶的中间件等根据行业方向不同可以按需研发和部署。SAAS差异也会更加的专业化,也会根据行业的不同差异比较大,比如面向教育行业,工业生产,智能驾驶,医疗系统,智能化农业等不同的应用。PAAS和SAAS是研发的重点,在智能化技术发展的新时期,也是信息产业革命中面向行业需要相关产业公司重点经营打磨的关键。 因此是否可以考虑面向行业,进行合理的建模抽象,将公共通用的业务逻辑按层次去搭建好面向行业的云系统产品。这样行业可以快速去部署,需要个性化的地方就去按需求再做定制开发,这样行业内存在几个有竞争力的企业已经足够。大大节省资源和提升效率。市场自发行为加上合理的统筹可能会效果更好,仅代表自己的观点,但感觉有一定的合理性。 感谢有机会和不同方向(网络,航空航天,计算机)的老师交流学习,后面也会专注一下自己的方向,践行一专多能的宗旨,拓展自己的认知边界。有新的想法就是大脑的养料,大脑也会常用常新,不断进步。 References