Category: ICT-Information and Communication Technology

  • 基础软硬件产业生态

    基础软件是个庞大的系统工程,和芯片一样都是核心的数字产业的基础设施。 软件的生态建立要有一个比较漫长的过程,如开源的基础软件,有linux操作系统,mysql数据库,android系统等。但这些生态也经历了比较漫长的时间,功能不断的迭代,bug不断的被fix,才能像滚雪球一样越滚越大。 基础软件的研发是个庞大的系统工程,操作系统底层要和各种外围设备硬件、persistent memeory, volatile memory,register,cpu等组件通过bus进行连接和通信,这些不同组件的管理都是很复杂的事情,一般在内核态通过系统调用去排他的访问设备,而进程线程的管理和调度等也都是比较复杂的过程。这些庞大的基础软件国内还处于暂时落后的状态。 好的东西是要拿来学习互鉴的,就像三人行必有我师焉,学习彼此的长处,在这种动态的合作博弈中去不断的推动文明的进步,减少彼此的短板效应,才能形成一个更大更深广的“地球人”命运共同体。 国内新的曙光已经出现,如harmony os和小米的澎湃os以及龙芯等都是逐渐实现自主的基础软硬件,希望能够通过开源和硬件的推广吸引更多的开发者去不断的丰富完善其功能,以后的万物互联,智能家居和汽车,智能个人AI agent,将会使得人们的生活越来越便捷,海纳百川,科技的发展将会超乎每一个人的想象。

  • 周末充电

    今天有幸再到交大的校园参加相关工程技术培训,再次在双创中心感受科技力量。 上次在双创中心老师的介绍下了解了F1方程式赛车的制作,包括使用catia软件进行模型设计,机电部分等等,最终在团队的协作下制造出赛车参加相关比赛,赛车手也是来自内部团队成员。整个过程下来同学们对于汽车制造的过程基本上了解熟悉的差不多了,对于汽车方向的同学面向后续的深造和就业都是很强的竞争力的体现。 今天在双创中心又看到了另一个很有意思的项目:robotcup,机器人世界杯。以下是从同学那里了解的相关信息,不一定完全正确,希望后面又机会再去了解一些细节。 该robotcup双方机器人团队各11个robot,通过挂在赛场上方的摄像头和赛场边上的视觉感知信号处理得出每个robot的位置等信息,然后模拟器通过运动状态去对每个robot的路径做出规划决策,模拟器再将规划决策结果信号发给每个单独的robot进行决策执行。整个robot即有巧妙的机械设计,也有嵌入式芯片和机电的结合。整个项目团队好几十人,来自不同的专业方向,去合作将不同的专业方向融合为一个机器人足球赛系统。其中模拟器是群体智能决策的核心关键部件,据同学介绍也是采用强化学习去做的(感觉和我之前介绍的flappybird有点像但复杂度要高很多),思路也有让机器人在场上比赛收集数据的部分(episode experience replay,收集模拟效果好的数据)。 创新创业是时代发展的动力和引擎,不管是在某一个领域的原创性的创新,还是将多个方向的技术进行集成创新去解决现实的问题,都是能推动社会进一步发展向前的生产力,希望自己也继续努力出一份力。 References

  • 傅里叶变换

    今天说一说数学上的傅里叶变换,后面可能在做工程应用上会用得到。傅里叶分析的使用场景挺多,有对信号特性进行分析的,有数据压缩方面的应用(如jpeg图像压缩用到了DCT,余弦正交基)。 傅里叶变换是将信号从一维时域信号(二维或三维空间域信号)转换为频域的过程,频域就是频率域,频率是变化快慢的度量,其单位为赫兹(hz)。 傅里叶分析基于三角函数的正交性原理,从直流分量,到基频,倍频之间存在着正交性,从而利用这种性质将函数分解为不同的正交基下面(不同频率)的幅值、相位。 傅里叶变换可以在实数域进行,也可以在复数域进行,相比于实数域,复数域的表达式更简洁,但是理解起来稍微麻烦些(欧拉公式的理解+复数域表示相位和幅值)。具体可以参考引文中的介绍。 基于python语言的傅里叶变换的代码实现有基于numpy的实现,如:Xfft = np.fft.fft(x)(其中x为原始信号信息),具体结果的解释参考引文。 References

  • 智能的载体是自然语言吗?

    今天受邀回答了知乎科技的问题,以下是我的回答,感谢知乎,大家有一个很不错的关于知识的分享交流平台。 个人的理解和观点如下仅供参考: 首先自然语言是一种智能信息载体,人类的语言博大精深,全世界不同的语系语言纷繁绚丽,就拿汉语和英语来说,历史长河中人类智慧的结晶主要用自然语言通过书籍进行传承。 自然语言的魅力不仅在于其传达日常的信息,更在于其表达的模糊性和多样性,一千个读者眼里有一千个哈姆雷特,从而可以说语言是一种博大精深的艺术。华夏五千年的四书五经(虽然没有系统读过),莎士比亚的悲喜剧,还有无数经典的中外小说琳琅满目不计其数,文史哲这类的鸿篇巨制也是目不暇接。而计算机的编程语言是一种更加规范和约束性的语言范式,没有二义性,是对计算过程的准确定义和描述。 基于深度学习的自然语言模型如基于transformer架构的GPT模型等通过大量的语料库对语言之间文字的上下文相关性进行统计学习来对语言的规律进行建模。大模型是基于人类反馈的强化学习进行的统计训练,也是基于大量的问答数据进行的统计学习。强化学习从生物的刺激响应的特性(巴普洛夫条件反射实验)中获得启发,因此如chatgpt和其他开源大模型的表现一样,从输入输出来看拥有一定的智能。 但是智能的载体不限于语言,从我个人的理解,智能的出现可能是历史进程中长时间的生物进化过程中出现的,从单细胞到多细胞,从植物到动物,特别是智人的出现,耳聪目明,心灵手巧,人类首先可能是通过眼睛观察世界,耳朵倾听世界(还有触觉嗅觉味觉感知通道)来不断加深对世界的了解和不断的归纳总结并且通过不断发展的手段将这些了解记录传承下来,使得文明的程度得到持续积累和进步。 因此个人的观点,智能的数字空间载体是信息(是一种数字和抽象的表达,如自然语言,数学公式语言等),信息可以是传统的各种语言文字,也可以是数字图像、语音、图形等多媒体富媒体形式,智能的物理空间载体是纸张,磁盘,电磁波以及人脑的记忆等等,智能的载体是其物理空间载体和数字空间载体的融合,所以可以说智能的载体是个很宽泛宏大的范畴,智能本身也是深邃和没有止境的,就如浩瀚无边的宇宙一样。 所以现有的大模型基于自然语言的智能其表现出的智能程度还是有较大局限的,所以有多模态的数据加入进来,但是现在多模态的融合好像还没有发展的很好。而且人类的智能发展经历了久远时代的积累,而机器表现出的智能才仅仅很短的时间,李飞飞教授也好像说过,从类比来看,机器的智能还处于前牛顿时代。所以期待人类和机器都能够不断的相互学习中迭代进步,人类的技术发展可以给机器赋予情感,成为彼此的朋友。 References

  • 元宇宙

    今天又幸去听了元宇宙的相关报告,对元宇宙的相关技术和应用又多了点了解,同时辅以一点思考,一并记录一下。 1、建筑设计院下面的数字学院,将元宇宙设计楼宇或小区等替代传统的建筑图纸,形成可观的数字资产; 2、汽车营销,要用酷炫的效果(如汽车在特殊的景色下的驰骋的效果图),一般用CG电影来实现,好莱坞大片中的不少的场景就是基于计算机图形学的原理精密设计而成,视觉效果绚丽而又不失真实; 3、数字孪生,用元宇宙技术克隆现实物理世界中的物体,甚至可以是地球,目标是知道地球上每一个角落长成什么样子; 4、数字人,这个现在也是研究和应用的比较热的点,大公司都有相关的数字人技术出现,可以实现虚拟主播等功能; 还有很多其他的应用,如游戏、数字化工厂等,只要敢于想象,生活中的很多场景都可以数字虚拟化,后面有好的场景再加以更新。 说到精准克隆地球,这个其实是不太现实的,在数字化的同时本来就给现实物理世界带来变化,因为数字化过程中本身会改变物理世界,可能和测不准原理有点类似。 况且地球的数据如果去克隆也只是一种简化和粗粒度的处理,比如地球表面,内部我们自己也看不清,就更不太好数字化了,而且地球表面的数字化也是进行一定的量化处理,而不能进行无限切分。人类本身对于世界的感知也是有空间位置分辨率精度和颜色分辨率精度的,比人类的精度还高可能意义也不是很大。 所以元宇宙的应用是对物理世界的一种简单化的建模,并将其数字化,这种建模对于我们的目的目标已经够用,同时也有利于我们整体的物理世界和数字世界的和谐统一发展。如果元宇宙的发展违背了数字世界和物理世界的和谐统一(比如细粒度的精确数字化可能需要巨大的资源),那可能就像AI一样要进行限制和规范化了。 信息技术主要通过数值表达和计算进行处理,从现在来看都是有限的,复杂的宇宙运行可能还是要人脑的复杂思维才有可能最终完全理解(人类能否完全理解全景宇宙可能尚存在未知),我们人类其实不借助于电脑也是生活在虚拟和现实交织的世界中,计算机是将我们的数字空间进行了更多的扩展。

  • 信息技术工程教育

    信息技术发展日新月异,最有创造力和生产率的是广大的程序员队伍(硬件的更新也是一样)。因此对现代的信息技术工程教育也提出了新的 要求,今天参加了相关的培训和研讨,与会老师对有些想法产生了共鸣,做点总结和记录。 1、技术迭代快,多所学校可以联合起来编写相关教材,分工合作,资源共享。这样效率高,同时也加深了同行的业务交流;好的教材甚至可以开源或推广,供更广的群体使用;下一次大的技术更新同样可以这样进行快速迭代; 2、和创新创业相结合,和科创竞赛相结合,通过新技术解决实际的问题,学以致用,锻炼通过技术解决实际问题的能力。好的结果可以产业化投入到实际的生产生活中; 3、通过技术的学习和使用,对技术提出新的需求,推动技术本身的迭代和进步。 交大的双创做的确实很好,获得很多的奖项和荣誉,有许多学习和借鉴的地方,感谢给与学习和讨论的机会。期待后面交大的优秀师资和学生给闵职院的老师和同学们的指导。

  • AI是工具还是硅基生命?

    自从去年差不多这个时候chatgpt诞生以来,generative AI的能力一步步迭代进步的速度很快,AI的未来甚至超乎一般人的想象,AI伦理的问题也随之成为讨论的热点。 从我个人的观点来看,AI是一种高级工具,人类的文明是从发明工具开始的,从早期的石器,到后来的青铜器,火药,指南针,望远镜,蒸汽机,发电机等,工具的效能也不能升级,工具的先进程度衡量了文明的发展程度。 人类虽然聪明过人,比如在数学物理推导,精确的物理实验等。但人类很多的能力是不如计算机的,比如数值的计算能力和速度,感知的数值精确度。一般人们只能模糊感知到远近,大概几十米上百米等,但不能感知到具体的距离的数字值。还有拿智能驾驶应用来说,现在可以在车身周围安装8个摄像头,形成360度全感知,而人类的视角大概估计在120-150度之间。所以说计算机和AI等先进工具是人类本身能力局限的延申,使得人们能变得更加神通广大。 因此我个人的观点,最近的AI agent的概念还是挺不错的,以后每个人都可以配备一个自己的AI助手,辅助个人个性化的解决生活中的各种问题和局限,人类可以做更加创造性的事务,而AI助手可以将人们从一些机械性的程式化的工作中解放出来,实现高效和谐的分工合作。 现在是AI较快发展的时期,高水平的机器人等方面的高科技从业者也很多,进步速度很快,甚至有些进步超乎了一般人的想象,在AI工具的辅助下,写文章,写论文等都将变的很高效,但是这些工作很多时候很多部分是要求高度思考和创造性的,如果让AI去做,人类自身的智能可能将会退化,甚至有些方向的文章用AI去写是不道德的,比如让基层民警去写歌颂社会美德的小文章,如果用AI合适吗? 所以还是规范化一下AI的使用,可以让其高效收集汇总信息,做程式化的劳动等。将人们集中在更高精尖的劳动,更创造性的劳动上面。 以后AI可能将会变得有自主性,希望能更好的更主动的帮助人类解决生活中的繁琐的一些事务,成为人类的相互协作和进步的好朋友。

  • Q-Learning

    今天新闻中关于OpenAI的Q*算法的介绍,现在看上去还是有点神秘的,之前接触过强化学习的相关内容,对Q-learning有所了解,也基本看通过一个简单的游戏的算法的实现细节(参考引文1)。深度强化学习和人脑的学习有较大的相似之处,机器学习的算法发明者还是从人类本身的学习中去总结经验和规律,将其进行数学形式化,确实了不起。发明了的AI算法从另一角度也会给更多的人们思考人类的生物智能提供了窗口,使得我们更好的对我们自己的智能进行反思。 Q-network learning解决了一些状态数量巨大的情况下的智能决策问题,满足我们很多场景中的状态不好进行枚举可数的情形,如很多的游戏场景,状态可以理解为当前或最近几帧的图像,不太好用Q-table进行描述,而神经网络如cnn对图像任务表现已经比较出色,自然会想到用cnn网络进行建模,输入为图像或组合,解决了不好显示定义状态(状态数太大)的问题。 强化学习中一个关键的方程为贝尔曼方程,也是一种递归定义,巧妙解决了价值函数的定义,具体细节可以参考引文3。 强化学习训练起来也不是很容易,有很多工程上技术问题需要解决,如大规模集群计算(高效的高速带宽大算力计算集群)以及大量的较为高质量的数据都很关键。不是一件容易的事情,需要专业人员摸索和积累经验。这方面经验不是很足。 强化学习中还有一个epsilon参数的定义,估计也是从人类的学习中去总结提炼出来的,是关于行为是采用经验保守还是进行探索冒险的这种比例机制问题。比如小孩子先验知识比较少,探索的时候更多些,年纪越大积累的更多的经验,认知也比较丰富了,这时需要的探索的事情就自然会少些。所以在强化学习算法的训练过程中,这个比例也是需要调整的。 OpenAI的大模型技术确实发展的挺快,在推理上可能有比较大的进展,人类对于AI的应用和使用确实要制定更加合理规范的规则。AI的未来还是有很多的可能性,期待给人来带来更多的福祉。 References

  • 马尔可夫性

    马尔可夫性是一种当前的状态只与前一时刻的状态相关,而与前一时刻之前的状态无关的性质(在前一刻状态已知的情况下与再之前的状态没有直接关系了)。马尔可夫性在应用数学里边也有一些应用,这里边说两个: 1、马尔可夫决策过程是强化学习的基础内容,该过程可以简要描述为:当前时刻的状态s下执行某个行为a后转移到另一个状态s‘的概率,并且获得收益r,整个过程可以建模为状态的集合S,行为的集合A,状态转移矩阵和收益R。马尔可夫决策过程解决的是在当前状态下执行什么行为能取得较好的收益,属于决策智能的基础算法。 2、HMM,隐马尔可夫模型,是一种时序模型,HMM最成功的应用是在语音识别上,李开复老师的语音识别用的就是这个算法。 3、扩散模型,当前主要的生成式模型算法,在图像可控生成方面有很成功的应用,如开源模型Stable Diffusion。 和马尔可夫性的理想假设类似,现有的很多算法都是解决实际问题的一种简化和近似,如朴素贝叶斯算法(如应用在邮件分类上)也是这样,对现实问题做了强假设理想化处理,但是在工程上,在特定领域和特定条件下能较好解决问题,也就有了用武之地。 但感觉我们的现实世界的运行是不满足这种马尔可夫性的,主要在于人类的智能的学习非常复杂,人类学习实践活动更有可能是复杂的非严格的单向时序关系,而是多个时序关系的叠加,比如从现在来看过去不同时刻的事情都会直接影响现在,就拿阅读这件事来说,将经典的思想进行学习吸收从而影响到决策和践行就可以认为是很久过去的认知结果(思想)影响到现在和未来,这种影响是从思想的诞生到后面一直累计影响的,有间接的有直接的,但也都有一定的概率性。从上面的实际例子场景可以感受到人类文明的生活空间的演化发展更像是某种程度多历史路径的积分影响,而且人与人之间(人类的社交网络本身也是很复杂的)也通过交互存在着相互的影响。所有总体上来说人的行为决策是一个非常复杂的智能决策结果,有待我们更进一步更多的认识和发现。 附:于2025/06/11做了第一次修订

  • 智能精密制造

    今天有幸有交大的教授和校友企业来访,了解到基于光电的精密测量产品,相比国外的同类产品的价格仅为10%左右,可以为后面各行各业的的智能精密制造服务。未来我们国家的制造业也会越来向着高端化智能化迈进,甚是激动和高兴,希望能助力成为其中的一员。 光电精密测量是有相关核心技术的,大体的思路是利用光(不可见波段的电磁波)在移动物体反射会出现多普勒效应。进而利用这种效应实现精密测量(纳米级)。而比较直观和易于想到的基于光的传播速度实现的测量精度只有毫米级。 想法到高精度测量仪器的实现也非易事,涉及到比较复杂的光电原理,信号放大的模拟电路(放大去噪等功能),以及后面的ADC模式转换和FPGA编程实现。而这些关键的技术实现自主研发俨然会成为企业的核心技术,形成技术壁垒,当然也需要时间去不断的打磨和迭代。聊天的过程中,大家比较认同现在的一个现象:现在不少行业存在着同质化竞争,内卷比较严重,需要进行合理的行业调配去优化产业结构,实现实体产业和互联网产业发展更加的均衡协调。 这些精密仪器在机床上的搭建也是需要熟练的技师去高效率完成的,这些高级技师是各行各业的智能高尖端制造的卓越工匠,也是职业技术学院培养的重点人才之一。 期待和校友和相关企业后续有较为全方位的合作,包括培养人才,合作研发相关软件,积累更多的人才培养经验和软件研发经验,一步步成长起来。感谢时代以及政府学校的支持,希望自己也在不断的实践中总结思考,和大家一起做好设计,执行到位。 References