学问思辨行: 记录生活学习和工作中的实践和思考,以期实现终身成长.
-
AIGC体验5-Stable Diffusion使用技巧之LoRA模型的使用
Stable Diffusion(SD)是开源的文生图大模型,随着相关技术的发展,已经迭代了多个版本(关于版本间不同的特性可以搜索查询,这里以1.5版本为例进行介绍,如和其兼容的lora模型比较多),并且其支持多种可控图像生成技巧,这篇短文将要向大家介绍相关的Stable Diffusion的使用技巧,不足支持欢迎读者提出意见建议并予以补充。 首先我们采用webui的方式使用比较便捷,参考文献1即为我们的Stable Diffusion V2.1版本的webui的jupyter notebook代码链接。具体使用可以在本地或colab里边。这篇短文将介绍SD的一般用法和基于LoRA模型的风格化用法。 一、一般用法:这里没有特别要强调说明的地方,主要是要写好提示词。这里举一个示例,提示词为:Two yellow orioles sing amid the green willows. 效果图为: 二、LoRA模型,lora模型是一种小模型技术,其显著的优点表现在:1、LoRA 通过低秩适应方法在较少的参数增加下微调大模型,资源消耗较少。2、在特定任务或小数据集上快速适应大模型,提升生成质量或特定任务的表现。3、LoRA模型可以作为额外模块加载到现有大模型中,灵活性高。使用LoRA模型的方法如下,1、首先,下载LoRA模型,如参考文献1所示;2、将下载的模型拷贝到lora的模型目录,如/content/stable-diffusion-webui/models/Lora,然后更新webui加载最新加入的lora模型(设置扫描lora模型路径),提示词为:Two yellow orioles sing amid the green willows. SONG DYNASTY FLOWER AND BIRD PAINTING如下图所示。 其中该界面的操作流程为:settings–>additional networks–>Extra paths to scan for LoRA models(设置为/content/stable-diffusion-webui/models/Lora)–>apply settings–>Reload UI。在上面的图中,我们用到了一个LoRA模型,具体可以参考引文1。 下一篇相关文章将介绍ControlNet的相关用法,欢迎读者继续关注,提出问题和意见建议。 References
-
AIGC体验4-midjourney中人物一致性的实现
在一般的电影和短视频中,一般的都存在的多个镜头(storyboard),为了保证镜头切换的时候的人物的一致性,需要文生图模型对此有较好的支持,否则在文生图的自动生成的场景中就会存在着不满足分镜头设计的需求,大模型的可用性就会受到交大影响。 今天向大家介绍midjourney中怎么实现人物一致性,主要通过一个实例向大家做演示介绍。 首先,我们通过提示词生成一个人物的不同角度的4张图片,提示词如下: 根据上述提示词生成的图片效果为: 将图像保存到本地,然后通过工具裁剪成4个小的图片,然后点击下图中左下脚的“+”号按钮在弹出的菜单中选择“上传文件”,将上面裁剪的4个图片上传后,将其链接保存下来(通过点击放大每个图片然后鼠标右键图片上方获取图片链接,供四个链接)。 然后用/prefer option set命令来进行设置风格一致性,具体的指令形如下面截图: 然后,就可以指定以该”littleboy”的option来生成人物一致性的场景了。具体的示例指令为: 最终的效果为: 后面有机会将继续向大家介绍关于图像视频多媒体方面的大模型应用的一些技巧。欢迎感兴趣的读者关注并提出问题一起来商议探讨共同提高。
-
关于社交网络的一点再思考
现代社会人们之间的交往频繁,人们的交往不再局限于物理上的小范围空间,小学,中学,大学的学习往往跨越了很大的物理空间距离,甚至到国外读书,这样距离空间就更大了。但是互联网能够解除物理空间的隔离,使得大家能够即使相聚遥远也能够感觉近在咫尺。今天和大家一起探讨一下互联网社交中出现的一些现象和思考,欢迎大家批评指正。真理越辩越明,不对的地方有则改之,无则加勉。 首先互联网生活是日常生活中的一部分,大家一口一舌,家长里短,并没有什么严格的对错去评判,大都都是每个人的脑子里的一些观点,没有深入调查研究,有时候也是逞一时口快,因此我们可以不必大动干戈,没有必要去争个输赢。 再次也说明了一些我们的认知,性格和日常行为的一些问题,也是我们需要审慎思考的。好的教育和思想观念,同理心的思想行为,都是值得去推广和执行的。现代社会对经济财富和权力的过度追求和崇拜,可能导致一些行为的扭曲和偏离正确的轨道,所以要从根本上营造更加和谐的互联网环境,需要从整体上去实现更加均衡的发展,提升教育和国民思想,实现更接近大同的社会。 今天我将博客的title进行了更新,采用了《礼记·中庸》中博学之、审问之、慎思之、明辨之、笃行之的一句话中的动词的拼凑–学问思辨行。在生活中我们每一个人都需要不断的学习,身边的事情多问问自己为什么,要勤于思考,也要明辨是非,最后要落实到行动上,和更加年轻的读者们共勉。
-
AIGC体验3-用Fliki+大模型制作短视频
前面两篇短文向大家简要介绍了midjourney来进行绘图,今天向大家简要介绍一个支持在线的短视频制作的工具Fliki,不足之处欢迎大家批评指正并予以补充。 Fliki的官网为Fliki – Turn text into videos with AI voices, 其主要是根据故事分镜头来制作短视频,分镜头(storyboard)是影视制作中的术语,大概是一个连续的镜头来描述一个场景(如长镜头,宽镜头,远镜头等)。这方面经验也不是很足,以后有机会再补充相关细节。 首先我们用大模型(ChatGPT,通义千问,文心一言等)生成故事的分镜头脚本描述,也可以自己去描写。这里我们以登鹳雀楼为例,自己写的一个简单的分镜头场景描述来进行说明(暂时没有用到大模型来生成场景描述),用的是通义万象来生活场景图。 基于上述场景文字生成的图片后,我们就可以再Fliki中去生成这首小诗的短视频了,具体方法为下面的截图演示: 有必要对语音进行优化,可以考虑借助第三方语音合成平台生成整个的语音放到common sense的场景中去(最上方)。然后在每个分场景中去掉voiceover的layer。基本设置好后,就可以export然后就download了(注:为了去除水印,需要upgrade成会员) 更多的经验会在后续继续向大家介绍。 References
-
生态宜居至善和美-颛桥的新发展和新变化
大城市的精细化管理越来越见成效了,就拿我所居住的地区颛桥为例,说说最近几年的发展和进步。觉着这些模式和亮点可以推广,欢迎读者为城市和乡村的建设提出自己的意见和建议,华夏文明源远流长,生生不息,让我们一起期待更加美好的明天! 首先第一个在于生态环境改进了很多,附近的河流治理已见成效,清清河水边已有水鸟栖息,每天都有人在拿着钓竿耐心的垂钓。政府也很用心的新建了为群众运动锻炼的小公园,每天早上参加运动锻炼的人也不算少,期待更多的人重视运动健康,希望其成为新时代的时尚潮流。 旧小区改造也基本完成,新小区依河而建,也挺高大上。 附近的几个很有特色的菜市场的菜品也很好,有的每天都有新鲜的物品,而且从外地养殖基地直达,物美价廉。为了保证新鲜,也只卖当天菜。 这边还有光华创意园,里边的文创挺有意思,期待这边随着小区的人们入住进来,更多的人在附近生活工作,商业也将逐渐更加繁荣。 欢迎更多的读者有机会来上海游玩,来颛桥走走看看。期待能看到更多的小美好,颛桥的明天会更美好,乡村的明天(包括我的老家)会更美好,祖国和地球世界的明天会更美好,我自发为颛桥代言!
-
AIGC体验2-midjourney使用配置对生成的图片进行约束和限制
上篇短文主要向大家介绍了midjourney的基本使用,在文生图的时候,有时作者期望有更多的控制条件,比如生成图片的大小和横竖比,生成图片的风格等。 首先可以通过命令/settings进行相关版本,以及模式的设置,输出结果为如下图示,具体关于这些模式的含义可以参考引文,这里不做赘述。 下面主要介绍一个使用一些约束和控制的示例 输出的结果如下图所示 点击“U4”后显示结果为: 加上图片风格和长宽比之后的示例如下: 点击“U4”后显示结果为: 后面将继续介绍相关使用的一些技能点。欢迎读者反馈意见和建议。 Reference
-
AIGC体验1-midjourney的初步使用
midjourney在图片生成方向上有较高的质量,这篇博客简要记录一下其初步的使用方法。欢迎读者给出意见和建议,以及补充相关的说明。 注册后(注册过程忽略),可以建立自己的频道,方法如下几个图示。 然后就可以在对应的服务器里用相关命令生成图片了,这里举个示例,假设提示词为“Bright forest, little bunny Lily in front of home, sunlight shining on the grass”,则生成后的效果如下图所示: 具体后面更多的使用经验将在后续的体验过程中进一步加以记录。 References
-
说说生活中的两个值得保持的小细节
这些天我调整了一下生活节奏,重构了一下生活方式,感觉挺好的。这里说一说和大家分享一下,不对的地方欢迎大家批评指正。 第一、保持整洁的居住工作环境,好的环境,整洁卫生,目之所视清净舒适,对人的心情也是一种滋养,而且卫生的环境本身就对身体健康有益处。在整洁卫生的基础上,再培养一下生活审美,家里养点绿植,东西布置讲究空间的美学分布或者普适的审美风格(或者可以称为“风水”),这样就能更有对生活的热爱。 第二、勤俭节约,物尽其用。但是现代社会商品更新迭代很快,衣物,电子设备等的使用生命周期都偏短,特别是发达地区,人们物质条件丰厚,不少人们的消费水平都挺高。其实反过来想,每天保持好心情,体验生活中的小的细节美好,比平时追逐名利费尽心思而操劳,从而需要买那些高档化妆品来保养说不准更能有好的功效。我的观点和看法就是物质的东西可以买质量稍好些的,但不用多,可以用长久些的时间,这样即能体验好品质,又能尽量少买。 以上两点是我的看法和总结,希望自己能够知行合一,在实践中去执行到位,做到整洁节约,我们可以将更多的钱花在教育,科技等方面,有更加合理的物质生活资源分配方法和策略。
-
八段锦视频分享
中华传统文化源远流长,中医,中国传统儒释道哲学思想还有中国武术。 今天分享一段八段锦,感觉挺好的,全身都能够锻炼得到,中国武术刚柔相济,是强身健体的很好的“保健操”。视频分享见参考引文。 最近深度学习和大模型相关技术又有新进展,1为Alapha Fold3,2为GPT-4o(“o”代表“omni”,全方位,全部的意思)。后面打算学习一下大模型相关的技术原理,并撰写相关的技术系列文章,为大模型相关基础技术普及出一点力,为国产大模型的技术突破提供几米阳光和几滴雨露。欢迎读者提供相关素材和意见建议。 Reference
-
祝天下的母亲节日快乐
从小就听一首耳熟能详的歌曲《世上只有妈妈好》,但感觉更应该这样说,妈妈的世界里只有孩子好她们才好。妈妈的无私奉献和付出,不求回报,儿女是她们一直的牵挂。因此晚辈也需要懂得反哺和感恩,妈妈们也能得以宽慰,这样的世界才充满爱,每个人才能感受到更多的温暖,才能更加团结力量去前行。 世界上几乎所有语言对母亲的称呼都是一样的,Mom,妈妈,您辛苦了,致敬天下所有的母亲!
本博客主要包含一些工程技术方面的短文和日常生活的随想。感谢所有师长领导朋友和老同学们的关心支持,特别感谢上海交通大学、上海建设管理职业技术学院、上海闵行职业技术学院、中科院软件所、北京师范大学及中小学的老师同学们和上汽集团等工作过公司的领导同事们给与的关爱和支持,以及家人们的期望和默默付出,希望有些文章能对大家有所启发。由于作者水平有限,撰写较为仓促,文章中难免存在一些缺点和错误,殷切希望来自世界各地的读者批评指正。期待能够和大家一起学习,迎接挑战,共同进步。