2023年度总结:反思与展望

我的 2023 年度总结 2023 很快就要过去了,转眼间大学生活只剩下最后半年了,我一个朋友说过,工作的越久越是觉得:*可怕的不是你失去了工作的激情,而是再也找不回来了。* 这一年经历了很多,接触了很多人,遇到过很多事情,慢慢的对自己的三观有种雏形。很喜欢马斯洛需求层次理论(Maslow’s hierarchy of needs) 从中找到自己的状态。我喜欢挑战,无论是工作还是业余爱好(爬山,骑车 …)我似乎已经成功地满足了马斯洛需求层次理论中的前四个级别:生理需求、安全需求、社交需求和尊重需求。我目前所处的阶段很可能是自我实现需求。但是值得一提的是,虽然马斯洛的理论是分层的,但实际上人的需求可能不会那么线性或固定。例如,即使一个人达到了自我实现的阶段,他们仍可能在不同时间遇到其他层次的需求。例如,如果一个人失去了工作或遭遇经济困难,他们可能会重新关注安全需求,比如财务安全和稳定。同样,如果一个人经历了亲密关系的结束或社交网络的变化,他们可能会重新感受到对社交需求的渴望。甚至在日常生活中,像是在生病或饥饿时,我们的注意力可能会暂时从更高层次的需求,如自我实现,转移到生理需求上。 我认为我们应该认识到,虽然人们可能在不同时间点上侧重于不同的需求层次,但这并不意味着他们在个人发展上有所倒退。相反,这是一个自然的、动态的过程,反映了人生的复杂性和多变性。在面对挑战和变化时,能够灵活地调整自己的需求焦点,是适应和个人成长的一部分。所以,顺其自然,把握节奏,不断学习,不断思考,是我的成长生存名言。 户外很大一个程度上,放松了我的思想,让我能站在一个局外的角度看待整个棋局。纵穿整个成长的周期,我们就像是深处在一个棋局上,每一个角色都不可或缺,但却都有自己的局限性。 今年有一种冲劲,很讨厌温水煮青蛙的生活,以及安于现状的人生,偶尔出现一点点的 idea,或者是灵光一闪,偶然间有一个冲动想自己创业做下去。这些想法也被我一点点的记录在本子上,我总觉得以后可能有机会会翻起,那时候会孤注一掷的去做。处在马斯洛的自我实现需求的层级上,渴望做出自己的事业。事业和工作,事业指人们所从事的具有一定目标,规模和系统的对社会发展有影响的经常活动;而工作指在长时间内做着重复的一系列动作或事情。很明显,我们都知道,如果人生是一个游戏,那么后者的角色就是一个 NPC,做的永远都是重复,没有任何价值的增效的工作,不利于个人成长,对社会的进步也是微乎其微。做事业和做生意也是有所区别的,生意是以短期赚钱为导向,事业是以人生高度为导向。 在重庆游玩的时候,也是和一个非常厉害的创业前辈交流过(经历和认知,文化水平卓越),明白了,对于以赚钱为驱动,那么就是在做生意;如果是以梦想,热爱,坚持为驱动,那么就是真正的做事业,赚钱,只是这个过程中的水到渠成。作为一个螺丝钉,在一线上工作,尽管象棋中的兵看似不起眼,但它们是实现战略目标的基础。在创业中,前线员工(开发、测试、运维)和日常运营团队就像这些兵,他们执行日常任务,是企业运行的基石。但是,如果只是做士兵,那么当然可以安于现状,但是,如果你期望做出自己的事业来,那么当然是不够的,只专注于日常的业务操作而没有更广阔的视野,可能会错失重要的战略机会。你还需要跳跃出你的思维和格局,要结合象的远见、马的创新思维和车的执行力。这意味着你需要能够制定长远的战略规划(象)、灵活地应对突发情况并创造性地解决问题(马),以及直接推动业务前进(车)。甚至是要有战略性思维,如果是作为企业的战略领导者,类似于象棋中的国王。具备全局视角,设定公司的长远目标和战略方向。虽然国王在棋盘上的移动有限,但却是游戏的核心。同样,作为创业者,我们可能不会直接参与每一个细节,但是,作为决策者的的决策和愿景对公司至关重要。从此,无论是工作中还是项目中,我常常是将自己带入到棋盘中的各个角色,去认真感受棋局以及每个角色的变化。 在职业生涯中,遇到面试官反问的环节,我比较喜欢询问的几句话: 在您看来,员工为什么选择留在这家公司?他们对工作最热情的方面是什么? 您为什么要选择这家公司,您个人在这里工作的最大动力是什么?您认为同事们最看重公司的哪些方面? 您能描述一下这里的工作环境吗?员工通常是怎样描述他们在这里的工作体验的? 您作为老板,能告诉我您的创业经历吗,为什么要选择创业,创业意味着什么? 您能分享一下公司领导的领导风格吗?他们是如何激励团队和推动创新的? 这些问题潜在的可以帮助你了解员工和老板的工作状态,思想。 在中国传统教育框架体系中,成功的定义是,拥有自己的事业。当然在课本上也并非如此,成功其实是一种感觉,可以说是一种积极的感觉,它是每个人达到自己理想之后一种自信的状态和一种满足的感觉!总之,我们每个人对于成功的定义是各不相同的!在简易的成功学中,成功的定义是:*天赋,努力和运气* 。用我们平常 code 的思维理解,三者中或只有 努力 是可以读写操作的,而天赋和运气都是可读的,但并不能写操作。所以,对于我们大部分普通的人来说,都是 “尽人事,听天命” 的状态。记得有首励志的歌这么说的:你尽管努力,剩下的交给天意 。 于是,这就是今年形成的思想,勇敢的去做,不要怕失去,努力也是一种投资,就像二级市场的 K 线图一样,有涨有跌。拿三种曲线举例,第一条曲线前期曲曲折折,突然在一个转折点扶摇而上,直冲云霄;第二条曲线前期曲曲折折,后期也是曲曲折折,不上不下;第三条曲线前期也是曲曲折折,突然一个转折点暴跌,坠入低谷;我们大部分人都渴望走第一条曲线的道路,但是,前期的曲曲折折,是否会迎来某一个转折点,没有人知道。有时候我们可能会感到停滞不前,甚至是跌宕起伏,但这并不意味着失败。稳定可以是成长和自我反思的机会,也可能是积蓄能量、准备下一次跳跃的阶段。勇敢地面对挑战,不惧怕失去,将努力视为一种投资,是通向成长和成功的关键。生活和职业道路有其起伏,这些在儒家思想中可见,对待得与失、荣与辱、成与败等等,乃至人生的吉凶祸福,人们应注重“求诸己”,不假外力,更不应怨天尤人。重要的是如何应对这些起伏,以及我们从这个过程中学到了什么。 接下来以下面的几个议题快速的对自己做年度总结: 首先,专业上,最具有代表性的是我的专业名片,github 地址 Github 的贡献的小绿点: 我的 gihtub 2023 徽章: 一、开源项目贡献 以 github 代表为例,今年的 ossinsight 表现: 项目参与: 2023 年主要参与的开源项目: openim, 参加了阿里的开源项目 sealer,网易的 gitops 项目 horizon,贡献了 kubernetes 项目、k8sgpt。提出了基于 AI和大语言模型的智能客服 openkf …… 技术成长:...

December 31, 2023 · 2 分钟 · 262 字 · 熊新伟, 我

Sora 技术讨论以及普通人和开发者如何利用 Sora 改变世界

Sora !!! 近日,互联网上掀起了一阵关于Sora的热潮。作为OpenAI最新推出的技术,Sora赋予了文字生成视频的魔力,其展示的效果令人印象深刻。 在当前,短视频的吸引力已远超过传统的小说和图像漫画。因此,Sora的问世,可能会在视频制作领域引发一场革命。 Sora的魅力在于,它能够基于文本描述生成长达60秒的视频内容,这些内容包括了精细的场景设置、栩栩如生的角色表情,以及流畅的镜头转换。 这项技术能够塑造出多元化的角色,实现特定的动作,并且在主题和背景方面做到与描述高度一致。Sora不仅准确地理解用户的指令,还能深刻洞察这些元素在现实世界中应有的呈现方式。 Sora展现了对语言的深刻洞察力,能够精确捕捉用户的意图,创造出既生动又情感充沛的视频内容。它甚至能在同一视频中呈现多个场景,同时保证角色的连贯性和视觉风格的统一。 然而,Sora并非完美无瑕。在模拟复杂场景下的物理效应,以及理解特定因果关系方面,它仍有待提升。例如,视频中的角色可能会咬一口饼干,却未能在饼干上留下明显的痕迹。 此外,Sora在处理空间细节,如分辨方向,或是描述一段时间内的具体事件,如摄影机的移动轨迹时,也可能显示出一定的局限性。 简单来说,简单来说,Sora 是一种能用文本生成最长 60 秒视频的技术,也可以用来生成图片,因为图片本质上是一帧的视频。 这篇文章,将会从 Sora 的架构,然后到 Sora 的生态,以及最后普通人或者开发者如何利用或者使用 Sora ,为这个 AI 浪潮做准备 ~ Sora的架构与创新 Sora代表了在AI视频生成技术中的一次重大创新,它在架构上与之前的Runway及Stable Diffusion等基于扩散模型的系统有着明显的区别。核心之处在于Sora采用了Diffusion Transformer模型,这是一个结合了扩散模型和Transformer模型的先进架构,为视频生成带来了前所未有的灵活性和质量提升。 架构比较 Runway/Stable Diffusion:这些系统基于扩散模型,通过逐步向图片添加噪点,再逐步去除噪点的方式生成清晰图片。这一过程虽然能够生成高质量的图像,但在视频生成上存在限制,尤其是在处理长视频和维持视频一致性方面。 Sora:Sora利用Diffusion Transformer模型,通过Transformer的编码器-解码器架构处理含噪点的输入图像,并预测出更清晰的图像版本。这不仅提高了图像处理的效率,而且在视频生成上实现了显著的进步。Sora的创新在于它处理的基本单位不是文本的Token,而是视频的“Patch”,即随时间变化的色块,这允许Sora处理任何大小和长宽比的视频,无需预先裁剪或调整。 创新应用 Sora的架构使其能够在训练时使用更多的数据和计算资源,得到更高质量的输出。这种方法不仅避免了视频预处理可能导致的原始构图丢失问题,而且因为能够接收任何视频作为训练输入,Sora的输出不会受到训练输入构图不良的影响。此外,Sora展示了模拟复杂物理现象(如液体动力学)的能力,这得益于其在训练时使用的大量视频数据中包含的物理规则。 研究基础与启示 Sora的开发受到了《Scalable Diffusion Models with Transformers》和《Patch n' Pack: NaViT, a Vision Transformer for any Aspect Ratio and Resolution》两篇论文的启发,这些研究来自Google,并在Sora项目启动后不久发表。这些研究提供了Sora架构的理论基础和技术细节,为Sora及未来AI视频生成技术的发展奠定了坚实的基础。 通过结合扩散模型和Transformer模型,Sora不仅在技术上实现了突破,而且为视频制作和AI应用开辟了新的可能性,预示着AI在影视制作、内容创作等领域的未来将更加广阔和深入。 Sora 和之前的 AI 视频生成工具有什么升级 Sora在AI视频生成领域的出现,标志着技术进步的一个重要里程碑。与早期的AI视频生成工具相比,Sora引入了一系列创新和升级,这些改进不仅提高了视频的生成质量,而且极大地扩展了视频创作的可能性。以下是Sora与之前AI视频生成工具的主要升级和优化: 提升生成视频的质量和稳定性 Sora的技术进步主要体现在能够生成高质量视频的能力上。与之前的工具相比,Sora生成的视频可以达到长达60秒的长度,同时支持镜头切换、确保画面中的人物和背景的稳定性,以及实现高画质输出。这些改进意味着使用Sora生成的视频更加逼真,观看体验更佳,为用户提供了更为丰富和动态的视觉内容。 创新的技术架构:Diffusion Transformer模型 Sora之所以能够实现上述优势,归功于其基于Diffusion Transformer模型的创新技术架构。这一架构融合了扩散模型和Transformer模型的优点,使Sora不仅能够生成文本内容,而且能够预测生成所谓的“时空补丁”。这些时空补丁可以理解为视频中的一个小片段,包含了几帧视频内容。这种方法使得Sora在训练过程中不受视频长度和显卡性能的限制,生成过程更加灵活多样,能够组合不同的时空补丁来创造出新的视频内容。 灵活性和多样性的增强 与基于Diffusion模型的Pika或基于Transformer模型的LLM和ChatGPT等工具相比,Sora的技术架构赋予了它更高的灵活性和多样性。Pika在处理视频内容时受到显卡性能的限制,而且主要模式集中在基于图片关键帧的视频扩展或风格转换上。Sora则通过其独特的模型,能够无需拘泥于特定的视频分辨率或长度限制,创造出更加丰富和多变的视频内容。 Sora 的算力要求 在讨论Sora的使用成本和算力要求之前,我们需要明白AI视频生成技术特别是像Sora这样的先进模型,其成本和算力需求是由多种因素决定的。这些因素包括但不限于模型的复杂度、生成内容的分辨率、视频的长度、以及所需的生成质量。以下是对Sora使用成本和算力要求的一个专业化和详细的分析。...

February 24, 2024 · 2 分钟 · 221 字 · 熊新伟, 我

心流状态的魔力:专注与幸福感提升指南

同之前写的 GTD 和 四象限法则实践 说的那样,我比较缺少一种专注度,以及效率。想起来最开始有过进入心流状态的体验,那就是在打游戏的时候,或者看小说的时候一旦沉迷在游戏或者小说中,那么就会进入到心流的状态,会忘记时间。 如果你曾经如此专注于一项任务,以至于忘记了时间,那么你就经历了心流。但是处于心流状态不仅仅是让一天过得更快。它对你的生活、健康、生产力和幸福感有积极的影响。 要理解是什么让心流状态如此神奇,你需要理解它是什么以及它是如何工作的。了解更多关于心流背后的科学以及如何忘乎所以。 定义 心流理论(英语:Flow),亦译神驰、沉浸,是1975年由奇克森特米哈伊·米哈伊所提出的心理学概念。其描述人类一种完全沉浸(专注)和完全投入于活动本身的心智状态的振奋状态。在适当的条件下,心流状态可以变成催眠或欣喜若狂的恍惚状态。一些科学家已将心流本身理解为一种恍惚。 触发心流 明白了心流是如何产生的,有助于我们进入到心流状态。 米哈里·契克森认为,使心流发生的活动有以下特点: 我们倾向去从事的活动 我们会专注一致的活动 注意力投入在当前活动 动作与意识的合并 反省自我意识的丧失 有清楚目标的活动 有立即回馈的活动 我们对环境与动作有主控感–挑战与技能之间达成平衡 在从事活动时我们的忧虑感消失 主观的时间感改变–例如可以从事很长的时间而不感觉时间的消逝 以上项目不必同时全部存在才能使心流产生。但米哈里·契克森也提出一些方式使得一群人可以在一起工作使得每个个体都能达到心流的状态。这种工作群体的特点包括了: 创意的空间排列 游戏场的设计 平行而有组织的聚焦 目标群组聚焦 现存某项工作的改善(原型化) 以视觉化增进效能 参与者的差别是随机的 在心流中,你会觉得你可以永远做你正在做的事情。没有一种体验会导致心流。它可能发生在你阅读、写作、绘画、跑步或园艺时。 虽然没有一个活动能保证创造心流,但人们经历的心流状态有一些共同的特征。并非所有这些都总是存在的。但是,存在的因素越多,你就越有可能体验到心流。 心流状态的特征 当人们处于心流状态,可能会出现四个特征: 自动运转:事情做起来顺手不需多加思考,身体自动发挥。 时间流逝:处于心流状态中,不会在意时间的流逝,直到回到正常状态后,才会注意到已经过了多长时间。 不觉他物:专注投入事物之中,导致不易察觉像是饥饿、手机震动等感觉与刺激。 感到愉悦:在事情完成后,感受到愉悦、满足、成就感等正向情绪。 心流状态是一种被一项有趣的任务所吸引的体验,你的注意力完全被它吸引住了,你通常会失去时间感、自我意识以及任何与手头任务无关的东西。 心流状态的十大特征 注意焦点(Attentional focus) 在心流中,无论你在做什么,你都会全神贯注。你没有在想别的事情。必须有人工作来吸引你的注意力,或者打断你手头的工作。 挑战(Challenge) 活动必须有适当的难度。太简单了,而且不够吸引人。太有挑战性了,你根本无法进入。 目标导向(Goal-oriented) 要激发心流,活动必须有一定的指向性,不一定要宏大–你可以玩电子游戏或给图片上色。但是为了引导你的注意力,你必须有一些东西来引导你的注意力。 反馈(Feedback) 在活动中有能量的交换。有没有花几个小时在电脑或手机上玩那些益智游戏?他们全神贯注是因为他们能给你给予即时的反馈。你赢了一场比赛,完成了一关,或者赢得了一颗星星–这会让你继续玩下去,因为你觉得自己做得很好。 个人控制(Personal control) 如果你觉得活动或情况超出了你的控制,你将很难进入心流状态。作为一个旁观者,很难拥有心流状态所特有的精神专注和参与感。 永恒(Timelessness)...

February 13, 2024 · 1 分钟 · 127 字 · 熊新伟, 我

OpenIM:构建高效的版本控制和测试工作流程

OpenIM 构建高效的版本控制和测试流程 开源项目的成功与否在很大程度上取决于其质量管理和协作流程。在 OpenIM 开源社区中,项目管理和测试流程的规范性至关重要,以确保代码的质量和稳定性。本文将简要介绍我们的测试方案、分支管理和质量控制策略,以及如何应用于 main 分支、PR 测试分支和稳定的 release 分支,以满足开发者、测试人员和社区管理者的需求。除此之外,还将介绍OpenIM开源社区的规范、测试方案和项目管理策略,旨在提供清晰的指导,以确保项目的稳定性和可持续性。 分支管理与版本控制 对于 OpenIM 来说分支的版本管理策略是尤其重要的,这里面设计到两块,一块是 OpenIM 的部署分支策略,一个是镜像版本策略,这两块分别参考下面的文章: 分支以及 tag 的版本策略 镜像的版本策略 总的来说: 在OpenIM社区中,main 分支被视为稳定版本的代表。所有代码必须经过严格的代码审查和测试,确保其质量和稳定性,然后才能合并到 main 分支中。 release 分支用于发布稳定版本。在 openim-docker 以及 openim-k8s 中使用的镜像版本也都是 release-v3.* 。在 release 分支上的任何更改都应该是针对已知问题的修复或功能的精心策划的添加。测试工作应重点关注于 release 分支,以确保发布版本的可靠性。 测试方案 Main 分支测试 在 main 分支上进行的测试应覆盖核心功能和关键路径,以确保基本功能的稳定性。测试工作应包括单元测试、集成测试和端到端测试。这部分所有的工作全部交给自动化去做,而不需要测试干预。 Release 分支测试 对于三种仓库,分别是 https://github.com/openimsdk/open-im-server 仓库,https://github.com/openimsdk/chat 仓库,https://github.com/openimsdk/openim-sdk-core 仓库。 在 release 分支上进行的测试要求更严格。测试团队应深入测试所有功能,并着重检查先前已知的问题是否已解决。确保在发布前没有潜在的问题。 这里的 PR 合并规则: 以 这个PR 为例: 首先是 PR 标题,PR 标题 fix pageFindUser ,首先,我们知道 git commit 信息包括是三种:...

January 15, 2024 · 2 分钟 · 300 字 · Xinwei Xiong, 我

Hugo 的高级教程

136: Hugo 进阶 来到进阶部分,就需要深度学习一些 Hugo 的高级技巧。 模块 Hugo 模块是 Hugo 的核心构建块。模块可以是您的主项目或较小的模块,提供 Hugo 中定义的 7种组件类型中的一种或多种:static、content、layouts、data、assets、i18n和archetypes。 您可以按照您喜欢的任何组合来组合模块,甚至可以挂载非 Hugo 项目的目录,形成一个大型的虚拟联合文件系统。 Hugo 模块由 Go 模块提供支持。有关 Go 模块的更多信息,请参阅: https://github.com/golang/go/wiki/Modules https://go.dev/blog/using-go-modules 一些示例项目: https://github.com/bep/docuapi是一个在测试此功能时已移植到 Hugo Modules 的主题。这是将非 Hugo 项目安装到 Hugo 文件夹结构中的一个很好的示例。它甚至展示了常规 Go 模板中的 JS Bundler 实现。 https://github.com/bep/my-modular-site是一个非常简单的用于测试的网站。 模块配置: top level 💡简单的一个案例如下: module:noProxy:nonenoVendor:""private:'*.*'proxy:directreplacements:""workspace:"off"noVendor 一个可选的Glob模式匹配模块路径,当自动售货时跳过,例如 github.com/** vendorClosest 启用后,我们将选择与使用它的模块最近的供应商模块。默认行为是选择第一个。请注意,给定的模块路径仍然只能有一个依赖项,因此一旦使用它,就不能重新定义它。 proxy 定义用于下载远程模块的代理服务器。默认值是 direct ,意思是“git clone”或类似的。 noproxy 逗号分隔的glob列表匹配不应使用上面配置的代理的路径。 private 逗号分隔的glob列表匹配应被视为私有的路径。 workspaces 要使用的工作区文件。这将启用Go工作区模式。请注意,这也可以通过OS env设置,例如 export HUGO_MODULE_WORKSPACE=/my/hugo.work 这只适用于Go 1.18+。在Hugo v0.109.0 中,我们将默认值更改为 off ,现在我们可以解析相对于工作目录的任何相对工作文件名。...

November 6, 2023 · 15 分钟 · 3098 字 · 熊鑫伟, Me

Kubernetes Kustomize 学习指南

介绍 关于 kustomize github 地址 Get Started Kustomize 是一个专为 Kubernetes 设计的开源配置管理工具,它能帮助用户定制 Kubernetes 对象,并以声明式的方式管理这些对象,而无需修改原始的 YAML 文件1。这意味着你可以保留应用和组件的基本设置,同时通过应用名为“补丁”的声明式 YAML 文档来覆盖默认设置,而不会更改原始文件。Kustomize 提供了一种声明式的方法,符合 Kubernetes 的哲学,并且能够以一种可重用、快速生成、易于调试和可伸缩的方式定制 Kubernetes 配置。 Kustomize 的主要功能包括: 声明式配置: 允许你以声明式的方式定义和管理 Kubernetes 对象,例如部署、Daemonsets、服务、ConfigMaps 等,为多个环境提供支持,而无需修改原始的 YAML 文件 配置层叠: 通过利用层叠来保留应用和组件的基本设置,并通过覆盖声明式的 YAML 文档(称为补丁)来选择性地覆盖默认设置 集成与独立使用: Kustomize 可以作为一个独立的工具使用,或者与 kubectl 结合使用。从 Kubernetes 1.14 版本开始,kubectl 也开始支持使用 kustomization 文件来管理 Kubernetes 对象 Kustomize 提供了一种自定义 Kubernetes 资源配置的解决方案,该方案摆脱了模板和 DSL。 版本关系 & kubectl 集成 要查找kubectl最新版本中嵌入的kustomize版本,请运行 kubectl version : $ kubectl version --short --client Client Version: v1....

October 31, 2023 · 5 分钟 · 1004 字 · Xinwei Xiong, Me