一个普通人眼里的战争思考

2025-05-25

最近读了一些关于战争的书，完整的读完了《血战太平洋之决战冲绳岛》。

近距离的体验一把短兵相接的战场，很难想象真实的战场是什么样子，我想人间地狱不过如此。

对于作者来说，我觉的幸运的是他人在战场上，但是他的家庭都处在安全和富足之中。他的战斗行为有足够的现实意义。

最不幸的是，人在战场上搏命，自己的家人也生活在水深火热之中。

没有人希望有战争，但是战争离我们真的又很近。

珍惜当下，好好生活。

展开全文 >>

工作周报2025年 5 月 19 日 - 2025年 5 月 23 日

2025-05-23

本周工作思考

Sentry性能排查相关工作思考
1. 按照团队的安排，本周开始针对性的排查Sentry上的性能问题，在第一轮rspack 和打包优化的基础上，这次排查的重点是比较突出的重点页面的性能问题，如PC课程页、M端课程页，M端各个重点小节的主页面，主要关注的性能指标包括FP和LCP的p75，也会关注和处理重点客户的p95的指标。这次优化思路上放在页面级组件、页面，接口上，结合Sentry性能指标和页面的Performance指标，针对性优化解决，通过快速迭代来分析性能提升效果，然后再总结性能优化方法以应用于同类的页面或者模块。
稳定性问题排查解决
1. 通过前一阵子的集中式的问题解决，最近一个月Sentry上Crash Free Sessions指标平均保持在98.5%以上，Crash Free Users指标平均保持在95%左右，按照OKR的目标设计，我们希望Sentry上Crash Free Sessions指标能稳定的保持在99.9%以上，Crash Free Users保持在99%以上，对Web端来说，涉及平台多，浏览器和网络情况复杂，实现起来还有比较大的挑战，很多疑难问题，偶发问题，第三方库库的问题都需要继续深入的解决。目前按照专项的方式逐步对音视频播放器，PDF阅读器，上传等关键组件增加了非常多必要日志和异常处理，随着这些优化的陆续上线，我们一定能在Q2完成这个目标。

展开全文 >>

工作周报2025年 5 月 12 日 - 2025年 5 月 18 日

2025-05-18

本周工作思考

构建自助问题排查系统的探索和思考
1. 随着前端稳定性项目的推进，代码报错类问题已经得到有效的监控和解决，按照现在的方式继续深入推荐，不管是新功能上线还老功能的深度使用，都得到了有效的控制
2. 目前项目的深入深入我们也注意几个点：一是我们目前没有完善自助问题排查工具，二是现在Sentry上的问题解决难度变大了，三是如何保持住这种治理效果
3. 在技术上，前端上深度依赖浏览器的能力，比如富文本编辑能力、Fetch/Ajax为代表的短连接网络技术、以Web socket为为主要技术长连接能力、以Canvas为主要技术的前端绘制能力、音频播放能力、视频播放/字幕能力、视频录制/媒体管理能力、音频录制能力、PDF展示能力，需要和APP绑定使用的Webview技术，基于腾讯云和AWS的前端资源管理能力（Blob大文件上传下载等），当然这里还有其他的，比如部分功能会依赖web worker，webassembly，SVG，对浏览器来说，这些能力实现就是异常复杂，加之用户的环境千差万别，用户可能会遇到各种各种的问题，我们经常在Sentry上看到一个从来没见过的报错，观察一两周也就只有这一个报错，这类报错我们从现有的观测系统上判断用户是正常使用的，也就是说报错是偶然发生而且不影响用户的使用。当然也有一些这类报错，我们没法做出这样的判断，因为报错时间后，就没有相关日志了，我们没法判断用户是因为报错而无法使用了，还是在我们的观察窗口期用户只是没有使用而已，或者使用了，我们的日志因为未命中采样策略而没有上报，这类问题问题就是难度比较大的情况之一。还有这个报错频繁发生，但是因为报错是来浏览器的报错，或者没有任何代码信息和堆栈信息，我们也无法判断和排查这类报错，只能通过监控系统来判断这类报错有没有影响用户的使用
4. 在和CO的伙伴们在问题排查问题的时候，特别是一些疑难问题，我也发现问题排查效率不高的情况，这类情况我以前认为是流程问题，后来我仔细观察发现，很多情况是的原因是客观的，首先客户反馈的问题不一定是及时的，CO的伙伴收到反馈，然后理解，确认，整理，这个过程的时间也是必不可少的，最后到工程师这边，工程师理解，复现，排查，定位，也需要一定的时间，如果是简单的bug，到这一步，后面就是bug修复发布流程，这个时间是可控的。目前不少问题是无法复现的问题，为了解决问题，需要寻找客户复现的潜在因素，可能就需要和用户这确认信息，这个中间又需要经过CO伙伴和用户，其中CO伙伴可能要理解一些基本的专业知识，比如浏览器兼容性，视频录制等，因为CO伙伴可能要给用户解释工程师为什么需要这个信息，这个信息怎么提供，这个信息是否是隐私数据等等。基于这些情况，我觉得优化流程流程并不能解决问题，真正要解决这类问题，就需要自主化的排查诊断排除工具，CSS伙伴不应该为解决这类问题而去理解浏览器兼容性，视频录制的这些知识，她们应该将精力用在如何维护好客户关系，深度挖掘产品的使用价值上，从这个角度出发，我们在修复Sentry问题的同时，也开始利用现有的经验和AI编程能力逐步的开发和完善一些问题排查工具，总结常见问题排查步骤，利用工具实现问题排查，省去中间不必要的沟通，从而提高整个团队的专业性和服务效率。

展开全文 >>

写给十年后的自己

2025-05-16

今年是2015年。

我们正在使用用有点傻逼的大模型。

我们的AI应用还没有现象级的。

AI创业热火朝天。

我们的出租车都是人开的。

我们需要自己决定何时买何种商品来满足自己。

我没有自己车。

我在UMU工作。

我的家在天津。

孩子还在上小学二年级。

我住在北京大兴。

我还不胖，体重120斤。

我再努力学习AI技术。

我今年39岁。

我的父母都健康，在老家务农。

我老婆还是一点微胖。

展开全文 >>

要不要生二胎

2025-05-13

这是一个很艰难的问题，也是很容易的问题。

艰难的是，这是关于幸福，生命，未来的问题。

容易的是，这完全有你决定，你可以听从父母的建议，朋友的建议，可以制造一些随机，甚至可以问问ChatGPT或者让Deepseek帮你深度思考一下。

五一回家和母亲闲聊，说到最近姨姐姨哥家都有闺女要结婚的话题时，我有意的询问母亲说，我和小乔计划不要二胎了，没想到母亲说，你们决定就好，孩子多少，都差不多。接着母亲开始唠叨起家里的一些事情，我是认同母亲的想法的，孩子多少其实差不多。

身边的好朋友基本上都是两三个孩子，小乔有时候会问我，你羡慕不？坦白说，我挺羡慕的。

当刘牧山出生后，我就开始想要不要二胎这个问题，特别纠结，想要的原因很简单，因为特别想要一个闺女，另外就是多子多福嘛，还有一个就是从众心理，国家鼓励要二胎，身边亲朋好友也在劝要第二胎孩子。不想要的原因也很简单，二胎是男孩，意味着未来的抚养成本会急剧提升，我不一定能支撑住。

后来随着对这个问题思考逐渐深入，我的观点发生了转变，我越来越不想要二胎了，我觉得一个孩子挺好的。

在工作中设计方案的时候，会使用SWOT思路，对要不要二胎这件事，要需要SWOT分析一下，一孩 VS 二孩方案。

先说说一孩方案

优势

家庭的资源最大力度上支撑和托举一孩，他未来的人生可能因此会增加一些机会，也可能会让他在求学阶段、就业阶段更加追随自己的想法一些。
整体抚养成本不会很高，可以有更多的时间和精力追求自己的向往生活。
对孩子来说，家里只有一个他孩子，心理成长上可能会更从容一些，个人成长也更自由一些。
家庭关系上也更加简单，我是工程师，简洁简单一直是我追求的信念，所以我也希望我的家庭关系是简简单单的。
家庭的生活压力、精神压力都会较小
家庭的生活质量同比会较好一些

劣势

孤独感会增强，不管是孩子还是父母，孤独感、寂寞感可能会更多，过年过节，红白喜事等活动在人力上会冷清不少
家庭焦点压力，所有的关注点都在孩子身上，对孩子的期望可能也会更高，这样会增加孩子的压力
社交环境受限，多孩子的家庭在孩子很小的时候就会体验和学习集体生活方式，如分享，忍耐，边界控制，合理对抗，只有一个孩子，就会让孩子无法再家庭中学习到这些，只能在学校和以后的工作中学习
孩子的未来的赡养责任压力大，没有兄弟姐妹分担父母的赡养压力
父母老年生活只能依赖一个孩子，老年的生活质量可能会不高

机会

更灵活的家庭生活方式：可以选择更自由的居住、教育方式
父母自我成长空间大：相对有更多时间发展职业或兴趣爱好。
子女教育可更定制化：可根据孩子特点量身打造成长路径。

威胁

独生子女养老压力大：父母年老后责任集中在一个人身上，负担重。
家庭抗风险能力弱：若孩子发生重大变故，家庭难以承受。
社会竞争压力依然存在：即使资源集中，也不一定带来绝对优势。

再说说二孩方案

优势

兄弟姐妹互助成长：孩子间相互陪伴，有助于社交能力、责任感和情绪发展。
家庭活力更强：家庭氛围更热闹、有互动，父母老年生活更有依靠。
心理支持系统更完整：孩子在遇到困难时有兄弟姐妹倾诉、商量。

劣势

资源分散：教育、经济等资源需在多个孩子间分配，可能降低单个孩子的支持度。
父母压力大：时间和精力需分配在多个孩子之间，精细化育儿难度提升。
孩子间竞争与冲突：容易产生偏爱争议、比较心理、争夺注意力等问题。

机会

家庭多样性教育：可以在家庭内部模拟社会协作、竞争等环境。
养老责任分担：将来可由多个子女共同照顾父母，减轻单一子女的压力。
亲情纽带延续：兄弟姐妹之间的情感是家庭文化的延续，有利于代际凝聚。

威胁

教育与经济负担加重：双倍甚至更多的教育投入，对中低收入家庭是巨大挑战。
政策、教育资源限制：部分地区对入学、医疗等配套资源不足，难以兼顾多个孩子。
育儿焦虑加剧：父母对不同孩子的成长路径难以完全同步管理，容易出现育儿焦虑。

需要考虑的应对方案

与孩子建设朋友关系、兄弟姐妹关系
父母要做好养老贮备金，提前规划好老年生活，并对未来的疾病等风险做好管控
提前做好身体健康，身体安全的准备
失独家庭的预防机制建设
增加家庭资产，建立经济上基础支撑
独生子女抗风险问题
万一孩子生病、成长遇阻，家庭如何应对？是否有心理与经济支持系统？
提前布局家庭的社交关系建设

展开全文 >>

工作周报2025年 5 月 6 日 - 2025年 5 月 11 日

2025-05-11

本周工作思考

uShow 博瑞纳2套的分数拟合
1. FAB打分对齐难的问题，FAB的分数向客户专家的对齐一直以来是一个比较棘手的问题，这个问题也和负责uShow交付的CSS伙伴们有过深入沟通，个别客户FAB的分数也提出这样或那样的问题。基于现有的工程实现，在实际交付中，FAB打分对齐确实存在一些固有的技术缺陷，如模型的优化、算法的优化等，但是这些调整都需要较完整的设计和实现，需要较长的开发路径和使用路劲进行迭代和验证。
2. 博瑞纳的这套uShow在打分对齐的也遇到的FAB对齐难的问题，之前在标签设计和打分逻辑上做了不少的探索，效果有好有坏，总体来说是模型对长句子的识别分类能力不足导致的，比如在说明“降低患者经济负担”这个利益的时候，一些销售人员的会对话术做比较丰富的发挥，并进行一些更深入的拆解说明，使之更利于医生医院角度的理解接受，但是这样往往被拆到了多于三四个句子的表述，这样导致FAB得分较低，而客户专家又比较认可这种说明，这样就导致了打分差异。
3. 基于这种考虑，这次增加了FAB分类识别的阈值控制的功能。对于此类情况，对零样本分类、多样本分类、语义相似度等阈值设定为高、标准、低等三组预设值，对于语义点分散的情况就是使用低预设值组合。而对于注重简练的uShow则使用高预设值组合。为不影响过往的uShow的，这些预设值的配置和标签设置一起设置，这样就提高了对客户逐字稿的特征控制。从实际操作来看，这个办法确实提高打分的对齐程度。
构建自助问题排查系统的初步思考
1. 随着我们对线上问题排查的深入，对稳定性和健壮性性的理解也在加深

展开全文 >>

工作周报2025年 4 月 28 日 - 2025年 5 月 5 日

2025-05-05

本周工作思考

提高线上疑难问题排查效率的实践和思考
1. 目前线上问题排查一个最有挑战的点是复现用户的反馈的问题，深层的原因是不知道在用户那问题是怎么发生的，我们通过业界内的调研和自身实践都发现，有通用的解决方案，如KIbana，Sentry都是类似的系统，不同的技术体系通常有不同的工具。另外，不同的企业和业务技术有自己的独有的工具体系和一整套思路。
2. 目前我们内部的对如何快速发现和解决客户的问题有了比较稳定的基础设施，但是将这些工具应用提高问题的解决速度虽然比之前好了很多，但是我们依然有很大的提升空间，比如在解决速度，用户的体验，用户如何快速有效的反馈问题，这些指标我们还有更进一步的提升空间，从工业化的指标看，售后质量优良与否也体现ToB业务的工程能力和客户服务能力。
3. 我们最近也在一直思考和探索线上问题排查工具链，对于一些疑难问题，一旦接到用户反馈，通过一系列的工具组合，CSS侧或者测试侧的伙伴就能能在较短的时间内收集更多的问题的信息，甚至能初步定位问题的原因。特别是国际客户，相当一部分问题需要把应用层问题转化为工程层问题，这个装换过程目前有些耗时漫长，CO的用户 - 企业对接人-UTG对接 - 工程，这中间同时也有信息损失，后续虽然会有大连团队伙伴们的介入，依靠文本信息传递使用过程的中问题，依然会面临不少问题。
4. 健全和完善问题排查工具链应该是解决这类问题的有效办法，之前我们也曾经做过类似的工具，但是不够专业，还有就是针对特定的问题，我们现在在逐渐补全这个链条上的不同工具，也在考虑如何利用AI技术快速识别和诊断。本周我们也针对视频录制类的功能做了一个专门的诊断工具，尝试用新的专业性的思考和技术来完善这个解决方案。
5. 后续我们尝试对文档类问题，视频类问题，AI相关业务都针对性的使用类似的方案在开发功能的同时，也完善其稳定性相关的支撑工作。
《0423 UMU&ATD直播: 东朔老师对话 ATD CEO Tony Bingham》
1. 假期里结合其他视频又仔细理解了全文，其中东朔老师的观点”在安全第一的视角和工具的实用性之间取得平衡“我认为在企业端AI应用上很重要的洞察，在工作中我也深有体悟，企业内部产生的知识是企业都有的，也是企业的重要资产，在AI时代如何保护好这些知识资产是我们的ToB业务需要重点考虑的，这是所有AI业务的基础，如果没有数据安全，我相信很多企业甚至会舍弃AI的优势，至少会延缓AI在核心业务的应用。我们一直重视企业的数据安全和知识保护，这是我们长期以来的坚守的价值观和产品优势，我想我们未来也一定会坚守住，用户也会因此而更加认可我们的价值。

展开全文 >>

活在AI的阴影里

2025-04-28

从今天开始，AI的阴影会逼近每一个人。

只有奔跑着创新的人，才能不被阴影罩住。

AI给普通人提供了新的机会和方向。

抓住AI的机会！

展开全文 >>

工作周报2025年 4 月 21日 - 2025年 4 月 26 日

2025-04-26

本周工作思考

部分前端库增加cursorignore文件的考虑
1. 本周的处理线上问题和时候，把涉及到的仓库增加了cursor文件，主要是防止cursor的索引文件的时候去把安全敏感文件加到索引里面，这个事本身的处理比较简单，主要是从安全角度出发的考量。从Cursor的公布的技术文档上看，codebase会把编码后存储到其服务器上，本身不涉及到明文存储，不过其文档中也提示用户把敏感信息放在cursorignore里，尽管如此，cursor也不保证这类信息不会被大模型使用。
2. 对我们来说，尽量保证敏感数据不直接存储在需要使用Cursor的代码库中，我们是自己的数据安全的第一负责人。
3. 在MCP，A2A，各种Agent和各种大模型技术和工具井喷式出现的时候，各家工具商对用户数据的安全重视程度不同，特别存在很多黑盒的情况下，大模型如何利用这类敏感信息，我们只能按照这些供应商对外提供的协议或者技术文档上来的对策，或者说很多这些工具的提供商也没法明确，这就要求对数据安全有一定的敏感性和主动的防范意识。
本周Sentry问题排查进展
1. 随着对Sentry使用深入理解，我们对Sentry的整体设置做了一些优化，增加了更多的Tag和用户信息，对Sentry的可观测性思想也有了深入的认知，在具体的使用上针对了基于umuI，企业ID，数据大盘都对用户的使用情况有了一定的观察和洞察，比如在遇到Issue时，我们可以判断用户是否还在继续使用，用户是否自我修复的能力，是否影响到了用户体验，用户的使用旅程到底是怎么样的。
2. 在问题修复上我们已经进入对困难问题的修复阶段，这类问题往往没有具体的错误的代码位置，或者有具体的代码位置但不知道怎么改，还有就是改动影响较大，特别是视频类（视频小节，视频作业，音视频录制），文档类（文档小节，图文小节）这类问题涉及到比较复杂的技术和业务，虽然知道问题在哪，但是真正解决还要做不少的代码分析和排查。我们目前基于报错数量和遇到此类问题的用户数量排序做优先级，踏踏实实的解决好这类难点问题。
3. 为了排查问题，除了和大模型聊，我也经常去翻阅网上相关资料获取去Sentry的论坛寻找一些线索和答案，我发现很多开发者也会面临着和我们一样的各类问题，大家通过Sentry或者其它工具都在不断地解决这些问题，不断提升各自公司的产品质量和用户体验，这也体现一个趋势：用户对互联网产品的质量和用户体验的要求是在不断提高的。
4. Sentry问题的排查是一种事后解决策略，它的最好结果是减少损失，而不是避免损失。很多思考和经验也不断的提醒我们，重视事后解决的同时，更要重视事前预防，把需求理解透，挖清楚，代码设计好，大模型利用好切实提高业务和代码质量，这样才能让Sentry问题排查更有价值。

展开全文 >>

工作周报2025年 4 月 14 日 - 2025年 4 月 19 日

2025-04-19

本周工作思考

脱敏处理

前端可观测性工程化改善及提效思考及实践
1. 通过一段时间的Sentry问题的排查和解决，除了提高了线上系统的运行稳定性，我们也逐步对我们的系统有了更深的理解和把控。在功能上线、例行发版等方面，我们通过现有的可观测的基础设施Sentry，KIbana等，对提前发现一些js报错和线上运行情况，对一较大的功能的上线，我们也有了把控运行情况的信心基础。
2. 这两周投入的较多的时间在业务项目，这块投入的时间少了，有时看到Sentry上的问题没有时间改，还是着急的。下周会集中精力搞定这些问题，另外也要加深推进一些工程化能力，对问题发现、问题排查等减少人工介入，实现自动化的常规巡查等，这些工作的落地是我们Q2的重要工作之一。
uShow的交付
1. 最近每周都有新的uShow部署需求，在过程中，逐步对uShow的交付工作做了一些自动化的工作，包括，PPT图片自动上传，上线SQL自动化生成，逐字稿测试视频的自动生成，这任务的自动化会让让每个uShow交付节省1个小时的时间。因为有了ChatGPT和Cursor的帮助，这些自动化任务的开发都是基于python的，使用很少的时间就能完成编码。
2. 这个过程中，我的一个体会是，以前没有能力做或者需要花费大量时间做的编码工作在AI的帮助下会很快完成，但是工作的难度和挑战变为工作流的设计、拆解、组装和Prompt能力。这类Prompt能力不仅是写Prompt本身的技术，更多的是对待开发系统的要有针对AI助手的框架性理解和拆分，其实也是我们说的AI力。
3. AI编码能力提高，也是倒逼我们程序员们提高自己，Cursor在时刻提醒程序员：你有一个能力超强的助手，你要怎么给你的助手安排合理的工作，你要怎么给它授权，你做的不好它就会抢你的饭碗，所以程序员的一个重要的基础工作变化是，之前是努力利用技术和工具提高自己的效率和产出，现在是通过提高管理指挥AI助手的能力，让你的AI团队有更高效更有产出。这种转变就意味了程序员的能力矩阵发生了巨大的变化，比如你可以对Python，GO，JavaScript等语言细节不了解，但是只要能对架构，设计、性能、业务等有深有的理解，就能交付有一定质量代码，不过有时候AI也会糊弄你，所以不仅有高阶的能力要求，还是要有一定的手写代码的经验和能力。

展开全文 >>