工作总结

发表时间：2026-03-13

2026年IT年终工作总结。

今年年初给自己定了个小目标：少做救火队员，试试能不能当个天气预报员。现在年底回头看，天气预报没当上，顶多算是个看云识天气的老农——偶尔准，偶尔翻车，但至少不再等打雷了才往外跑。

先说那个折腾最久的数据库连接池问题。我们这套核心交易系统，每年业务量往上拱20%，老架构喘得越来越厉害。最典型的就是连接池半夜被占满，以前解决办法简单粗暴：业务低峰期重启。但今年不行了，凌晨也有跨境订单，重启一次，客诉电话能响一宿。

刚开始以为是网络抖动，拉着网工查了一周，所有指标都正常。又怀疑代码里有连接泄漏，上内存分析工具，折腾两天也没抓到。后来我把过去一年的监控数据全拉出来，连接池水位、并发数、慢SQL、GC次数，按时间轴对齐，用回归跑了一遍。结果发现一个规律：告警并不发生在并发最高的时候，而是出现在“高并发+某个特定慢查询”同时出现的时间窗口。那个慢查询是个统计报表，业务部门喜欢整点前后跑，一跑就是几十秒，连接池就被拖死了。

找到病根就好办了。我们没急着加连接数（加了也治标不治本），而是做了两件事：第一，把那个报表查询从主库剥离到历史库，通过Canal同步数据，查询只读从库；第二，修改应用层的连接池释放策略，从“等待超时”改成“快速失败+重试”，失败的任务丢进MQ，由补偿程序处理。这么改完，心里其实有点虚——快速失败会不会丢数据？后来加了一堆监控和日志，跑了俩月，确实没丢，但有一次补偿程序挂了，导致几张单子卡了两个小时。这事让我记住：任何优化都会带来新坑，得提前想好怎么填。

再说一个跟业务扯皮的事。六月份，销售总监找我，说某地市分公司业绩连续三个月下滑，问我是不是系统卡。我第一反应是查服务器负载，CPU、内存、IO全正常。后来调了那个地市所有门店的操作日志，按接口响应时间排序，发现十几家店在“上传附件”这一步平均耗时是其他店的20倍。远程连进去一看，这些店用的都是老式USB摄像头，驱动不兼容新浏览器，他们内部流传了一个“兼容模式”脚本，但这脚本有内存泄漏，跑半天就得重启浏览器。

我把硬件型号、浏览器版本、操作耗时分布图打包发过去，建议统一换成即插即用的高拍仪。业务一开始不信，觉得我在甩锅给他们硬件。我把那十几家店的工单量和操作耗时做成散点图扔到群里，他们才松口。设备换完后第二个月，那十几家店的报障工单降了70%，单日最大开单量也确实涨了——但我不敢说全是硬件的功劳，因为那个月正好是业务旺季。不过数据至少证明：系统不背这锅。

有些问题，数据帮不上忙，得亲自跑一趟。那是个雨后的早晨，工地项目部的网络时断时续，远程看了两天，光衰正常，设备没重启，ARP没冲突。实在没辙，我开车拉着备机过去。现场是个临时板房，设备间在角落，墙上掏了个洞走网线。顺着洞往外一瞅，雨后积水顺着墙壁往下滴，正好滴在水晶头根部。拿福禄克测线仪一量，第4芯对地电阻偏高，明显是进水了。换了根防水网线，重新做头，涂上防水胶，问题解决。回程路上我就在想：监控图上的抖动，可能只是一滴雨水。跑了这一趟，至少证明不是我们系统的问题，也算值了。

✹作文5000网内容组内部知识竞赛题库:

IT年终工作总结 | 年单位出纳年终工作总结 | 销售珠宝年终工作总结年 | 导游年终工作总结 | 2026年终工作总结 | 2026年终工作总结

今年还顺手改了设备验收标准。以前只测连通性、测带宽，结果去年吃过一次亏：新换的交换机，空载时啥问题没有，一跑业务流量延迟就从2ms跳到200ms。查了半个月，发现是缓存算法有bug，对业务里大量的小包处理不过来。所以今年验收时，我们加了一套自己写的压测脚本，模拟真实业务流量特征（大量小包+突发请求），连续跑24小时，记录丢包率和延迟抖动。就靠这套脚本，今年堵住了三批不合格设备，其中一批还是某大厂的——他们的测试报告写得天花乱坠，一跑压测就现原形。

当然，也有没搞定的事。比如老旧设备的驱动程序维护，总有一些“钉子户”因为预算问题换不掉。数据告诉我们，这些设备拖累了整体效率，但你就是动不了。明年计划专门做个统计，把每台旧设备拖慢了多少效率、产生了多少报障工单量化出来，拿数据去跟财务磨。

这一年干下来，最大的变化是开始信数据了，但也更清楚数据的边界。数据能告诉你问题在哪，但到现场动手修、跟业务扯皮、跟预算斗智斗勇，还是得靠人。说白了，干运维这行，就是跟不确定打交道，能做的无非是多看点数据、少踩点坑、踩了坑赶紧爬出来。

推荐阅读:

作文5000网小编为您推荐工作总结专题，欢迎访问：工作总结

热门标签:

坐席年终工作总结

党员年终工作总结

科协年终工作总结