What about the first 30 seconds: what the pr description tells me?

Before I look at a single line of code, I spend 30 seconds reading the PR description. This might seem trivial, but a poorly written description is often the first red flag that the code itself might have issues. In my experience, developers who can't clearly articulate what their code does often...

The Logic Layer: Does This Actually Solve the Problem?

Once I understand what the PR is supposed to do, I verify that it actually does it. This sounds obvious, but you'd be surprised how often code passes tests yet doesn't fully address the underlying issue. I've seen developers fix the symptom while leaving the root cause untouched, creating a time...

What about the data layer: following the information flow?

Data bugs are the worst kind of bugs because they're often silent and cumulative. A logic error might crash your application immediately, but a data error might corrupt your database slowly over weeks, and by the time you notice, you have thousands of bad records and no clean way to fix them.

What about the security lens: thinking like an attacker?

Security review isn't just about finding SQL injection vulnerabilities—though I do look for those. It's about thinking through how a malicious user might abuse the system. After dealing with two security incidents in my career (one minor, one that made the news), I've become much more paranoid...

What about the testing strategy: beyond green checkmarks?

Tests passing is necessary but not sufficient. I've approved PRs with 100% test coverage that still had critical bugs because the tests weren't testing the right things. Good tests verify behavior, not implementation. They test edge cases, not just the happy path. And they're maintainable—they...

Code Review Checklist: What I Look for After 10 Years of PRs \u2014 TXT1.ai [中文]

💡 Key Takeaways

The First 30 Seconds: What the PR Description Tells Me
The Logic Layer: Does This Actually Solve the Problem?
The Data Layer: Following the Information Flow
The Security Lens: Thinking Like an Attacker

三年前，我批准了一个拉取请求，导致我的公司在一个周末损失了47,000美元的收入。代码看起来很好。测试通过了。逻辑是可靠的。但我在处理我们的欧洲客户的时区转换时错过了一些微妙之处，当夏令时启动时，我们的支付处理系统开始在18%的用户基础上悄然失败。

💡 关键要点

前30秒：PR描述告诉我的内容
逻辑层：这真的解决了问题吗？
数据层：跟随信息流
安全视角：像攻击者一样思考

这一事件改变了我检查代码的方式。我是Sarah Chen，在过去十年里，我在三家不同的SaaS公司担任高级工程经理，每周审核平均15到20个拉取请求。这大约是我职业生涯中的8,000个PR，从单行热修复到跨越50多个文件的大规模架构重构。我见过优秀的代码却交付了bug，也见过凌乱的代码却在生产中无故障运行多年。

我学到的是，代码审查其实并不只是发现bug——尽管这很重要。它是关于构建能够经受现实考验的系统。它是关于创建代码，让下一个开发者（通常是你自己，在六个月后）可以理解和修改，而不必担心。它是关于捕捉那些只有在你的应用程序扩展、出现边缘案例，或者当那位在澳大利亚的客户做了你从未预料的事情时，才能显露出来的隐形问题。

这是我的检查清单。不是教科书中的理论清单，而是我通过无数次生产事故、深夜调试会议和当你意识到一个你批准的bug现在影响了实际用户时的那种沉重感觉而提炼出来的实战清单。

前30秒：PR描述告诉我的内容

在查看任何一行代码之前，我会花30秒阅读PR描述。这可能看起来微不足道，但描述写得不好的时候，往往是代码本身可能存在问题的第一个红旗。在我看来，无法清晰表达代码功能的开发者通常没有充分考虑实现的细节。

我关注三个具体的方面：解决的问题、采取的方法，以及任何权衡的考虑。好的PR描述就像一个迷你设计文档。“修复用户身份验证中的bug”对我没有任何意义。“修复JWT令牌刷新中的竞争条件，这导致0.3%的用户在高流量期间意外地被注销，方法是使用Redis实现分布式锁”则告诉我开发者对问题有深入的理解。

我还检查PR的大小是否适宜。我的经验法则是：如果一个PR涉及超过400行代码（不包括测试和生成文件），那么它可能太大而无法有效审查。谷歌的工程实践研究表明，审查的有效性在200-400行之后会显著下降。我发现这一点是准确的——在审查大约300行后，我的注意力开始分散，并开始错过一些微妙的问题。

当我遇到一个庞大的PR时，我会要求开发者将其拆分为更小、逻辑清晰的几个部分。是的，这一过程在前期会花费更多时间，但它可以防止我草率批准一个2,000行的PR，因为我被压倒，只想尽快通过。我早期职业生涯中以这种方式批准了太多有问题的PR。

描述中还应链接相关背景：所处理的票据或问题、任何设计文档和相关的PR。如果我必须在Jira或Slack中搜索，才能理解为何要进行此更改，这会慢下整个审查过程的进展。在我目前的公司，我们已经将没有适当背景的PR列为审查政策，只有在描述更新后才会进行审查。这一简单的规则显著提高了我们的审查质量。

逻辑层：这真的解决了问题吗？

一旦我明白PR的预计功能，我会验证它是否真正实现了这个功能。这听起来显而易见，但你会惊讶于代码经过测试却并未完全解决潜在问题的频率。我见过开发者修补症状却忽视根本原因，造成一个后续会爆炸的定时炸弹。

"代码审查其实并不只是找bug，而是构建能够经受现实考验的系统，并创建让下一个开发者能无畏理解的代码。"

我首先在脑海中审视顺利的路径。如果这是一个处理退款的新功能，我会想象客户请求退款，并追踪代码路径，从API端点通过业务逻辑到数据库更新。每一步是否合理？我们是否正确处理了数据？我们是否更新了所有必要的记录？

但是，顺利的路径很简单。把优秀代码与可以投入生产的代码区分开的，是它如何处理不顺利的路径。如果支付网关宕机怎么办？如果退款金额为负数怎么办？如果用户请求退款，但订单已经退款怎么办？我学会了对边缘案例抱有几乎偏执的关注，因为生产环境是发现你未考虑的每个边缘案例的混乱引擎。

我寻找防御性编程模式：空值检查、输入验证、边界条件处理。但我也会关注过度设计。不是每个函数都需要处理每个可能的边缘案例。如果一个私有方法仅在一个地方被调用，且输入是经过验证的，那么添加冗余的验证只是噪音。关键是理解每个函数的契约，并在边界处确保得到维护。

我见过的一个模式反复引发问题，即“乐观更新”。开发者假设操作会成功，并在确认成功之前更新UI或数据库状态。这通常在99%的情况下有效，但那1%会产生令人困惑的bug，使系统状态变得不一致。我总是标记这些模式并问：如果这个操作中途失败，会发生什么？

数据层：跟随信息流

数据bug是最糟糕的bug，因为它们通常是静默且累积的。逻辑错误可能会立即导致应用程序崩溃，但数据错误可能会缓慢损坏你的数据库，等到你注意到时，可能已经会有数千条错误记录，且没有干净的办法来修复它们。

审查重点	初级审查员	高级审查员	对生产的影响
语法与风格	主要关注	自动/最小关注	低
边缘案例	仅明显的场景	时区、区域、规模问题	高
测试覆盖率	测试存在并通过	测试覆盖失败模式	关键
性能	代码工作正常	在负载/规模下的行为	高
文档	有注释	为什么做出这些决策	中

在审查涉及数据的代码时，我会追踪该数据的整个生命周期。它来自哪里？如何验证？如何转换？存储在哪里？谁可以访问？这对用户生成的内容或财务数据尤其重要，因为错误会造成真正的后果。

我特别留意数据类型转换。我曾批准过一段将价格从浮点数转换为整数进行计算，然后再转换回浮点数的代码。看似无害。但由于浮点精度问题，像$10.99这样的价格有时会经过转换变为$10.98或$11.00。我们没能及时发现，直到客户开始投诉错误收费。现在我仔细审查每个类型转换，特别是涉及金钱或度量单位的转换。

数据库迁移是另一个我特别小心的领域。我关注几个方面：迁移是否可逆？如果中途失败会发生什么？在我们的生产数据库上需要多长时间？我见过某些在1,000条记录的开发数据库上运行良好的迁移，但在50百万条记录的生产数据库上却锁定了表格达20分钟，甚至导致整个应用崩溃。

对于任何修改现有数据的代码，我会问：是否有备份计划？如果出现问题，我们可以回滚吗？在我之前的公司，我们有一项政策，任何影响超过10,000条记录的数据迁移都需要在生产快照上进行干运行，并在PR中记录明确的回滚程序。这让我们避免了多次问题。

我还关注数据访问模式。这段代码是否在进行N+1查询？它是否在只需要几个字段时加载整个集合到内存中？这些性能问题在开发时可能不明显，但在扩展时变得至关重要。我曾审核过的代码似乎没有问题，但如果投入生产，将导致我们的数据库CPU飙升至100%，原因在于它是