当前位置:首页 > 文章列表 > 文章 > php教程 > PHP-FPM 慢请求报警运行手册:从 slowlog 到进程池参数调整

PHP-FPM 慢请求报警运行手册:从 slowlog 到进程池参数调整

来源:17golang原创 2026-06-29 18:17:55 0浏览 收藏

PHP-FPM 慢请求报警出现时,常见反应是先看接口日志,再猜是不是数据库慢了。但在线上值班场景里,更稳的做法是先判断 PHP-FPM 池是否被占满,再用 slowlog 找到卡住的脚本位置,最后决定是临时扩容、回滚配置,还是推动代码修复。

这篇文章按一份运行手册来写,适合 PHP 接口服务、传统后台管理系统、Nginx + PHP-FPM 部署环境。你可以直接把其中的检查项改成自己的域名、池名称和日志路径。

目录
  • 触发信号:先确认是不是 PHP-FPM 池在排队
  • 快速判断:用状态页和 slowlog 锁定卡点
  • 处理步骤:分临时止血和根因修复两条线
  • 回滚路径:参数调大后怎么安全退回来
  • 告警确认:看哪些指标才算恢复
  • 复盘项:把慢请求治理变成固定动作

触发信号:先确认是不是 PHP-FPM 池在排队

慢请求报警不一定等于 PHP 代码慢。Nginx 上游超时、数据库连接池拥塞、外部接口阻塞、PHP-FPM 子进程不够,都可能让同一个接口看起来“变慢”。值班时先看三个信号:

  • Nginx 访问日志中同一批接口的响应时间同时升高。
  • PHP-FPM 状态页里 listen queue 持续大于 0。
  • slowlog 里反复出现同一个入口脚本或同一段业务函数。

如果只有单个接口慢,优先看业务代码和 SQL。如果多个 PHP 接口同时变慢,而且 listen queue 持续增加,就要先把它当成 PHP-FPM 池容量问题处理,避免请求继续堆积。

PHP-FPM 慢请求报警从队列到 slowlog 的判断链路

快速判断:用状态页和 slowlog 锁定卡点

建议先确保 PHP-FPM 池开启状态页和 slowlog。下面是一段典型池配置,路径按自己的发行版调整:

; /etc/php-fpm.d/www.conf
pm.status_path = /fpm-status
request_slowlog_timeout = 3s
slowlog = /var/log/php-fpm/www-slow.log

Nginx 内部访问状态页时,可以只允许本机访问,避免把运行信息暴露到公网:

location = /fpm-status {
    allow 127.0.0.1;
    deny all;
    fastcgi_pass unix:/run/php-fpm/www.sock;
    include fastcgi_params;
    fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
}

报警发生后,先看状态页。重点不是某一次瞬时值,而是连续几次采样的趋势:

curl -s "http://127.0.0.1/fpm-status?full" | sed -n '1,80p'

# 重点观察
# active processes
# idle processes
# max children reached
# listen queue

判断规则可以这样定:

  • listen queue 持续增加:新请求正在等待空闲 PHP 子进程。
  • max children reached 增长:池上限已经打满。
  • active processes 接近 pm.max_children:当前池容量不足或部分请求卡住。
  • idle processes 很多但接口仍慢:优先排查 Nginx、网络或下游服务。

再看 slowlog,找出耗时请求停在什么位置:

sudo tail -n 120 /var/log/php-fpm/www-slow.log

你可能会看到类似记录:

[29-Jun-2026 18:08:21] [pool www] pid 28431
script_filename = /srv/app/public/index.php
[0x00007f7a] mysqli_query() /srv/app/src/OrderReport.php:42
[0x00007f82] buildDailyReport() /srv/app/src/ReportController.php:88
[0x00007f90] handleReport() /srv/app/public/index.php:19

这条记录说明,子进程没有闲着,而是卡在报表查询。此时继续盲目增加 pm.max_children 可能只是让更多慢查询同时压向数据库。正确动作是把“池容量”和“卡点函数”分开判断。

处理步骤:分临时止血和根因修复两条线

处理动作建议分成两条线:先恢复服务,再修根因。不要把所有动作混在一次改动里,否则事后很难判断是哪一步生效。

第一步:确认当前池参数和机器余量

php-fpm -tt 2>&1 | grep -E "pm\\.|slowlog|status_path"
free -m
top -o %MEM

如果机器内存还有余量,并且状态页显示 max children reached 增长,可以临时把池上限调高一档。粗略估算方式是:

可给 PHP-FPM 的内存 / 单个 PHP 子进程平均内存 = 可承载子进程数

例如预留 3GB 给 PHP-FPM,单个子进程平均 80MB,那么 pm.max_children 不应超过 38 左右。还要给系统、Nginx、数据库客户端和后台任务留出空间。

第二步:只做一个临时参数改动

pm = dynamic
pm.max_children = 38
pm.start_servers = 8
pm.min_spare_servers = 8
pm.max_spare_servers = 16

改完先做配置检查,再平滑重载:

sudo php-fpm -tt
sudo systemctl reload php-fpm
sudo systemctl status php-fpm --no-pager

这里不建议一次性修改很多参数。比如同时调整池上限、慢日志阈值、Nginx 超时和数据库连接数,短期看可能恢复,长期会让复盘失去依据。

第三步:根因修复要看 slowlog 热点

如果 slowlog 总是落在报表查询、远程 HTTP 调用或大文件处理,池参数只能止血。根因修复可以按下面顺序推进:

  • SQL 慢:补索引、缩小时间范围、拆分页或改成异步导出。
  • 外部服务慢:加超时、缓存兜底、失败降级。
  • 文件处理慢:改成后台任务,接口只返回任务编号。
  • 锁等待慢:缩小锁范围,避免长事务包住 PHP 业务流程。

PHP-FPM 慢请求处理步骤从状态页到参数重载和结果确认

回滚路径:参数调大后怎么安全退回来

临时调大池容量不是永久方案。它会增加内存占用,也可能放大下游数据库压力。每次临时改动都要准备回滚路径:

sudo cp /etc/php-fpm.d/www.conf /etc/php-fpm.d/www.conf.bak-20260629
sudo php-fpm -tt
sudo systemctl reload php-fpm

回滚时同样先检查再重载:

sudo cp /etc/php-fpm.d/www.conf.bak-20260629 /etc/php-fpm.d/www.conf
sudo php-fpm -tt
sudo systemctl reload php-fpm

如果回滚后 listen queue 立刻升高,说明业务根因还没有修好;如果回滚后指标稳定,说明临时参数只是应急动作,可以按原容量运行。

告警确认:看哪些指标才算恢复

不要只看“报警消失”。恢复确认至少要覆盖入口、池、日志和下游四层:

  • 入口层:接口 P95/P99 回到平时区间,5xx 没有继续增长。
  • PHP-FPM 层:listen queue 回到 0,idle processes 恢复稳定。
  • 慢日志层:slowlog 不再持续刷同一段业务函数。
  • 下游层:数据库 CPU、慢 SQL、连接数没有因扩池继续升高。

可以在重载后每 30 秒采样一次,连续观察 5 分钟:

for i in 1 2 3 4 5 6 7 8 9 10; do
  date "+%H:%M:%S"
  curl -s "http://127.0.0.1/fpm-status" | grep -E "active processes|idle processes|listen queue|max children"
  sleep 30
done

如果入口耗时恢复,但数据库指标明显变差,要立刻停止继续扩池,把重点切回慢 SQL 或后台任务拆分。

复盘项:把慢请求治理变成固定动作

一次慢请求报警结束后,建议沉淀下面几项,下一次值班会快很多:

  • 记录触发时间、影响接口、峰值 listen queue、峰值 max children reached
  • 保留 slowlog 中出现次数最多的脚本和函数。
  • 写清临时参数改动、重载时间、恢复时间和回滚时间。
  • 把根因修复拆成代码、SQL、任务拆分或容量规划任务。
  • 给状态页、slowlog 和数据库慢查询建立统一排查面板。

总结一下:PHP-FPM 慢请求报警的关键不是“把参数调大”,而是先判断池是否排队,再用 slowlog 找到请求卡点。池参数负责止血,代码和下游治理负责根因修复。把这些动作写成运行手册,线上排障就不会每次都从猜测开始。

版本声明
本文转载于:17golang原创 如有侵犯,请联系study_golang@163.com删除
MySQL 审计日志小项目:记录订单状态变更、查询和清理MySQL 审计日志小项目:记录订单状态变更、查询和清理
上一篇
MySQL 审计日志小项目:记录订单状态变更、查询和清理
接口列表页越查越慢怎么办:N+1 查询从 120 次降到 3 次
下一篇
接口列表页越查越慢怎么办:N+1 查询从 120 次降到 3 次
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ljg-skills -
    ljg-skills
    ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
    2903次使用
  • MELO音乐 - AI 音乐生成平台,支持多模态创作能力
    MELO音乐
    MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
    2691次使用
  • UniScribe - AI 免费在线音视频转文字平台
    UniScribe
    UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
    2624次使用
  • 剧云 - 免费 AI 智能中文剧本创作平台
    剧云
    剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
    2857次使用
  • 万象有声 - AI 一站式有声内容创作平台
    万象有声
    万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
    2797次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码