当前位置:首页 > 文章列表 > 文章 > python教程 > Python用apply给DataFrame整列应用函数

Python用apply给DataFrame整列应用函数

2026-05-25 18:49:13 0浏览 收藏
本文深入解析了在Pandas中对DataFrame整列应用自定义函数的正确方法与常见误区,明确指出`df[col_name].apply(func)`是最安全、直观且高效的单列处理方式,而误用`df.apply(func, axis=1)`会导致函数接收行而非列、引发属性错误或结果错乱;即使使用`df.apply()`,也必须确保`axis=0`(默认)并使函数能处理Series输入,同时强调向量化操作(如`.str`、`.dt`)在性能和简洁性上远超`.apply()`,真正需要`.apply()`的场景应限于逻辑复杂、难以向量化的业务规则。

Python怎么对DataFrame的整列应用自定义函数_使用apply并配置axis参数

直接说结论:对 DataFrame 整列应用自定义函数,用 df[col_name].apply(func) 最安全、最直观;非要用 df.apply() 就必须设 axis=0(默认值),且函数必须能处理 Series —— 但很多人误设 axis=1 导致出错或结果错乱。

为什么 df.apply(func, axis=1) 不是“对列操作”

axis=1 表示按行遍历,即把每一行(Series)传给你的函数。这时函数收到的是横向切片(比如 pd.Series({'A': 1, 'B': 2, 'C': 3})),不是你想要的“整列”。常见错误现象包括:

  • 函数报错 AttributeError: 'Series' object has no attribute 'lower'(试图对行调用字符串方法)
  • 返回结果形状变成 (n_rows,),但被错误地广播成新列(值全一样)
  • 原意是清洗 'name' 列,结果却把所有列拼成字符串再处理

df[col].apply() 是最推荐的写法

明确指定列名,语义清晰,性能好,且不依赖 axis 理解是否准确。适用于绝大多数单列转换场景:

  • 字符串处理:df['email'].apply(lambda x: x.strip().lower() if pd.notna(x) else x)
  • 数值分箱:df['age'].apply(lambda x: 'adult' if x >= 18 else 'minor')
  • 调用外部函数:df['timestamp'].apply(parse_datetime)(只要 parse_datetime 接收单个值)

注意:如果函数本身要求接收 Series(比如用到了 .str.contains().dt.year),那就别用 .apply(),直接链式调用更高效:df['date'].dt.yeardf['text'].str.upper()

非要用 df.apply() 处理多列时,axis=0 才是对列

df.apply(func, axis=0)axis=0 是默认值,可省略)会把每一列作为 Series 传入函数。此时函数签名必须是 def func(series: pd.Series) -> any

def normalize_col(s):
    return (s - s.mean()) / s.std() if s.dtype in ['float64', 'int64'] else s
<h1>正确:对数值列做标准化,其他列保持原样</h1><p>df.apply(normalize_col)</p>

容易踩的坑:

  • 误写 df.apply(lambda x: x.str.lower(), axis=0) —— xSeries,但 .str 只对 Series[str] 有效,若某列是 int 就报错
  • 返回值长度和输入列不一致(比如函数里用了 return s.iloc[:2]),会导致结果列变短或对齐失败
  • 混合类型列(如含 None 和字符串)调用 .lower() 前没判空,触发 AttributeError

性能与可读性提醒

df[col].apply()df.apply(..., axis=0) 快,因为跳过了列间类型检查和对齐逻辑;而向量化方法(.str.dtnp.where)又比 .apply() 快 10–100 倍。真正需要 .apply() 的,通常是逻辑复杂、无法向量化的业务规则。另外,axis 参数只在 df.apply() 中生效,Series.apply() 没有这个参数——这点很容易被文档带偏。

以上就是《Python用apply给DataFrame整列应用函数》的详细内容,更多关于的资料请关注golang学习网公众号!

HTML画布编辑区域怎么实现?低代码画布编辑器避坑指南HTML画布编辑区域怎么实现?低代码画布编辑器避坑指南
上一篇
HTML画布编辑区域怎么实现?低代码画布编辑器避坑指南
WorkBuddy AI毛利怎么算?教程详解
下一篇
WorkBuddy AI毛利怎么算?教程详解
查看更多
最新文章
资料下载
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    5206次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    5572次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    5445次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    7379次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    5839次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码