Python字典展平方法:递归flatten实现
2026-05-22 14:21:51
0浏览
收藏
本文深入解析了Python中真正有效的嵌套字典展平方法,指出常见误区如依赖json.dumps或简单循环无法处理list元素、类型混淆及键名拼接无规则等问题,并提供了一个健壮的递归flatten函数——它统一支持dict与list混合嵌套,自动生成带索引路径的唯一键名(如a.b.0.c),同时兼顾None、空值、重复键、datetime等真实场景中的边界情况;文章还延伸讲解了展平后不可逆的本质、CSV/Pandas导出技巧、数据库字段适配、键名清洗必要性及性能优化建议,帮你避开生产环境中的典型陷阱,实现安全、可控、可落地的数据结构扁平化。

为什么直接用 json.dumps 或循环遍历无法真正展平嵌套字典
很多人试过用 for 遍历字典再拼接键名,结果在遇到 list、None、嵌套 dict 混合结构时就崩了——比如 {"a": {"b": [1, {"c": 2}]}},单纯递归一层就停,或把整个 list 当作值原样塞进去,根本没“展开”数组里的对象。
关键在于:展平不是只处理 dict,还要对 list 中的每个元素做同样递归,并为每个路径生成唯一键名(如 a.b.0.c)。
- 不处理
list→ 数组内容被丢弃或整体保留,失去结构信息 - 不区分
None/int/str类型 → 可能误触发递归或报错 - 键名拼接不用分隔符或固定规则 → 后续无法反向解析,也不利于写入 CSV/数据库
用 flatten 函数实现带路径控制的递归展平
Python 标准库没有内置 flatten,但可以用几行递归搞定。核心逻辑是:遇到 dict 就展开键值对;遇到 list 就按索引展开每个元素;其余类型(str、int、bool、None)直接作为叶子值返回。
示例函数:
def flatten(d, parent_key='', sep='.'):
items = []
for k, v in d.items() if isinstance(d, dict) else enumerate(d) if isinstance(d, list) else []:
new_key = f"{parent_key}{sep}{k}" if parent_key else str(k)
if isinstance(v, (dict, list)) and v: # 非空才递归
items.extend(flatten(v, new_key, sep=sep).items())
else:
items.append((new_key, v))
return dict(items)
- 支持
dict和list混合嵌套,如{"x": [{"y": 1}, {"z": 2}]}→{"x.0.y": 1, "x.1.z": 2} parent_key初始为空,避免开头多出一个.- 用
isinstance(d, dict)和isinstance(d, list)显式判断,不依赖鸭子类型,防止对字符串、bytes等误展开
常见踩坑:空值、重复键、非标准数据类型怎么处理
真实数据里常有 None、datetime、自定义类实例,这些不会被默认递归,但可能让下游系统崩溃。
None:函数中已当作叶子值处理,但若需转成字符串"null",得在else分支加if v is None: v = "null"- 重复键名:比如
[{"id": 1}, {"id": 2}]展平后都是"0.id"和"1.id",没问题;但若原始结构是{"a": 1, "a": 2}(Python 字典本身不允许重复键),那就不是展平的问题,而是输入不合法 datetime、Decimal等:它们不属于(dict, list),会直接存入结果,但某些 JSON 序列化器不认——建议在展平后统一用json.dumps(..., default=str)处理- 无限嵌套(如自引用字典):当前函数无保护,会栈溢出;加个深度计数参数或用
id(v)缓存已访问对象可规避
展平后如何安全还原或导出到 Pandas / CSV
展平本质是单向变换,不可逆——除非你额外保存路径元信息。所以别指望靠键名自动还原原始结构。
- 导出 CSV:直接用
pandas.DataFrame([flattened_dict])即可,每行一个展平后的记录,缺失键自动补NaN - 写入数据库:键名可作字段名,但注意长度限制(如 MySQL 列名最大 64 字符),建议用
sep='_'替代'.'避免特殊字符问题 - 调试查看:用
pprint.pprint(dict(sorted(flatten(d).items())))按字母序排列,方便定位字段 - 性能提示:对超大嵌套结构(>10 层、>10000 个键),递归可能慢;可用迭代+栈模拟替代,但代码复杂度上升,一般场景没必要
最易被忽略的是:展平后键名长度和字符集。比如 API 返回的字段含空格或中文,flatten(d, sep='.') 会产生 "用户信息.手机号" 这种键——多数数据库和配置系统不支持,得提前清洗键名,而不是等导出时报错。
以上就是《Python字典展平方法:递归flatten实现》的详细内容,更多关于的资料请关注golang学习网公众号!
淘宝关闭猜你喜欢广告方法
- 上一篇
- 淘宝关闭猜你喜欢广告方法
- 下一篇
- Go 中使用 go-redis 执行 Lua 实现原子操作
查看更多
最新文章
-
- 文章 · python教程 | 12分钟前 |
- Python安装库临时文件占满磁盘怎么解决
- 197浏览 收藏
-
- 文章 · python教程 | 21分钟前 |
- TensorFlow权重初始化技巧:设置kernel_initializer方法
- 461浏览 收藏
-
- 文章 · python教程 | 39分钟前 |
- Python密码安全存储:hash与salt实战指南
- 398浏览 收藏
-
- 文章 · python教程 | 46分钟前 |
- Python处理PDF方法,PyPDF2实用教程
- 176浏览 收藏
-
- 文章 · python教程 | 50分钟前 |
- Python字典展平方法:递归flatten实现
- 108浏览 收藏
-
- 文章 · python教程 | 1小时前 |
- Python NumPy求和误差原因详解
- 146浏览 收藏
-
- 文章 · python教程 | 2小时前 |
- Python在PyCharm中配置Poetry环境指南
- 195浏览 收藏
-
- 文章 · python教程 | 2小时前 |
- Python zip与tar文件压缩处理指南
- 408浏览 收藏
-
- 文章 · python教程 | 2小时前 |
- Python静态方法、类方法与实例方法详解
- 262浏览 收藏
-
- 文章 · python教程 | 2小时前 |
- Python位运算应用与实战解析
- 408浏览 收藏
-
- 文章 · python教程 | 3小时前 |
- 解决Python安装grpcio慢的方法:配置二进制源加速
- 109浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
查看更多
AI推荐
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 4748次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 5101次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 4979次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 6937次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 5339次使用
查看更多
相关文章
-
- Flask框架安装技巧:让你的开发更高效
- 2024-01-03 501浏览
-
- Django框架中的并发处理技巧
- 2024-01-22 501浏览
-
- 提升Python包下载速度的方法——正确配置pip的国内源
- 2024-01-17 501浏览
-
- Python与C++:哪个编程语言更适合初学者?
- 2024-03-25 501浏览
-
- 品牌建设技巧
- 2024-04-06 501浏览

