Java实现KD树M近邻搜索详解
IT行业相对于一般传统行业,发展更新速度更快,一旦停止了学习,很快就会被行业所淘汰。所以我们需要踏踏实实的不断学习,精进自己的技术,尤其是初学者。今天golang学习网给大家整理了《Java 中 KD 树实现 M 近邻搜索详解》,聊聊,我们一起来看看吧!

本文详解如何在不依赖第三方库的前提下,基于自定义 KD 树结构,用 Java 实现 `float[][] findMNearest(float[] point, int m)` 方法,支持返回距离查询点最近的 m 个样本坐标,涵盖剪枝策略、最大堆优化与递归回溯逻辑。
在单近邻(1-NN)搜索中,我们维护一个全局最优节点 best 和最小距离 bestDistance,通过轴对齐分割与超矩形剪枝高效遍历。但扩展到 M 近邻(M-NN) 时,核心挑战在于:
✅ 不再只需跟踪“当前最近”,而需动态维护 候选集 Top-M;
✅ 剪枝条件必须升级——不能仅比较单点距离,而需判断「当前子树是否可能包含比当前第 M 近点更近的点」;
✅ 需避免重复访问或遗漏,尤其在回溯时需重新评估另一侧子树。
✅ 解决方案:最大堆 + 递归回溯(推荐)
使用 PriorityQueue 构建固定容量的最大堆(按欧氏距离平方排序),始终保留距离最小的 m 个点。堆顶即当前第 m 近的距离上限 maxHeapTopDistSq,用于关键剪枝:
import java.util.*;
public class KDTree {
private static class KDNode {
final float[] coords;
KDNode left, right;
int axis; // splitting axis (0, 1, ..., k-1)
KDNode(float[] coords, int axis) {
this.coords = coords.clone();
this.axis = axis;
}
float distanceSq(KDNode other) {
float sum = 0f;
for (int i = 0; i < coords.length; i++) {
float d = coords[i] - other.coords[i];
sum += d * d;
}
return sum;
}
float getCoordinate(int dim) { return coords[dim]; }
}
private KDNode root;
private final int k; // dimensionality
public KDTree(int k) { this.k = k; }
// Main M-NN method
public float[][] findMNearest(float[] point, int m) {
if (point == null || m <= 0 || root == null)
return new float[0][0];
// Max-heap: store [distance^2, coordinates] → sort by distance^2 descending
PriorityQueue maxHeap = new PriorityQueue<>((a, b) ->
Float.compare(b[0], a[0]) // descending order
);
// Recursive search with pruning
searchMNN(root, new KDNode(point, 0), 0, maxHeap, m);
// Extract top m points (heap may contain < m if tree size < m)
float[][] result = new float[maxHeap.size()][k];
int i = 0;
while (!maxHeap.isEmpty()) {
float[] entry = maxHeap.poll();
System.arraycopy(entry, 1, result[i++], 0, k); // skip dist at index 0
}
return result;
}
private void searchMNN(KDNode node, KDNode target, int depth,
PriorityQueue heap, int m) {
if (node == null) return;
int axis = depth % k;
float distSq = node.distanceSq(target);
float[] coords = node.coords;
// Insert current node if heap not full, or replace worst if closer
if (heap.size() < m) {
float[] entry = new float[k + 1];
entry[0] = distSq;
System.arraycopy(coords, 0, entry, 1, k);
heap.offer(entry);
} else if (distSq < heap.peek()[0]) {
heap.poll(); // remove worst
float[] entry = new float[k + 1];
entry[0] = distSq;
System.arraycopy(coords, 0, entry, 1, k);
heap.offer(entry);
}
// Determine which child is closer & visit first (better pruning chance)
boolean goLeftFirst = (target.getCoordinate(axis) < node.getCoordinate(axis));
KDNode nearChild = goLeftFirst ? node.left : node.right;
KDNode farChild = goLeftFirst ? node.right : node.left;
// Visit near subtree first
searchMNN(nearChild, target, depth + 1, heap, m);
// Pruning: check if far subtree can contain better candidates
float diff = target.getCoordinate(axis) - node.getCoordinate(axis);
float diffSq = diff * diff;
// If heap is not full, we MUST check far side (no pruning)
// If heap is full, only explore far side if diffSq < heap's max distance^2
if (heap.size() == m && diffSq < heap.peek()[0]) {
searchMNN(farChild, target, depth + 1, heap, m);
}
}
} ⚠️ 关键注意事项
- 距离平方代替开方:全程使用 distanceSq 避免 Math.sqrt() 的性能开销,排序与剪枝逻辑完全等价;
- 堆容量控制:PriorityQueue 必须限制为最多 m 个元素,否则内存与时间复杂度失控;
- 剪枝条件严格性:diffSq < heap.peek()[0] 是核心剪枝依据——它表示:当前分割超平面到查询点的距离平方,小于当前第 m 近点的距离平方,意味着远侧子树中仍可能存在更近点;
- 空堆处理:若整棵树节点数 < m,最终结果自然少于 m 行,符合语义(无需补零或抛异常);
- 线程安全:该实现非线程安全;如需并发调用,请为每次查询新建独立堆实例。
✅ 性能与验证建议
- 时间复杂度:平均 O(log N + m log m)(N 为节点数),最坏 O(N);
- 推荐单元测试覆盖:m=1(应与原 nearest 方法一致)、m=3、m > 树大小、边界点(如根节点本身);
- 可视化调试:打印 visited 计数器对比 1-NN 与 M-NN 的访问节点数,验证剪枝有效性。
通过将单近邻的“全局最优”升级为“动态 Top-M 堆”,并强化剪枝阈值为堆顶距离,你就能在保持 KD 树经典结构的同时,稳健支撑多近邻检索需求——这正是工业级空间索引(如 Elasticsearch 向量搜索、FAISS 子模块)的核心思想之一。
到这里,我们也就讲完了《Java实现KD树M近邻搜索详解》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!
PPT如何用相交裁剪图片形状
- 上一篇
- PPT如何用相交裁剪图片形状
- 下一篇
- 块级元素居中:marginautovsflex对比
-
- 文章 · java教程 | 5天前 | 性能优化 · Java教程 · CompletableFuture · 接口聚合 · java completablefuture orTimeout completeOnTimeout 接口性能 P95
- Java CompletableFuture 聚合接口优化:用超时兜底把 P95 从 920ms 降到 330ms
- 255浏览 收藏
-
- 文章 · java教程 | 6天前 | Spring Boot · Java教程 · 接口设计 · Webhook · 幂等设计 · java spring boot WebHook 回调接口 幂等 状态流转 验签
- Java Webhook 回调接收接口设计:验签、幂等和状态流转
- 488浏览 收藏
-
- 文章 · java教程 | 1星期前 | Java教程 · TTL缓存 · ConcurrentHashMap · 小项目 · java 本地缓存 concurrenthashmap TTL缓存 过期淘汰
- Java 本地 TTL 缓存小项目:用 ConcurrentHashMap 实现过期淘汰和命中统计
- 394浏览 收藏
-
- 文章 · java教程 | 1星期前 | Java · Stream · 数据处理 · 后端教程 · Java Stream bigdecimal 分组统计 Collectors 订单汇总
- Java Stream 分组统计实验:从订单列表到客户消费汇总
- 355浏览 收藏
-
- 文章 · java教程 | 1星期前 | Java · Spring Boot · 后端开发 · 接口校验 · java spring boot dto 接口设计 参数校验
- Spring Boot 参数校验工作流:DTO、注解和统一错误响应
- 495浏览 收藏
-
- 文章 · java教程 | 2星期前 | map · 并发安全 · 缓存设计 · Java教程 · java optional concurrenthashmap computeIfAbsent Map缓存
- Java computeIfAbsent 缓存初始化实战:少写判断、避开空值和并发坑
- 236浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- ljg-skills
- ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
- 3984次使用
-
- MELO音乐
- MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
- 3698次使用
-
- UniScribe
- UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
- 3672次使用
-
- 剧云
- 剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
- 3867次使用
-
- 万象有声
- 万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
- 3829次使用
-
- 矩阵主副对角线快速定位技巧
- 2026-05-31 501浏览
-
- Java多态优化流程代码与行为分发改进
- 2026-05-26 501浏览
-
- JVM 类元数据双亲委派链表深度解析
- 2026-05-21 501浏览
-
- 反射异常处理:InvocationTargetException解析与应用
- 2026-05-16 501浏览
-
- 怎么通过 HTML 的 accesskey 属性为网页中的按钮或链接设置键盘快捷键
- 2026-05-04 501浏览

