副标题#e#
1.二叉搜索树介绍
前面我们已经介绍过了向量和链表。有序向量可以以二分查找的方式高效的查找特定元素,而缺点是插入删除的效率较低(需要整体移动内部元素);链表的优点在于插入,删除元素时效率较高,但由于不支持随机访问,特定元素的查找效率为线性复杂度O(n),效率较低。
向量和链表的优缺点是互补的,那么有没有办法兼具两者的优点呢?这便引出了接下来需要介绍的数据结构——二叉搜索树(Binary Search Tree)。
二叉搜索树和链表类似,同样是以节点为单位存储数据的链式数据结构。二叉搜索树作为一种树形数据结构,内部维护着一个根节点,在插入新数据时,会不断的和当前子树的根节点进行key值的大小比较,较小的key值落在左子树,较大的key值落在右子树,使得二叉搜索树从左到右维持一个有序的状态。
形式化的定义:
二叉搜索树的左子树上结点的值均小于根结点的值;右子树上结点的值均大于根结点的值;二叉搜索树的左、右子树也分别为二叉搜索树。
由于二叉搜索树中的数据是有序存储的,可以使用高效的二分查找查询特定元素;同时由于内部存储结构为链式节点,在插入、删除元素时的效率和链表类似,也十分高效。
可以说,二叉搜索树兼具了向量和链表的优点。

2.二叉搜索树ADT接口
二叉搜索树同样是一个存储key/value类型数据结构,因此和哈希表实现共用同一个接口(Map)。K/V数据结构需要暴露出内部节点的Key,value给用户灵活的访问,但哈希表和二叉搜索树的内部节点实现有一定的差异,所以在Map接口中暴露了Map.EntryNode接口,由哈希表和二叉搜索树的内部节点分别实现Map.EntryNode接口。
public interface Map <K,V>{
/**
* 存入键值对
* @param key key值
* value value
* @return 被覆盖的的value值
*/
V put(K key,V value);
* 移除键值对
* 被删除的value的值
V remove(K key);
* 获取key对应的value值
* 对应的value值
V get(K key);
* 是否包含当前key值
* true:包含 false:不包含
*/
boolean containsKey(K key);
* 是否包含当前value值
* value value值
* true:包含 false:不包含
containsValue(V value);
* 获得当前map存储的键值对数量
* 键值对数量
* int size();
* 当前map是否为空
* true:为空 false:不为空
isEmpty();
* 清空当前map
void clear();
* 获得迭代器
* 迭代器对象
Iterator<EntryNode<K,V>> iterator();
* entry 键值对节点接口
* interface EntryNode<K,1)">{
* 获得key值
*
K getKey();
* 获得value值
*
V getValue();
* 设置value值
* */
setValue(V value);
}
}
3.二叉搜索树实现细节
3.1?二叉搜索树基本属性
值得一提的是,二叉搜索树通过给存储的元素进行排序来加快查询的速度(遍历查询 ---> 二分查询)。
java是面向对象的语言,二叉搜索树中的元素不仅仅是整数、小数。如果说对于整数、小数甚至字符串的排序,我们确定了一个公认的排序逻辑。但是用户自定义的对象,例如小猫、小狗对象的排序可就仁者见仁智者见智了。
由于java并不支持比较符号">","<"的运算符重载,因此我们提供了一个比较排序的接口,用户可以在二叉搜索树初始化时指定排序时元素间比较的逻辑,使得二叉搜索树能以满足用户需求的方式执行排序的逻辑。
比较器接口(Comparator)定义:
@FunctionalInterface
interface Comparator<T> {
* 比较方法逻辑
* o1 参数1
* o2 参数2
* 返回值大于0 ---> (o1 > o2)
* 返回值等于0 ---> (o1 = o2)
* 返回值小于0 ---> (o1 < o2)
compare(T o1,T o2);
}
基本属性:
class TreeMap<K,V> implements Map<K,1)">{
* 根节点
* private EntryNode<K,1)"> root;
* 比较器(初始化之后,不能改)
* private final Comparator<? super K> comparator;
* 当前二叉树的大小
* size;
* 默认构造函数
* public TreeMap() {
this.comparator = null;
}
* 指定了比较器的构造函数
* public TreeMap(Comparator<? comparator) {
this.comparator = comparator;
}
}
3.2?二叉搜索树内部节点
二叉搜索树的内部节点除了必须的key,value字段,同时还维护了左、右孩子节点和双亲节点的引用。
通过实现暴露出去的Map.EntryNode接口,允许用户访问内部节点的key、value值,但二叉搜索树节点内部的孩子、双亲节点的引用是被封装起来的,外部用户是无法感知,也无需了解的。
* 二叉搜索树 内部节点
* static class EntryNode<K,1)">implements Map.EntryNode<K,1)">
* key值
*
K key;
* value值
*
V value;
* 左孩子节点
*
EntryNode<K,1)"> left;
* 右孩子节点
* right;
* 双亲节点
* parent;
EntryNode(K key,V value) {
this.key = key;
this.value = value;
}
EntryNode(K key,V value,EntryNode<K,1)"> parent) {
value;
this.parent = parent;
}
@Override
K getKey() {
return key;
}
@Override
V getValue() {
value;
}
@Override
setValue(V value) {
String toString() {
return key + "=" + value;
}
}
3.3?二叉搜索树 内部辅助函数
为了简化代码逻辑以及去除重复代码,在实现过程中提取出了诸如:获取第一个节点(getFirst)、获取节点直接后继(getSuccessor)、获得key值对应目标节点(getTargetEntryNode)等等辅助方法。
getTargetEntryNode用于获取key值对应的目标节点,运用了哨兵的思想。从根节点开始,使用二分查找的方式逐步逼近key值对应目标节点的位置。
如果目标节点确实存在,自然直接返回目标节点的引用(相对位置:RelativePosition.CURRENT);
#p#分页标题#e#
当目标节点不存在时,则假设目标节点已经存在(哨兵节点),返回哨兵节点的双亲节点引用以及哨兵节点的相对位置(左、右节点:RelativePosition.LEFT、RelativePosition.Right)。
#p#副标题#e#

* target 和目标节点的相对位置
* enum RelativePosition {
* 左节点
*
LEFT,
* 右节点
*
RIGHT,1)">
* 当前节点
*
CURRENT;
}
* 查找目标节点 返回值
* class TargetEntryNode<K,1)">
* 目标节点
* target;
* 目标节点的双亲节点
* parent;
* 相对位置
* private RelativePosition relativePosition;
TargetEntryNode(EntryNode<K,V> target,EntryNode<K,1)"> parent,RelativePosition relativePosition) {
this.target = target;
parent;
this.relativePosition = relativePosition;
}
}
* 获得key对应的目标节点
* key 对应的key
* 对应的目标节点
* 返回null代表 目标节点不存在
* private TargetEntryNode<K,1)"> getTargetEntryNode(K key){
int compareResult = 0;
EntryNode<K,V> parent = this.root;
while(currentNode != ){
parent = currentNode;
//:::当前key 和 currentNode.key进行比较
compareResult = compare(key,currentNode.key);
if(compareResult > 0){
:::当前key 大于currentNode 指向右边节点
currentNode = currentNode.right;
}else if(compareResult < 0:::当前key 小于currentNode 指向右边节点
currentNode = currentNode.left;
}else{
return new TargetEntryNode<>(currentNode,parent,RelativePosition.CURRENT);
}
}
:::没有找到目标节点
){
:::返回 右孩子 哨兵节点
new TargetEntryNode<>(,RelativePosition.RIGHT);
}:::返回 左孩子 哨兵节点
{
throw new RuntimeException("状态异常");
}
}
* key值进行比较
*
@SuppressWarnings("unchecked")
compare(K k1,K k2){
:::迭代器不存在
if(this.comparator == :::依赖对象本身的 Comparable,可能会转型失败
((Comparable) k1).compareTo(k2);
}:::通过迭代器逻辑进行比较
.comparator.compare(k1,k2);
}
}
* 判断双亲节点和目标节点 相对位置
* parent 双亲节点
* target 目标节点
* 相对位置(左孩子/右孩子)
private RelativePosition getRelativeByParent(EntryNode<K,V> parent,1)"> target){
if(parent.left == target){
RelativePosition.LEFT;
}if(parent.right == RelativePosition.RIGHT;
}new RuntimeException("不是父子节点关系"
* 获得当前节点的直接后继
* targetEntryNode 当前节点
* 当前节点的直接后继
targetEntryNode){
if(targetEntryNode == :::当前节点为null,则后继也为null
;
}
:::判断当前节点是否存在右孩子
if(targetEntryNode.right != :::存在右孩子,右子树的最左节点为直接后继
EntryNode<K,V> rightChildSuccessor = targetEntryNode.right;
:::循环往复,直至直接右孩子的最左节点
while(rightChildSuccessor.left != ){
rightChildSuccessor = rightChildSuccessor.left;
}
rightChildSuccessor;
}:::不存在右孩子,寻找第一个靠右的双亲节点
EntryNode<K,V> parent = targetEntryNode.parent;
EntryNode<K,V> child = targetEntryNode;
:::判断当前孩子节点是否是双亲节点的左孩子
while(parent != null && parent.right == child){
:::不是左孩子,而是右孩子,继续向上寻找
child = parent;
parent = parent.parent;
}
parent;
}
}
* 获得二叉搜索树的第一个节点
* getFirstNode(){
this.root == :::空树,返回null
;
}
EntryNode<K,V> entryNode = .root;
:::循环往复,寻找整棵树的最左节点(最小节点、第一个节点)
while(entryNode.left != ){
entryNode = entryNode.left;
}
entryNode;
}
3.4?二叉搜索树插入接口实现
二叉搜索树的插入接口复用了前面提到的getTargetEntryNode方法,以二分查找的方式进行查询。
当key值对应的目标节点存在时,替换掉之前的value。
#p#副标题#e##p#分页标题#e#
当key值对应的目标节点不存在时,运用哨兵的思想,通过双亲节点和哨兵节点的相对位置,在目标位置插入一个新的节点。
@Override
V put(K key,V value) {
this.root = new EntryNode<>(key,value);
this.size++;
:::获得目标节点
TargetEntryNode<K,V> targetEntryNode = getTargetEntryNode(key);
if(targetEntryNode.relativePosition == RelativePosition.CURRENT){
:::目标节点存在于当前容器
:::暂存之前的value
V oldValue = targetEntryNode.target.value;
:::替换为新的value
targetEntryNode.target.value =:::返回之前的value
oldValue;
}:::目标节点不存在于当前容器
EntryNode<K,1)"> targetEntryNode.parent;
RelativePosition.LEFT){
:::目标节点位于左边
parent.left = :::目标节点位于右边
parent.right = ;
}
}
3.5 二叉搜索树删除接口实现
二叉搜索树节点在被删除时,被删除节点存在三种情况:
1.不存在任何孩子节点(既没有左孩子,也没有右孩子)
直接将双亲节点和当前节点的连接切断(双亲对应孩子节点引用置为null)。
2.只存在一个孩子节点(只存在左孩子或者只存在右孩子)
被删除节点唯一的孩子节点代替被删除节点本身,唯一的孩子节点和双亲节点直接相连。
3.既有左孩子节点,又有右孩子节点
找到被删除节点的直接后继节点(直接前驱节点也行,本质上是保证删除之后依然保证有序性),将被删除节点和其直接后继交换位置。
当右孩子节点存在时,直接后继节点必定存在于右子树中,并且其直接后继一定不存在左孩子节点(否则就不是直接后继节点了),因此被删除节点的直接后继节点至多只存在一个右孩子节点(或没有任何孩子节点)。在两者交换位置后,可以转换为第一或第二种情况进行处理。
节点删除前:

1.无孩子节点的删除:
?

2. 只有一个孩子节点的删除:

3. 拥有两个孩子的节点的删除:

二叉搜索树节点删除代码实现:
V remove(K key) {
:::查询目标节点
TargetEntryNode<K,1)">if(targetEntryNode.relativePosition !=:::没有找到目标节点
;
}:::找到了目标节点
:::从二叉树中删除目标节点
deleteEntryNode(targetEntryNode.target);
targetEntryNode.target.value;
}
}
* 将目标节点从二叉搜索树中删除
* target 需要被删除的节点
* void deleteEntryNode(EntryNode<K,1)">/*
* 删除二叉搜索树节点
* 1.无左右孩子
* 直接删除
* 2.只有左孩子或者右孩子
* 将唯一的孩子和parent节点直接相连
* 3.既有左孩子,又有右孩子
* 找到自己的直接前驱/后继(左侧的最右节点/右侧的最左节点)
* 将自己和直接后继进行交换,转换为第1或第2种情况,并将自己删除
* */
:::size自减1
this.size--;
:::既有左孩子,又有右孩子
if(target.left != null && target.right != :::找到直接后继(右侧的最左节点)
EntryNode<K,V> targetSuccessor = getSuccessor(target);
:::target的key/value和自己的后继交换
target.key = targetSuccessor.key;
target.value = targetSuccessor.value;
:::target指向自己的后继,转换为第一/第二种情况
target = targetSuccessor;
}
EntryNode<K,1)"> target.parent;
:::获得代替被删除节点原先位置的节点(从左右孩子中选择一个)
EntryNode<K,V> replacement = (target.left != null ? target.left : target.right);
if(replacement == :::无左右孩子
:::被删除的target是根节点,且无左右孩子
if(parent == :::全树置空
;
}{
RelativePosition relativePosition = getRelativeByParent(parent,target);
:::直接删除,断开和双亲节点的联系
if(relativePosition == RelativePosition.LEFT){
parent.left = ;
}{
parent.right = ;
}
target.parent = ;
}
}:::只有左孩子或者右孩子
:::被删除的target是根节点,且只有左孩子或者右孩子
if(target.parent == :::将存在的子树孩子节点,设置为根节点
this.root = replacement;
}{
replacement.parent = target.parent;
RelativePosition relativePosition =:::被删除节点的双亲节点指向被代替的节点
RelativePosition.LEFT){
parent.left = replacement;
}{
parent.right = replacement;
}
}
}
}
3.6?二叉搜索树查询接口实现
二叉搜索树的查询接口使用了getTargetEntryNode方法。
#p#副标题#e##p#分页标题#e#
当返回的相对位置为Current时,代表找到了目标节点,直接返回value;反之代表目标节点不存在,返回null。
V get(K key) {
targetEntryNode.target.value;
}
}
3.7?二叉搜索树其它接口实现
containsKey(K key) {
return (get(key) != );
}
@Override
containsValue(V value) {
:::寻找到第一个节点
EntryNode<K,V> entryNode = getFirstNode();
:::从第一个节点开始,遍历整颗二叉搜索树
while(entryNode != if(Objects.equals(entryNode.value,value)){
:::当前节点value匹配,返回true
true:::指向下一个直接后继节点
entryNode = getSuccessor(entryNode);
}
}
:::遍历整颗树之后,还未匹配,返回false
false;
}
@Override
size() {
.size;
}
@Override
isEmpty() {
return (this.size == 0 clear() {
this.size = 0;
String toString(){
Iterator<Map.EntryNode<K,V>> iterator = .iterator();
:::空容器
if(!iterator.hasNext()){
return "[]":::容器起始使用"["
StringBuilder s = new StringBuilder("[");
:::反复迭代
while(:::获得迭代的当前元素
Map.EntryNode<K,V> data = iterator.next();
:::判断当前元素是否是最后一个元素
iterator.hasNext()){
:::是最后一个元素,用"]"收尾
s.append(data).append("]");
:::返回 拼接完毕的字符串
s.toString();
}:::不是最后一个元素
:::使用","分割,拼接到后面
s.append(data).append(",");
}
}
}
@Override
public Iterator<Map.EntryNode<K,1)"> iterator() {
new Itr();
}
4.二叉搜索树迭代器
1. 二叉搜索树从最左节点开始,以中序遍历的方式遍历整颗树
2. 在迭代器初始化时,迭代器指向最小的节点(也就是最左节点)
3. 迭代器迭代时,下一个节点总是指向当前节点的直接后继
* 二叉搜索树 迭代器实现
* class Itr implements Iterator<Map.EntryNode<K,1)">
* 当前迭代节点
* currentNode;
* 下一个节点
* nextNode;
Itr() {
:::初始化时,nextNode指向第一个节点
this.nextNode = TreeMap..getFirstNode();
}
@Override
hasNext() {
this.nextNode != );
}
@Override
public Map.EntryNode<K,1)"> next() {
this.currentNode = .nextNode;
this.getSuccessor(.nextNode);
.currentNode;
}
@Override
remove() {
this.currentNode == new IteratorStateErrorException("迭代器状态异常: 可能在一次迭代中进行了多次remove操作");
}
:::判断当前被删除的节点是否同时存在左右孩子
this.currentNode.left != null && this.currentNode.right !=
同时存在左右孩子的节点删除时当前节点会和直接后继(nextNode)进行交换
因此nextNode指向当前节点
*/
this.nextNode = .currentNode;
}
:::删除当前节点
TreeMap.this.deleteEntryNode(.currentNode);
:::currentNode设置为null,防止反复调用remove方法
;
}
}
5.二叉搜索树性能
5.1 空间效率
二叉搜索树的内部节点除了key,value的引用,同时还维护着双亲,左右孩子节点的引用(不一定存在),因此其空间效率比链表稍差,更是不如向量结构紧凑。但是这一点点空间效率的损失,带来的是二叉搜索树全面而优异的增删改查效率。
5.2 时间效率
二叉搜索树的插入,删除依赖于查询接口,而查询接口是以二分查找的方式实现的。在理想状态下(平衡的),二叉搜索树的增删改查接口的效率为(O(logN)),N为当前二叉搜索树存储的元素总数;也可以说,二叉搜索树增删改查接口的效率正比于二叉搜索树的高度。
6.二叉搜索树总结
6.1 当前版本缺陷:
至此,我们实现了一个最基础的二叉搜索树,但还存在一个致命缺陷:
二叉搜索树在插入数据时,以二分查找的方式确定插入的位置。但是当插入数据的数据不够随机时,会降低二叉搜索树的查询效率。举个极端例子,当按照顺序插入1到10000的元素以从小到大顺序插入,二叉搜索树将退化为一个一维的链表(极端不平衡),查询效率从O(logN)急剧降低为O(n)。
#p#分页标题#e#
我们希望在插入,删除元素时,通过及时的调整二叉搜索树结构,用一系列等价变换的操作,使二叉搜索树始终保持一个适度平衡的状态。我们称这样的二叉搜索树为平衡二叉搜索树(Balanced?Binary?Search?Tree),常见的平衡二叉搜索树有AVL树、红黑树等。
只有平衡二叉搜索树才能始终保证始终高效的查询效率(O(logN)),而不会因为极端数据集合的插入,造成效率的大幅降低。
6.2 完整代码
#p#副标题#e#
二叉搜索树ADT接口:


1 /**
2 * Map ADT接口
3 */
4 {
5 6 * 存入键值对
7 * key key值
8 value value
9 被覆盖的的value值
10 11 V put(K key,V value);
12
13 14 * 移除键值对
15 16 被删除的value的值
17 18 V remove(K key);
19
20 21 * 获取key对应的value值
22 23 对应的value值
24 25 V get(K key);
26
27 28 * 是否包含当前key值
29 30 true:包含 false:不包含
31 32 containsKey(K key);
33
34 35 * 是否包含当前value值
36 value value值
37 true:包含 false:不包含
38 39 containsValue(V value);
40
41 42 * 获得当前map存储的键值对数量
43 键值对数量
44 * 45 size();
46
47 48 * 当前map是否为空
49 true:为空 false:不为空
50 51 isEmpty();
52
53 54 * 清空当前map
55 56 clear();
57
58 59 * 获得迭代器
60 迭代器对象
61 62 Iterator<EntryNode<K,1)"> iterator();
63
64 65 * entry 键值对节点接口
66 67 68 69 * 获得key值
70 * 71 K getKey();
72
73 74 * 获得value值
75 76 V getValue();
77
78 79 * 设置value值
80 81 setValue(V value);
82 }
83 }
View Code
二叉搜索树实现:


* 二叉搜索树实现
comparator;
}
CURRENT;
}
K key;
V value;
value;
}
}
同时存在左右孩子的节点删除时会和直接后继(nextNode)进行交换
因此nextNode指向当前节点
;
}
}
relativePosition;
}
}
@Override
;
}
}
@Override
deleteEntryNode(targetEntryNode.target);
targetEntryNode.target.value;
}
}
@Override
Itr();
}
@Override
);
}
}
}
target.parent;
RelativePosition relativePosition = target.left : target.right);
RelativePosition.LEFT){
parent.left = {
parent.right = ;
}
target.parent = :::只有左孩子或者右孩子
replacement.parent = target.parent;
:::被删除节点的双亲节点指向被代替的节点
RelativePosition.LEFT){
parent.left ={
parent.right = replacement;
}
}
}
:::不是左孩子,是右孩子,继续向上寻找
child = parent;
}
}
;
}
EntryNode<K,1)"> entryNode.left;
}
entryNode;
}
}
View Code
我们已经实现了一个二叉搜索树,遗憾的是,实现的并不是更强大的平衡二叉搜索树。
平衡二叉搜索树的实现远比普通二叉搜索树复杂,难理解。但凡事不能一蹴而就,要想理解更复杂的平衡二叉搜索树,理解普通的、非平衡的二叉搜索树是基础的一步。希望大家能更好的理解二叉搜索树,更好的理解自己所使用的数据结构,写出更高效,易维护的程序。
本系列博客的代码在我的 github上:https://github.com/1399852153/DataStructures?,存在许多不足之处,请多多指教。