Двоичное дерево
Двоичное дерево (бинарное дерево) — это особая форма дерева, которое имеет не более двух дочерних элементов. Информацию, представленную в виде двоичных деревьев, гораздо удобнее обрабатывать, так как двоичные деревья обладают определенными свойствами.
Структура
Формально двоичное дерево может быть представлено тройкой T = (x, L, R)
,
где x
представляет узел, а L
и R
- левую и правую ветви соответственно.
L
и R
являются непересекающимися двоичными деревьями и не содержат x
.
Термин «двоичный» происходит от двух дочерних элементов,
т.е. каждый узел в двоичном дереве может иметь не более двух дочерних элементов.
Также это называется степенью двоичного дерева, которая равна 2.
Чтобы двоичное дерево было полным (полное двоичное дерево), оно должно удовлетворять двум условиям:
- Все листья находятся на одном уровне и
- У каждого внутреннего узла есть два потомка
Несколько важных определений, связанных со структурой двоичных деревьев или деревьев в целом:
- путь (path): определяется как последовательность узлов (\(x_{0}, x_{1}, x_{2}, ... , x_{n}\)), где узлы с соседними нижними индексами являются соседними узлами. Поскольку деревья ацикличны, путь не может содержать один и тот же узел более одного раза.
- длина пути (path length): определяется как количество \(n\) соседних пар.
- корневой путь (root path): для узла \(x_{0}\) его корневой путь определяется как путь (\(x_{0}, x_{1}, x_{2}, ... , x_{n}\)), где \(x_{n}\) — корень дерева.
- глубина (depth): определяется как длина корневого пути
- высота (height): определяется как наибольшая глубина среди всех его узлов
- уровень (level): это набор всех узлов на заданной глубине
- размер (size): определяется как количество неконечных узлов
Код:
enum BinaryTree[+A]:
case Leaf
case Branch(value: A, left: BinaryTree[A], right: BinaryTree[A])
lazy val isEmpty: Boolean = this match
case Leaf => true
case _ => false
lazy val size: Int = this match
case Leaf => 0
case Branch(_, l, r) => 1 + l.size + r.size
lazy val height: Int = this match
case Leaf => 0
case Branch(_, l, r) => 1 + math.max(l.height, r.height)
def rootPath[B >: A](b: B): Option[NonEmptyList[B]] = this match
case Leaf => None
case Branch(value, _, _) if value == b => Some(NonEmptyList.one(b))
case Branch(value, left, right) =>
left.rootPath(b).orElse(right.rootPath(b)).map: nel =>
value :: nel
def level(level: Int): List[A] =
@tailrec
def loop(level: Int, trees: List[BinaryTree[A]]): List[A] =
if level < 0 then List.empty
else if level == 0 then
trees.foldLeft(List.empty[A]) { case (acc, tree) =>
tree match
case Leaf => acc
case Branch(v, _, _) => v :: acc
}
else
loop(
level - 1,
trees.flatMap:
case Branch(_, left, right) if !left.isEmpty && !right.isEmpty =>
List(left, right)
case Branch(_, left, _) if !left.isEmpty => List(left)
case Branch(_, _, right) if !right.isEmpty => List(right)
case _ => List.empty[BinaryTree[A]]
)
loop(level, List(this))
end level
Пример:
val exampleBinaryTree: BinaryTree[Char] = Branch(
'A',
Branch('B', Branch('D', Leaf, Leaf), Leaf),
Branch(
'C',
Branch('E', Leaf, Branch('G', Leaf, Leaf)),
Branch('F', Branch('H', Leaf, Leaf), Branch('J', Leaf, Leaf))
)
)
exampleBinaryTree.size // 9
exampleBinaryTree.height // 4
exampleBinaryTree.rootPath('G') // Some(NonEmptyList(A, C, E, G))
exampleBinaryTree.level(3) // List(J, H, G)
Построение дерева
Алгоритм:
В объекте BinaryTree
определены методы apply
,
которые создают бинарные деревья из различных типов коллекций данных:
- Метод
apply
с одним аргументом возвращает узел дерева с этим значением и двумя пустыми поддеревьями. - Метод
apply
, принимающий коллекцию, строит бинарное дерево из заданных значений. Если коллекция пуста, то возвращается пустой лист. В противном случае, коллекция без первого элемента делится пополам, создается узел с первым элементом и двумя поддеревьями, созданными из левой и правой разбитой части.
Код:
object BinaryTree:
def apply[A](a: A): BinaryTree[A] = Branch(a, Leaf, Leaf)
def apply[A](values: List[A]): BinaryTree[A] =
values match
case Nil => Leaf
case x :: xs =>
val (left, right) = xs.splitAt(xs.length / 2)
Branch(x, BinaryTree(left), BinaryTree(right))
def apply[A](values: Vector[A]): BinaryTree[A] =
if values.isEmpty then Leaf
else
val (left, right) = values.tail.splitAt(values.length / 2)
Branch(values.head, BinaryTree(left), BinaryTree(right))
Алгоритмы обхода дерева
Существует достаточно много алгоритмов работы с древовидными структурами, в которых наиболее часто встречается понятие обхода (traversing) дерева или "прохода" по дереву. При таком методе исследования дерева каждый узел посещается в точности один раз, а полный обход дерева задает линейное упорядочение узлов, что позволяет упростить алгоритм, так как при этом можно использовать понятие "следующий" узел, т.е. узел, который располагается перед данным узлом в таком упорядочении или после него.
Для обхода бинарного дерева можно применить один из трех принципиально разных способов: в прямом порядке (preorder), в центрированном порядке (inorder) или в обратном порядке (postorder).
Preorder (прямой порядок)
- Посетить корень
- Выполнить preorder обход левого поддерева, если оно не пустое
- Выполнить preorder обход правого поддерева, если оно не пустое
Inorder (центрированный порядок)
- Выполнить inorder обход левого поддерева, если оно не пустое
- Посетить корень
- Произвести inorder обход правого поддерева, если оно не пустое
Postorder (обратный порядок)
- Выполнить postorder обход левого поддерева, если оно не пустое
- Выполнить postorder обход правого поддерева, если оно не пустое
- Посетить корень
Код:
lazy val preorder: IndexedSeq[A] = this match
case Leaf => IndexedSeq.empty
case Branch(value, left, right) => IndexedSeq(value) ++ left.preorder ++ right.preorder
lazy val inorder: IndexedSeq[A] = this match
case Leaf => IndexedSeq.empty
case Branch(value, left, right) => left.inorder ++ IndexedSeq(value) ++ right.inorder
lazy val postorder: IndexedSeq[A] = this match
case Leaf => IndexedSeq.empty
case Branch(value, left, right) => left.postorder ++ right.postorder ++ IndexedSeq(value)
Пример:
Если применить эти определения к бинарному дереву
('A', ('B', ('D', -, -), -), ('C', ('E', -, ('G', -, -)), ('F', ('H', -, -), ('J', -, -))))
,
то при прямом порядке обхода узлов получим последовательность A B D C E G F H J
.
(Сначала следует корень A
, затем — левое поддерево в прямом порядке, и, наконец, правое поддерево в прямом порядке.)
При центрированном порядке обхода корень посещается после обхода узлов одного из деревьев точно так,
как если бы узлы дерева "проектировались" на горизонтальную прямую с образованием последовательности D B A E G C H F J
.
Аналогично обратный порядок обхода позволяет получить последовательность D B G E H J F C A
.
val binaryTree: BinaryTree[Int] = Branch(
'A',
Branch('B', Branch('D', Leaf, Leaf), Leaf),
Branch(
'C',
Branch('E', Leaf, Branch('G', Leaf, Leaf)),
Branch('F', Branch('H', Leaf, Leaf), Branch('J', Leaf, Leaf))
)
)
binaryTree.preorder
// Vector('A', 'B', 'D', 'C', 'E', 'G', 'F', 'H', 'J')
binaryTree.inorder
// Vector('D', 'B', 'A', 'E', 'G', 'C', 'H', 'F', 'J')
binaryTree.postorder
// Vector('D', 'B', 'G', 'E', 'H', 'J', 'F', 'C', 'A')
Подобие и эквивалентность
Пусть \(u_{1}, u_{2}, ... , u_{n}\) и \(\acute{u}_{1}, \acute{u}_{2}, ... , \acute{u}_{\acute{n}}\) являются узлами бинарных деревьев \(T\) и \(\acute{T}\) соответственно в прямом порядке обхода.
Для любого узла u положим
- \(l(u)=1\), если \(u\) имеет непустое левое поддерево, иначе \(l(u) = 0\);
- \(r(u)=1\), если \(u\) имеет непустое правое поддерево, иначе \(r(u) = 0\);
\(T\) и \(\acute{T}\) подобны тогда и только тогда, когда \(n = \acute{n}\) и \(l(u_{j}) = l(\acute{u}_{j})\), \(r(u_{j}) = r(\acute{u}_{j})\) для \(1 \leq j \leq n\).
Более того, подобные деревья \(T\) и \(\acute{T}\) эквивалентны тогда и только тогда, когда \(info(u_{j}) = info(\acute{u}_{j})\) для \(1 \leq j \leq n\).
Код:
def areSimilar[A, B](treeA: BinaryTree[A], treeB: BinaryTree[B]): Boolean =
(treeA, treeB) match
case (Leaf, Leaf) => true
case (Branch(_, leftA, rightA), Branch(_, leftB, rightB)) =>
areSimilar(leftA, leftB) && areSimilar(rightA, rightB)
case _ => false
def areEqual[A](treeA: BinaryTree[A], treeB: BinaryTree[A]): Boolean =
(treeA, treeB) match
case (Leaf, Leaf) => true
case (Branch(valueA, leftA, rightA), Branch(valueB, leftB, rightB)) =>
valueA == valueB && areEqual(leftA, leftB) && areEqual(rightA, rightB)
case _ => false
Естественное соответствие
Пусть \(F = (T_{1}, T_{2}, ... , T_{n})\) — некоторый лес деревьев. Тогда бинарное дерево \(B(F)\), соответствующее \(F\), можно строго определить следующим образом.
- a) Если \(n = 0\), то \(B(F)\) пусто.
- b) Если \(n > 0\), то корень \(B(F)\) является корнем \((T_{1})\); \(B(T_{11}, T_{12}, ... , T_{1m})\) является левым поддеревом дерева \(B(F)\), где \(T_{11}, T_{12}, ... , T_{1m}\) — поддеревья корня \((T_{1})\); \(B(T_{2}, ... , T_{n})\) является правым поддеревом дерева \(B(F)\).
Это приведение называется естественным соответствием (natural correspondence) между лесом и бинарными деревьями.
Применение
Двоичные деревья имеют множество применений.
Одной из специализаций двоичных деревьев являются двоичные деревья поиска, которые ускоряют поисковые приложения, поскольку поддерживают поиск, вставку и удаление со средней временной сложностью O(lg n).
Двоичные деревья также используются в компиляторах для обработки выражений с использованием деревьев выражений. Также их можно использовать для сжатия данных, таких как деревья кодирования Хаффмана.
Ссылки: