Двоичное дерево

Двоичное дерево (бинарное дерево) — это особая форма дерева, которое имеет не более двух дочерних элементов. Информацию, представленную в виде двоичных деревьев, гораздо удобнее обрабатывать, так как двоичные деревья обладают определенными свойствами.

Структура

Формально двоичное дерево может быть представлено тройкой T = (x, L, R), где x представляет узел, а L и R - левую и правую ветви соответственно. L и R являются непересекающимися двоичными деревьями и не содержат x. Термин «двоичный» происходит от двух дочерних элементов, т.е. каждый узел в двоичном дереве может иметь не более двух дочерних элементов. Также это называется степенью двоичного дерева, которая равна 2.

Чтобы двоичное дерево было полным (полное двоичное дерево), оно должно удовлетворять двум условиям:

Все листья находятся на одном уровне и
У каждого внутреннего узла есть два потомка

Несколько важных определений, связанных со структурой двоичных деревьев или деревьев в целом:

путь (path): определяется как последовательность узлов (\(x_{0}, x_{1}, x_{2}, ... , x_{n}\)), где узлы с соседними нижними индексами являются соседними узлами. Поскольку деревья ацикличны, путь не может содержать один и тот же узел более одного раза.
длина пути (path length): определяется как количество \(n\) соседних пар.
корневой путь (root path): для узла \(x_{0}\) его корневой путь определяется как путь (\(x_{0}, x_{1}, x_{2}, ... , x_{n}\)), где \(x_{n}\) — корень дерева.
глубина (depth): определяется как длина корневого пути
высота (height): определяется как наибольшая глубина среди всех его узлов
уровень (level): это набор всех узлов на заданной глубине
размер (size): определяется как количество неконечных узлов

Код:

enum BinaryTree[+A]:
  case Leaf
  case Branch(value: A, left: BinaryTree[A], right: BinaryTree[A])

  lazy val isEmpty: Boolean = this match
    case Leaf => true
    case _    => false
    
  lazy val size: Int = this match
    case Leaf            => 0
    case Branch(_, l, r) => 1 + l.size + r.size

  lazy val height: Int = this match
    case Leaf            => 0
    case Branch(_, l, r) => 1 + math.max(l.height, r.height)
    
  def rootPath[B >: A](b: B): Option[NonEmptyList[B]] = this match
    case Leaf                              => None
    case Branch(value, _, _) if value == b => Some(NonEmptyList.one(b))
    case Branch(value, left, right) =>
      left.rootPath(b).orElse(right.rootPath(b)).map: nel =>
        value :: nel
  
  def level(level: Int): List[A] =
    @tailrec
    def loop(level: Int, trees: List[BinaryTree[A]]): List[A] =
      if level < 0 then List.empty
      else if level == 0 then
        trees.foldLeft(List.empty[A]) { case (acc, tree) =>
          tree match
            case Leaf            => acc
            case Branch(v, _, _) => v :: acc
        }
      else
        loop(
          level - 1,
          trees.flatMap:
            case Branch(_, left, right) if !left.isEmpty && !right.isEmpty =>
              List(left, right)
            case Branch(_, left, _) if !left.isEmpty   => List(left)
            case Branch(_, _, right) if !right.isEmpty => List(right)
            case _ => List.empty[BinaryTree[A]]
        )

    loop(level, List(this))
  end level

Пример:

val exampleBinaryTree: BinaryTree[Char] = Branch(
  'A',
  Branch('B', Branch('D', Leaf, Leaf), Leaf),
  Branch(
    'C',
    Branch('E', Leaf, Branch('G', Leaf, Leaf)),
    Branch('F', Branch('H', Leaf, Leaf), Branch('J', Leaf, Leaf))
  )
)

exampleBinaryTree.size          // 9
exampleBinaryTree.height        // 4
exampleBinaryTree.rootPath('G') // Some(NonEmptyList(A, C, E, G))
exampleBinaryTree.level(3)      // List(J, H, G)

Построение дерева

Алгоритм:

В объекте BinaryTree определены методы apply, которые создают бинарные деревья из различных типов коллекций данных:

Метод apply с одним аргументом возвращает узел дерева с этим значением и двумя пустыми поддеревьями.
Метод apply, принимающий коллекцию, строит бинарное дерево из заданных значений. Если коллекция пуста, то возвращается пустой лист. В противном случае, коллекция без первого элемента делится пополам, создается узел с первым элементом и двумя поддеревьями, созданными из левой и правой разбитой части.

Код:

object BinaryTree:
  def apply[A](a: A): BinaryTree[A] = Branch(a, Leaf, Leaf)

  def apply[A](values: List[A]): BinaryTree[A] =
    values match
      case Nil => Leaf
      case x :: xs =>
        val (left, right) = xs.splitAt(xs.length / 2)
        Branch(x, BinaryTree(left), BinaryTree(right))

  def apply[A](values: Vector[A]): BinaryTree[A] =
    if values.isEmpty then Leaf
    else
      val (left, right) = values.tail.splitAt(values.length / 2)
      Branch(values.head, BinaryTree(left), BinaryTree(right))

Алгоритмы обхода дерева

Существует достаточно много алгоритмов работы с древовидными структурами, в которых наиболее часто встречается понятие обхода (traversing) дерева или "прохода" по дереву. При таком методе исследования дерева каждый узел посещается в точности один раз, а полный обход дерева задает линейное упорядочение узлов, что позволяет упростить алгоритм, так как при этом можно использовать понятие "следующий" узел, т.е. узел, который располагается перед данным узлом в таком упорядочении или после него.

Для обхода бинарного дерева можно применить один из трех принципиально разных способов: в прямом порядке (preorder), в центрированном порядке (inorder) или в обратном порядке (postorder).

Preorder (прямой порядок)

Посетить корень
Выполнить preorder обход левого поддерева, если оно не пустое
Выполнить preorder обход правого поддерева, если оно не пустое

Inorder (центрированный порядок)

Выполнить inorder обход левого поддерева, если оно не пустое
Посетить корень
Произвести inorder обход правого поддерева, если оно не пустое

Postorder (обратный порядок)

Выполнить postorder обход левого поддерева, если оно не пустое
Выполнить postorder обход правого поддерева, если оно не пустое
Посетить корень

Код:

lazy val preorder: IndexedSeq[A] = this match
  case Leaf                       => IndexedSeq.empty
  case Branch(value, left, right) => IndexedSeq(value) ++ left.preorder ++ right.preorder

lazy val inorder: IndexedSeq[A] = this match
  case Leaf                       => IndexedSeq.empty
  case Branch(value, left, right) => left.inorder ++ IndexedSeq(value) ++ right.inorder

lazy val postorder: IndexedSeq[A] = this match
  case Leaf                       => IndexedSeq.empty
  case Branch(value, left, right) => left.postorder ++ right.postorder ++ IndexedSeq(value)

Пример:

Если применить эти определения к бинарному дереву ('A', ('B', ('D', -, -), -), ('C', ('E', -, ('G', -, -)), ('F', ('H', -, -), ('J', -, -)))), то при прямом порядке обхода узлов получим последовательность A B D C E G F H J. (Сначала следует корень A, затем — левое поддерево в прямом порядке, и, наконец, правое поддерево в прямом порядке.)

При центрированном порядке обхода корень посещается после обхода узлов одного из деревьев точно так, как если бы узлы дерева "проектировались" на горизонтальную прямую с образованием последовательности D B A E G C H F J.

Аналогично обратный порядок обхода позволяет получить последовательность D B G E H J F C A.

val binaryTree: BinaryTree[Int] = Branch(
  'A',
  Branch('B', Branch('D', Leaf, Leaf), Leaf),
  Branch(
    'C',
    Branch('E', Leaf, Branch('G', Leaf, Leaf)),
    Branch('F', Branch('H', Leaf, Leaf), Branch('J', Leaf, Leaf))
  )
)

binaryTree.preorder
// Vector('A', 'B', 'D', 'C', 'E', 'G', 'F', 'H', 'J')

binaryTree.inorder
// Vector('D', 'B', 'A', 'E', 'G', 'C', 'H', 'F', 'J')

binaryTree.postorder
// Vector('D', 'B', 'G', 'E', 'H', 'J', 'F', 'C', 'A')

Подобие и эквивалентность

Пусть \(u_{1}, u_{2}, ... , u_{n}\) и \(\acute{u}_{1}, \acute{u}_{2}, ... , \acute{u}_{\acute{n}}\) являются узлами бинарных деревьев \(T\) и \(\acute{T}\) соответственно в прямом порядке обхода.

Для любого узла u положим

\(l(u)=1\), если \(u\) имеет непустое левое поддерево, иначе \(l(u) = 0\);
\(r(u)=1\), если \(u\) имеет непустое правое поддерево, иначе \(r(u) = 0\);

\(T\) и \(\acute{T}\) подобны тогда и только тогда, когда \(n = \acute{n}\) и \(l(u_{j}) = l(\acute{u}_{j})\), \(r(u_{j}) = r(\acute{u}_{j})\) для \(1 \leq j \leq n\).

Более того, подобные деревья \(T\) и \(\acute{T}\) эквивалентны тогда и только тогда, когда \(info(u_{j}) = info(\acute{u}_{j})\) для \(1 \leq j \leq n\).

Код:

def areSimilar[A, B](treeA: BinaryTree[A], treeB: BinaryTree[B]): Boolean =
  (treeA, treeB) match
    case (Leaf, Leaf) => true
    case (Branch(_, leftA, rightA), Branch(_, leftB, rightB)) =>
      areSimilar(leftA, leftB) && areSimilar(rightA, rightB)
    case _ => false

def areEqual[A](treeA: BinaryTree[A], treeB: BinaryTree[A]): Boolean =
  (treeA, treeB) match
    case (Leaf, Leaf) => true
    case (Branch(valueA, leftA, rightA), Branch(valueB, leftB, rightB)) =>
      valueA == valueB && areEqual(leftA, leftB) && areEqual(rightA, rightB)
    case _ => false

Естественное соответствие

Пусть \(F = (T_{1}, T_{2}, ... , T_{n})\) — некоторый лес деревьев. Тогда бинарное дерево \(B(F)\), соответствующее \(F\), можно строго определить следующим образом.

a) Если \(n = 0\), то \(B(F)\) пусто.
b) Если \(n > 0\), то корень \(B(F)\) является корнем \((T_{1})\); \(B(T_{11}, T_{12}, ... , T_{1m})\) является левым поддеревом дерева \(B(F)\), где \(T_{11}, T_{12}, ... , T_{1m}\) — поддеревья корня \((T_{1})\); \(B(T_{2}, ... , T_{n})\) является правым поддеревом дерева \(B(F)\).

Это приведение называется естественным соответствием (natural correspondence) между лесом и бинарными деревьями.

Применение

Двоичные деревья имеют множество применений.

Одной из специализаций двоичных деревьев являются двоичные деревья поиска, которые ускоряют поисковые приложения, поскольку поддерживают поиск, вставку и удаление со средней временной сложностью O(lg n).

Двоичные деревья также используются в компиляторах для обработки выражений с использованием деревьев выражений. Также их можно использовать для сжатия данных, таких как деревья кодирования Хаффмана.

Ссылки: