Численные алгоритмы

Наибольший общий делитель

Алгоритм Евклида

Даны два целых положительных числа m и n. Требуется найти их наибольший общий делитель, т.е. наибольшее целое положительное число, которое нацело делит оба числа m и n.

Алгоритм:

E1 (Сравнение с нулем). Если n = 0, то выполнение алгоритма прекращается; m — искомое значение.
E2 (Замещение). Присвоить r ← m % n, m ← n, n ← r и вернуться к шагу E1.

Пояснение:

Наибольший общий делитель (НОД) с помощью алгоритма Евклида вычисляется исходя из следующих соображений:

НОД(r, 0) = r для любого ненулевого r (так как 0 делится на любое целое число).
Пусть a = b*q + r, тогда НОД (a, b) = НОД (b, r).

Оценка:

Время - O(log n)
Память - O(log n)

Код:

@tailrec
final def gcdByEuclideanAlgorithm(a: Long, b: Long): Long =
  if b == 0 then a
  else gcdByEuclideanAlgorithm(b, a % b)
  
gcdByEuclideanAlgorithm(4851, 3003)
// 231

Метрики:

Вычисление НОД всех пар первых 10000 чисел, начиная с миллиона, с помощью алгоритма Евклида занимает примерно 3 секунды.

@main def gcdByEuclideanAlgorithmBench(): Unit =
  val limit = 10_000
  val start = 1_000_000
  val end   = start + limit
  (start until end).foreach: i =>
    (i + 1 to end).foreach: j =>
      gcdByEuclideanAlgorithm(j, i)
      
// CPU Time: 3057 ms
// Allocation memory size: 817,66 MB

Алгоритм НОД на основе четности чисел

Алгоритм:

Алгоритм, нахождения НОД, учитывающий четность чисел:

Если u == v, то НОД(u, v) = u.
НОД(r, 0) = r для любого ненулевого r (так как 0 делится на любое целое число).
Если u и v - четные, то НОД(u, v) = 2 * НОД(u/2, v/2).
Если числа имеют разную четность, то НОД этих двух чисел равен НОД нечетному и четному, разделенному на 2.
Если оба нечетные, то вычтем из большего меньшее и продолжим (разница будет четная, можно сразу поделить на 2)

Оценка:

Время - O(log n)
Память - O(log n)

Код:

def gcdBasedOnParityOfNumbers(a: Long, b: Long): Long =
  val u = math.abs(a)
  val v = math.abs(b)
  if u == v then u
  else if u == 0 then v
  else if v == 0 then u
  else
    (~u & 1, ~v & 1) match
      case (1, 1) => gcdBasedOnParityOfNumbers(u >> 1, v >> 1) << 1
      case (1, 0) => gcdBasedOnParityOfNumbers(u >> 1, v)
      case (0, 1) => gcdBasedOnParityOfNumbers(u, v >> 1)
      case (_, _) =>
        if u > v then gcdBasedOnParityOfNumbers((u - v) >> 1, v)
        else gcdBasedOnParityOfNumbers((v - u) >> 1, u)
  
gcdBasedOnParityOfNumbers(4851, 3003)  
// 231

Метрики:

Вычисление НОД всех пар первых 10000 чисел, начиная с миллиона, с помощью алгоритма на основе четности чисел занимает примерно 22 секунды.

@main def gcdBasedOnParityOfNumbersBench(): Unit =
  val limit = 10_000
  val start = 1_000_000
  val end   = start + limit
  (start until end).foreach: i =>
    (i + 1 to end).foreach: j =>
      gcdBasedOnParityOfNumbers(j, i
      
// CPU Time: 21697 ms
// Allocation memory size: 33,11 GB

Вычисление НОД на основе алгоритма Евклида оказывается на порядок эффективнее алгоритма на основе четности чисел. Во всяком случае на числах Long в Scala.

Обобщенный алгоритм Евклида

Даны два целых положительных числа m и n. Требуется найти их наибольший общий делитель d и два целых числа a и b, таких, что am + bn = d.

Алгоритм:

E1 (Инициализация). Присвоить \(\acute{a} \leftarrow b \leftarrow 1, a \leftarrow \acute{b} \leftarrow 0, c \leftarrow m, d \leftarrow n\).
E2 (Деление). Пусть \(q\) и \(r\) — это частное и остаток от деления \(c\) на \(d\) соответственно. (Тогда \(c = qd + r\), где \(0 \leq r < d\)).
E3 (Остаток — нуль?). Если \(r = 0\), то выполнение алгоритма прекращается; в этом случае имеем \(am + bn = d\), как и требовалось.
E4 (Повторение цикла). Присвоить \(c \leftarrow d, d \leftarrow r, t \leftarrow \acute{a}, \acute{a} \leftarrow a, a \leftarrow t − qa, t \leftarrow \acute{b}, \acute{b} \leftarrow b, b \leftarrow t − qb\) и вернуться к шагу E2.

Оценка:

Время - ???
Память - ???

Код:

def generalizedEuclideanAlgorithm(
    m: SafeLong,
    n: SafeLong
): (SafeLong, SafeLong, SafeLong) =
  @tailrec
  def loop(
      aa: SafeLong,
      b: SafeLong,
      a: SafeLong,
      bb: SafeLong,
      c: SafeLong,
      d: SafeLong
  ): (SafeLong, SafeLong, SafeLong) =
    val r = c % d
    if r == 0 then (d, a, b)
    else
      val q = c / d
      loop(aa = a, b = bb - q * b, a = aa - q * a, bb = b, c = d, d = r)

  loop(aa = 1, b = 1, a = 0, bb = 0, c = m, d = n)
end generalizedEuclideanAlgorithm

generalizedEuclideanAlgorithm(1769, 551)
// (d = 29, a = 5, b = -16)

Метрики:

Вычисление обобщенного алгоритма Евклида всех пар первых 10000 чисел, начиная с 2, занимает примерно 21 секунду.

@main def generalizedEuclideanAlgorithmBench(): Unit =
  val limit = 10_000
  (2 until limit).foreach: i =>
    (i + 1 to limit).foreach: j =>
      generalizedEuclideanAlgorithm(j, i)
      
// CPU Time: 20321 ms
// Allocation memory size: 58,71 GB

Обратное по модулю число

Алгоритм:

Обратное по модулю целого m — это такое целое число x, что произведение m*x сравнимо с 1 по модулю n: \(mx \equiv 1\) (mod n).

При вычислении обратного по модулю числа достаточно воспользоваться "Обобщенным алгоритмом Евклида". Если два числа m и n взаимно простые (d = 1), то a из формулы am + bn = 1 и есть искомое значение.

Если числа не взаимно простые, то такого числа x не существует.

Оценка:

Аналогична оценке Обобщенного алгоритма Евклида.

Время - ???
Память - ???

Код:

import spire.math.SafeLong

def gcdInverse(m: SafeLong, n: SafeLong): Option[SafeLong] =
  val (d, a, _) = generalizedEuclideanAlgorithm(m, n)
  if d == 1 then Some((a % n + n) % n) else None

Метрики:

Метрики аналогичны метрикам Обобщенного алгоритма Евклида.

@main def gcdInverseBench(): Unit =
  val limit = 10_000
  (2 until limit).foreach: i =>
    (i + 1 to limit).foreach: j =>
      gcdInverse(j, i)

// CPU Time: 29643 ms
// Allocation memory size: 62,59 GB

Китайская теорема об остатках

Алгоритм:

Китайская теорема об остатках

Оценка:

Время - ???
Память - ???

Код:

object ChineseRemainderTheorem:
  def solution(
      aArray: Array[SafeLong],
      rArray: Array[SafeLong]
  ): Option[SafeLong] =
    val m      = aArray.product         // Step 1
    val mArray = aArray.map(a => m / a) // Step 2
    val maybeMMinus1Array =
      mArray.indices.toList.traverse: i => // Step 3
        gcdInverse(mArray(i), aArray(i))
    maybeMMinus1Array.map: mMinus1Array =>
      mArray.indices.foldLeft(SafeLong(0)): (x, i) => // Step 4
        x + (((rArray(i) * mArray(i)) % m) * mMinus1Array(i)) % m
        
solution(Array(2, 3), Array(1, 2)))
// 5, потому что 5 % 2 = 1, 5 % 3 = 2

solution(Array(707, 527), Array(0, 5)))
// 258762, потому что 258762 % 707 = 0, 258762 % 527 = 5

Метрики:

Решение задачи для достаточно больших чисел вычисляется меньше чем за секунду.

@main def solutionChineseRemainderTheoremBench(): Unit =
  println(ChineseRemainderTheorem.solution(
    Array(1504170715041707L, 4503599627370517L),
    Array(0L, 8912517754604L)
  ))

// CPU Time: 676 ms
// Allocation memory size: 28,59 MB

Наименьшее общее кратное

Алгоритм:

Наименьшее общее кратное вычисляется как произведение двух чисел, деленное на их НОД.

Оценка:

Время - O(log n)
Память - O(log n)

Код:

def lcm(x: Long, y: Long): Long = math.abs(x * y) / gcd(x, y)

Метрики:

Вычисление НОК всех пар первых 10000 чисел, начиная с миллиона, занимает примерно 3,5 секунды.

@main def lcmBench(): Unit =
  val limit = 10_000
  val start = 1_000_000
  val end   = start + limit
  (start until end).foreach: i =>
    (i + 1 to end).foreach: j =>
      lcm(j, i)
      
// CPU Time: 3535 ms
// Allocation memory size: 2,01 GB

Возведение числа в степень

Алгоритм:

Возведение числа в степень основывается на двух ключевых формулах:

\(A^{2*M} = (A^{2})^{M}\)
\(A^{M+N} = A^{M} * A^{N}\)

Первая позволяет быстро вычислить степень числа А, возводя квадрат A в половину исходной степени; вторая помогает комбинировать степени любым удобным образом.

Оценка:

Время - O(log n)
Память - O(log n)

Код:

Реализация алгоритма (Exercise 1.16 из SICP):

def power(a: SafeLong, n: SafeLong): SafeLong =
  @tailrec
  def loop(base: SafeLong, power: SafeLong, acc: SafeLong): SafeLong =
    if power == 0 then acc
    else if power % 2 == 0 then loop(base * base, power / 2, acc)
    else loop(base, power - 1, base * acc)
  loop(a, n, 1)

Метрики:

Поочередное возведение первых 100 чисел в степени от 1 до 10 занимает меньше секунды.

@main def powerBench(): Unit =
  (1 to 100).foreach: i =>
    (1 to 10).foreach: j =>
      power(j, i)

// CPU Time: 678 ms
// Allocation memory size: 13,72 MB

Нахождение корня

Алгоритм:

Вычисление квадратного корня методом Ньютона хорошо описана в главе "Пример: вычисление квадратного корня методом Ньютона" книги "Структура и интерпретация компьютерных программ".

Метод Ньютона основывается на том, что имея некоторое приближенное значение y для квадратного корня числа x, мы можем получить более точное значение, если возьмем среднее между y и x/y.

Оценка:

Время - O(n)
Память - O(n)

Код:

Exercise 1.7 из SICP:

def sqrt(x: Double): Double       =
  def isGoodEnough(guess: Double): Boolean =
    math.abs(guess * guess - x) < delta

  def improve(guess: Double): Double = (guess + x / guess) / 2

  def sqrtIter(guess: Double): Double =
    if isGoodEnough(guess) then guess
    else sqrtIter(improve(guess))

  sqrtIter(1.0)

Метрики:

Вычисление квадратного корня первых миллиона чисел занимает меньше секунды.

@main def sqrtBench(): Unit =
  (1 to 1_000_000).foreach: i =>
    sqrt(i)

// CPU Time: 380 ms
// Allocation memory size: 48,41 MB

Нахождение кубического корня

Алгоритм:

Метод нахождения кубического корня основывается на том, что имея некоторое приближенное значение y для кубического корня числа x, можно получить более точное значение по формуле: \((\frac{x}{y^{2}} + 2y) / 3\).

Оценка:

Время - O(n)
Память - O(n)

Код:

Exercise 1.8 из SICP:

def cubeRootOf(x: Double): Double =
  def isGoodEnough(guess: Double): Boolean =
    math.abs(guess * guess * guess - x) < delta

  def improve(guess: Double): Double = (x / (guess * guess) + 2 * guess) / 3

  def sqrtIter(guess: Double): Double =
    if isGoodEnough(guess) then guess
    else sqrtIter(improve(guess))

  sqrtIter(1.0)

Метрики:

Вычисление кубического корня первых миллиона чисел занимает меньше секунды. Результаты аналогичны метрикам вычисления квадратного корня, т.к. алгоритмы похожие.

@main def cubeRootOfBench(): Unit =
  (1 to 1_000_000).foreach: i =>
    cubeRootOf(i)

// CPU Time: 476 ms
// Allocation memory size: 48,3 MB

Степень двойки

Алгоритм:

Проверка, является ли заданное число степенью двойки.

Оценка:

Время - O(1)
Память - O(1)

Код:

def isPowerOfTwo(x: Int): Boolean = (x & (x - 1)) == 0

isPowerOfTwo(16) // true

Метрики:

Определение, является ли число степенью двойки, для первых миллиарда чисел занимает 4,5 секунды. Результаты аналогичны тому, как если бы мы просто прошлись по коллекции в миллиард элементов и ничего не делали.

@main def isPowerOfTwoBench(): Unit =
  (1 to 1_000_000_000).foreach: i =>
    isPowerOfTwo(i)

// CPU Time: 4658 ms
// Allocation memory size: 16,04 GB

Количество битовых единиц

Алгоритм:

Проверяет, содержат ли данные числа x и y одинаковое количество битовых единиц или нет.

Оценка:

Время - O(1)
Память - O(1)

Код:

@tailrec
def isSnoob(x: Int, y: Int): Boolean = 
  if x == 0 && y == 0 then true
  else if x == 0 || y == 0 then false
  else if x % 2 == 1 && y % 2 == 0 then isSnoob(x, y >> 1)
  else if x % 2 == 0 && y % 2 == 1 then isSnoob(x >> 1, y)
  else isSnoob(x >> 1, y >> 1)
  
// isSnoob(11, 13) // true: "1101", "1011"

Метрики:

Проверка для первых 10000 пар занимает 4 секунды.

@main def isSnoobBench(): Unit =
  val limit = 10_000
  (1 until limit).foreach: i =>
    (i + 1 to limit).foreach: j =>
      isSnoob(j, i)

// CPU Time: 3937 ms
// Allocation memory size: 810 MB

Делители числа

Алгоритм:

Согласно функциям делителей сумму делителей числа, разложенного на простые множители со степенями: \(n = \prod_{i=1}^{r}\rho_{i}^{\alpha_{i}}\) можно посчитать по формуле:

\(\sigma_{1}(n) = \prod_{i=1}^{r}\frac{\rho_{i}^{\alpha_{i} + 1} - 1}{\rho_{i} - 1}\)

А количество делителей по формуле:

\(\sigma_{0}(n) = \prod_{i=1}^{r}(\alpha_{i} + 1)\)

Сумма делителей числа

Алгоритм:

\(\sigma_{1}(n) = \prod_{i=1}^{r}\frac{\rho_{i}^{\alpha_{i} + 1} - 1}{\rho_{i} - 1}\)

Оценка:

Время - ???
Память - ???

Код:

def sumOfDivisors(number: Long): SafeLong =
  val primeDivisors = primeFactorsWithPow(number)
  primeDivisors.foldLeft(SafeLong(1)) { case (mul, (prime, power)) =>
    val num = SafeLong(prime).pow(power + 1) - 1
    val den = prime - 1
    mul * (num / den)
  }
  
sumOfDivisors(220) // 504  
sumOfDivisors(284) // 504

Метрики:

Вычисление суммы делителей первых миллиона чисел занимает 2 секунды.

@main def sumOfDivisorsBench(): Unit =
  (1 to 1_000_000).foreach: i =>
    sumOfDivisors(i)

// CPU Time: 1867 ms
// Allocation memory size: 1,18 GB

Количество делителей числа

Алгоритм:

\(\sigma_{0}(n) = \prod_{i=1}^{r}(\alpha_{i} + 1)\)

Оценка:

Время - ???
Память - ???

Код:

def countOfDivisors(number: Long): SafeLong =
  primeFactorsWithPow(number).values.foldLeft(SafeLong(1)): (mul, a) =>
    mul * (a + 1)
    
countOfDivisors(100) // 9

Метрики:

Вычисление количества делителей первых миллиона чисел занимает примерно 1 секунду.

@main def countOfDivisorsBench(): Unit =
  (1 to 1_000_000).foreach: i =>
    countOfDivisors(i)  

// CPU Time: 1216 ms
// Allocation memory size: 435 MB

Совершенное число

Алгоритм:

Совершенное число — это целое положительное число, равное сумме своих положительных делителей, исключая само число.

Недостаточное число — это целое положительное число, которое меньше суммы своих положительных делителей, исключая само число.

Избыточное число — это целое положительное число, которое больше суммы своих положительных делителей, исключая само число.

Оценка:

Время - ???
Память - ???

Код:

enum PerfectNumbersType:
  case Perfect, Deficient, Abundant
  
def perfectNumbersType(n: Long): PerfectNumbersType =
  val sum = sumOfDivisors(n) - n
  if sum == n then Perfect
  else if sum < n then Deficient
  else Abundant
  
perfectNumbersType(6)  // Perfect
perfectNumbersType(7)  // Deficient
perfectNumbersType(12) // Abundant

Метрики:

Вычисление типа числа (совершенное/избыточное/недостаточное) первых миллиона чисел занимает 2 секунды.

@main def perfectNumbersTypeBench(): Unit =
  (1 to 1_000_000).foreach: i =>
    perfectNumbersType(i)

// CPU Time: 2013 ms
// Allocation memory size: 1,27 GB

Сумма первых натуральных чисел

Сумма первых натуральных чисел до заданного

Алгоритм:

Сумму первых натуральных чисел можно посчитать по формуле: \(\frac{n * (n + 1)}{2}\)

Оценка:

Время - O(1)
Память - O(1)

Код:

def sumToGiven(n: Long): SafeLong = SafeLong(n) * SafeLong(n + 1) / 2

sumToGiven(1000000) 
// 500000500000L

Метрики:

Вычисление суммы от 1 до заданного числа для первого миллиона чисел занимает меньше секунды. Результаты аналогичны тому, как если бы мы просто прошлись по коллекции в миллион элементов и ничего не делали.

@main def sumToGivenBench(): Unit =
  (1 to 1_000_000).foreach: i =>
    sumToGiven(i)

// CPU Time: 309 ms
// Allocation memory size: 122,85 MB

Сумма квадратов первых натуральных чисел до заданного

Алгоритм:

Сумму квадратов первых натуральных чисел можно посчитать по формуле: \(\frac{n * (n + 1) * (2 * n + 1)}{6}\)

Оценка:

Время - O(1)
Память - O(1)

Код:

def sumOfSquaresTo(n: Long): SafeLong = SafeLong(n) * SafeLong(n + 1) * SafeLong(2 * n + 1) / 6

sumOfSquaresTo(1000) 
// 333833500L

Метрики:

Вычисление суммы квадратов от 1 до заданного числа для первого миллиона чисел занимает меньше секунды. Результаты аналогичны тому, как если бы мы просто прошлись по коллекции в миллион элементов и ничего не делали.

@main def sumOfSquaresToBench(): Unit =
  (1 to 1_000_000).foreach: i =>
    sumOfSquaresTo(i)

// CPU Time: 418 ms
// Allocation memory size: 170,55 MB

Сумма кубов первых натуральных чисел до заданного

Алгоритм:

Сумму кубов первых натуральных чисел можно посчитать по формуле: \(\left ( \frac{n * (n + 1)}{2} \right )^{2}\)

Оценка:

Время - O(1)
Память - O(1)

Код:

def sumOfCubesTo(n: Long): SafeLong =
  val s = sumToGiven(n)
  s * s
  
sumOfCubesTo(1000) 
// 250500250000L

Метрики:

Вычисление суммы кубов от 1 до заданного числа для первого миллиона чисел занимает 2 секунды. Результаты аналогичны тому, как если бы мы просто прошлись по коллекции в миллион элементов и ничего не делали.

@main def sumOfCubesToBench(): Unit =
  (1 to 1_000_000).foreach: i =>
    sumOfCubesTo(i)  

// CPU Time: 1795 ms
// Allocation memory size: 1,06 GB

Рандомизация данных - Линейный конгруэнтный генератор

Алгоритм:

Линейный конгруэнтный генератор использует следующую зависимость для формирования псевдослучайных величин

\(X_{n+1}\) = (A * \(X_{n}\) + B) % M, где A, B и M - константы.

Величина \(X_{0}\) называется начальным числом.

Оценка:

Время - ???
Память - ???

Код:

val A = 7
val B = 5
val M = 11
val generator = LazyList.iterate(0)(x => (A * x + B) % M)
generator.take(11).toList
// List(0, 5, 7, 10, 9, 2, 8, 6, 3, 4, 0)

Преобразование десятичного числа в двоичное

Алгоритм:

Мы переводим числа с основанием 10 в числа с основанием 2. В этих двух системах счисления процедура счета различается главным образом из-за используемых символов.

Сначала опишем алгоритм конвертации:

Начиная с заданного числа, составить последовательность чисел таким образом, чтобы последующее число было половиной предыдущего, отбрасывая десятичную часть. Продолжить до тех пор, пока последний элемент не будет удовлетворять условию 2 > x > 0, где x — последнее число в последовательности. Формально S = {\(x_{1}\), \(x_{2}\),..., \(x_{n}\)}, где \(x_{2}\) = \(x_{1}\)/2, \(x_{3}\) = \(x_{2}\)/2 и т.д., и 2 > \(x_{n}\) > 0.
Для каждого числа из приведенного выше списка разделить на 2 и хранить остаток в контейнере.
Теперь контейнер содержит двоичные эквивалентные биты в обратном порядке, \(b_{1}b_{2}...b_{n}\), поэтому надо изменить порядок, чтобы получить двоичное эквивалентное число, \(b_{n}...b_{2}b_{1}\).

Оценка:

Время - ???
Память - ???

Код:

def decToBinConv(x: Int): String =
  val seqOfDivByTwo = Iterator.iterate(x)(a => a / 2)
  val binList = seqOfDivByTwo
    .takeWhile(a => a > 0)
    .map(a => a % 2)
  binList.mkString.reverse

decToBinConv(8) // "1000"
decToBinConv(7) // "111"

Метрики:

Преобразование из десятичного в двоичный формат для первого миллиона чисел занимает 2 секунды.

@main def decToBinConvBench(): Unit =
  (1 to 1_000_000).foreach: i =>
    decToBinConv(i)

// CPU Time: 1905 ms
// Allocation memory size: 1,59 GB

Палиндром

Алгоритм:

Палиндром - число, буквосочетание, слово или текст, одинаково читающееся в обоих направлениях.

Оценка:

Время - ???
Память - ???

Код:

def isPalindrome(number: Long): Boolean = isPalindrome(number, 10)

// Является ли заданное число палиндромом в системе исчисления по заданному состоянию
def isPalindrome(number: Long, base: Int): Boolean =
  number == 0 || number > 0 && number % base != 0 && {
    var revertedNumber = 0L
    var k              = number
    while k > revertedNumber
    do
      revertedNumber = revertedNumber * base + k % base
      k /= base
    k == revertedNumber || k == revertedNumber / base
  }

Метрики:

Количество палиндромов в первом миллионе чисел (1998) рассчитывается меньше секунды.

@main def isPalindromeBench(): Unit =
  println((1 to 1000000).count(isPalindrome))
      
// CPU Time: 312 ms
// Allocation memory size: 24,15 MB

Ссылки: