Эталон тестирования продукта — разбор подхода SQLite

01корректность

Функциональная корректность

Базовый слой: даёт ли движок правильный ответ на правильный вход.

Принцип: Миллионы параметризованных кейсов покрывают штатные сценарии. Дёшево, быстро, обязательно.
Как у SQLite: Подмножество veryquick (~304 тыс. кейсов) гоняется перед каждым коммитом — достаточно, чтобы поймать большинство ошибок за минуты.
Что ловит: Регрессии в основной логике, очевидные поломки, ошибки в новой фиче на штатных данных.

02корректность

Дифференциальный оракул

Как проверить правильность ответа, когда вручную прописать его невозможно.

Принцип: Один и тот же вход подаётся в несколько независимых реализаций; расхождение = баг хотя бы в одной.
Как у SQLite: 7.2 млн SQL-запросов прогоняются против SQLite и четырёх других СУБД; ответы сверяются автоматически.
Что ловит: Тонкие ошибки семантики, где код «работает», но считает не то — и где нет заранее известного эталона.

03корректность

Граничные значения

Большинство багов живёт на краях диапазонов, а не в их середине.

Принцип: Целенаправленно толкать систему ровно к её пределам — и на шаг за них.
Как у SQLite: Тесты на макс. число столбцов, длину SQL, переполнение integer. Макрос testcase() гарантирует, что покрыты обе стороны каждой границы.
Что ловит: Off-by-one, переполнения, некорректную обработку «ровно на пределе» и «чуть за пределом».

04устойчивость к сбоям

Аномальное тестирование

Поведение, когда отказывает окружение: память, диск, питание.

Принцип: Не «случается ли сбой когда-нибудь», а детерминированно перебрать каждую точку, где сбой возможен.
Как у SQLite: Подменный malloc() падает на N-й аллокации; подменный VFS симулирует отказ диска и потерю питания, переупорядочивая и портя несинхронизированные записи. В цикле точка отказа сдвигается, пока операция не пройдёт целиком. После каждого прогона — integrity_check.
Что ловит: Утечки и порчу данных при OOM, ошибках ввода-вывода и крахах. Отдельно — составные сбои: ошибка ввода-вывода во время восстановления после прошлого краха.

05устойчивость к атаке

Fuzz-тестирование

Устойчивость к враждебному, бессмысленному и злонамеренному вводу.

Принцип: Профиль-направленный фаззер инструментирует код, генерирует мутации входа и сохраняет те, что открыли новый путь исполнения, — затем мутирует их дальше. Так находятся состояния, которые не предусмотрел ни один разработчик.
Как у SQLite: Путь от AFL (2015) к libFuzzer. dbsqlfuzz мутирует SQL и файл БД сразу; jfuzz портит JSONB-блобы; сторонние фаззеры (напр. М. Риггера) находят не падения, а неверные ответы. «Интересные» исторические кейсы прогоняются на каждом make test через fuzzcheck.
Что ловит: Падения, переполнения буфера, неопределённое поведение и редкие неверные ответы на корректном, но безумном вводе.

06устойчивость к атаке

Повреждённые данные

Что делает движок, когда ему подсовывают битый файл хранилища.

Принцип: Сборка должна корректно отклонять повреждённый вход, а не падать на нём.
Как у SQLite: Берётся корректный файл БД, байты портятся в обход движка, затем файл читается. Проверяется, что ошибка формата ловится и сообщается кодом SQLITE_CORRUPT без переполнений буфера и разыменования NULL.
Что ловит: Уязвимости при чтении недоверенных или испорченных данных — классический вектор атаки.

07внутренние инварианты

Динамический анализ

Проверки, встроенные внутрь кода и работающие во время исполнения.

Принцип: Код сам непрерывно проверяет свои предположения, пока выполняется, — а не только постфактум по результату.
Как у SQLite: 6754 assert() на пред/постусловия и инварианты циклов (в debug-сборке; в проде выключены — с ними движок втрое медленнее). Прогоны под Valgrind. Проверки неопределённого поведения: -fsanitize=undefined, -ftrapv, /RTC1, на 32/64-бит и big/little-endian. Авто-детект утечек памяти, дескрипторов и мьютексов на каждом прогоне.
Что ловит: Нарушенные инварианты, выходы за границы массива, чтение неинициализированной памяти, утечки, неопределённое поведение C.

08необратимость прогресса

Регрессионное тестирование

Однажды исправленный баг не должен вернуться никогда.

Принцип: Баг не считается исправленным, пока не написан тест, который его воспроизводил.
Как у SQLite: Каждый отчёт о баге превращается в постоянный кейс в TCL или TH3. За годы — тысячи таких тестов.
Что ловит: Повторное появление уже известных ошибок. Особенно критично для БД, которая «помнит» прошлые ошибки в данных.

// слои 01–03 → корректность · 04–06 → устойчивость · 07–08 → внутренняя дисциплина

Как тестируют продукт, который
нельзя позволить себе сломать

Надёжность — это не обещание, а побочный продукт процесса

Не один большой набор тестов, а четыре независимых

Восемь уровней тестирования

Функциональная корректность

Дифференциальный оракул

Граничные значения

Аномальное тестирование

Fuzz-тестирование

Повреждённые данные

Динамический анализ

Регрессионное тестирование

Что на самом деле значит «100% покрытие»

Последний рубеж — это человек со списком

Лестница зрелости, а не чек-лист на завтра

Каждый баг → постоянный регрессионный тест

Тестировать сбои, а не только happy path

Разнообразие проверок важнее их объёма

Дифференциальный оракул, когда есть с чем сверять

Branch coverage честнее statement coverage

Человек в релизном контуре

Этот сайт построен по этой карте

Цена ошибки у вас своя —
но карта обороны одна

Как тестируют продукт, которыйнельзя позволить себе сломать

Надёжность — это не обещание, а побочный продукт процесса

Не один большой набор тестов, а четыре независимых

Восемь уровней тестирования

Функциональная корректность

Дифференциальный оракул

Граничные значения

Аномальное тестирование

Fuzz-тестирование

Повреждённые данные

Динамический анализ

Регрессионное тестирование

Что на самом деле значит «100% покрытие»

Последний рубеж — это человек со списком

Лестница зрелости, а не чек-лист на завтра

Каждый баг → постоянный регрессионный тест

Тестировать сбои, а не только happy path

Разнообразие проверок важнее их объёма

Дифференциальный оракул, когда есть с чем сверять

Branch coverage честнее statement coverage

Человек в релизном контуре

Этот сайт построен по этой карте

Цена ошибки у вас своя — но карта обороны одна

Как тестируют продукт, который
нельзя позволить себе сломать

Цена ошибки у вас своя —
но карта обороны одна