Оптимизация запросов через сходство планов выполнения на основе больших языковых моделей без обучения

Н. К. Василенко; А. В. Демин; В. С. Бурлаков

Список выпусков > Серия «Математика». 2026. Том 56

Оптимизация запросов через сходство планов выполнения на основе больших языковых моделей без обучения

Автор(ы)

Н. К. Василенко¹, А. В. Демин¹, В. С. Бурлаков²

¹Институт систем информатики им. А. П. Ершова, Новосибирск, Российская Федерация

²Московский государственный университет им. М. В. Ломоносова, Москва, Российская Федерация

Аннотация

Отмечается, что векторные представления, получаемые большими языковыми моделями, открывают многообещающее направление в оптимизации запросов к базам данных. Исследуется, как векторные представления планов выполнения, полученные предобученной моделью, могут направлять исполнение SQLзапросов без необходимости дополнительного обучения. Представляется LLM-based Plan Mapping (LLM-PM) — фреймворк, который кодирует стандартный план выполнения запроса, находит его 𝑘 ближайших соседей среди ранее выполненных планов и на основе «голосования по окрестности» рекомендует набор подсказок оптимизатору. Облегчённая проверка согласованности валидирует выбранную подсказку, а при необходимости резервный механизм выполняет поиск по всему пространству подсказок. В экспериментах на бенчмарке JOB-CEB в системе openGauss LLM-PM в среднем сокращает задержку выполнения запросов на 21 %.

Об авторах

Василенко Никита Константинович, аспирант, Институт систем информатики им. А. П. Ершова СО РАН, Новосибирск, 630090, Российская Федерация, vasilenko.nikita.research@gmail.com, https://orcid.org/0009-0003-8727-3000

Демин Александр Викторович, канд. физ.-мат. наук, Институт систем информатики им. А. П. Ершова СО РАН, Новосибирск, 630090, Российская Федерация, alexandredemin@yandex.ru, https://orcid.org/0000-0002-2535-2016

Бурлаков Владимир Сергеевич,мл. науч. сотр., Исследовательский Центр в сфере искусственного интеллекта МГУ, vladimir.boorlakov@gmail.com, https://orcid.org/0009-0009-1738-9239

Ссылка для цитирования

Vasilenko N. K., Demin A. V., Burlakov V. S. TrainingFree Query Optimization via LLM-Based Plan Similarity // Известия Иркутского государственного университета. Серия Математика. 2026. Т. 56. C. 113–128. https://doi.org/10.26516/1997-7670.2026.56.113

Ключевые слова

оптимизация запросов, LLM для баз данных, подсказки баз данных

УДК

004.657:004.8

MSC

68P15, 68T07

DOI

https://doi.org/10.26516/1997-7670.2026.56.113

Литература

Akioyamen P., Yi Z., Marcus R. The Unreasonable Effectiveness of LLMs for Query Optimization. arXiv e-prints, Nov. 2024, arXiv:2411.02862.
Ivanov O., Bartunov S. Adaptive query estimation. arXiv e-prints, Nov. 2017, arXiv:1711.08330.
Kipf A., Kipf T., Radke B., Leis V., Boncz P., Kemper A. Learned Cardinalities: Estimating Correlated Joins with Deep Learning. arXiv e-prints, Sept. 2018, arXiv:1809.00677.
Li Z., Yuan H., Wang H., Cong G., Bing L. LLM-R2: A Large Language Model Enhanced Rule-based Rewrite System for Boosting Query Efficiency. arXiv e-prints, Apr. 2024, arXiv:2404.12872.
Marcus R., Negi P., Mao H., Zhang C., Alizadeh M., Kraska T., Papaemmanouil O., Tatbul N. Neo: a learned query optimizer. Proc. VLDB Endowment, 2019, vol. 12, pp. 1705–1718.
Negi P., Marcus R., Kipf A., Mao H., Tatbul N., Kraska T., Alizadeh M. Flow-loss: learning cardinality estimates that matter. Proc. VLDB Endowment, 2021, vol. 14, pp. 2019–2032.
Tan J., Zhao K., Li R., Yu J., Piao C., Cheng H., Meng H., Zhao D., Rong Y. Can Large Language Models Be Query Optimizer for Relational Databases? arXiv e-prints, Feb. 2025, arXiv:2502.05562.
Vasilenko N. K, Demin A. V, Ponomaryov D. K Adaptive Cost Model for Query Optimization. The Bulletin of Irkutsk State University. Series Mathematics, 2025, vol. 52, pp. 137–152. https://doi.org/10.26516/1997-7670.2025.52.137
Woltmann L., Hartmann C., Thiele M., Habich D., Lehner W. Cardinality estimation with local deep learning models. Proceedings of the second international workshop on exploiting artificial intelligence techniques for data management, 2019, pp. 1–8.
Woltmann L., Thiessat J., Hartmann C., Habich D., Lehner W. FASTgres: Making Learned Query Optimizer Hinting Effective. Proc. VLDB Endowment, 2023, vol. 16, pp. 3310–3322.
Xu X., Zhao Z., Zhang T., Kang R., Sun L., Chen J. Coool: A learning-to-rank approach for sql hint recommendations. arXiv e-prints, Apr. 2023, arXiv:2304.04407.
Zhu R., Chen W., Ding B., Chen X., Pfadler A., Wu Z., Zhou J. Lero: A learning-to-rank query optimizer. Proc. VLDB Endowment, 2023, vol. 16, pp. 1466–1479.

Список выпусков > Серия «Математика». 2026. Том 56

Оптимизация запросов через сходство планов выполнения на основе больших языковых моделей без обучения

Полная версия (english)