«ИЗВЕСТИЯ ИРКУТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА». СЕРИЯ «МАТЕМАТИКА»
«IZVESTIYA IRKUTSKOGO GOSUDARSTVENNOGO UNIVERSITETA». SERIYA «MATEMATIKA»
«THE BULLETIN OF IRKUTSK STATE UNIVERSITY». SERIES «MATHEMATICS»
ISSN 1997-7670 (Print)
ISSN 2541-8785 (Online)

Список выпусков > Серия «Математика». 2026. Том 56

Оптимизация запросов через сходство планов выполнения на основе больших языковых моделей без обучения

Автор(ы)

Н. К. Василенко1, А. В. Демин1, В. С. Бурлаков2

Институт систем информатики им. А. П. Ершова, Новосибирск, Российская Федерация 

Московский государственный университет им. М. В. Ломоносова, Москва, Российская Федерация 

Аннотация
Отмечается, что векторные представления, получаемые большими языковыми моделями, открывают многообещающее направление в оптимизации запросов к базам данных. Исследуется, как векторные представления планов выполнения, полученные предобученной моделью, могут направлять исполнение SQLзапросов без необходимости дополнительного обучения. Представляется LLM-based Plan Mapping (LLM-PM) — фреймворк, который кодирует стандартный план выполнения запроса, находит его 𝑘 ближайших соседей среди ранее выполненных планов и на основе «голосования по окрестности» рекомендует набор подсказок оптимизатору. Облегчённая проверка согласованности валидирует выбранную подсказку, а при необходимости резервный механизм выполняет поиск по всему пространству подсказок. В экспериментах на бенчмарке JOB-CEB в системе openGauss LLM-PM в среднем сокращает задержку выполнения запросов на 21 %.
Об авторах

Василенко Никита Константинович, аспирант, Институт систем информатики им. А. П. Ершова СО РАН, Новосибирск, 630090, Российская Федерация, vasilenko.nikita.research@gmail.com, https://orcid.org/0009-0003-8727-3000 

Демин Александр Викторович, канд. физ.-мат. наук, Институт систем информатики им. А. П. Ершова СО РАН, Новосибирск, 630090, Российская Федерация, alexandredemin@yandex.ru, https://orcid.org/0000-0002-2535-2016

Бурлаков Владимир Сергеевич,мл. науч. сотр., Исследовательский Центр в сфере искусственного интеллекта МГУ, vladimir.boorlakov@gmail.com, https://orcid.org/0009-0009-1738-9239

Ссылка для цитирования
Vasilenko N. K., Demin A. V., Burlakov V. S. TrainingFree Query Optimization via LLM-Based Plan Similarity // Известия Иркутского государственного университета. Серия Математика. 2026. Т. 56. C. 113–128. https://doi.org/10.26516/1997-7670.2026.56.113
Ключевые слова
оптимизация запросов, LLM для баз данных, подсказки баз данных
УДК
004.657:004.8
MSC
68P15, 68T07
DOI
https://doi.org/10.26516/1997-7670.2026.56.113
Литература
  1. Akioyamen P., Yi Z., Marcus R. The Unreasonable Effectiveness of LLMs for Query Optimization. arXiv e-prints, Nov. 2024, arXiv:2411.02862.
  2. Ivanov O., Bartunov S. Adaptive query estimation. arXiv e-prints, Nov. 2017, arXiv:1711.08330.
  3. Kipf A., Kipf T., Radke B., Leis V., Boncz P., Kemper A. Learned Cardinalities: Estimating Correlated Joins with Deep Learning. arXiv e-prints, Sept. 2018, arXiv:1809.00677.
  4. Li Z., Yuan H., Wang H., Cong G., Bing L. LLM-R2: A Large Language Model Enhanced Rule-based Rewrite System for Boosting Query Efficiency. arXiv e-prints, Apr. 2024, arXiv:2404.12872.
  5. Marcus R., Negi P., Mao H., Zhang C., Alizadeh M., Kraska T., Papaemmanouil O., Tatbul N. Neo: a learned query optimizer. Proc. VLDB Endowment, 2019, vol. 12, pp. 1705–1718.
  6. Negi P., Marcus R., Kipf A., Mao H., Tatbul N., Kraska T., Alizadeh M. Flow-loss: learning cardinality estimates that matter. Proc. VLDB Endowment, 2021, vol. 14, pp. 2019–2032.
  7. Tan J., Zhao K., Li R., Yu J., Piao C., Cheng H., Meng H., Zhao D., Rong Y. Can Large Language Models Be Query Optimizer for Relational Databases? arXiv e-prints, Feb. 2025, arXiv:2502.05562.
  8. Vasilenko N. K, Demin A. V, Ponomaryov D. K Adaptive Cost Model for Query Optimization. The Bulletin of Irkutsk State University. Series Mathematics, 2025, vol. 52, pp. 137–152. https://doi.org/10.26516/1997-7670.2025.52.137
  9. Woltmann L., Hartmann C., Thiele M., Habich D., Lehner W. Cardinality estimation with local deep learning models. Proceedings of the second international workshop on exploiting artificial intelligence techniques for data management, 2019, pp. 1–8.
  10. Woltmann L., Thiessat J., Hartmann C., Habich D., Lehner W. FASTgres: Making Learned Query Optimizer Hinting Effective. Proc. VLDB Endowment, 2023, vol. 16, pp. 3310–3322.
  11. Xu X., Zhao Z., Zhang T., Kang R., Sun L., Chen J. Coool: A learning-to-rank approach for sql hint recommendations. arXiv e-prints, Apr. 2023, arXiv:2304.04407.
  12. Zhu R., Chen W., Ding B., Chen X., Pfadler A., Wu Z., Zhou J. Lero: A learning-to-rank query optimizer. Proc. VLDB Endowment, 2023, vol. 16, pp. 1466–1479.

Полная версия (english)