shopProductsCollection::categoryPrepare() - 20x times faster #275

danf0rth · 2018-06-29T10:52:28Z

Немного изменил логику построения SQL запросов на выборку товаров для статических категорий.

Что изменилось и зачем это нужно:

теперь не используется JOIN + DISTINCT на огромной результирущей таблице, теперь мы сперва делаем выборку всех товаров в нужных нам категориях, затем делаем DISTINCT, после чего выбираем по ID этих товаров из таблицы shop_product
- запрос выполняется в 20 раз быстрее, если раньше на 80к товаров это было 1.84 сек., сейчас - 0.09 сек. (Delta -95.10%)
- вместе с этим, теперь быстрее выполняется запрос на подсчет количества товаров: раньше - 0.27 сек., сейчас - 0.13 сек. (Delta -51.85%)
- теперь не используется using temporary, using_filesort, в результате чего снижается дисковое I/O
мелкий рефакторинг, код для генерации алиаса вынесет в отдельный метод generateAliasForTable

Количество данных:
shop_product: 82066
shop_category_products: 165121

ВАЖНО: т.к. код не покрыт тестами, быстро проверить работоспособность невозможно. Немного потыкал, посравнивал результаты запросов - визуально все ок, нужно смотреть детальней
ВАЖНО: этот PR зависит от этого, т.к. используется метод waDbQuery::getSQL(), который должен быть публичным.
ВАЖНО: производительность на маленьких таблицах не мерил, там, где JOIN + DISTINCT может влезть в буфер, запрос теоретически может работать быстрее, но не на столько, на сколько выигрывает в скорости на больших данных запрос из этого PR.

Есть небольшие косяки в PHPDoc, чуть позже поправлю.

@Leonix, @SergeR, @ZloyTip, @WinterSilence

По мотивам этой темы: https://support.webasyst.ru/27218/medlennaya-skorost-raboty-s-bolshim-kolichestvo-tovarov-pravit-dvizhok-/

…imes faster Немного изменена логика запроса в БД. Теперь, вместо того чтобы JOIN-ть большие таблицы, мы сначала делаем выборку товаров, присутствующих в нужных категориях, а затем эту выборку JOIN-им с shop_product таблицей. Что это нам дает: * отпимизатор больше не использует using_temporary, using_filesort, из-за этого снижается дисковая нагрузка * обычный запрос (без ручной сортировки) выполняется на 95% быстрее (20-кратное ускорение), если раньше на 80к товаров это было 1.84 сек, сейчас - 0.09 сек. * также ускорился COUNT запрос * в ручной сортировке также немного ускорился запрос, т.к. DISTINCT делается в простом подзапросе без джойнов, когда результирующий размер таблицы ещё не такой большой и влезает в буфер Также был проделан небольшой рефакторинг, например, получение алиаса таблицы вынесено в отдельный метод. ВНИМАНИЕ: так как код не покрыт тестами, нет никаких гарантий что где-то что-то не всплывет. Поэтому, нужно тщательно проверить.

SergeR · 2018-12-07T00:09:18Z

Очень надеюсь, что это будет в основном коде. Хоть когда-нибудь 😢

danf0rth · 2018-12-07T13:35:54Z

@SergeR в идеале, переделать логику хранения товаров в категориях как я описал тут. Так будет на порядок быстрее и проще делать выборки, без IN(), DISTINCT, смс и регистраций.

То что в этом PR это скорее временная мера для жирных магазинов.

SergeR · 2018-12-07T13:53:45Z

@SergeR в идеале, переделать логику хранения товаров в категориях как я описал тут. Так будет на порядок быстрее и проще делать выборки, без IN(), DISTINCT, смс и регистраций.

То что в этом PR это скорее временная мера для жирных магазинов.

Держать дубли товаров -- это вообще не по феншую совсем.

WinterSilence · 2018-12-09T19:19:29Z

@SergeR мы говорим о реляционных субд, а конкретнее про мускул, поэтому при большой нагрузке дублирование данных выгоднее номализации. Учи мат.часть.

danf0rth added 3 commits June 28, 2018 11:45

Add DISTINCT in queries with no 'sort' param

2723283

Fix $distinct param in addJoinSubquery, fix PHPDoc

cbc5455

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

shopProductsCollection::categoryPrepare() - 20x times faster #275

shopProductsCollection::categoryPrepare() - 20x times faster #275

Uh oh!

danf0rth commented Jun 29, 2018 •

edited

Loading

Uh oh!

SergeR commented Dec 7, 2018

Uh oh!

danf0rth commented Dec 7, 2018

Uh oh!

SergeR commented Dec 7, 2018

Uh oh!

WinterSilence commented Dec 9, 2018

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

shopProductsCollection::categoryPrepare() - 20x times faster #275

Are you sure you want to change the base?

shopProductsCollection::categoryPrepare() - 20x times faster #275

Uh oh!

Conversation

danf0rth commented Jun 29, 2018 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

SergeR commented Dec 7, 2018

Uh oh!

danf0rth commented Dec 7, 2018

Uh oh!

SergeR commented Dec 7, 2018

Uh oh!

WinterSilence commented Dec 9, 2018

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

danf0rth commented Jun 29, 2018 •

edited

Loading