Выбор типа дерева (структура данных) для хранения данных в БД

Воскресенье, 28 Июня 2020 г. 02:32 + в цитатник

FasterHarder: Все, проблема решена! 1800+ строк кода, функций стало еще больше + они стали сложнее местами гораздо (где-то 450 строк взял из 1ой версии).
Все реализовал на чистейшей динамике. Все статические строковые массивы (марка и пр.) заменил на char * с выделением дин. памяти. Кол-во указателей какое-то дичайшее получилось.

Сделал тесты на 10 авто, 100, 1000, 10 000, 100 000, 1 000 000, 5 000 000, 25 000 000 (файлик текстовый весит 2.5+ Гигов). Во всех случаях поиск МГНОВЕННЫЙ. Как я понимаю, замеряем время до нахождения первого блока искомых данных (а потом они идут все последовательно, благодаря списку ссылок из узла дерева). От 5млн. комп начинает терять сознание, на 25млн. завис наглушняк (оперативку забрал всю теор.возможную) - ребут пришлось делать.

Самая тяжелая операция: загрузка данных в память. Для 1млн. длится несколько минут(даже вроде больше 10 длилось). При очистке памяти аналогично.
Производительность по сравнению с 1ой версии увеличена в +бесконечность (особенно при увеличении объема входных данных).

Если добавить балансировку главного дерева (вспомогательных бессмысленно, вроде), можно еще ускорить поиск, например (по коду, хотя на 1млн. авто поиск коду был ПОЧТИ мгновенным, правда не тестировал вырожденные случаи), но балансировать дерево даже на 1млн. авто - жесть.

Как я понимаю, ускорить импорт данных не представляется возможным. Фундаментально структуру входных файлов не изменить.
Вижу лишь единственный полуминус - данные как бы пришлось закачивать в двойном экземпляре в память (всего лишь в двойном!!). С другой стороны, ну, вот, например, марка машины "Jaguar", занимаем 7байт информации. Если заменить на целое число, то будет 4байта (или 2 байта). Благодаря указателям (char*) на каждое строковое данное было использовано минимально требуемое число памяти, не сильно превышающее числовой код (раньше была константа = 100 символам для всех строк, кроме краткого описания, там было под 500). Тут все как бы оптимально!

Кардинально программу уже менять стопудова не придется, т к:
и тай сойдет (с) - и реально сойдет!

P.S. сложно проводить тесты на больших объемах данных, нужен супермощный комп с дичайшим объемом ОЗУ...

https://forum.sources.ru/index.php?showtopic=419028&view=findpost&p=3833343

Метки: Алгоритмы

<a href="https://www.liveinternet.ru/users/rss_forum_sources_ru/post471927988/">Р’С‹Р±РѕСЂ С‚РёРїР° РґРµСЂРµРІР° (СЃС‚СЂСѓРєС‚СѓСЂР° РґР°РЅРЅС‹С…) РґР»СЏ С…СЂР°РЅРµРЅРёСЏ РґР°РЅРЅС‹С… РІ Р‘Р”</a><br/>FasterHarder: Р’СЃРµ, РїСЂРѕР±Р»РµРјР° СЂРµС€РµРЅР°! 1800+ СЃС‚СЂРѕРє РєРѕРґР°, С„СѓРЅРєС†РёР№ СЃС‚Р°Р»Рѕ РµС‰Рµ Р±РѕР»СЊС€Рµ + РѕРЅРё СЃС‚Р°Р»Рё СЃР»РѕР¶РЅРµРµ РјРµСЃС‚Р°РјРё РіРѕСЂР°Р·РґРѕ (РіРґРµ-С‚Рѕ 450 СЃС‚СЂРѕРє РІР·СЏР» РёР· 1РѕР№ РІРµСЂСЃРёРё).Р’СЃРµ СЂРµР°Р»РёР·РѕРІР°Р» РЅР° С‡РёСЃС‚РµР№С€РµР№ РґРёРЅР°РјРёРєРµ. Р’СЃРµ СЃС‚Р°С‚РёС‡РµСЃРєРёРµ СЃС‚СЂРѕРєРѕРІС‹Рµ РјР°СЃСЃРёРІС‹ (РјР°СЂРєР° Рё РїСЂ.) Р·Р°РјРµРЅРёР» РЅР° char * СЃ РІС‹РґРµР»РµРЅРёРµРј РґРёРЅ. РїР°РјСЏС‚Рё. РљРѕР»-РІРѕ СѓРєР°Р·Р°С‚РµР»РµР№ РєР°РєРѕРµ-С‚Рѕ РґРёС‡Р°Р№С€РµРµ РїРѕР»СѓС‡РёР»РѕСЃСЊ.РЎРґРµР»Р°Р» С‚РµСЃС‚С‹ РЅР° 10 Р°РІС‚Рѕ, 100, 1000, 10 000, 100 000, 1 000 000, 5 000 000, 25 000 000 (С„Р°Р№Р»РёРє С‚РµРєСЃС‚РѕРІС‹Р№ РІРµСЃРёС‚ 2.5+ Р“РёРіРѕРІ). Р’Рѕ РІСЃРµС… СЃР»СѓС‡Р°СЏС… РїРѕРёСЃРє РњР“РќРћР’Р•РќРќР«Р™. РљР°Рє СЏ РїРѕРЅРёРјР°СЋ, Р·Р°РјРµСЂСЏРµРј РІСЂРµРјСЏ РґРѕ РЅР°С…РѕР¶РґРµРЅРёСЏ РїРµСЂРІРѕРіРѕ Р±Р»РѕРєР° РёСЃРєРѕРјС‹С… РґР°РЅРЅС‹С… (Р° РїРѕС‚РѕРј РѕРЅРё РёРґСѓС‚ РІСЃРµ РїРѕСЃР»РµРґРѕРІР°С‚РµР»СЊРЅРѕ, Р±... <a href="https://www.liveinternet.ru/users/rss_forum_sources_ru/post471927988/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Поиск по дневнику

-Подписка по e-mail

-Постоянные читатели

-Статистика

Выбор типа дерева (структура данных) для хранения данных в БД