@praxiscodeio: Как Google и Яндекс экономят миллионы на проверке никнеймов 🕵️ Покажем, как Фильтр Блума помогает Google и Яндекс мгновенно проверять никнеймы без похода в БД: битовый массив + несколько хешей. Короткий разбор и рабочий пример на Go. #golang #программирование #алгоритмы #datastructures #bloompartner #фильтрблума #backend #godev #computerscience #системныйдизайн #оптимизация #перфоманс #hashing #базыданных #it #разработчик

Praxis 🧑‍💻
Praxis 🧑‍💻
Open In TikTok:
Region: MY
Saturday 15 November 2025 07:23:28 GMT
659385
45326
183
4139

Music

Download

Comments

dexedrine0
dexedrine0 :
самый крутой никнейм это "DROP DATABASE"
2025-11-15 14:15:43
3063
aleksandrb_
AleksandrB_ :
а что сложно милиард проверить? для современых компьютеров это вроде пустяуки.
2025-11-17 21:21:24
4
dck2511
dck2511 :
А бор сделать?
2025-11-15 10:31:41
1
gigazisa
Maestro :
т.е получается,что когда я ввожу никнейм,который типа занят,может быть на самом деле не занят и мне просто не повезло,что хеши совпали с уже существующим ником?
2025-11-15 09:43:52
4715
genofsenco
GenOfSenco :
я думал там строится как дерево по символам, по мере ввода дерево двигается и к концу ввода мы приходим к листику дерева есть ли такой ник... так зотя бы точно определяется, а у вас выходит с вероятностью совпадения кеша.. с другой стороны это правда эффективно
2025-11-15 10:38:53
88
whaaaaaaaaaaaaaaaaao
Whao :
Хорошо, а что если false positive? Все равно же надо перепроверить данные
2025-11-15 10:00:13
6
gorilla_hleb
golgolgol :
слишком много букв , больше 3х строк не перевариваю users = list() user = input() if user in users:
2026-01-12 00:19:46
2
mrpronya
pronya :
Настолько хорошо обтясняешь что не понятен сам алгоритм
2025-11-15 13:08:53
105
linferny
Sergey Bayramov :
Спасибо за инфу, полезное знание
2025-11-15 09:18:07
67
arlykkatyk
isee :
интересно на практике узнать разницу в скорости этого фильтра и поиск по индексу
2025-11-15 10:41:53
7
alexey.lugovoy
Alexey :
в любом случае никто миллион записей не перебирает а используют хешмапу или btree в качестве индекса, сложность определения коллизии будет O(log n) - в данном случае 7, и как полезный бонус который дает эта структура - можно сразу же подсказать пару-тройку похожих имен которые ТОЧНО не заняты проверив соседние ветки дерева
2025-11-15 14:20:50
6
mansheev
Нанзыд Маншеев :
похоже на бинарный поиск 🤔
2025-11-15 09:54:12
6
idnwtwrhfugtfo
idnwtwrhfugtfo :
Так индексы в бд же есть…
2025-11-25 12:27:55
2
user296980530
Sergey 😁 :
Вы тут объясняете хэширование, там где нужно объяснять индексацию.
2025-11-16 04:11:29
30
marklusik
marklusik :
видимо такое очень в крупных корпорациях с миллиардом записей, потому что у нас по 9 миллионам записей монго поиск имени идёт доли секунды
2025-11-15 09:52:45
138
_fungy
Fungy :
фильтр Блума-это очень извилистая дорожка, на которую не стоит сильно заглядываться. тут нужно почувствовать некую грань, когда он вам действительно нужен. Хороший пример это уникальный id роликов в ютубе или тиктоке. с логинами не стоит так заморачиваться. просто для справки, если у вас 1млрд пользователь то на это в среднем нужно всего лишь 6 ГБ оперативки чтобы сохранить мапку всех логинов. даже так не стоит парится для современной БД 1млрд записей это не сильно много. это в худшем случае 30 итераций по дереву индексов - это ничто.
2025-11-15 19:40:39
44
duckduckx6
duckduckx :
В чем проблемма проверить в бд если навесить хеш индекс? O(1) - нахрена тут фильтр блума?) никто так не делает
2025-11-16 12:05:06
16
sliva1707
Sliva :
просто сделал ключ по имени уникальным, и не надо ничего искать. Пробуешь вставить в БД, ошибка = имя занято, нет ошибки = свободно.
2025-11-15 10:17:27
92
gidrocefalni_petyshara
Крутой :
я всё равно нихрена не понял
2025-11-25 11:01:35
1
d4122y
Дарья Ололоева :
Не каталог, а каталог.
2025-12-01 23:49:39
1
burmipxtj2u
bubmik23 :
так это не отвечает на вопрос "этот ник уже занят". это отвечает на вопрос "ник 100% не занят"
2025-11-15 14:24:07
2
quattro860
джесне пикма :
Программирование это поиск элегантных решений для сложных проблем… Очень точное описание👍🏻👍🏻👍🏻
2025-11-17 10:03:26
1
vladimirkrasnozhon
LingLingUA :
спасибо.
2025-11-15 11:57:34
1
romario.b10
ㅤ :
А почему не используют БОР? Все буквы добавляют в конец, а значит обработка новой буквы займет условно меньше 100*Const, а если эта ветка раньше не существовала, то ответ - гарантированно свободно мгновенно. По памяти это конечно не оч экономично, но не очень ужасно.
2025-11-15 22:19:51
2
baikawdasd
baikawdasd :
Спасибо
2025-11-15 09:04:00
3
To see more videos from user @praxiscodeio, please go to the Tikwm homepage.

Other Videos


About