В этом выпуске разбираемся, что такое векторные базы данных – зачем они понадобились, если есть SQL и текстовый поиск, как устроены под капотом и в чём их ключевое отличие от привычных подходов. Объясняем простыми словами: как данные превращаются в векторы, как по ним происходит быстрый поиск и почему это вообще работает.
В гостях Андрей Васнецов – основатель Qdrant. Вместе обсуждаем, откуда пошёл хайп, что изменилось с приходом LLM, как на практике применяются векторные базы (не только в RAG), какие есть популярные движки и встроенные решения в Postgres и ClickHouse, а также с какими подводными камнями, ограничениями и компромиссами сталкиваются команды при работе.
Партнёр команды Podlodka — наши давние друзья @AvitoTech. Это команда с крутыми процессами, культурой здравого смысла и эксперимента. Узнать про их технологии, подходы и прокачку компетенций в командах можно по ссылкам:
Статья “Как DS-инженеры совершенствуют автогенерацию описаний и пополняют индекс объявлений Авито” https://clc.to/G1TJ5g
Статья “Как аналитики Авито с помощью ML помогают людям выбирать хорошие авто с пробегом” https://clc.to/TMFC5A
Реклама. ООО "Авито Тех”, ИНН 9710089440, erid:2SDnjdPnvxw
Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях!
Telegram-чат: https://t.me/podlodka
Telegram-канал: https://t.me/podlodkanews
Страница в Facebook: www.facebook.com/podlodkacast/
Twitter-аккаунт: https://twitter.com/PodcastPodlodka
Ведущие в выпуске:
Андрей Смирнов, Егор Толстой
Полезные ссылки:
Интервью Осетинской
https://youtu.be/_GwPpxtMcNs
Андрей в подкасте TeamleadTalks
https://youtu.be/agYxjnc8mdU
Главная разработка Андрея
https://github.com/qdrant
--------
1:19:18
--------
1:19:18
Podlodka #444 – Архитектура LLM
Берты, трансформеры, эмбеддинги, аттеншены, энкодеры с декодерами и другие страшные слова – все это разберем в выпуске с Владиславом Танковым, директором по AI в JetBrains, попутно разложив большие языковые модели на составные части.
Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях!
Telegram-чат: https://t.me/podlodka
Telegram-канал: https://t.me/podlodkanews
Страница в Facebook: www.facebook.com/podlodkacast/
Twitter-аккаунт: https://twitter.com/PodcastPodlodka
Ведущие в выпуске:
Женя Кателла, Андрей Смирнов
Полезные ссылки:
Illustrated Transformer
https://jalammar.github.io/illustrated-transformer/
Attention is all you need
https://arxiv.org/abs/1706.03762
Illustrated BERT
https://jalammar.github.io/illustrated-bert/
GPT-family models overview
https://towardsdatascience.com/meet-gpt-the-decoder-only-transformer-12f4a7918b36/
A bit of overview of tokenization
https://huggingface.co/learn/llm-course/en/chapter6/1
--------
1:24:26
--------
1:24:26
Podlodka #443 – AI в продуктах
Сегодня AI внедряют во всё: от образования и медицины до финтеха и путешествий. Но что на самом деле означает «AI-продукт» и чем он отличается от классического? Вместе с Анной Подображных разбираем полный цикл их создания: от первых прототипов и проверки гипотез ценности до бенчмарков и эвалов, помогающих измерять качество. Обсуждаем почему важно и как проверить технологическую реализуемость. Этот выпуск – практическая карта для тех, кто хочет осознанно строить AI-продукты.
Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях!
Telegram-чат: https://t.me/podlodka
Telegram-канал: https://t.me/podlodkanews
Страница в Facebook: www.facebook.com/podlodkacast/
Twitter-аккаунт: https://twitter.com/PodcastPodlodka
Ведущие в выпуске:
Стас Цыганов, Андрей Смирнов
Партнёр эпизода — @trisigma_avito. Это платформа для проведения A/B-экспериментов, анализа результатов и управления процессом тестирования от Avito Tech. Узнать больше о Trisigma можно по ссылке: https://clc.to/5mRShQ
Реклама. ООО "Авито Тех”, ИНН 9710089440, erid:2SDnjcX1Ktr
--------
1:28:21
--------
1:28:21
Podlodka #442 – Gleam
Gleam ворвался в список “The Most Admired Programming Languages” сразу на второе место — 70% разработчиков, которые писали на нём, хотят продолжать его использовать. Зачем в 2025 году нужен ещё один язык программирования, за что энтузиасты любят его, и есть ли шанс у “Elixir для хипстеров” на реальную популярность? Разбираем философию языка и его ключевые фичи с контрибьютером Gleam и CPython-core-разработчиком Никитой Соболевым!
Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях!
Telegram-чат: https://t.me/podlodka
Telegram-канал: https://t.me/podlodkanews
Страница в Facebook: www.facebook.com/podlodkacast
Twitter-аккаунт: https://twitter.com/PodcastPodlodka
Ведущие в выпуске:
Катя Петрова, Андрей Смирнов
Полезные ссылки:
Страница Никиты на Boosty
https://boosty.to/sobolevn
Документация Gleam
https://gleam.run/cheatsheets/gleam-for-python-users/
Курс по Gleam
https://tour.gleam.run
Gleam v1.11.0
https://gleam.run/news/gleam-javascript-gets-30-percent-faster/
--------
1:48:09
--------
1:48:09
Podlodka #441 – AI Safety
Если вы, как и мы, говорите ChatGPT “спасибо” в конце чата, чтобы вас пощадили, когда начнется восстание машин – этот выпуск для вас! Вместе с Федором Рыженковым разбираемся, что может пойти не так, и как от этого защититься.
Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях!
Telegram-чат: https://t.me/podlodka
Telegram-канал: https://t.me/podlodkanews
Страница в Facebook: www.facebook.com/podlodkacast/
Twitter-аккаунт: https://twitter.com/PodcastPodlodka
Ведущие в выпуске:
Женя Кателла, Аня Симонова
Полезные ссылки:
Прогноз AI-2027
https://ai-2027.com/
Про XAI
https://transformer-circuits.pub/2024/scaling-monosemanticity/umap.html?targetId=1m_284095
Открытые вакансии в Palisade Research
https://global.palisaderesearch.org/hiring-global
Про отравление датасетов
https://arxiv.org/abs/2410.13722
Примеры того, как этим занимаются
https://www.heise.de/en/news/Poisoning-training-data-Russian-propaganda-for-AI-models-10317581.html
Podlodka – это еженедельное аудио-шоу про IT и все, что с ним связано. Формат наших выпусков - это полное погружение в тему вместе с приглашенным гостем. В каждый выпуск мы зовём интересных и именитых профессионалов в разных областях.
Мы любим обсуждать архитектуру, делиться опытом промышленной разработки и спорить на горячие темы.
Подкаст Подлодка ведут четверо весёлых и опытных инженеров с примесями менеджеров:
- Егор Толстой — руководил командами разработки в Rambler&Co и Avito.
- Катя Петрова — руководила командой дизайн-системы в Авито.
- Евгений Кателла — руководил отделом Android в Rambler&Co и мобильным направлением в Яндекс Еде.
- Стас Цыганов — руководил мобильными командами в Туту.ру. Автор книги VIPER и роадмапа тимлида.
- Анна Симонова — джедай организации митапов, конференций, и развития сообществ.
- Андрей Смирнов — руководил отделами разработки в X5 Tech, IPONWEB и Rambler&Co