{"blocks":[{"type":"paragraph","data":{"text":"Доступна первая экспериментальная сборка СУБД EuclidesDB, написанная на языке C++. Эта система позволяет задействовать модели машинного обучения во время индексирования и выборки данных из базы."}},{"type":"header3","data":{"level":3,"text":"Что умеет СУБД?"}},{"type":"paragraph","data":{"text":"К СУБД EuclidesDB можно подключать модели машинного обучения и использовать их для выдачи результатов. Это позволяет задействовать модель, которую натренировали распознавать определённые объекты на фото, после чего выбирать из базы подходящие изображения автоматически."}},{"type":"paragraph","data":{"text":"Подобное пригодится в крупных базах данных, например, для интернет-магазинов в качестве системы рекомендаций или для тех же задач в потоковых сервисах. СУБД сможет выбирать данные в зависимости от того, чем заинтересовался пользователь. При этом можно подключать несколько моделей, обученных на разные категории данных."}},{"type":"image","data":{"file":{"id":99857,"url":"https://media.tproger.ru/uploads/2018/11/arch.png"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":1216,"height":1034,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2018/11/arch.png","alt":"Выпущена СУБД EuclidesDB с элементами машинного обучения 1","dimensions":{"width":1216,"height":1034},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/3Z4t7z3tzQ6I53msLligJktxqVUGFgHgvv4rBZjL0rk/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8xMS9hcmNoLnBuZw=","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/BmEG8MVG5UEdlfZcwhnhE8aQGLCdno_3VpaBneF_pnA/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8xMS9hcmNoLnBuZw=","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/UmBbmO5VVpVI1zfCP3VreV1CdUaG714XvZh6HDC0yfU/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8xMS9hcmNoLnBuZw=","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/IYwBwkWTpKQNzVnPjgr1mPJwFWgh-SJCZXwE-PUIP3w/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8xMS9hcmNoLnBuZw=","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/P7HktLjBOE3qyv-3R1LllLMf0Mmn4fw8QkE6TE-01N8/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8xMS9hcmNoLnBuZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/md3q1XxnEOywQOlTc8WCWsEbzQXqslRAucCmJ5EUEeI/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8xMS9hcmNoLnBuZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/qECUXn3hsUiPPMxcYNMVPnwn9UuY9KRxwIFsT9a5FgQ/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8xMS9hcmNoLnBuZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/N4wZ8FSetrbn95d6audZJnspUvOjoHFXjWuuMoGynAk/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8xMS9hcmNoLnBuZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"При добавлении новых данных требуется указывать модель машинного обучения для каждого изображения. Система обрабатывает информацию и сохраняет ключ в локальное хранилище. На основе этих результатов формируется индекс запросов. В случае сходства элементов в запросе нужно указать допустимый диапазон моделей для поиска. На выходе система вернёт перечень аналогичных элементов с указанием уровня релеватности."}},{"type":"header3","data":{"level":3,"text":"Как это работает?"}},{"type":"paragraph","data":{"text":"EuclidesDB использует фреймворк gRPC для вызова удалённых процедур, протокол HTTP/2 — для сетевого взаимодействия и Protocol Buffers — для сериализации. Низкоуровневое хранение реализовано с помощью системы LevelDB, а работа моделей машинного обучения построена на библиотеке PyTorch."}},{"type":"paragraph","data":{"text":"В комплекте идёт три готовые модели — resnet101, resnet18 и vgg16 — для распознавания и классификации фотографий объектов. В будущем планируется добавить обработку и других видов информации."}},{"type":"paragraph","data":{"text":"При этом используется различные способы индексирования и поиска:"}},{"type":"list","data":{"items":["annoy — система нечёткого поиска на базе одноимённой библиотеки. Она используется в музыкальном сервисе Spotify для создания списка рекомендаций. Библиотека решает задачу поиска ближайшего соседа, при этом алгоритм оптимизирован, чтобы уменьшить потребление памяти и файла подкачки;","faiss — система для поиска похожих элементов с большим количеством настроек;","exact_disk — система для поиска точных совпадений. В этом случае индекс сразу сохраняется на диск, что минимизирует потребление ОЗУ."],"style":"unordered"}},{"type":"paragraph","data":{"text":"В ноябре 2018 года Apple выпустила первую стабильную версию открытой распределённой СУБД FoundationDB. Она рассчитана на обработку крупных наборов структурированных данных. СУБД относится к категории NoSQL-систем и работает с большим количеством языков программирования."}}]}

Ошибка в настройках сайта