GitHub - Alek-dr/FastAPI-TrironServer-example

Примаер сервиса классификации с FastAPI и Triton Inference Server

Суть примера

В данном репозитоии представлен сервис, где модели и сервис с бизнес-логикой разнесены по разным сервисам. Преимущества такого подхода:

Модели можно обновлять на лету, не останавливая сервис
Физически, сервис с моделями может находиться на другой машине, имещюей гораздо больше вычислительных ресурсов
Triton Inference Server берет на себя работу по балансированию нагрузки
Основной сервис никак не зависит от моделей и не нуждается в множестве зависимостей, необходимых для работы модели

Данные и модели

В скрипте train_model.py генерируются и обучаются три модели: pytorch, sklearn и xgboost. Модели решают простую задачу классификации на данных, представленных на изображении ниже

Обученные модели не используются в приложении, а деплоятся в отдельном сервисе - Triton Inference Server. Подробнее см. по ссылке. Тритон из коробки поддерживаем множество фреймворков, однако, если требуется задеплоить модели LightGBM, XGBoost или Scikit-Learn, придется проделать дополнительные шаги. Все эти шаги описаны здесь. Образ, который получится после выполнения ./build будет поддерживать FIL backend и позволяет деплоить вышеперечисленные моедли.

Если обучить модели заново, то для sklearn модели необходима дополнительная конвертация

./convert_sklearn.sh models/rf/1/model.pkl

Шаги для запуска репозитория:

Установить Docker. Инструкция на оф.сайте
Установить nvidia-docker2. Инстуркция по установке
Скачать FIL-backend. Следовать инструкции в разделе Installation на странице. После выполнения (довольно долгого), проверить, что появился образ triton_fil. Сделать это можно командой docker images.
В корневой директории этого проекта выполнить docker-compose build. Эта команда выполнит сборку всех описанных сервисов в файле docker-compose.yml.
Если всё успешно, можем запускать сервис docker-compose up -d

ЗАМЕЧАНИЕ!!! Если требуется задеплоить, например pytorch модель, шаги с FIL-backend выполнять не нужно. Достаточно использовать образ tritonserver. Скачать docker pull nvcr.io/nvidia/tritonserver:22.09-py3 и в дальнейшем использовать вместо образа triton_fil.

Логи каждого сервиса можно посмотреть выполнив docker-compose logs triton или docker-compose logs app. Если модели успешно поднялись, в логе triton сервиса должно быть сообщение, что модели запущены:

Тестирование моделей

По адресу http://0.0.0.0:8000/docs можно зайти и протестировать работу моделей.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
app		app
models		models
.dockerignore		.dockerignore
.env		.env
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
convert_sklearn.sh		convert_sklearn.sh
docker-compose.yml		docker-compose.yml
entrypoint.sh		entrypoint.sh
myplot.png		myplot.png
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
train_model.py		train_model.py
triton_log.png		triton_log.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Примаер сервиса классификации с FastAPI и Triton Inference Server

Суть примера

Данные и модели

Шаги для запуска репозитория:

Тестирование моделей

About

Releases

Packages

Languages

Alek-dr/FastAPI-TrironServer-example

Folders and files

Latest commit

History

Repository files navigation

Примаер сервиса классификации с FastAPI и Triton Inference Server

Суть примера

Данные и модели

Шаги для запуска репозитория:

Тестирование моделей

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages