Zpět na slovník MLOps & Životní cyklus

Obsluha modelu

Infrastruktura a postupy pro nasazeni trenoavanych AI modelu do produkcnich prostredi kde zpracovavaji pozadavky v realnem case.

Co je obsluha modelu?

Obsluha modelu zahrnuje infrastrukturu, software a provozni postupy potrebne k zpristupneni trenovanych AI modelu pro predikce v realnem case nebo dávkove zpracovani. Je to bridging krok mezi vyvojem modelu a obchodniou hodnotou: i nejpresnejsi model neprinasi zadny business dopad, dokud neni spolehlivne dostupny a efektivni pri zpracovavani pozadavku.

Vzory obsluhy

Obsluha v realnem case zpracovava jednotlive pozadavky s nizkou latenci, vhodna pro interaktivni aplikace jako doporucovaci systemy, detekce podvodu a konverzacni AI. Davkova inferenci zpracovava velke objemy predikci mimo hodiny spicky, efektivni pro skoring, klasifikaci nebo zpracovani dokumentu. Nasazeni na hrane provozuje modely na zarizeni blizko zdroje dat pro scenare vyzadujici vysoce nizkou latenci nebo operaci offline.

Vymery podnikove obsluhy

Systemy obsluhy musejii vyvazovat latenci (rychlost odpovedi), propustnost (pozadavky za sekundu), naklady (GPU-hodiny) a spolehllivost (dostupnost SLA). Dynamicke davkovani zlepzuje efektivitu GPU sdruzovanim vice pozadavku. Horizontalni skaloavni prida instance obsluhy automaticky na zaklade zateze. Vyvazovani zatize distribuuje pozadavky na zdrave instance.