Inference (következtetés, angolul: Inference)
Az inference vagy következtetés a gépi tanulási életciklus azon fázisa, amikor a már betanított modellt éles környezetben alkalmazzák új, korábban nem látott adatok feldolgozására és előrejelzések készítésére. Ellentétben a tanítási fázissal, amely hatalmas számítási kapacitást és időt igényel a súlyok optimalizálásához, az inference célja a gyors és hatékony válaszadás, gyakran valós idejű követelmények mellett. Ennek a folyamatnak az optimalizálása (pl. modelltömörítés, kvantálás) kulcsfontosságú a költségek csökkentése és a felhasználói élmény javítása szempontjából, lehetővé téve az AI-alkalmazások futtatását akár mobileszközökön is.