Wat is Latency

tl:dr: ”Latency is de tijd tussen een verzoek en het antwoord van een systeem.“

Wat is Latency?

Latency is de vertraging die een gebruiker ervaart tussen actie en respons. Bij AI-toepassingen gaat het vaak om de tijd tussen prompt en modelantwoord.

Te hoge latency zorgt voor een trage gebruikerservaring, zelfs als de inhoud van het antwoord goed is. Daarom is latency een belangrijke factor in UX en systeemarchitectuur.

Je beïnvloedt latency onder andere met modelkeuze, caching, infrastructuur en slim contextbeheer.

Mogelijkheden of kansen voor
jouw organisatie bespreken?

Arjan Renkema Chris Hagg Damiaen Toussaint Arrow