OpenGL dessine dans une image tampon. Cette image tampon peut être soit directement la mémoire vidéo de la fenêtre graphique, soit une image tampon intermédiaire permettant de faire du "double buffering"1.
Les différentes étapes de la génération d'une image sont (voir figure 1) :
Ces quatre étapes sont réalisées directement à l'appel d'une fonction de dessin d'OpenGL et ne nécessitent pas quatre appels spécifiques. En effet, les spécifications du point de vue, de la projection et du fenêtrage se font de manière indépendante de la spécification des primitives. Cela veut dire qu'à chaque appel d'une fonction de dessin, la transformation point de vue courante et la projection courante sont appliquées aux primitives. La figure 2 montre, par exemple, ce qui est effectué lors de l'appel d'une fonction de dessin d'une ligne polygonale.
Les paragraphes suivant explicitent les spécifications de ces différentes étapes.