Bon, voila, j'ai trouvé une solution compatible windows, en utilisant ctypes et les dll windows (j'ai utilisé la dll user32 qui permet de faire notamment de la simulation souris clavier).
Voici un code exemple, pour ceux que ça intéressera:
from ctypes import *
import time
#on met le curseur sur le pixel 400 par 400
windll.user32.SetCursorPos(400,400)
time.sleep(0.1)
#on presse le bouton gauche de la souris
windll.user32.mouse_event(2,0,0,0,0)
time.sleep(0.05)
#on relache le bouton gauche de la souris
windll.user32.mouse_event(4,0,0,0,0)
time.sleep(0.2)
#appui sur la touche entree
windll.user32.keybd_event(13,0,0,0)