Moyenne entre deux couleurs

vecchio56 Messages postés 6535 Date d'inscription lundi 16 décembre 2002 Statut Membre Dernière intervention 22 août 2010 - 4 avril 2007 à 22:39
vecchio56 Messages postés 6535 Date d'inscription lundi 16 décembre 2002 Statut Membre Dernière intervention 22 août 2010 - 6 avril 2007 à 18:52
Bonjour,

Je cherche a faire le plus rapidement possible la moyenne entre deux couleurs, au format RGB
Par exemple avec 128, 128, 128 (0x00808080) et 0, 0, 0, je voudrais obtenir 64, 64, 64
Pour le moment, je fais
COLORREF moyenne = RGB((GetRValue(clr1) + GetRValue(clr2)) / 2, (GetGValue(clr1) + GetGValue(clr2)) / 2, (GetBValue(clr1) + GetBValue(clr2)) / 2);
Je trouve que ca fait pas mal de calculs, et je me demandais s'il y a une astuce pour calculer cela plus vite.

Merci
_____________________________________
Un éditeur de ressources gratuit pour Windows

13 réponses

Ombitious_Developper Messages postés 2333 Date d'inscription samedi 28 février 2004 Statut Membre Dernière intervention 26 juillet 2013 39
5 avril 2007 à 01:19
Salut:

Tu veux utiliser les décalages?


________________________________________________________________________________
A.B. : 
"Dieu nous donne des mains, mais il ne bâtit pas les ponts"
0
BruNews Messages postés 21041 Date d'inscription jeudi 23 janvier 2003 Statut Modérateur Dernière intervention 21 août 2019 17
5 avril 2007 à 08:01
Le prob est de faire les additions d'octets séparément, le reste est trivial, SHR suivi de AND pour masquer les bits hauts.
Ne voyant rien qui puisse accélérer les additions avec les instructions de base, passons aux choses sérieuses, on va traiter par passes de 128 bits:
- Aligne tes donnés sur 16 (indispensable).
- MOVAPD , chargement en xmm
- PADDB , add par 16 octets
- PAND , masquage bits hauts pour BYTEs bas
- PSRAD , decalage droit
- PAND , masquage bits hauts pour chaque BYTE
- MOVAPD , remise où tu veux du xmm

Tu peux utiliser MOVUPD si mem non alignée mais moins rapide.

ciao...
BruNews, MVP VC++
0
Ombitious_Developper Messages postés 2333 Date d'inscription samedi 28 février 2004 Statut Membre Dernière intervention 26 juillet 2013 39
5 avril 2007 à 13:36
Salut:

"Step by step"

Brunews >> j'ai une question pour toi. Est il possible de remplacer une addition par exemple par une opération binaire de type (or, and, xor, not, ...)?


________________________________________________________________________________
A.B. : 
"Dieu nous donne des mains, mais il ne bâtit pas les ponts"
0
turnerom Messages postés 492 Date d'inscription samedi 10 juillet 2004 Statut Membre Dernière intervention 12 janvier 2012 1
5 avril 2007 à 15:40
COLORREF moyenne = RGB((GetRValue(clr1) + GetRValue(clr2)) << 1 , (GetRValue(clr1) + GetRValue(clr2)) << 1, (GetRValue(clr1) + GetRValue(clr2)) << 1));

Hors constructeur et affectations : 6 cycles, qui dit mieux
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
racpp Messages postés 1910 Date d'inscription vendredi 18 juin 2004 Statut Modérateur Dernière intervention 14 novembre 2014 15
5 avril 2007 à 16:09
Salut,
turnerom > Le décalage à gauche d'un bit multiplie la valeur par 2. Je pense que tu voulais écrire ">> 1"
qui la divise par 2. D'ailleurs, le compilateur traduit implicitement
toutes les divisions et multiplications par des puissances de 2 en
décalages. Je pense que vecchio56 veut éviter les appels de GetXValue()
pour gagner en vitesse en travaillant directement sur les COLORREFs.
0
turnerom Messages postés 492 Date d'inscription samedi 10 juillet 2004 Statut Membre Dernière intervention 12 janvier 2012 1
5 avril 2007 à 16:48
Oui, au temps pour moi pour les décalages en effet. Le compilateur les traduits moyenant certains param de compilations comme les -O3 avec un compilo gcc mais sur Visual aucune idée
0
racpp Messages postés 1910 Date d'inscription vendredi 18 juin 2004 Statut Modérateur Dernière intervention 14 novembre 2014 15
5 avril 2007 à 16:55
Cette optimisation est faite par défaut sur Visaul C/C++.
0
cs_juju12 Messages postés 966 Date d'inscription samedi 3 avril 2004 Statut Membre Dernière intervention 4 mars 2010 4
5 avril 2007 à 17:27
quant à l'addition c'est une suite d'opérations binaires (impossible à faire d'un coup à cause des retenues), sauf contexte très particulier
0
BruNews Messages postés 21041 Date d'inscription jeudi 23 janvier 2003 Statut Modérateur Dernière intervention 21 août 2019 17
5 avril 2007 à 19:24
turnerom > faut le listing asm pour compter les cycles et j'ai du mal à croire que tu t'en tires en 6 cycles, à vérifier.

Dans tous les cas il faut passer en traitement SSE2 si on veut pulvériser les temps.

ciao...
BruNews, MVP VC++
0
BruNews Messages postés 21041 Date d'inscription jeudi 23 janvier 2003 Statut Modérateur Dernière intervention 21 août 2019 17
5 avril 2007 à 19:30
juju12 > comme les autres d'ailleurs (opération binaire) mais ADD "codée" en dur pour tenir en 1 cycle parallélisable (avec restrictions d'usage).

ciao...
BruNews, MVP VC++
0
vecchio56 Messages postés 6535 Date d'inscription lundi 16 décembre 2002 Statut Membre Dernière intervention 22 août 2010 13
5 avril 2007 à 19:44
Hélas je peux pas me permettre de mettre du SSE2.
C'est sur le code plus haut ne fait pas 6 cycles...

J'avais pensé à ca:
      BYTE* c1 = (BYTE*)&clr1;
      BYTE* c2 = (BYTE*)&clr2;
      BYTE* res = (BYTE*)&clr;
      res[0] = (c1[0] + c2[0]) / 2;
      res[1] = (c1[1] + c2[1]) / 2;
      res[2] = (c1[2] + c2[2]) / 2;

Mais c'est beaucoup plus lent que la solution de départ (qui faisia pourtant il me semble 6 AND, 9 décalages et 3 additions.
C'est a cause de l'alignement des données?

_____________________________________
Un éditeur de ressources gratuit pour Windows
0
BruNews Messages postés 21041 Date d'inscription jeudi 23 janvier 2003 Statut Modérateur Dernière intervention 21 août 2019 17
5 avril 2007 à 21:14
Regarde ce que le compilo produit et ensuite essaie ceci:


hors de la boucle
xor ecx, ecx
xor eax, eax


mov cl, [c1r2 + 2]
mov dx, [c1r2]
add cl, [c1r1 + 2]
mov ax, [clr1]
shl ecx, 16
add al, dl
add ah, dh
or  eax, ecx
shr eax, 1
and eax, 7F7F7Fh


A tester, pas le temps.

Tu peux utilise EBX et traiter sur le principe de eax et ecx, ainsi faire 4 octets par tour.

ciao...
BruNews, MVP VC++
0
vecchio56 Messages postés 6535 Date d'inscription lundi 16 décembre 2002 Statut Membre Dernière intervention 22 août 2010 13
6 avril 2007 à 18:52
Je vais essayer de voir ce que je peux faire avec ca. Merci

_____________________________________
Un éditeur de ressources gratuit pour Windows
0
Rejoignez-nous