سعی کن حلقه های for که استفاده میکنی به جای اضافه کردن یه واحد به شمارنده در هر تکرار چند واحد اضافه کنی.
این روش رو تو یه مقاله خوندم. در ضمن کتابخانه lapack که مربوط به توابع جبر خطی میشه و توابعش فوق العاده بهینه هست هم تو توابعش از این روش استفاده کرده.
یه مثال ساده میارم تا بهتر متوجه شی :
این روش معمولیه که همه استفاده میکنن :
for(int i=0;i<10000;i++) x[i]=0;


این روش بهینه تره :
for(int i=0;i<10000;i+=4)
{
x[i]=0;
x[i+1]=0;
x[i+2]=0;
x[i+3]=0;
}