swap arguments to vDSP_vdiv call

xaedes · xaedes · commit 2c4f95d28579 · 2023-05-08T20:09:52.000+02:00
documentation for vDSP_vdiv states: "Note that B comes before A!"
diff --git a/ggml.c b/ggml.c
@@ -8777,8 +8777,8 @@ static void ggml_compute_forward_div_f32(
 
 #ifdef GGML_USE_ACCELERATE
             vDSP_vdiv(
-                    (float *) ((char *) src0->data + i3*nb03 + i2*nb02 + i1*nb01), 1,
                     (float *) ((char *) src1->data + i3*nb13 + i2*nb12 + i1*nb11), 1,
+                    (float *) ((char *) src0->data + i3*nb03 + i2*nb02 + i1*nb01), 1,
                     (float *) ((char *) dst->data  + i3*nb3  + i2*nb2  + i1*nb1 ), 1,
                     ne0);
 #else
@@ -9831,15 +9831,15 @@ static void ggml_compute_forward_rms_norm_back_f32(
                     sum_xdz += (ggml_float)(x[i00] * dz[i00]);
                 }
 
-                const float mean     = sum_xx/ne00;
-                const float mean_eps = sum_xx/ne00 + eps;
-                const float sum_eps  = sum_xx + eps*ne00;
-                const float mean_xdz = sum_xdz/ne00;
+                const ggml_float mean     = sum_xx/ne00;
+                const ggml_float mean_eps = sum_xx/ne00 + eps;
+                const ggml_float sum_eps  = sum_xx + eps*ne00;
+                const ggml_float mean_xdz = sum_xdz/ne00;
                 // we could cache rms from forward pass to improve performance.
                 // to do this implement ggml_rms and compose ggml_rms_norm using ggml_rms.
-                const float rms      = sqrtf(mean_eps);
-                const float rrms     = 1.0f / sqrtf(mean_eps);
-                const float scale    = -rrms/(ne00 * mean_eps); // -1/(n*rms**3)
+                const ggml_float rms      = sqrtf(mean_eps);
+                const ggml_float rrms     = 1.0f / sqrtf(mean_eps);
+                const ggml_float scale    = -rrms/(ne00 * mean_eps); // -1/(n*rms**3)
 
                 {
                     // z = rms_norm(x)