Can the inner-most loop in NTT be parallelized?

This is the performance critical code. It would be cool if the inner-most loop here could be parallelized:

```rust
for _ in 0..log_2_of_n {
        let w_m = omega.mod_pow_u32(n / (2 * m));
        let mut k = 0;
        while k < n {
            let mut w = BFieldElement::one();
            for j in 0..m {
                let u = x[(k + j) as usize];
                let mut v = x[(k + j + m) as usize];
                v *= w;
                x[(k + j) as usize] = u + v;
                x[(k + j + m) as usize] = u - v;
                w *= w_m;
            }

            k += 2 * m;
        }

        m *= 2;
    }
```

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Can the inner-most loop in NTT be parallelized? #168

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Can the inner-most loop in NTT be parallelized? #168

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions