GCC Code Coverage Report

Directory:	./
File:	tasks/mityaeva_radix/omp/src/sorter_omp.cpp
Date:	2026-05-11 08:26:31

	Exec	Total	Coverage
Lines:	25	33	75.8%
Functions:	2	4	50.0%
Branches:	20	38	52.6%

  
      Line
      Branch
      Exec
      Source
    
      #include "mityaeva_radix/omp/include/sorter_omp.hpp"
    
      #include <omp.h>
    
      #include <algorithm>
    
      #include <cstddef>
    
      #include <cstdint>
    
      #include <cstring>
    
      #include <vector>
    
      #include "util/include/util.hpp"
    
      namespace mityaeva_radix {
    
      ✗
      uint64_t SorterOmp::DoubleToSortable(uint64_t x) {
    
      ✗
        if ((x & 0x8000000000000000ULL) != 0U) {
    
      ✗
          return ~x;
    
        }
    
      ✗
        return x | 0x8000000000000000ULL;
    
      }
    
      ✗
      uint64_t SorterOmp::SortableToDouble(uint64_t x) {
    
      ✗
        if ((x & 0x8000000000000000ULL) != 0U) {
    
      ✗
          return x & 0x7FFFFFFFFFFFFFFFULL;
    
        }
    
      ✗
        return ~x;
    
      }
    
      512
      void SorterOmp::CountingPass(std::vector<uint64_t> *current, std::vector<uint64_t> *next, int shift, int radix,
    
                                   int num_threads, size_t data_size) {
    
        1/2✓ Branch 2 taken 512 times.
✗ Branch 3 not taken.

      512
        std::vector<std::vector<int>> thread_counters(num_threads, std::vector<int>(radix, 0));
    
      512
      #pragma omp parallel default(none) shared(current, shift, radix, thread_counters, data_size, num_threads)
    
        {
    
          int thread_id = omp_get_thread_num();
    
          size_t chunk_size = data_size / static_cast<size_t>(num_threads);
    
          size_t start = static_cast<size_t>(thread_id) * chunk_size;
    
          size_t end = (thread_id == num_threads - 1) ? data_size : start + chunk_size;
    
          auto &local_counters = thread_counters[thread_id];
    
          for (size_t i = start; i < end; i++) {
    
            int digit = static_cast<int>(((*current)[i] >> static_cast<size_t>(shift)) & static_cast<size_t>(radix - 1));
    
            local_counters[digit]++;
    
          }
    
        }
    
        1/2✓ Branch 1 taken 512 times.
✗ Branch 2 not taken.

      512
        std::vector<int> prefix_sums(static_cast<size_t>(radix * num_threads), 0);
    
        int total = 0;
    
        2/2✓ Branch 0 taken 131072 times.
✓ Branch 1 taken 512 times.

      131584
        for (int digit = 0; digit < radix; digit++) {
    
          int digit_sum = 0;
    
        2/2✓ Branch 0 taken 307200 times.
✓ Branch 1 taken 131072 times.

      438272
          for (int thread_idx = 0; thread_idx < num_threads; thread_idx++) {
    
      307200
            prefix_sums[(thread_idx * radix) + digit] = total + digit_sum;
    
      307200
            digit_sum += thread_counters[thread_idx][digit];
    
          }
    
      131072
          total += digit_sum;
    
        }
    
        1/2✓ Branch 0 taken 512 times.
✗ Branch 1 not taken.

      512
      #pragma omp parallel default(none) shared(current, next, shift, radix, prefix_sums, data_size, num_threads)
    
        {
    
          int thread_id = omp_get_thread_num();
    
          size_t chunk_size = data_size / static_cast<size_t>(num_threads);
    
          size_t start = static_cast<size_t>(thread_id) * chunk_size;
    
          size_t end = (thread_id == num_threads - 1) ? data_size : start + chunk_size;
    
          std::vector<int> local_pos(radix, 0);
    
          for (int digit = 0; digit < radix; digit++) {
    
            local_pos[digit] = prefix_sums[(thread_id * radix) + digit];
    
          }
    
          for (size_t i = start; i < end; i++) {
    
            int digit = static_cast<int>(((*current)[i] >> static_cast<size_t>(shift)) & static_cast<size_t>(radix - 1));
    
            auto pos = static_cast<size_t>(local_pos[digit]++);
    
            (*next)[pos] = (*current)[i];
    
          }
    
        }
    
      512
      }
    
        2/2✓ Branch 0 taken 8 times.
✓ Branch 1 taken 64 times.

      72
      void SorterOmp::Sort(std::vector<double> &data) {
    
        2/2✓ Branch 0 taken 8 times.
✓ Branch 1 taken 64 times.

      72
        if (data.size() <= 1) {
    
      8
          return;
    
        }
    
      64
        int num_threads = ppc::util::GetNumThreads();
    
      64
        omp_set_num_threads(num_threads);
    
        1/2✓ Branch 2 taken 64 times.
✗ Branch 3 not taken.

      64
        std::vector<double> temp(data.size());
    
        1/4✓ Branch 1 taken 64 times.
✗ Branch 2 not taken.
✗ Branch 3 not taken.
✗ Branch 4 not taken.

      64
        std::vector<uint64_t> as_uint(data.size());
    
        1/2✓ Branch 1 taken 64 times.
✗ Branch 2 not taken.

      64
      #pragma omp parallel for default(none) shared(data, as_uint, num_threads)
    
        for (size_t i = 0; i < data.size(); i++) {
    
          uint64_t bits = 0;
    
          std::memcpy(&bits, &data[i], sizeof(double));
    
          as_uint[i] = DoubleToSortable(bits);
    
        }
    
        const int bits_per_pass = 8;
    
        const int radix = 1 << bits_per_pass;
    
        const int passes = static_cast<int>(sizeof(uint64_t) * 8 / bits_per_pass);
    
        1/4✓ Branch 1 taken 64 times.
✗ Branch 2 not taken.
✗ Branch 3 not taken.
✗ Branch 4 not taken.

      64
        std::vector<uint64_t> uint_temp(data.size());
    
      64
        std::vector<uint64_t> *current = &as_uint;
    
        std::vector<uint64_t> *next = &uint_temp;
    
        2/2✓ Branch 0 taken 512 times.
✓ Branch 1 taken 64 times.

      576
        for (int pass = 0; pass < passes; pass++) {
    
        1/2✓ Branch 1 taken 512 times.
✗ Branch 2 not taken.

      512
          int shift = pass * bits_per_pass;
    
        1/2✓ Branch 1 taken 512 times.
✗ Branch 2 not taken.

      512
          CountingPass(current, next, shift, radix, num_threads, data.size());
    
          std::swap(current, next);
    
        }
    
        1/2✓ Branch 0 taken 64 times.
✗ Branch 1 not taken.

      64
      #pragma omp parallel for default(none) shared(data, current, as_uint, uint_temp)
    
        for (size_t i = 0; i < data.size(); i++) {
    
          uint64_t bits = 0;
    
          if (current == &as_uint) {
    
            bits = SortableToDouble(as_uint[i]);
    
          } else {
    
            bits = SortableToDouble(uint_temp[i]);
    
          }
    
          std::memcpy(&data[i], &bits, sizeof(double));
    
        }
    
      }
    
      }  // namespace mityaeva_radix

Line	Branch	Exec	Source
1			#include "mityaeva_radix/omp/include/sorter_omp.hpp"
2
3			#include <omp.h>
4
5			#include <algorithm>
6			#include <cstddef>
7			#include <cstdint>
8			#include <cstring>
9			#include <vector>
10
11			#include "util/include/util.hpp"
12
13			namespace mityaeva_radix {
14
15		✗	uint64_t SorterOmp::DoubleToSortable(uint64_t x) {
16		✗	if ((x & 0x8000000000000000ULL) != 0U) {
17		✗	return ~x;
18			}
19		✗	return x \| 0x8000000000000000ULL;
20			}
21
22		✗	uint64_t SorterOmp::SortableToDouble(uint64_t x) {
23		✗	if ((x & 0x8000000000000000ULL) != 0U) {
24		✗	return x & 0x7FFFFFFFFFFFFFFFULL;
25			}
26		✗	return ~x;
27			}
28
29		512	void SorterOmp::CountingPass(std::vector<uint64_t> current, std::vector<uint64_t> next, int shift, int radix,
30			int num_threads, size_t data_size) {
31	1/2 ✓ Branch 2 taken 512 times. ✗ Branch 3 not taken.	512	std::vector<std::vector<int>> thread_counters(num_threads, std::vector<int>(radix, 0));
32
33		512	#pragma omp parallel default(none) shared(current, shift, radix, thread_counters, data_size, num_threads)
34			{
35			int thread_id = omp_get_thread_num();
36			size_t chunk_size = data_size / static_cast<size_t>(num_threads);
37			size_t start = static_cast<size_t>(thread_id) * chunk_size;
38			size_t end = (thread_id == num_threads - 1) ? data_size : start + chunk_size;
39
40			auto &local_counters = thread_counters[thread_id];
41
42			for (size_t i = start; i < end; i++) {
43			int digit = static_cast<int>(((*current)[i] >> static_cast<size_t>(shift)) & static_cast<size_t>(radix - 1));
44			local_counters[digit]++;
45			}
46			}
47
48	1/2 ✓ Branch 1 taken 512 times. ✗ Branch 2 not taken.	512	std::vector<int> prefix_sums(static_cast<size_t>(radix * num_threads), 0);
49
50			int total = 0;
51	2/2 ✓ Branch 0 taken 131072 times. ✓ Branch 1 taken 512 times.	131584	for (int digit = 0; digit < radix; digit++) {
52			int digit_sum = 0;
53	2/2 ✓ Branch 0 taken 307200 times. ✓ Branch 1 taken 131072 times.	438272	for (int thread_idx = 0; thread_idx < num_threads; thread_idx++) {
54		307200	prefix_sums[(thread_idx * radix) + digit] = total + digit_sum;
55		307200	digit_sum += thread_counters[thread_idx][digit];
56			}
57		131072	total += digit_sum;
58			}
59
60	1/2 ✓ Branch 0 taken 512 times. ✗ Branch 1 not taken.	512	#pragma omp parallel default(none) shared(current, next, shift, radix, prefix_sums, data_size, num_threads)
61			{
62			int thread_id = omp_get_thread_num();
63			size_t chunk_size = data_size / static_cast<size_t>(num_threads);
64			size_t start = static_cast<size_t>(thread_id) * chunk_size;
65			size_t end = (thread_id == num_threads - 1) ? data_size : start + chunk_size;
66
67			std::vector<int> local_pos(radix, 0);
68			for (int digit = 0; digit < radix; digit++) {
69			local_pos[digit] = prefix_sums[(thread_id * radix) + digit];
70			}
71
72			for (size_t i = start; i < end; i++) {
73			int digit = static_cast<int>(((*current)[i] >> static_cast<size_t>(shift)) & static_cast<size_t>(radix - 1));
74			auto pos = static_cast<size_t>(local_pos[digit]++);
75			(next)[pos] = (current)[i];
76			}
77			}
78		512	}
79
80	2/2 ✓ Branch 0 taken 8 times. ✓ Branch 1 taken 64 times.	72	void SorterOmp::Sort(std::vector<double> &data) {
81	2/2 ✓ Branch 0 taken 8 times. ✓ Branch 1 taken 64 times.	72	if (data.size() <= 1) {
82		8	return;
83			}
84
85		64	int num_threads = ppc::util::GetNumThreads();
86		64	omp_set_num_threads(num_threads);
87
88	1/2 ✓ Branch 2 taken 64 times. ✗ Branch 3 not taken.	64	std::vector<double> temp(data.size());
89	1/4 ✓ Branch 1 taken 64 times. ✗ Branch 2 not taken. ✗ Branch 3 not taken. ✗ Branch 4 not taken.	64	std::vector<uint64_t> as_uint(data.size());
90
91	1/2 ✓ Branch 1 taken 64 times. ✗ Branch 2 not taken.	64	#pragma omp parallel for default(none) shared(data, as_uint, num_threads)
92			for (size_t i = 0; i < data.size(); i++) {
93			uint64_t bits = 0;
94			std::memcpy(&bits, &data[i], sizeof(double));
95			as_uint[i] = DoubleToSortable(bits);
96			}
97
98			const int bits_per_pass = 8;
99			const int radix = 1 << bits_per_pass;
100			const int passes = static_cast<int>(sizeof(uint64_t) * 8 / bits_per_pass);
101
102	1/4 ✓ Branch 1 taken 64 times. ✗ Branch 2 not taken. ✗ Branch 3 not taken. ✗ Branch 4 not taken.	64	std::vector<uint64_t> uint_temp(data.size());
103		64	std::vector<uint64_t> *current = &as_uint;
104			std::vector<uint64_t> *next = &uint_temp;
105
106	2/2 ✓ Branch 0 taken 512 times. ✓ Branch 1 taken 64 times.	576	for (int pass = 0; pass < passes; pass++) {
107	1/2 ✓ Branch 1 taken 512 times. ✗ Branch 2 not taken.	512	int shift = pass * bits_per_pass;
108
109	1/2 ✓ Branch 1 taken 512 times. ✗ Branch 2 not taken.	512	CountingPass(current, next, shift, radix, num_threads, data.size());
110
111			std::swap(current, next);
112			}
113
114	1/2 ✓ Branch 0 taken 64 times. ✗ Branch 1 not taken.	64	#pragma omp parallel for default(none) shared(data, current, as_uint, uint_temp)
115			for (size_t i = 0; i < data.size(); i++) {
116			uint64_t bits = 0;
117			if (current == &as_uint) {
118			bits = SortableToDouble(as_uint[i]);
119			} else {
120			bits = SortableToDouble(uint_temp[i]);
121			}
122			std::memcpy(&data[i], &bits, sizeof(double));
123			}
124			}
125
126			} // namespace mityaeva_radix
127