ctf/summation_8h_source.html

 #ifndef __INT_SUMMATION_H__
 #define __INT_SUMMATION_H__

 #include <assert.h>
 #include "sum_tsr.h"
 #include "spsum_tsr.h"

 namespace CTF_int {
   class tensor;
   class topology;

   class summation {
      public:
       tensor * A;
       tensor * B;

       char const * alpha;
       char const * beta;

       int * idx_A;
       int * idx_B;
       bool is_custom;
       univar_function const * func;

 //      summation(){ idx_A = NULL; idx_B = NULL; alpha=NULL; beta=NULL; is_custom=0; };

       ~summation();

       summation(summation const & other);

       summation(tensor *     A,
                 int const *  idx_A,
                 char const * alpha,
                 tensor *     B,
                 int const *  idx_B,
                 char const * beta);
       summation(tensor *     A,
                 char const * idx_A,
                 char const * alpha,
                 tensor *     B,
                 char const * idx_B,
                 char const * beta);

       summation(tensor *                A,
                 int const *             idx_A,
                 char const *            alpha,
                 tensor *                B,
                 int const *             idx_B,
                 char const *            beta,
                 univar_function const * func);
       summation(tensor *                A,
                 char const *            idx_A,
                 char const *            alpha,
                 tensor *                B,
                 char const *            idx_B,
                 char const *            beta,
                 univar_function const * func);

       void execute(bool run_diag=false);

       double estimate_time();

       int is_equal(summation const & os);


       int sum_tensors(bool run_diag);

       void print();

     private:
       void get_fold_indices(int *  num_fold,
                             int ** fold_idx);

       int can_fold();

       void get_fold_sum(summation *& fold_sum,
                         int &        all_fdim_A,
                         int &        all_fdim_B,
                         int *&       all_flen_A,
                         int *&       all_flen_B);


       int map_fold();

       double est_time_fold();


       void get_len_ordering(int ** new_ordering_A,
                             int ** new_ordering_B);


       tsum * construct_sum(int inner_stride=-1);

       tspsum * construct_sparse_sum(int const * phys_mapped);

       tsum * construct_dense_sum(int         inner_stride,
                                  int const * phys_mapped);


       int home_sum_tsr(bool run_diag);

       int sym_sum_tsr(bool run_diag);

       int unfold_broken_sym(summation ** new_sum);

       bool check_consistency();


       int check_mapping();

       int map_sum_indices(topology const * topo);

       int map();

       void sp_sum();
   };
 }

 #endif
CTF_int::summation::is_custom
bool is_custom
whether there is a elementwise custom function
Definition: summation.h:32

CTF_int::summation::idx_A
int * idx_A
indices of left operand
Definition: summation.h:28

CTF_int::summation::execute
void execute(bool run_diag=false)
run summation
Definition: summation.cxx:119

CTF_int::summation::summation
summation(summation const &other)
copy constructor
Definition: summation.cxx:24

CTF_int::univar_function
untyped internal class for doubly-typed univariate function
Definition: sum_tsr.h:14

spsum_tsr.h

CTF_int::tsum
Definition: sum_tsr.h:67

CTF_int::summation::estimate_time
double estimate_time()
predicts execution time in seconds using performance models
Definition: summation.cxx:132

CTF_int::summation::~summation
~summation()
lazy constructor
Definition: summation.cxx:19

CTF_int::summation::alpha
char const * alpha
scaling of A
Definition: summation.h:23

CTF_int::tspsum
Definition: spsum_tsr.h:8

CTF_int::summation::idx_B
int * idx_B
indices of output
Definition: summation.h:30

sum_tsr.h

CTF_int::summation::print
void print()
print contraction details
Definition: summation.cxx:2362

CTF_int::summation::func
univar_function const * func
function to execute on elements
Definition: summation.h:34

CTF_int::summation::beta
char const * beta
scaling of existing B
Definition: summation.h:25

CTF_int::summation::B
tensor * B
output
Definition: summation.h:20

CTF_int::summation::is_equal
int is_equal(summation const &os)
returns 1 if summations have same tensors and index map
Definition: summation.cxx:1821

CTF_int::tensor
internal distributed tensor class
Definition: untyped_tensor.h:20

CTF_int::summation::A
tensor * A
left operand
Definition: summation.h:18

CTF_int::summation
class for execution distributed summation of tensors
Definition: summation.h:15

CTF_int
Definition: model_trainer.cxx:16

CTF_int::topology
Definition: topology.h:14

CTF_int::summation::sum_tensors
int sum_tensors(bool run_diag)
PDAXPY: a*idx_map_A(A) + b*idx_map_B(B) -> idx_map_B(B). Treats symmetric as lower triangular...
Definition: summation.cxx:1384