ctf/spsum__tsr_8h_source.html

 #ifndef __SPSUM_TSR_H__
 #define __SPSUM_TSR_H__

 #include "sum_tsr.h"

 namespace CTF_int {

   class tspsum : public tsum {
     public:
       bool      is_sparse_A;
       int64_t   nnz_A;
       int       nvirt_A;
       int64_t * nnz_blk_A;
       bool      is_sparse_B;
       int64_t   nnz_B;
       int       nvirt_B;
       int64_t * nnz_blk_B;
       int64_t   new_nnz_B;
       char *    new_B;

       ~tspsum();
       tspsum(tspsum * other);
       virtual tspsum * clone() { return NULL; }
       tspsum(summation const * s);
       virtual void set_nnz_blk_A(int64_t const * nnbA){
         if (nnbA != NULL) memcpy(nnz_blk_A, nnbA, nvirt_A*sizeof(int64_t));
       }
   };

   class tspsum_virt : public tspsum {
     public:
       /* Class to be called on sub-blocks */
       tspsum * rec_tsum;

       int         num_dim;
       int *       virt_dim;
       int         order_A;
       int64_t     blk_sz_A; //if dense
       int const * idx_map_A;
       int         order_B;
       int64_t     blk_sz_B; //if dense
       int const * idx_map_B;

       void run();
       void print();
       int64_t mem_fp();
       void set_nnz_blk_A(int64_t const * nnbA){
         tspsum::set_nnz_blk_A(nnbA);
         rec_tsum->set_nnz_blk_A(nnbA);
       }
       tspsum * clone();

       tspsum_virt(tspsum * other);
       ~tspsum_virt();
       tspsum_virt(summation const * s);
   };

   class tspsum_replicate : public tspsum {
     public:
       int64_t size_A; /* size of A blocks */
       int64_t size_B; /* size of B blocks */
       int ncdt_A; /* number of processor dimensions to replicate A along */
       int ncdt_B; /* number of processor dimensions to replicate B along */

       CommData ** cdt_A;
       CommData ** cdt_B;
       /* Class to be called on sub-blocks */
       tspsum * rec_tsum;

       void run();
       void print();
       int64_t mem_fp();
       tspsum * clone();
       void set_nnz_blk_A(int64_t const * nnbA){
         tspsum::set_nnz_blk_A(nnbA);
         rec_tsum->set_nnz_blk_A(nnbA);
       }

       tspsum_replicate(tspsum * other);
       ~tspsum_replicate();
       tspsum_replicate(summation const * s,
                        int const *       phys_mapped,
                        int64_t           blk_sz_A,
                        int64_t           blk_sz_B);
   };

   class seq_tsr_spsum : public tspsum {
     public:
       int         order_A;
       int *       edge_len_A;
       int const * idx_map_A;
       int *       sym_A;
       int         order_B;
       int *       edge_len_B;
       int const * idx_map_B;
       int *       sym_B;
       //fseq_tsr_sum func_ptr;

       int is_inner;
       int inr_stride;

       int64_t map_pfx;

       int is_custom;
       univar_function const * func; //fseq_elm_sum custom_params;

       void run();
       void print();
       int64_t mem_fp();
       tspsum * clone();
       void set_nnz_blk_A(int64_t const * nnbA){
         tspsum::set_nnz_blk_A(nnbA);
       }

       seq_tsr_spsum(tspsum * other);
       ~seq_tsr_spsum(){ CTF_int::cdealloc(edge_len_A), CTF_int::cdealloc(edge_len_B),
                       CTF_int::cdealloc(sym_A), CTF_int::cdealloc(sym_B); };
       seq_tsr_spsum(summation const * s);

   };

   class tspsum_map : public tspsum {
     public:
       tspsum * rec_tsum;
       int nmap_idx;
       int64_t * map_idx_len;
       int64_t * map_idx_lda;

       void run();
       void print();
       int64_t mem_fp();
       tspsum * clone();
       void set_nnz_blk_A(int64_t const * nnbA){
         tspsum::set_nnz_blk_A(nnbA);
         rec_tsum->set_nnz_blk_A(nnbA);
       }

       tspsum_map(tspsum * other);
       ~tspsum_map();
       tspsum_map(summation const * s);
   };

   class tspsum_permute : public tspsum {
     public:
       tspsum * rec_tsum;
       bool A_or_B; //if false perm_B
       int order;
       int * lens_new;
       int * lens_old; // FIXME = lens_new?
       int * p;
       bool skip;

       void run();
       void print();
       int64_t mem_fp();
       tspsum * clone();
       void set_nnz_blk_A(int64_t const * nnbA){
         tspsum::set_nnz_blk_A(nnbA);
         rec_tsum->set_nnz_blk_A(nnbA);
       }

       tspsum_permute(tspsum * other);
       ~tspsum_permute();
       tspsum_permute(summation const * s, bool A_or_B, int const * lens);
   };

   class tspsum_pin_keys : public tspsum {
     public:
       tspsum * rec_tsum;
       bool A_or_B;
       int order;
       int const * lens;
       int * divisor;
       int * virt_dim;
       int * phys_rank;

       void run();
       void print();
       int64_t mem_fp();
       tspsum * clone();
       void set_nnz_blk_A(int64_t const * nnbA){
         tspsum::set_nnz_blk_A(nnbA);
         rec_tsum->set_nnz_blk_A(nnbA);
       }

       tspsum_pin_keys(tspsum * other);
       ~tspsum_pin_keys();
       tspsum_pin_keys(summation const * s, bool A_or_B);

   };

 }

 #endif
CTF_int::tspsum::nvirt_A
int nvirt_A
Definition: spsum_tsr.h:12

CTF_int::seq_tsr_spsum::inr_stride
int inr_stride
Definition: spsum_tsr.h:106

CTF_int::seq_tsr_spsum::order_B
int order_B
Definition: spsum_tsr.h:99

CTF_int::tspsum_pin_keys::rec_tsum
tspsum * rec_tsum
Definition: spsum_tsr.h:182

CTF_int::tspsum_permute::lens_new
int * lens_new
Definition: spsum_tsr.h:161

CTF_int::seq_tsr_spsum::edge_len_A
int * edge_len_A
Definition: spsum_tsr.h:96

CTF_int::tspsum_map
Definition: spsum_tsr.h:135

CTF_int::tspsum_permute::order
int order
Definition: spsum_tsr.h:160

CTF_int::tspsum_replicate::ncdt_B
int ncdt_B
Definition: spsum_tsr.h:69

CTF_int::seq_tsr_spsum::~seq_tsr_spsum
~seq_tsr_spsum()
Definition: spsum_tsr.h:129

CTF_int::tspsum_replicate::rec_tsum
tspsum * rec_tsum
Definition: spsum_tsr.h:74

CTF_int::tspsum_replicate::set_nnz_blk_A
void set_nnz_blk_A(int64_t const *nnbA)
Definition: spsum_tsr.h:80

CTF_int::tspsum::tspsum
tspsum(tspsum *other)
Definition: spsum_tsr.cxx:11

CTF_int::tspsum_virt::rec_tsum
tspsum * rec_tsum
Definition: spsum_tsr.h:33

CTF_int::tspsum::nnz_blk_B
int64_t * nnz_blk_B
Definition: spsum_tsr.h:17

CTF_int::tspsum_virt
Definition: spsum_tsr.h:30

CTF_int::tspsum_permute::A_or_B
bool A_or_B
Definition: spsum_tsr.h:159

CTF_int::tspsum_virt::num_dim
int num_dim
Definition: spsum_tsr.h:35

CTF_int::tspsum_pin_keys::phys_rank
int * phys_rank
Definition: spsum_tsr.h:188

CTF_int::tspsum::is_sparse_A
bool is_sparse_A
Definition: spsum_tsr.h:10

CTF_int::seq_tsr_spsum::idx_map_B
int const * idx_map_B
Definition: spsum_tsr.h:101

CTF_int::CommData
Definition: common.h:127

CTF_int::tspsum::~tspsum
~tspsum()
Definition: spsum_tsr.cxx:30

CTF_int::tspsum::set_nnz_blk_A
virtual void set_nnz_blk_A(int64_t const *nnbA)
Definition: spsum_tsr.h:25

CTF_int::tspsum_virt::set_nnz_blk_A
void set_nnz_blk_A(int64_t const *nnbA)
Definition: spsum_tsr.h:47

CTF_int::tspsum::is_sparse_B
bool is_sparse_B
Definition: spsum_tsr.h:14

CTF_int::univar_function
untyped internal class for doubly-typed univariate function
Definition: sum_tsr.h:14

CTF_int::seq_tsr_spsum::order_A
int order_A
Definition: spsum_tsr.h:95

CTF_int::tspsum_replicate::size_B
int64_t size_B
Definition: spsum_tsr.h:67

CTF_int::tspsum_virt::blk_sz_A
int64_t blk_sz_A
Definition: spsum_tsr.h:38

CTF_int::tspsum_permute::lens_old
int * lens_old
Definition: spsum_tsr.h:162

CTF_int::tspsum_replicate::ncdt_A
int ncdt_A
Definition: spsum_tsr.h:68

CTF_int::tspsum_pin_keys::set_nnz_blk_A
void set_nnz_blk_A(int64_t const *nnbA)
Definition: spsum_tsr.h:194

CTF_int::tspsum_virt::order_B
int order_B
Definition: spsum_tsr.h:40

CTF_int::tsum
Definition: sum_tsr.h:67

CTF_int::tspsum_virt::order_A
int order_A
Definition: spsum_tsr.h:37

CTF_int::tspsum_pin_keys::divisor
int * divisor
Definition: spsum_tsr.h:186

CTF_int::seq_tsr_spsum
Definition: spsum_tsr.h:93

CTF_int::tspsum::new_nnz_B
int64_t new_nnz_B
Definition: spsum_tsr.h:18

CTF_int::seq_tsr_spsum::edge_len_B
int * edge_len_B
Definition: spsum_tsr.h:100

CTF_int::seq_tsr_spsum::set_nnz_blk_A
void set_nnz_blk_A(int64_t const *nnbA)
Definition: spsum_tsr.h:120

CTF_int::tsum::mem_fp
virtual int64_t mem_fp()
returns the number of bytes of buffer space needed
Definition: sum_tsr.h:84

CTF_int::seq_tsr_spsum::sym_A
int * sym_A
Definition: spsum_tsr.h:98

CTF_int::tspsum_map::map_idx_lda
int64_t * map_idx_lda
Definition: spsum_tsr.h:140

CTF_int::seq_tsr_spsum::idx_map_A
int const * idx_map_A
Definition: spsum_tsr.h:97

CTF_int::tspsum_pin_keys::A_or_B
bool A_or_B
Definition: spsum_tsr.h:183

CTF_int::tspsum_pin_keys::order
int order
Definition: spsum_tsr.h:184

CTF_int::seq_tsr_spsum::is_custom
int is_custom
Definition: spsum_tsr.h:110

CTF_int::tspsum
Definition: spsum_tsr.h:8

CTF_int::tspsum_permute::p
int * p
Definition: spsum_tsr.h:163

CTF_int::tsum::run
virtual void run()
Definition: sum_tsr.h:77

CTF_int::tspsum_pin_keys::lens
int const * lens
Definition: spsum_tsr.h:185

CTF_int::tspsum_map::rec_tsum
tspsum * rec_tsum
Definition: spsum_tsr.h:137

CTF_int::tspsum::nnz_B
int64_t nnz_B
Definition: spsum_tsr.h:15

CTF_int::seq_tsr_spsum::map_pfx
int64_t map_pfx
Definition: spsum_tsr.h:108

CTF_int::tspsum::nvirt_B
int nvirt_B
Definition: spsum_tsr.h:16

CTF_int::seq_tsr_spsum::sym_B
int * sym_B
Definition: spsum_tsr.h:102

CTF_int::tspsum_permute::set_nnz_blk_A
void set_nnz_blk_A(int64_t const *nnbA)
Definition: spsum_tsr.h:170

CTF_int::seq_tsr_spsum::func
univar_function const * func
Definition: spsum_tsr.h:111

CTF_int::tspsum_pin_keys
Definition: spsum_tsr.h:180

sum_tsr.h

CTF_int::tspsum::clone
virtual tspsum * clone()
Definition: spsum_tsr.h:23

CTF_int::tspsum_permute
Definition: spsum_tsr.h:156

CTF_int::seq_tsr_spsum::is_inner
int is_inner
Definition: spsum_tsr.h:105

CTF_int::tspsum::nnz_A
int64_t nnz_A
Definition: spsum_tsr.h:11

CTF_int::cdealloc
int cdealloc(void *ptr)
free abstraction
Definition: memcontrol.cxx:480

CTF_int::tspsum_virt::idx_map_A
int const * idx_map_A
Definition: spsum_tsr.h:39

CTF_int::tspsum_virt::idx_map_B
int const * idx_map_B
Definition: spsum_tsr.h:42

CTF_int::tspsum_permute::skip
bool skip
Definition: spsum_tsr.h:164

CTF_int::tspsum::nnz_blk_A
int64_t * nnz_blk_A
Definition: spsum_tsr.h:13

CTF_int::tspsum_map::map_idx_len
int64_t * map_idx_len
Definition: spsum_tsr.h:139

CTF_int::tspsum_map::nmap_idx
int nmap_idx
Definition: spsum_tsr.h:138

CTF_int::tspsum_replicate::cdt_B
CommData ** cdt_B
Definition: spsum_tsr.h:72

CTF_int::tspsum_replicate
performs replication along a dimension, generates 2.5D algs
Definition: spsum_tsr.h:64

CTF_int::summation
class for execution distributed summation of tensors
Definition: summation.h:15

CTF_int::tspsum_permute::rec_tsum
tspsum * rec_tsum
Definition: spsum_tsr.h:158

CTF_int::tspsum::new_B
char * new_B
Definition: spsum_tsr.h:19

CTF_int::tspsum_pin_keys::virt_dim
int * virt_dim
Definition: spsum_tsr.h:187

CTF_int::tspsum_replicate::cdt_A
CommData ** cdt_A
Definition: spsum_tsr.h:71

CTF_int
Definition: model_trainer.cxx:16

CTF_int::tspsum_virt::blk_sz_B
int64_t blk_sz_B
Definition: spsum_tsr.h:41

CTF_int::tspsum_virt::virt_dim
int * virt_dim
Definition: spsum_tsr.h:36

CTF_int::tspsum_map::set_nnz_blk_A
void set_nnz_blk_A(int64_t const *nnbA)
Definition: spsum_tsr.h:146

CTF_int::tspsum_replicate::size_A
int64_t size_A
Definition: spsum_tsr.h:66

CTF_int::tsum::print
virtual void print()
Definition: sum_tsr.h:78