ctf/ctr__2d__general_8h_source.html

 /*Copyright (c) 2011, Edgar Solomonik, all rights reserved.*/
 #include "ctr_comm.h"

 #ifndef __CTR_2D_GENERAL_H__
 #define __CTR_2D_GENERAL_H__

 namespace CTF_int{
   class tensor;
   int  ctr_2d_gen_build(int                        is_used,
                         CommData                   global_comm,
                         int                        i,
                         int *                      virt_dim,
                         int &                      cg_edge_len,
                         int &                      total_iter,
                         tensor *                   A,
                         int                        i_A,
                         CommData *&                cg_cdt_A,
                         int64_t &                  cg_ctr_lda_A,
                         int64_t &                  cg_ctr_sub_lda_A,
                         bool &                     cg_move_A,
                         int *                      blk_len_A,
                         int64_t &                  blk_sz_A,
                         int const *                virt_blk_len_A,
                         int &                      load_phase_A,
                         tensor *                   B,
                         int                        i_B,
                         CommData *&                cg_cdt_B,
                         int64_t &                  cg_ctr_lda_B,
                         int64_t &                  cg_ctr_sub_lda_B,
                         bool &                     cg_move_B,
                         int *                      blk_len_B,
                         int64_t &                  blk_sz_B,
                         int const *                virt_blk_len_B,
                         int &                      load_phase_B,
                         tensor *                   C,
                         int                        i_C,
                         CommData *&                cg_cdt_C,
                         int64_t &                  cg_ctr_lda_C,
                         int64_t &                  cg_ctr_sub_lda_C,
                         bool &                     cg_move_C,
                         int *                      blk_len_C,
                         int64_t &                  blk_sz_C,
                         int const *                virt_blk_len_C,
                         int &                      load_phase_C);


   class ctr_2d_general : public ctr {
     public:
       int edge_len;

       int64_t ctr_lda_A; /* local lda_A of contraction dimension 'k' */
       int64_t ctr_sub_lda_A; /* elements per local lda_A
                             of contraction dimension 'k' */
       int64_t ctr_lda_B; /* local lda_B of contraction dimension 'k' */
       int64_t ctr_sub_lda_B; /* elements per local lda_B
                             of contraction dimension 'k' */
       int64_t ctr_lda_C; /* local lda_C of contraction dimension 'k' */
       int64_t ctr_sub_lda_C; /* elements per local lda_C
                             of contraction dimension 'k' */
   #ifdef OFFLOAD
       bool alloc_host_buf;
   #endif

       bool move_A;
       bool move_B;
       bool move_C;

       CommData * cdt_A;
       CommData * cdt_B;
       CommData * cdt_C;
       /* Class to be called on sub-blocks */
       ctr * rec_ctr;

       void print();
       void run(char * A, char * B, char * C);
       int64_t mem_fp();
       int64_t mem_rec();
       double est_time_fp(int nlyr);
       double est_time_rec(int nlyr);
       ctr * clone();

       void find_bsizes(int64_t & b_A,
                        int64_t & b_B,
                        int64_t & b_C,
                        int64_t & s_A,
                        int64_t & s_B,
                        int64_t & s_C,
                        int64_t & aux_size);
       ctr_2d_general(ctr * other);
       ~ctr_2d_general();
       ctr_2d_general(contraction * c) : ctr(c){ move_A=0; move_B=0; move_C=0; }
   };
 }
 #endif
CTF_int::ctr_2d_general::~ctr_2d_general
~ctr_2d_general()
deallocs ctr_2d_general object
Definition: ctr_2d_general.cxx:171

CTF_int::ctr_2d_general::ctr_sub_lda_B
int64_t ctr_sub_lda_B
Definition: ctr_2d_general.h:55

CTF_int::ctr_2d_general
Definition: ctr_2d_general.h:47

CTF_int::ctr_2d_general::print
void print()
print ctr object
Definition: ctr_2d_general.cxx:200

CTF_int::ctr_2d_general::mem_rec
int64_t mem_rec()
returns the number of bytes of buffer space we need recursively
Definition: ctr_2d_general.cxx:271

CTF_int::ctr_2d_general::ctr_lda_A
int64_t ctr_lda_A
Definition: ctr_2d_general.h:51

CTF_int::CommData
Definition: common.h:127

CTF_int::ctr
Definition: ctr_comm.h:165

CTF_int::ctr_2d_general::cdt_B
CommData * cdt_B
Definition: ctr_2d_general.h:69

CTF_int::ctr_2d_general::clone
ctr * clone()
Definition: ctr_2d_general.cxx:220

CTF_int::ctr_2d_general::est_time_rec
double est_time_rec(int nlyr)
returns the number of bytes send by each proc recursively
Definition: ctr_2d_general.cxx:261

CTF_int::ctr_2d_general::move_A
bool move_A
Definition: ctr_2d_general.h:64

CTF_int::ctr_2d_general::rec_ctr
ctr * rec_ctr
Definition: ctr_2d_general.h:72

CTF_int::ctr_2d_general::move_B
bool move_B
Definition: ctr_2d_general.h:65

CTF_int::contraction
class for execution distributed contraction of tensors
Definition: contraction.h:16

CTF_int::ctr_2d_general::mem_fp
int64_t mem_fp()
returns the number of bytes of buffer space we need
Definition: ctr_2d_general.cxx:265

CTF_int::ctr_2d_general::run
void run(char *A, char *B, char *C)
Basically doing SUMMA, except assumes equal block size on each processor. Performs rank-b updates whe...
Definition: ctr_2d_general.cxx:275

CTF_int::ctr_2d_general::ctr_2d_general
ctr_2d_general(ctr *other)
copies ctr object
Definition: ctr_2d_general.cxx:179

CTF_int::ctr_2d_general::cdt_A
CommData * cdt_A
Definition: ctr_2d_general.h:68

CTF_int::ctr_2d_general::edge_len
int edge_len
Definition: ctr_2d_general.h:49

CTF_int::ctr_2d_general::cdt_C
CommData * cdt_C
Definition: ctr_2d_general.h:70

CTF_int::ctr_2d_general::est_time_fp
double est_time_fp(int nlyr)
returns the number of bytes this kernel will send per processor
Definition: ctr_2d_general.cxx:248

CTF_int::ctr_2d_general::find_bsizes
void find_bsizes(int64_t &b_A, int64_t &b_B, int64_t &b_C, int64_t &s_A, int64_t &s_B, int64_t &s_C, int64_t &aux_size)
determines buffer and block sizes needed for ctr_2d_general
Definition: ctr_2d_general.cxx:224

CTF_int::ctr_2d_general::ctr_2d_general
ctr_2d_general(contraction *c)
partial constructor, most of the logic is in the ctr_2d_gen_build function
Definition: ctr_2d_general.h:137

CTF_int::ctr_2d_general::ctr_sub_lda_A
int64_t ctr_sub_lda_A
Definition: ctr_2d_general.h:52

ctr_comm.h

CTF_int::ctr_2d_general::ctr_lda_B
int64_t ctr_lda_B
Definition: ctr_2d_general.h:54

CTF_int::ctr_2d_general::ctr_sub_lda_C
int64_t ctr_sub_lda_C
Definition: ctr_2d_general.h:58

CTF_int::ctr_2d_gen_build
int ctr_2d_gen_build(int is_used, CommData global_comm, int i, int *virt_dim, int &cg_edge_len, int &total_iter, tensor *A, int i_A, CommData *&cg_cdt_A, int64_t &cg_ctr_lda_A, int64_t &cg_ctr_sub_lda_A, bool &cg_move_A, int *blk_len_A, int64_t &blk_sz_A, int const *virt_blk_len_A, int &load_phase_A, tensor *B, int i_B, CommData *&cg_cdt_B, int64_t &cg_ctr_lda_B, int64_t &cg_ctr_sub_lda_B, bool &cg_move_B, int *blk_len_B, int64_t &blk_sz_B, int const *virt_blk_len_B, int &load_phase_B, tensor *C, int i_C, CommData *&cg_cdt_C, int64_t &cg_ctr_lda_C, int64_t &cg_ctr_sub_lda_C, bool &cg_move_C, int *blk_len_C, int64_t &blk_sz_C, int const *virt_blk_len_C, int &load_phase_C)
sets up a ctr_2d_general (2D SUMMA) level where A is not communicated function will be called with A/...
Definition: ctr_2d_general.cxx:12

CTF_int
Definition: model_trainer.cxx:16

CTF_int::ctr_2d_general::ctr_lda_C
int64_t ctr_lda_C
Definition: ctr_2d_general.h:57

CTF_int::ctr_2d_general::move_C
bool move_C
Definition: ctr_2d_general.h:66