ctf/spctr__2d__general_8h_source.html

 /*Copyright (c) 2011, Edgar Solomonik, all rights reserved.*/
 #include "spctr_comm.h"

 #ifndef __SPCTR_2D_GENERAL_H__
 #define __SPCTR_2D_GENERAL_H__

 namespace CTF_int{
   class tensor;
   int  spctr_2d_gen_build(int                        is_used,
                           CommData                   global_comm,
                           int                        i,
                           int *                      virt_dim,
                           int &                      cg_edge_len,
                           int &                      total_iter,
                           tensor *                   A,
                           int                        i_A,
                           CommData *&                cg_cdt_A,
                           int64_t &                  cg_spctr_lda_A,
                           int64_t &                  cg_spctr_sub_lda_A,
                           bool &                     cg_move_A,
                           int *                      blk_len_A,
                           int64_t &                  blk_sz_A,
                           int const *                virt_blk_len_A,
                           int &                      load_phase_A,
                           tensor *                   B,
                           int                        i_B,
                           CommData *&                cg_cdt_B,
                           int64_t &                  cg_spctr_lda_B,
                           int64_t &                  cg_spctr_sub_lda_B,
                           bool &                     cg_move_B,
                           int *                      blk_len_B,
                           int64_t &                  blk_sz_B,
                           int const *                virt_blk_len_B,
                           int &                      load_phase_B,
                           tensor *                   C,
                           int                        i_C,
                           CommData *&                cg_cdt_C,
                           int64_t &                  cg_spctr_lda_C,
                           int64_t &                  cg_spctr_sub_lda_C,
                           bool &                     cg_move_C,
                           int *                      blk_len_C,
                           int64_t &                  blk_sz_C,
                           int const *                virt_blk_len_C,
                           int &                      load_phase_C);


   class spctr_2d_general : public spctr {
     public:
       int edge_len;

       int64_t ctr_lda_A; /* local lda_A of contraction dimension 'k' */
       int64_t ctr_sub_lda_A; /* elements per local lda_A
                             of contraction dimension 'k' */
       int64_t ctr_lda_B; /* local lda_B of contraction dimension 'k' */
       int64_t ctr_sub_lda_B; /* elements per local lda_B
                             of contraction dimension 'k' */
       int64_t ctr_lda_C; /* local lda_C of contraction dimension 'k' */
       int64_t ctr_sub_lda_C; /* elements per local lda_C
                             of contraction dimension 'k' */
       int64_t dns_vrt_sz_A; /* size of each block of A when stored as dense, needed for time estimation given nnz frac */
       int64_t dns_vrt_sz_B; /* size of each block of A when stored as dense, needed for time estimation given nnz frac */
       int64_t dns_vrt_sz_C; /* size of each block of A when stored as dense, needed for time estimation given nnz frac */
   #ifdef OFFLOAD
       bool alloc_host_buf;
   #endif

       bool move_A;
       bool move_B;
       bool move_C;

       CommData * cdt_A;
       CommData * cdt_B;
       CommData * cdt_C;
       /* Class to be called on sub-blocks */
       spctr * rec_ctr;

       void print();
       void run(char * A, int nblk_A, int64_t const * size_blk_A,
                char * B, int nblk_B, int64_t const * size_blk_B,
                char * C, int nblk_C, int64_t * size_blk_C,
                char *& new_C);

       int64_t spmem_fp(double nnz_frac_A, double nnz_frac_B, double nnz_frac_C);
       int64_t spmem_rec(double nnz_frac_A, double nnz_frac_B, double nnz_frac_C);
       double est_time_fp(int nlyr, double nnz_frac_A, double nnz_frac_B, double nnz_frac_C);

       double est_time_rec(int nlyr, double nnz_frac_A, double nnz_frac_B, double nnz_frac_C);

       spctr * clone();
 /*      void set_size_blk_A(int new_nblk_A, int64_t const * nnbA){
         spctr::set_size_blk_A(new_nblk_A, nnbA);
         rec_ctr->set_size_blk_A(new_nblk_A, nnbA);
       }*/

       void find_bsizes(int64_t & b_A,
                        int64_t & b_B,
                        int64_t & b_C,
                        int64_t & s_A,
                        int64_t & s_B,
                        int64_t & s_C,
                        int64_t & aux_size);
       spctr_2d_general(spctr * other);
       ~spctr_2d_general();
       spctr_2d_general(contraction * c) : spctr(c){ move_A=0; move_B=0; move_C=0; }
   };
 }

 #endif
CTF_int::spctr_2d_general::est_time_fp
double est_time_fp(int nlyr, double nnz_frac_A, double nnz_frac_B, double nnz_frac_C)
returns the time this kernel will take including calls to rec_ctr
Definition: spctr_2d_general.cxx:92

CTF_int::spctr_2d_general::move_C
bool move_C
Definition: spctr_2d_general.h:69

CTF_int::spctr_2d_general::dns_vrt_sz_B
int64_t dns_vrt_sz_B
Definition: spctr_2d_general.h:61

CTF_int::spctr_2d_general::dns_vrt_sz_C
int64_t dns_vrt_sz_C
Definition: spctr_2d_general.h:62

spctr_comm.h

CTF_int::spctr_2d_general::ctr_sub_lda_B
int64_t ctr_sub_lda_B
Definition: spctr_2d_general.h:55

CTF_int::CommData
Definition: common.h:127

CTF_int::spctr_2d_general::est_time_rec
double est_time_rec(int nlyr, double nnz_frac_A, double nnz_frac_B, double nnz_frac_C)
returns the time this kernel will take including calls to rec_ctr
Definition: spctr_2d_general.cxx:117

CTF_int::spctr_2d_general::cdt_A
CommData * cdt_A
Definition: spctr_2d_general.h:71

CTF_int::spctr_2d_general::cdt_C
CommData * cdt_C
Definition: spctr_2d_general.h:73

CTF_int::spctr_2d_general::edge_len
int edge_len
Definition: spctr_2d_general.h:49

CTF_int::spctr_2d_general::ctr_lda_B
int64_t ctr_lda_B
Definition: spctr_2d_general.h:54

CTF_int::spctr_2d_gen_build
int spctr_2d_gen_build(int is_used, CommData global_comm, int i, int *virt_dim, int &cg_edge_len, int &total_iter, tensor *A, int i_A, CommData *&cg_cdt_A, int64_t &cg_spctr_lda_A, int64_t &cg_spctr_sub_lda_A, bool &cg_move_A, int *blk_len_A, int64_t &blk_sz_A, int const *virt_blk_len_A, int &load_phase_A, tensor *B, int i_B, CommData *&cg_cdt_B, int64_t &cg_spctr_lda_B, int64_t &cg_spctr_sub_lda_B, bool &cg_move_B, int *blk_len_B, int64_t &blk_sz_B, int const *virt_blk_len_B, int &load_phase_B, tensor *C, int i_C, CommData *&cg_cdt_C, int64_t &cg_spctr_lda_C, int64_t &cg_spctr_sub_lda_C, bool &cg_move_C, int *blk_len_C, int64_t &blk_sz_C, int const *virt_blk_len_C, int &load_phase_C)

CTF_int::spctr
Definition: spctr_tsr.h:10

CTF_int::spctr_2d_general::spmem_fp
int64_t spmem_fp(double nnz_frac_A, double nnz_frac_B, double nnz_frac_C)
returns the number of bytes of buffer space we need
Definition: spctr_2d_general.cxx:121

CTF_int::contraction
class for execution distributed contraction of tensors
Definition: contraction.h:16

CTF_int::spctr_2d_general::spmem_rec
int64_t spmem_rec(double nnz_frac_A, double nnz_frac_B, double nnz_frac_C)
returns the number of bytes of buffer space we need recursively
Definition: spctr_2d_general.cxx:134

CTF_int::spctr::new_C
char * new_C
Definition: spctr_tsr.h:15

CTF_int::spctr_2d_general::rec_ctr
spctr * rec_ctr
Definition: spctr_2d_general.h:75

CTF_int::spctr_2d_general::spctr_2d_general
spctr_2d_general(contraction *c)
partial constructor, most of the logic is in the spctr_2d_gen_build function
Definition: spctr_2d_general.h:150

CTF_int::spctr_2d_general::run
void run(char *A, int nblk_A, int64_t const *size_blk_A, char *B, int nblk_B, int64_t const *size_blk_B, char *C, int nblk_C, int64_t *size_blk_C, char *&new_C)
Basically doing SUMMA, except assumes equal block size on each processor. Performs rank-b updates whe...
Definition: spctr_2d_general.cxx:365

CTF_int::spctr_2d_general::move_B
bool move_B
Definition: spctr_2d_general.h:68

CTF_int::spctr_2d_general::ctr_lda_A
int64_t ctr_lda_A
Definition: spctr_2d_general.h:51

CTF_int::spctr_2d_general::cdt_B
CommData * cdt_B
Definition: spctr_2d_general.h:72

CTF_int::spctr_2d_general
Definition: spctr_2d_general.h:47

CTF_int::spctr_2d_general::move_A
bool move_A
Definition: spctr_2d_general.h:67

CTF_int::spctr_2d_general::spctr_2d_general
spctr_2d_general(spctr *other)
copies spctr object
Definition: spctr_2d_general.cxx:19

CTF_int::spctr_2d_general::clone
spctr * clone()
Definition: spctr_2d_general.cxx:64

CTF_int::spctr_2d_general::find_bsizes
void find_bsizes(int64_t &b_A, int64_t &b_B, int64_t &b_C, int64_t &s_A, int64_t &s_B, int64_t &s_C, int64_t &aux_size)
determines buffer and block sizes needed for spctr_2d_general
Definition: spctr_2d_general.cxx:68

CTF_int::spctr_2d_general::ctr_sub_lda_A
int64_t ctr_sub_lda_A
Definition: spctr_2d_general.h:52

CTF_int::spctr_2d_general::print
void print()
print ctr object
Definition: spctr_2d_general.cxx:44

CTF_int::spctr_2d_general::ctr_sub_lda_C
int64_t ctr_sub_lda_C
Definition: spctr_2d_general.h:58

CTF_int
Definition: model_trainer.cxx:16

CTF_int::spctr_2d_general::~spctr_2d_general
~spctr_2d_general()
deallocs spctr_2d_general object
Definition: spctr_2d_general.cxx:11

CTF_int::spctr_2d_general::dns_vrt_sz_A
int64_t dns_vrt_sz_A
Definition: spctr_2d_general.h:60

CTF_int::spctr_2d_general::ctr_lda_C
int64_t ctr_lda_C
Definition: spctr_2d_general.h:57