ctf/coo_8cxx_source.html

 #include "coo.h"
 #include "csr.h"
 #include "../shared/util.h"
 #include "../contraction/ctr_comm.h"

 namespace CTF_int {
   int64_t get_coo_size(int64_t nnz, int val_size){
     val_size = std::max(val_size,64*((val_size + 63)/64));
     return nnz*(val_size+sizeof(int)*2)+2*sizeof(int64_t);
   }

   COO_Matrix::COO_Matrix(int64_t nnz, algstrct const * sr){
     int64_t size = get_coo_size(nnz, sr->el_size);
     all_data = (char*)alloc(size);
     ((int64_t*)all_data)[0] = nnz;
     ((int64_t*)all_data)[1] = sr->el_size;
     //printf("all_data %p vals %p\n",all_data,this->vals());
   }

   COO_Matrix::COO_Matrix(char * all_data_){
     all_data = all_data_;
   }

   COO_Matrix::COO_Matrix(CSR_Matrix const & csr, algstrct const * sr){
     int64_t nnz = csr.nnz();
     int64_t v_sz = csr.val_size();
     int const * csr_ja = csr.JA();
     int const * csr_ia = csr.IA();
     char const * csr_vs = csr.vals();

     int64_t size = get_coo_size(nnz, v_sz);
     all_data = (char*)alloc(size);
     ((int64_t*)all_data)[0] = nnz;
     ((int64_t*)all_data)[1] = v_sz;

     char * vs = vals();
     int * coo_rs = rows();
     int * coo_cs = cols();

     sr->init_shell(nnz, vs);

     sr->csr_to_coo(nnz, csr.nrow(), csr_vs, csr_ja, csr_ia, vs, coo_rs, coo_cs);
   }

   int64_t COO_Matrix::nnz() const {
     return ((int64_t*)all_data)[0];
   }

   int COO_Matrix::val_size() const {
     return ((int64_t*)all_data)[1];
   }

   int64_t COO_Matrix::size() const {
     return get_coo_size(nnz(),val_size());
   }

   char * COO_Matrix::vals() const {
     return all_data + 2*sizeof(int64_t);
   }

   int * COO_Matrix::rows() const {
     int64_t n = this->nnz();
     int v_sz = this->val_size();

     return (int*)(all_data + n*v_sz+2*sizeof(int64_t));
   }

   int * COO_Matrix::cols() const {
     int64_t n = this->nnz();
     int v_sz = ((int64_t*)all_data)[1];

     return (int*)(all_data + n*(v_sz+sizeof(int))+2*sizeof(int64_t));
   }

   void COO_Matrix::set_data(int64_t nz, int order, int const * lens, int const * rev_ordering, int nrow_idx, char const * tsr_data, algstrct const * sr, int const * phase){
     TAU_FSTART(convert_to_COO);
     ((int64_t*)all_data)[0] = nz;
     ((int64_t*)all_data)[1] = sr->el_size;
     int v_sz = sr->el_size;

     int * rev_ord_lens = (int*)alloc(sizeof(int)*order);
     int * ordering = (int*)alloc(sizeof(int)*order);
     int64_t * lda_col = (int64_t*)alloc(sizeof(int64_t)*(order-nrow_idx));
     int64_t * lda_row = (int64_t*)alloc(sizeof(int64_t)*nrow_idx);

     for (int i=0; i<order; i++){
       ordering[rev_ordering[i]]=i;
     }
     for (int i=0; i<order; i++){
     //  printf("[%d] %d -> %d\n", lens[i], i, ordering[i]);
       rev_ord_lens[ordering[i]] = lens[i]/phase[i];
       if (lens[i]%phase[i] > 0) rev_ord_lens[ordering[i]]++;
     }

     for (int i=0; i<order; i++){
       if (i==0 && i<nrow_idx){
         lda_row[0] = 1;
       }
       if (i>0 && i<nrow_idx){
         lda_row[i] = lda_row[i-1]*rev_ord_lens[i-1];
       }
       if (i==nrow_idx){
         lda_col[0] = 1;
       }
       if (i>nrow_idx){
         lda_col[i-nrow_idx] = lda_col[i-nrow_idx-1]*rev_ord_lens[i-1];
       //  printf("lda_col[%d] = %ld len[%d] = %d\n",i-nrow_idx, lda_col[i-nrow_idx], i, rev_ord_lens[i]);
       }
     }

     int * rs = rows();
     int * cs = cols();
     char * vs = vals();

 #ifdef USE_OMP
     #pragma omp parallel for
 #endif
     for (int64_t i=0; i<nz; i++){
       ConstPairIterator pi(sr, tsr_data);
       int64_t k = pi[i].k();
       cs[i] = 1;
       rs[i] = 1;
       for (int j=0; j<order; j++){
         int64_t kpart = (k%lens[j])/phase[j];
         if (ordering[j] < nrow_idx){
           rs[i] += kpart*lda_row[ordering[j]];
         } else {
           cs[i] += kpart*lda_col[ordering[j]-nrow_idx];
         //  printf("%d %ld %d %d %ld\n",j,kpart,ordering[j],nrow_idx,lda_col[ordering[j]-nrow_idx]);
         }
         k=k/lens[j];
       }
       //printf("k=%ld col = %d row = %d\n", pi[i].k(), cs[i], rs[i]);
       pi[i].read_val(vs+v_sz*i);
       //printf("wrote value at %p v_Sz = %d\n",vs+v_sz*i, v_sz);
       //sr->print(pi[i].d());
       //sr->print(vs+v_sz*i);
     }
     cdealloc(ordering);
     cdealloc(rev_ord_lens);
     cdealloc(lda_col);
     cdealloc(lda_row);
     TAU_FSTOP(convert_to_COO);
   }

   void COO_Matrix::get_data(int64_t nz, int order, int const * lens, int const * rev_ordering, int nrow_idx, char * tsr_data, algstrct const * sr, int const * phase, int const * phase_rank){
     TAU_FSTART(convert_to_COO);
     ASSERT(((int64_t*)all_data)[0] == nz);
     ASSERT(((int64_t*)all_data)[1] == sr->el_size);
     int v_sz = sr->el_size;

     int * rev_ord_lens = (int*)alloc(sizeof(int)*order);
     int * ordering = (int*)alloc(sizeof(int)*order);
     int64_t * lda_col = (int64_t*)alloc(sizeof(int64_t)*(order-nrow_idx));
     int64_t * lda_row = (int64_t*)alloc(sizeof(int64_t)*nrow_idx);

     for (int i=0; i<order; i++){
       ordering[rev_ordering[i]]=i;
     }
     for (int i=0; i<order; i++){
     //  printf("[%d] %d -> %d\n", lens[i], i, ordering[i]);
       rev_ord_lens[ordering[i]] = lens[i]/phase[i];
       if (lens[i]%phase[i] > 0) rev_ord_lens[ordering[i]]++;
     }

     for (int i=0; i<order; i++){
       if (i==0 && i<nrow_idx){
         lda_row[0] = 1;
       }
       if (i>0 && i<nrow_idx){
         lda_row[i] = lda_row[i-1]*rev_ord_lens[i-1];
       }
       if (i==nrow_idx){
         lda_col[0] = 1;
       }
       if (i>nrow_idx){
         lda_col[i-nrow_idx] = lda_col[i-nrow_idx-1]*rev_ord_lens[i-1];
       //  printf("lda_col[%d] = %ld len[%d] = %d\n",i-nrow_idx, lda_col[i-nrow_idx], i, rev_ord_lens[i]);
       }
     }

     int * rs = rows();
     int * cs = cols();
     char * vs = vals();

 #ifdef USE_OMP
     #pragma omp parallel for
 #endif
     for (int64_t i=0; i<nz; i++){
       PairIterator pi(sr, tsr_data);
       int64_t k = 0;
       int64_t lda_k = 1;
       for (int j=0; j<order; j++){
         int64_t kpart;
         if (ordering[j] < nrow_idx){
           kpart = ((rs[i]-1)/lda_row[ordering[j]])%rev_ord_lens[ordering[j]];
         } else {
           kpart = ((cs[i]-1)/lda_col[ordering[j]-nrow_idx])%rev_ord_lens[ordering[j]];
         }
         //  printf("%d %ld %d %d %ld\n",j,kpart,ordering[j],nrow_idx,lda_col[ordering[j]-nrow_idx]);
        // if (j>0){ kpart *= lens[j-1]; }
         k+=(kpart*phase[j]+phase_rank[j])*lda_k;
 /*        if (k>=tot_sz){
           printf("%d kpart %ld k1 %d phase[j-1] %d phase_rank[j-1] %d lda_k %ld\n",j-1,((k-(kpart*phase[j]+phase_rank[j])*lda_k)/(lda_k/lens[j-1])-phase_rank[j-1])/phase[j-1],k-(kpart*phase[j]+phase_rank[j])*lda_k,phase[j-1],phase_rank[j-1],lda_k/lens[j-1]);
           printf("%d kpart %ld k2 %ld phase[j] %d phase_rank[j] %d lda_k %ld\n",j,kpart,(kpart*phase[j]+phase_rank[j])*lda_k,phase[j],phase_rank[j],lda_k);
         }*/
         lda_k *= lens[j];
       }
       //ASSERT(k<tot_sz);
 //      if (k>=tot_sz) printf("k=%ld tot_sz=%ld c = %d r = %d\n",k,tot_sz,cs[i],rs[i]);
 //      printf("p[%d %d] [%d,%d]->%ld\n",phase_rank[0],phase_rank[1],rs[i],cs[i],k);
       pi[i].write_key(k);
       pi[i].write_val(vs+v_sz*i);
       //printf("k=%ld col = %d row = %d\n", pi[i].k(), cs[i], rs[i]);
       //sr->print(pi[i].d());
 //      memcpy(pi[i].d(), vs+v_sz*i, v_sz);
     }
     PairIterator pi2(sr, tsr_data);
     TAU_FSTART(COO_to_kvpair_sort);
     pi2.sort(nz);
     TAU_FSTOP(COO_to_kvpair_sort);
     cdealloc(ordering);
     cdealloc(rev_ord_lens);
     cdealloc(lda_col);
     cdealloc(lda_row);
     TAU_FSTOP(convert_to_COO);
   }


   void COO_Matrix::coomm(char const * A, algstrct const * sr_A, int m, int n, int k, char const * alpha, char const * B, algstrct const * sr_B, char const * beta, char * C, algstrct const * sr_C, bivar_function const * func){
     COO_Matrix cA((char*)A);
     int64_t nz = cA.nnz();
     int const * rs = cA.rows();
     int const * cs = cA.cols();
     char const * vs = cA.vals();
     if (func != NULL){
       assert(sr_C->isequal(beta, sr_C->mulid()));
       assert(alpha == NULL || sr_C->isequal(alpha, sr_C->mulid()));
       func->ccoomm(m,n,k,vs,rs,cs,nz,B,C);
     } else {
       ASSERT(sr_B->el_size == sr_A->el_size);
       ASSERT(sr_C->el_size == sr_A->el_size);
       sr_A->coomm(m,n,k,alpha,vs,rs,cs,nz,B,beta,C,func);
     }
   }
 }
CTF_int::COO_Matrix::rows
int * rows() const
retrieves pointer to array row indices of each value
Definition: coo.cxx:61

CTF_int::PairIterator::write_key
void write_key(int64_t key)
sets key of head pair to key
Definition: algstrct.cxx:821

CTF_int::CSR_Matrix::IA
int * IA() const
retrieves prefix sum of number of nonzeros for each row (of size nrow()+1) out of all_data ...
Definition: csr.cxx:107

CTF_int::get_coo_size
int64_t get_coo_size(int64_t nnz, int val_size)
Definition: coo.cxx:7

CTF_int::algstrct::isequal
virtual bool isequal(char const *a, char const *b) const
returns true if algstrct elements a and b are equal
Definition: algstrct.cxx:340

CTF_int::COO_Matrix::size
int64_t size() const
retrieves buffer size out of all_data
Definition: coo.cxx:53

ASSERT
#define ASSERT(...)
Definition: util.h:88

CTF_int::alloc
void * alloc(int64_t len)
alloc abstraction
Definition: memcontrol.cxx:365

CTF_int::PairIterator::sort
void sort(int64_t n)
sorts set of pairs using std::sort
Definition: algstrct.cxx:825

CTF_int::bivar_function
untyped internal class for triply-typed bivariate function
Definition: ctr_comm.h:16

CTF_int::algstrct::coomm
virtual void coomm(int m, int n, int k, char const *alpha, char const *A, int const *rows_A, int const *cols_A, int64_t nnz_A, char const *B, char const *beta, char *C, bivar_function const *func) const
sparse version of gemm using coordinate format for A
Definition: algstrct.cxx:703

CTF_int::PairIterator
Definition: algstrct.h:434

CTF_int::COO_Matrix::all_data
char * all_data
serialized buffer containing info and data
Definition: coo.h:17

CTF_int::COO_Matrix::COO_Matrix
COO_Matrix(int64_t nnz, algstrct const *sr)
constructor that allocates empty buffer
Definition: coo.cxx:12

coo.h

csr.h

CTF_int::COO_Matrix::cols
int * cols() const
retrieves pointer to array of column indices for each value
Definition: coo.cxx:68

CTF_int::COO_Matrix::nnz
int64_t nnz() const
retrieves number of nonzeros out of all_data
Definition: coo.cxx:45

CTF_int::CSR_Matrix::JA
int * JA() const
retrieves column indices of each value in vals stored in sorted form by row
Definition: csr.cxx:119

CTF_int::algstrct::csr_to_coo
virtual void csr_to_coo(int64_t nz, int nrow, char const *csr_vs, int const *csr_ja, int const *csr_ia, char *coo_vs, int *coo_rs, int *coo_cs) const
converts CSR sparse matrix layout to coordinate (COO) layout
Definition: algstrct.cxx:355

CTF_int::bivar_function::ccoomm
virtual void ccoomm(int m, int n, int k, char const *A, int const *rows_A, int const *cols_A, int64_t nnz_A, char const *B, char *C) const
Definition: ctr_comm.h:96

CTF_int::COO_Matrix::get_data
void get_data(int64_t nz, int order, int const *lens, int const *rev_ordering, int nrow_idx, char *tsr_data, algstrct const *sr, int const *phase, int const *phase_rank)
unfolds tensor data from COO format based on prespecification of row and column modes ...
Definition: coo.cxx:146

CTF_int::CSR_Matrix::nnz
int64_t nnz() const
retrieves number of nonzeros out of all_data
Definition: csr.cxx:80

CTF_int::ConstPairIterator::k
int64_t k() const
returns key of pair at head of ptr
Definition: algstrct.cxx:764

CTF_int::COO_Matrix
serialized matrix in coordinate format, meaning three arrays of dimension nnz are stored...
Definition: coo.h:14

CTF_int::ConstPairIterator
Definition: algstrct.h:380

CTF_int::CSR_Matrix
abstraction for a serialized sparse matrix stored in column-sparse-row (CSR) layout ...
Definition: csr.h:22

CTF_int::COO_Matrix::coomm
static void coomm(char const *A, algstrct const *sr_A, int m, int n, int k, char const *alpha, char const *B, algstrct const *sr_B, char const *beta, char *C, algstrct const *sr_C, bivar_function const *func)
computes C = beta*C + func(alpha*A*B) where A is a COO_Matrix, while B and C are dense ...
Definition: coo.cxx:230

TAU_FSTOP
#define TAU_FSTOP(ARG)
Definition: util.h:281

TAU_FSTART
#define TAU_FSTART(ARG)
Definition: util.h:280

CTF_int::ConstPairIterator::read_val
void read_val(char *buf) const
sets value to the value pointed by the iterator
Definition: algstrct.cxx:776

CTF_int::COO_Matrix::set_data
void set_data(int64_t nz, int order, int const *lens, int const *ordering, int nrow_idx, char const *tsr_data, algstrct const *sr, int const *phase)
folds tensor data into COO format based on prespecification of row and column modes ...
Definition: coo.cxx:75

CTF_int::CSR_Matrix::nrow
int nrow() const
retrieves number of rows out of all_data
Definition: csr.cxx:93

CTF_int::COO_Matrix::val_size
int val_size() const
retrieves matrix entry size out of all_data
Definition: coo.cxx:49

CTF_int::CSR_Matrix::vals
char * vals() const
retrieves array of values out of all_data
Definition: csr.cxx:101

CTF_int::accumulatable::el_size
int el_size
size of each element of algstrct in bytes
Definition: algstrct.h:16

CTF_int::cdealloc
int cdealloc(void *ptr)
free abstraction
Definition: memcontrol.cxx:480

CTF_int::algstrct
algstrct (algebraic structure) defines the elementwise operations computed in each tensor contraction...
Definition: algstrct.h:34

CTF_int::PairIterator::write_val
void write_val(char const *buf)
sets value of head pair to what is in buf
Definition: algstrct.cxx:817

CTF_int::CSR_Matrix::val_size
int val_size() const
retrieves matrix entry size out of all_data
Definition: csr.cxx:84

CTF_int::accumulatable::init_shell
virtual void init_shell(int64_t n, char *arr) const
initialize n objects to zero
Definition: algstrct.h:26

CTF_int
Definition: model_trainer.cxx:16

CTF_int::algstrct::mulid
virtual char const * mulid() const
identity element for multiplication i.e. 1
Definition: algstrct.cxx:93

CTF_int::COO_Matrix::vals
char * vals() const
retrieves pointer to array of values out of all_data
Definition: coo.cxx:57