ctf/symmetrization_8cxx_source.html

 #include "symmetrization.h"
 #include "../tensor/untyped_tensor.h"
 #include "../shared/util.h"
 #include "../interface/timer.h"
 #include "sym_indices.h"
 #include "../scaling/scaling.h"

 using namespace CTF;

 namespace CTF_int {

   void desymmetrize(tensor * sym_tsr,
                     tensor * nonsym_tsr,
                     bool     is_C){
     int i, is, j, sym_dim, scal_diag, num_sy, num_sy_neg;
     int * idx_map_A, * idx_map_B;
     int rev_sign;

     if (sym_tsr == nonsym_tsr) return;

     TAU_FSTART(desymmetrize);

     sym_dim = -1;
     is = -1;
     rev_sign = 1;
     scal_diag = 0;
     num_sy=0;
     num_sy_neg=0;
     for (i=0; i<sym_tsr->order; i++){
       if (sym_tsr->sym[i] != nonsym_tsr->sym[i]){
         is = i;
         if (sym_tsr->sym[i] == AS) rev_sign = -1;
         if (sym_tsr->sym[i] == SY){
           scal_diag = 1;
         }
         if (i>0 && sym_tsr->sym[i-1] != NS) i++;
         sym_dim = i;
         num_sy = 0;
         j=i;
         while (j<sym_tsr->order && sym_tsr->sym[j] != NS){
           num_sy++;
           j++;
         }
         num_sy_neg = 0;
         j=i-1;
         while (j>=0 && sym_tsr->sym[j] != NS){
           num_sy_neg++;
           j--;
         }
         break;
       }
     }
     nonsym_tsr->clear_mapping();
     nonsym_tsr->set_padding();
     copy_mapping(sym_tsr->order, sym_tsr->edge_map, nonsym_tsr->edge_map);
     if (nonsym_tsr->is_sparse){
       nonsym_tsr->nnz_blk = (int64_t*)alloc(sizeof(int64_t)*nonsym_tsr->calc_nvirt());
       std::fill(nonsym_tsr->nnz_blk, nonsym_tsr->nnz_blk+nonsym_tsr->calc_nvirt(), 0);
     }
     nonsym_tsr->is_mapped = 1;
     nonsym_tsr->topo      = sym_tsr->topo;
     nonsym_tsr->set_padding();

     if (sym_dim == -1) {
       nonsym_tsr->size            = sym_tsr->size;
       nonsym_tsr->data            = sym_tsr->data;
       nonsym_tsr->home_buffer     = sym_tsr->home_buffer;
       nonsym_tsr->is_home         = sym_tsr->is_home;
       nonsym_tsr->has_home        = sym_tsr->has_home;
       nonsym_tsr->home_size       = sym_tsr->home_size;
       nonsym_tsr->is_data_aliased = 1;
       nonsym_tsr->set_new_nnz_glb(sym_tsr->nnz_blk);
       TAU_FSTOP(desymmetrize);
       return;
     }
     #ifdef PROF_SYM
     if (sym_tsr->wrld->rank == 0)
       VPRINTF(2,"Desymmetrizing %s\n", sym_tsr->name);
     if (sym_tsr->profile) {
       char spf[80];
       strcpy(spf,"desymmetrize_");
       strcat(spf,sym_tsr->name);
       CTF::Timer t_pf(spf);
       if (sym_tsr->wrld->rank == 0)
         VPRINTF(2,"Desymmetrizing %s\n", sym_tsr->name);
       t_pf.start();
     }
     #endif

     if (!nonsym_tsr->is_sparse)
       nonsym_tsr->data = nonsym_tsr->sr->alloc(nonsym_tsr->size);
       //CTF_int::mst_alloc_ptr(nonsym_tsr->size*nonsym_tsr->sr->el_size, (void**)&nonsym_tsr->data);
     nonsym_tsr->set_zero();
     //nonsym_tsr->sr->set(nonsym_tsr->data, nonsym_tsr->sr->addid(), nonsym_tsr->size);

     CTF_int::alloc_ptr(sym_tsr->order*sizeof(int), (void**)&idx_map_A);
     CTF_int::alloc_ptr(sym_tsr->order*sizeof(int), (void**)&idx_map_B);

     for (i=0; i<sym_tsr->order; i++){
       idx_map_A[i] = i;
       idx_map_B[i] = i;
     }

     if (scal_diag){
       if (!is_C){
         tensor * ctsr = sym_tsr;
         if (scal_diag && num_sy+num_sy_neg==1){
           ctsr = new tensor(sym_tsr);
           ctsr->sym[is] = SH;
           ctsr->zero_out_padding();
           ctsr->sym[is] = SY;
         }
         for (i=-num_sy_neg-1; i<num_sy; i++){
           if (i==-1) continue;
           idx_map_A[sym_dim] = sym_dim+i+1;
           idx_map_A[sym_dim+i+1] = sym_dim;
           char * mksign = NULL;
           char const * ksign;
           if (rev_sign == -1){
             mksign = (char*)alloc(nonsym_tsr->sr->el_size);
             nonsym_tsr->sr->addinv(nonsym_tsr->sr->mulid(), mksign);
             ksign = mksign;
            } else
             ksign = nonsym_tsr->sr->mulid();
           summation csum = summation(ctsr, idx_map_A, ksign,
                                      nonsym_tsr, idx_map_B, nonsym_tsr->sr->mulid());

           csum.sum_tensors(0);
           if (rev_sign == -1) cdealloc(mksign);
           idx_map_A[sym_dim] = sym_dim;
           idx_map_A[sym_dim+i+1] = sym_dim+i+1;
         }
         if (scal_diag && num_sy+num_sy_neg==1) delete ctsr;
         summation ssum = summation(sym_tsr, idx_map_A, nonsym_tsr->sr->mulid(), nonsym_tsr, idx_map_B, nonsym_tsr->sr->mulid());
         ssum.sum_tensors(0);
       }
       /*printf("DESYMMETRIZED:\n");
       sym_tsr->print();
       printf("TO:\n");
       nonsym_tsr->print();*/

       /*printf("SYM %s\n",sym_tsr->name);
       sym_tsr->print();
       printf("NONSYM %s\n",sym_tsr->name);
       nonsym_tsr->print();*/


       /* Do not diagonal rescaling since sum has beta=0 and overwrites diagonal */
       if (num_sy+num_sy_neg>1){
   //      assert(0); //FIXME: zero_out_padding instead, fractional rescaling factor seems problematic?
     //    print_tsr(stdout, nonsym_tid);
         if (!is_C && scal_diag){
           for (i=-num_sy_neg-1; i<num_sy; i++){
             if (i==-1) continue;
             for (j=0; j<sym_tsr->order; j++){
               if (j==sym_dim+i+1){
                 if (j>sym_dim)
                   idx_map_A[j] = sym_dim;
                 else
                   idx_map_A[j] = sym_dim-1;
               } else if (j<sym_dim+i+1) {
                 idx_map_A[j] = j;
               } else {
                 idx_map_A[j] = j-1;
               }
             }
     /*        idx_map_A[sym_dim+i+1] = sym_dim-num_sy_neg;
             idx_map_A[sym_dim] = sym_dim-num_sy_neg;
             for (j=MAX(sym_dim+i+2,sym_dim+1); j<sym_tsr->order; j++){
               idx_map_A[j] = j-1;
             }*/
     /*        printf("tid %d before scale\n", nonsym_tid);
             print_tsr(stdout, nonsym_tid);*/
             char * scalf = (char*)alloc(nonsym_tsr->sr->el_size);
             nonsym_tsr->sr->cast_double(((double)(num_sy+num_sy_neg-1.))/(num_sy+num_sy_neg), scalf);
             scaling sscl(nonsym_tsr, idx_map_A, scalf);
             sscl.execute();
             cdealloc(scalf);
     /*        printf("tid %d after scale\n", nonsym_tid);
             print_tsr(stdout, nonsym_tid);*/
   //          if (ret != CTF_SUCCESS) ABORT;
           }
         }
     //    print_tsr(stdout, nonsym_tid);
       }
     } else if (!is_C) {
       summation ssum = summation(sym_tsr, idx_map_A, nonsym_tsr->sr->mulid(), nonsym_tsr, idx_map_B, nonsym_tsr->sr->mulid());
       ssum.execute();
     }
     CTF_int::cdealloc(idx_map_A);
     CTF_int::cdealloc(idx_map_B);

   /*  switch (sym_tsr->edge_map[sym_dim].type){
       case NOT_MAPPED:
         ASSERT(sym_tsr->edge_map[sym_dim+1].type == NOT_MAPPED);
         rw_smtr<dtype>(sym_tsr->order, sym_tsr->edge_len, 1.0, 0,
            sym_tsr->sym, nonsym_tsr->sym,
            sym_tsr->data, nonsym_tsr->data);
         rw_smtr<dtype>(sym_tsr->order, sym_tsr->edge_len, rev_sign, 1,
            sym_tsr->sym, nonsym_tsr->sym,
            sym_tsr->data, nonsym_tsr->data);
         break;

       case VIRTUAL_MAP:
         if (sym_tsr->edge_map[sym_dim+1].type == VIRTUAL_MAP){
     nvirt =

         } else {
     ASSERT(sym_tsr->edge_map[sym_dim+1].type == PHYSICAL_MAP);

         }
         break;

       case PHYSICAL_MAP:
         if (sym_tsr->edge_map[sym_dim+1].type == VIRTUAL_MAP){

         } else {
     ASSERT(sym_tsr->edge_map[sym_dim+1].type == PHYSICAL_MAP);

         }
         break;
     }*/
     #ifdef PROF_SYM
     if (sym_tsr->profile) {
       char spf[80];
       strcpy(spf,"desymmetrize_");
       strcat(spf,sym_tsr->name);
       CTF::Timer t_pf(spf);
       t_pf.stop();
     }
     #endif

     TAU_FSTOP(desymmetrize);

   }

   void symmetrize(tensor * sym_tsr,
                   tensor * nonsym_tsr){
     int i, j, is, sym_dim, scal_diag, num_sy, num_sy_neg;
     int * idx_map_A, * idx_map_B;
     int rev_sign;

     TAU_FSTART(symmetrize);

     #ifdef PROF_SYM
     if (sym_tsr->profile) {
       char spf[80];
       strcpy(spf,"symmetrize_");
       strcat(spf,sym_tsr->name);
       CTF::Timer t_pf(spf);
       if (sym_tsr->wrld->rank == 0)
         VPRINTF(2,"Symmetrizing %s\n", sym_tsr->name);
       t_pf.start();
     }
     #endif

     sym_dim = -1;
     is = -1;
     rev_sign = 1;
     scal_diag = 0;
     num_sy=0;
     num_sy_neg=0;
     for (i=0; i<sym_tsr->order; i++){
       if (sym_tsr->sym[i] != nonsym_tsr->sym[i]){
         is = i;
         if (sym_tsr->sym[i] == AS) rev_sign = -1;
         if (sym_tsr->sym[i] == SY){
           scal_diag = 1;
         }
         if (i>0 && sym_tsr->sym[i-1] != NS) i++;
         sym_dim = i;
         num_sy = 0;
         j=i;
         while (j<sym_tsr->order && sym_tsr->sym[j] != NS){
           num_sy++;
           j++;
         }
         num_sy_neg = 0;
         j=i-1;
         while (j>=0 && sym_tsr->sym[j] != NS){
           num_sy_neg++;
           j--;
         }
         break;
       }
     }
     if (sym_dim == -1) {
       sym_tsr->topo    = nonsym_tsr->topo;
       copy_mapping(nonsym_tsr->order, nonsym_tsr->edge_map, sym_tsr->edge_map);
       if (sym_tsr->is_sparse){
         sym_tsr->nnz_blk = (int64_t*)alloc(sizeof(int64_t)*sym_tsr->calc_nvirt());
         std::fill(sym_tsr->nnz_blk, sym_tsr->nnz_blk+sym_tsr->calc_nvirt(), 0);
       }
       sym_tsr->is_mapped    = 1;
       sym_tsr->set_padding();
       sym_tsr->size     = nonsym_tsr->size;
       sym_tsr->data     = nonsym_tsr->data;
       sym_tsr->is_home  = nonsym_tsr->is_home;
       sym_tsr->set_new_nnz_glb(nonsym_tsr->nnz_blk);
     } else {

       //sym_tsr->sr->set(sym_tsr->data, sym_tsr->sr->addid(), sym_tsr->size);
       CTF_int::alloc_ptr(sym_tsr->order*sizeof(int), (void**)&idx_map_A);
       CTF_int::alloc_ptr(sym_tsr->order*sizeof(int), (void**)&idx_map_B);

       for (i=0; i<sym_tsr->order; i++){
         idx_map_A[i] = i;
         idx_map_B[i] = i;
       }

       if (0){
         //FIXME: this is not robust when doing e.g. {SY, SY, SY, NS} -> {SY, NS, SY, NS}
         for (i=-num_sy_neg-1; i<num_sy; i++){
           if (i==-1) continue;
           idx_map_A[sym_dim] = sym_dim+i+1;
           idx_map_A[sym_dim+i+1] = sym_dim;
       //    printf("symmetrizing\n");
     /*      summation csum = summation(nonsym_tsr, idx_map_A, rev_sign,
                                         sym_tsr, idx_map_B, 1.0);*/
             char * ksign = (char*)alloc(nonsym_tsr->sr->el_size);
             if (rev_sign == -1)
               nonsym_tsr->sr->addinv(nonsym_tsr->sr->mulid(), ksign);
             else
               nonsym_tsr->sr->copy(ksign, nonsym_tsr->sr->mulid());
             summation csum(nonsym_tsr, idx_map_A, ksign,
                               sym_tsr, idx_map_B, nonsym_tsr->sr->mulid());
             csum.sum_tensors(0);
             cdealloc(ksign);

       //    print_tsr(stdout, sym_tid);
           idx_map_A[sym_dim] = sym_dim;
           idx_map_A[sym_dim+i+1] = sym_dim+i+1;
         }
         if (scal_diag && num_sy+num_sy_neg == 1) {
       /*    for (i=-num_sy_neg-1; i<num_sy-1; i++){
             tensors[sym_tid]->sym[sym_dim+i+1] = SH;
             zero_out_padding(sym_tid);
             tensors[sym_tid]->sym[sym_dim+i+1] = SY;
           }*/
           sym_tsr->sym[is] = SH;
           sym_tsr->zero_out_padding();
           sym_tsr->sym[is] = SY;
       /*    for (i=-num_sy_neg-1; i<num_sy-1; i++){
             tensors[sym_tid]->sym[sym_dim+i+1] = SY;
           }*/
         }

         summation ssum = summation(nonsym_tsr, idx_map_A, nonsym_tsr->sr->mulid(), sym_tsr, idx_map_B, nonsym_tsr->sr->mulid());
         ssum.sum_tensors(0);


         if (num_sy+num_sy_neg > 1){
           //assert(0); //FIXME: use zero_out_padding?
           if (scal_diag){
          //   printf("symmetrizing diagonal=%d\n",num_sy);
             for (i=-num_sy_neg-1; i<num_sy; i++){
               if (i==-1) continue;
               idx_map_B[sym_dim+i+1] = sym_dim-num_sy_neg;
               idx_map_B[sym_dim] = sym_dim-num_sy_neg;
               for (j=MAX(sym_dim+i+2,sym_dim+1); j<sym_tsr->order; j++){
                 idx_map_B[j] = j-i-num_sy_neg-1;
               }
               /*printf("tid %d before scale\n", nonsym_tid);
               print_tsr(stdout, sym_tid);*/
               char * scalf = (char*)alloc(nonsym_tsr->sr->el_size);
               nonsym_tsr->sr->cast_double(((double)(num_sy-i-1.))/(num_sy-i), scalf);
               scaling sscl = scaling(sym_tsr, idx_map_B, scalf);
               sscl.execute();
       /*        printf("tid %d after scale\n", sym_tid);
               print_tsr(stdout, sym_tid);*/
               //if (ret != CTF_SUCCESS) ABORT;
             }
           }
         }
       } else {
         tensor sym_tsr2(sym_tsr,1,0);
         summation ssum = summation(nonsym_tsr, idx_map_A, nonsym_tsr->sr->mulid(), &sym_tsr2, idx_map_B, nonsym_tsr->sr->addid());
         ssum.execute();
         summation ssum2 = summation(&sym_tsr2, idx_map_A, nonsym_tsr->sr->mulid(), sym_tsr, idx_map_B, nonsym_tsr->sr->mulid());
         ssum2.execute();
       }
       CTF_int::cdealloc(idx_map_A);
       CTF_int::cdealloc(idx_map_B);
     }
     #ifdef PROF_SYM
     if (sym_tsr->profile) {
       char spf[80];
       strcpy(spf,"symmetrize_");
       strcat(spf,sym_tsr->name);
       CTF::Timer t_pf(spf);
       t_pf.stop();
     }
     #endif


     TAU_FSTOP(symmetrize);
   }


   void cmp_sym_perms(int         ndim,
                      int const * sym,
                      int *       nperm,
                      int **      perm,
                      double *    sign){
     int i, np;
     int * pm;
     double sgn;

     ASSERT(sym[0] != NS);
     CTF_int::alloc_ptr(sizeof(int)*ndim, (void**)&pm);

     np=0;
     sgn=1.0;
     for (i=0; i<ndim; i++){
       if (sym[i]==AS){
         sgn=-1.0;
       }
       if (sym[i]!=NS){
         np++;
       } else {
         np++;
         break;
       }
     }
     /* a circular shift of n indices requires n-1 swaps */
     if (np % 2 == 1) sgn = 1.0;

     for (i=0; i<np; i++){
       pm[i] = (i+1)%np;
     }
     for (i=np; i<ndim; i++){
       pm[i] = i;
     }

     *nperm = np;
     *perm = pm;
     *sign = sgn;
   }

   void order_perm(tensor const * A,
                   tensor const * B,
                   int *          idx_arr,
                   int            off_A,
                   int            off_B,
                   int *          idx_A,
                   int *          idx_B,
                   int &          add_sign,
                   int &          mod){
     int  iA, jA, iB, jB, iiB, broken, tmp;

     //find all symmetries in A
     for (iA=0; iA<A->order; iA++){
       if (A->sym[iA] != NS){
         jA=iA;
         iB = idx_arr[2*idx_A[iA]+off_B];
         while (A->sym[jA] != NS){
           broken = 0;
           jA++;
           jB = idx_arr[2*idx_A[jA]+off_B];
           if ((iB == -1) ^ (jB == -1)) broken = 1;
          /* if (iB != -1 && jB != -1) {
             if (B->sym[iB] != A->sym[iA]) broken = 1;
           }*/
           if (iB != -1 && jB != -1) {
             /* Do this because iB,jB can be in reversed order */
             for (iiB=MIN(iB,jB); iiB<MAX(iB,jB); iiB++){
               ASSERT(iiB >= 0 && iiB <= B->order);
               if (B->sym[iiB] == NS) broken = 1;
             }
           }


           /*//if (iB == jB) broken = 1;
           } */
           //if the symmetry is preserved, make sure index map is ordered
           if (!broken){
             if (idx_A[iA] > idx_A[jA]){
               idx_arr[2*idx_A[iA]+off_A] = jA;
               idx_arr[2*idx_A[jA]+off_A] = iA;
               tmp                          = idx_A[iA];
               idx_A[iA] = idx_A[jA];
               idx_A[jA] = tmp;
               if (A->sym[iA] == AS) add_sign *= -1.0;
               mod = 1;
             }
           }
         }
       }
     }
   }

   void order_perm(tensor const * A,
                   tensor const * B,
                   tensor const * C,
                   int *          idx_arr,
                   int            off_A,
                   int            off_B,
                   int            off_C,
                   int *          idx_A,
                   int *          idx_B,
                   int *          idx_C,
                   int &          add_sign,
                   int &          mod){

     int  iA, jA, iB, iC, jB, jC, iiB, iiC, broken, tmp;

     //find all symmetries in A
     for (iA=0; iA<A->order; iA++){
       if (A->sym[iA] != NS){
         jA=iA;
         iB = idx_arr[3*idx_A[iA]+off_B];
         iC = idx_arr[3*idx_A[iA]+off_C];
         while (A->sym[jA] != NS){
           broken = 0;
           jA++;
           jB = idx_arr[3*idx_A[jA]+off_B];
           //if (iB == jB) broken = 1;
           if (iB != -1 && jB != -1){
             for (iiB=MIN(iB,jB); iiB<MAX(iB,jB); iiB++){
               if (B->sym[iiB] ==  NS) broken = 1;
             }
           }
           if ((iB == -1) ^ (jB == -1)) broken = 1;
           jC = idx_arr[3*idx_A[jA]+off_C];
           //if (iC == jC) broken = 1;
           if (iC != -1 && jC != -1){
             for (iiC=MIN(iC,jC); iiC<MAX(iC,jC); iiC++){
               if (C->sym[iiC] == NS) broken = 1;
             }
           }
           if ((iC == -1) ^ (jC == -1)) broken = 1;
           //if the symmetry is preserved, make sure index map is ordered
           if (!broken){
             if (idx_A[iA] > idx_A[jA]){
               idx_arr[3*idx_A[iA]+off_A] = jA;
               idx_arr[3*idx_A[jA]+off_A] = iA;
               tmp                          = idx_A[iA];
               idx_A[iA] = idx_A[jA];
               idx_A[jA] = tmp;
               if (A->sym[iA] == AS) add_sign *= -1.0;
               mod = 1;
             }
           }
         }
       }
     }
   }

   void add_sym_perm(std::vector<summation>& perms,
                     std::vector<int>&       signs,
                     summation const &       new_perm,
                     int                     new_sign){

     int mod, num_tot, i;
     int * idx_arr;
     int add_sign;
     tensor * tsr_A, * tsr_B;

     add_sign = new_sign;
     summation norm_ord_perm(new_perm);

     tsr_A = new_perm.A;
     tsr_B = new_perm.B;

     inv_idx(tsr_A->order, norm_ord_perm.idx_A,
             tsr_B->order, norm_ord_perm.idx_B,
             &num_tot, &idx_arr);
     //keep permuting until we get to normal order (no permutations left)
     do {
       mod = 0;
       order_perm(tsr_A, tsr_B, idx_arr, 0, 1,
                  norm_ord_perm.idx_A, norm_ord_perm.idx_B,
                  add_sign, mod);
       order_perm(tsr_B, tsr_A, idx_arr, 1, 0,
                  norm_ord_perm.idx_B, norm_ord_perm.idx_A,
                  add_sign, mod);
     } while (mod);
     add_sign = add_sign*align_symmetric_indices(tsr_A->order, norm_ord_perm.idx_A, tsr_A->sym,
                                                 tsr_B->order, norm_ord_perm.idx_B, tsr_B->sym);

     // check if this summation is equivalent to one of the other permutations
     for (i=0; i<(int)perms.size(); i++){
       if (perms[i].is_equal(norm_ord_perm)){
         CTF_int::cdealloc(idx_arr);
         return;
       }
     }
     perms.push_back(norm_ord_perm);
     signs.push_back(add_sign);
     CTF_int::cdealloc(idx_arr);
   }

   void add_sym_perm(std::vector<contraction>& perms,
                     std::vector<int>&         signs,
                     contraction const &       new_perm,
                     int                       new_sign){
     int mod, num_tot, i;
     int * idx_arr;
     int add_sign;
     tensor * tsr_A, * tsr_B, * tsr_C;

     tsr_A = new_perm.A;
     tsr_B = new_perm.B;
     tsr_C = new_perm.C;

     add_sign = new_sign;
     contraction norm_ord_perm(new_perm);

     inv_idx(tsr_A->order, norm_ord_perm.idx_A,
             tsr_B->order, norm_ord_perm.idx_B,
             tsr_C->order, norm_ord_perm.idx_C,
             &num_tot, &idx_arr);
     //keep permuting until we get to normal order (no permutations left)
     do {
       mod = 0;
       order_perm(tsr_A, tsr_B, tsr_C, idx_arr, 0, 1, 2,
                  norm_ord_perm.idx_A, norm_ord_perm.idx_B, norm_ord_perm.idx_C,
                  add_sign, mod);
       order_perm(tsr_B, tsr_A, tsr_C, idx_arr, 1, 0, 2,
                  norm_ord_perm.idx_B, norm_ord_perm.idx_A, norm_ord_perm.idx_C,
                  add_sign, mod);
       order_perm(tsr_C, tsr_B, tsr_A, idx_arr, 2, 1, 0,
                  norm_ord_perm.idx_C, norm_ord_perm.idx_B, norm_ord_perm.idx_A,
                  add_sign, mod);
     } while (mod);
     add_sign *= align_symmetric_indices(tsr_A->order,
                                         norm_ord_perm.idx_A,
                                         tsr_A->sym,
                                         tsr_B->order,
                                         norm_ord_perm.idx_B,
                                         tsr_B->sym,
                                         tsr_C->order,
                                         norm_ord_perm.idx_C,
                                         tsr_C->sym);

     for (i=0; i<(int)perms.size(); i++){
       if (perms[i].is_equal(norm_ord_perm)){
         CTF_int::cdealloc(idx_arr);
         return;
       }
     }
     perms.push_back(norm_ord_perm);
     signs.push_back(add_sign);
     CTF_int::cdealloc(idx_arr);
   }

   void get_sym_perms(summation const &       sum,
                      std::vector<summation>& perms,
                      std::vector<int>&       signs){
     int i, j, k, tmp;
     int sign;
     tensor * tsr_A, * tsr_B;
     tsr_A = sum.A;
     tsr_B = sum.B;

     summation new_type(sum);
     add_sym_perm(perms, signs, new_type, 1);

     for (i=0; i<tsr_A->order; i++){
       j=i;
       while (tsr_A->sym[j] != NS){
         j++;
         for (k=0; k<(int)perms.size(); k++){
           summation new_type1(perms[k]);
           sign = signs[k];
           if (tsr_A->sym[j-1] == AS) sign *= -1;
           tmp                 = new_type1.idx_A[i];
           new_type1.idx_A[i]  = new_type1.idx_A[j];
           new_type1.idx_A[j]  = tmp;
           add_sym_perm(perms, signs, new_type1, sign);
         }
       }
     }
     for (i=0; i<tsr_B->order; i++){
       j=i;
       while (tsr_B->sym[j] != NS){
         j++;
         for (k=0; k<(int)perms.size(); k++){
           summation new_type2(perms[k]);
           sign = signs[k];
           if (tsr_B->sym[j-1] == AS) sign *= -1;
           tmp                = new_type2.idx_B[i];
           new_type2.idx_B[i] = new_type2.idx_B[j];
           new_type2.idx_B[j] = tmp;
           add_sym_perm(perms, signs, new_type2, sign);
         }
       }
     }
   }

   void get_sym_perms(contraction const &       ctr,
                      std::vector<contraction>& perms,
                      std::vector<int>&         signs){
   //  dtype * scl_alpha_C;
   //  int ** scl_idx_maps_C;
   //  nscl_C = 0;
   //  CTF_int::alloc_ptr(sizeof(dtype)*order_C, (void**)&scl_alpha_C);
   //  CTF_int::alloc_ptr(sizeof(int*)*order_C, (void**)&scl_idx_maps_C);

     int i, j, k, tmp;
     int sign;
     tensor * tsr_A, * tsr_B, * tsr_C;
     tsr_A = ctr.A;
     tsr_B = ctr.B;
     tsr_C = ctr.C;

     contraction new_type = contraction(ctr);

     add_sym_perm(perms, signs, new_type, 1);

     for (i=0; i<tsr_A->order; i++){
       j=i;
       while (tsr_A->sym[j] != NS){
         j++;
         for (k=0; k<(int)perms.size(); k++){
           contraction ntype(perms[k]);
           sign = signs[k];
           if (tsr_A->sym[j-1] == AS) sign *= -1;
           tmp             = ntype.idx_A[i];
           ntype.idx_A[i]  = ntype.idx_A[j];
           ntype.idx_A[j]  = tmp;
           add_sym_perm(perms, signs, ntype, sign);
         }
       }
     }
     for (i=0; i<tsr_B->order; i++){
       j=i;
       while (tsr_B->sym[j] != NS){
         j++;
         for (k=0; k<(int)perms.size(); k++){
           contraction ntype(perms[k]);
           sign = signs[k];
           if (tsr_B->sym[j-1] == AS) sign *= -1;
           tmp             = ntype.idx_B[i];
           ntype.idx_B[i]  = ntype.idx_B[j];
           ntype.idx_B[j]  = tmp;
           add_sym_perm(perms, signs, ntype, sign);
         }
       }
     }

     for (i=0; i<tsr_C->order; i++){
       j=i;
       while (tsr_C->sym[j] != NS){
         j++;
         for (k=0; k<(int)perms.size(); k++){
           contraction ntype(perms[k]);
           sign = signs[k];
           if (tsr_C->sym[j-1] == AS) sign *= -1;
           tmp             = ntype.idx_C[i];
           ntype.idx_C[i]  = ntype.idx_C[j];
           ntype.idx_C[j]  = tmp;
           add_sym_perm(perms, signs, ntype, sign);
         }
       }
     }
   }
 }
CTF_int::order_perm
void order_perm(tensor const *A, tensor const *B, tensor const *C, int *idx_arr, int off_A, int off_B, int off_C, int *idx_A, int *idx_B, int *idx_C, int &add_sign, int &mod)
orders the contraction indices of one tensor that don&#39;t break contraction symmetries ...
Definition: symmetrization.cxx:492

CTF_int::tensor::home_buffer
char * home_buffer
buffer associated with home mapping of tensor, to which it is returned
Definition: untyped_tensor.h:121

ctf.core.sum
def sum(tensor, init_A, axis=None, dtype=None, out=None, keepdims=None)
Definition: core.pyx:4261

CTF_int::tensor::is_home
bool is_home
whether the latest tensor data is in the home buffer
Definition: untyped_tensor.h:125

CTF_int::tensor::nnz_blk
int64_t * nnz_blk
nonzero elements in each block owned locally
Definition: untyped_tensor.h:141

CTF_int::tensor::sym
int * sym
symmetries among tensor dimensions
Definition: untyped_tensor.h:74

CTF_int::contraction::A
tensor * A
left operand
Definition: contraction.h:19

CTF_int::get_sym_perms
void get_sym_perms(contraction const &ctr, std::vector< contraction > &perms, std::vector< int > &signs)
finds all permutations of a contraction that must be done for a broken symmetry
Definition: symmetrization.cxx:691

CTF_int::summation::idx_A
int * idx_A
indices of left operand
Definition: summation.h:28

CTF_int::summation::execute
void execute(bool run_diag=false)
run summation
Definition: summation.cxx:119

CTF_int::contraction::B
tensor * B
right operand
Definition: contraction.h:21

CTF_int::inv_idx
void inv_idx(int order_A, int const *idx_A, int order_B, int const *idx_B, int order_C, int const *idx_C, int *order_tot, int **idx_arr)
invert index map
Definition: ctr_tsr.cxx:592

CTF_int::algstrct::copy
virtual void copy(char *a, char const *b) const
copies element b to element a
Definition: algstrct.cxx:538

CTF::Timer::stop
void stop()
Definition: int_timer.cxx:151

CTF_int::tensor::has_home
bool has_home
whether the tensor has a home mapping/buffer
Definition: untyped_tensor.h:119

sign
double sign(int par)
Definition: fast_as_as_sy_tensor_ctr.cxx:69

CTF::Timer
local process walltime measurement
Definition: timer.h:50

CTF_int::tensor::size
int64_t size
current size of local tensor data chunk (mapping-dependent)
Definition: untyped_tensor.h:98

ASSERT
#define ASSERT(...)
Definition: util.h:88

CTF_int::alloc
void * alloc(int64_t len)
alloc abstraction
Definition: memcontrol.cxx:365

NS
Definition: common.h:37

CTF_int::ctr
Definition: ctr_comm.h:165

symmetrization.h

CTF_int::tensor::home_size
int64_t home_size
size of home buffer
Definition: untyped_tensor.h:123

CTF_int::desymmetrize
void desymmetrize(tensor *sym_tsr, tensor *nonsym_tsr, bool is_C)
unfolds the data of a tensor
Definition: symmetrization.cxx:12

CTF_int::algstrct::addid
virtual char const * addid() const
MPI datatype for pairs.
Definition: algstrct.cxx:89

CTF_int::tensor::set_new_nnz_glb
void set_new_nnz_glb(int64_t const *nnz_blk)
sets the number of nonzeros both locally (nnz_loc) and overall globally (nnz_tot) ...
Definition: untyped_tensor.cxx:2716

CTF_int::copy_mapping
void copy_mapping(int order, mapping const *mapping_A, mapping *mapping_B)
copies mapping A to B
Definition: mapping.cxx:190

CTF_int::tensor::is_sparse
bool is_sparse
whether only the non-zero elements of the tensor are stored
Definition: untyped_tensor.h:131

CTF_int::tensor::order
int order
number of tensor dimensions
Definition: untyped_tensor.h:76

CTF_int::algstrct::alloc
virtual char * alloc(int64_t n) const
allocate space for n items, necessary for object types
Definition: algstrct.cxx:685

CTF_int::tensor::set_padding
void set_padding()
sets padding and local size of a tensor given a mapping
Definition: untyped_tensor.cxx:456

CTF_int::algstrct::addinv
virtual void addinv(char const *a, char *b) const
b = -a
Definition: algstrct.cxx:103

CTF_int::tensor::wrld
CTF::World * wrld
distributed processor context on which tensor is defined
Definition: untyped_tensor.h:70

MAX
#define MAX(a, b)
Definition: util.h:180

sym_indices.h

CTF_int::scaling
class for execution distributed scaling of a tensor
Definition: scaling.h:14

VPRINTF
#define VPRINTF(...)
Definition: util.h:207

CTF::World::rank
int rank
rank of local processor
Definition: world.h:24

CTF_int::contraction
class for execution distributed contraction of tensors
Definition: contraction.h:16

CTF_int::tensor::zero_out_padding
int zero_out_padding()
sets padded portion of tensor to zero (this should be maintained internally)
Definition: untyped_tensor.cxx:2570

CTF_int::contraction::idx_B
int * idx_B
indices of right operand
Definition: contraction.h:33

CTF_int::contraction::C
tensor * C
output
Definition: contraction.h:23

CTF_int::alloc_ptr
int alloc_ptr(int64_t len, void **const ptr)
alloc abstraction
Definition: memcontrol.cxx:320

CTF_int::tensor::is_data_aliased
bool is_data_aliased
whether the tensor data is an alias of another tensor object&#39;s data
Definition: untyped_tensor.h:110

CTF_int::tensor::sr
algstrct * sr
algstrct on which tensor elements and operations are defined
Definition: untyped_tensor.h:72

CTF_int::tensor::edge_map
mapping * edge_map
mappings of each tensor dimension onto topology dimensions
Definition: untyped_tensor.h:96

CTF_int::summation::idx_B
int * idx_B
indices of output
Definition: summation.h:30

TAU_FSTOP
#define TAU_FSTOP(ARG)
Definition: util.h:281

TAU_FSTART
#define TAU_FSTART(ARG)
Definition: util.h:280

CTF_int::tensor::is_mapped
bool is_mapped
whether a mapping has been selected
Definition: untyped_tensor.h:92

CTF_int::tensor::set_zero
int set_zero()
elects a mapping and sets tensor data to zero
Definition: untyped_tensor.cxx:499

CTF_int::contraction::idx_C
int * idx_C
indices of output
Definition: contraction.h:35

CTF_int::tensor::calc_nvirt
int64_t calc_nvirt() const
calculate virtualization factor of tensor return virtualization factor
Definition: untyped_tensor.cxx:417

CTF_int::accumulatable::el_size
int el_size
size of each element of algstrct in bytes
Definition: algstrct.h:16

CTF::Timer::start
void start()
Definition: int_timer.cxx:141

CTF_int::tensor::profile
bool profile
whether profiling should be done for contractions/sums involving this tensor
Definition: untyped_tensor.h:129

CTF_int::cdealloc
int cdealloc(void *ptr)
free abstraction
Definition: memcontrol.cxx:480

CTF
Definition: apsp.cxx:17

CTF_int::summation::B
tensor * B
output
Definition: summation.h:20

CTF_int::tensor::data
char * data
tensor data, either the data or the key-value pairs should exist at any given time ...
Definition: untyped_tensor.h:117

CTF_int::tensor
internal distributed tensor class
Definition: untyped_tensor.h:20

CTF_int::cmp_sym_perms
void cmp_sym_perms(int ndim, int const *sym, int *nperm, int **perm, double *sign)
finds all permutations of a tensor according to a symmetry
Definition: symmetrization.cxx:400

CTF_int::scal_diag
void scal_diag(int order, int64_t size, int nvirt, int const *edge_len, int const *sym, int const *padding, int const *phase, int const *phys_phase, int const *virt_phase, int const *cphase_rank, char *vdata, algstrct const *sr, int const *sym_mask)
scales each element by 1/(number of entries equivalent to it after permutation of indices for which s...
Definition: pad.cxx:567

CTF_int::scaling::execute
int execute()
run scaling
Definition: scaling.cxx:64

CTF_int::add_sym_perm
void add_sym_perm(std::vector< contraction > &perms, std::vector< int > &signs, contraction const &new_perm, int new_sign)
puts a contraction map into a nice ordering according to preserved symmetries, and adds it if it is d...
Definition: symmetrization.cxx:593

align_symmetric_indices
int align_symmetric_indices(int order_A, T &idx_A, const int *sym_A, int order_B, T &idx_B, const int *sym_B)
Definition: sym_indices.cxx:40

CTF_int::tensor::topo
topology * topo
topology to which the tensor is mapped
Definition: untyped_tensor.h:94

MIN
#define MIN(a, b)
Definition: util.h:176

SY
Definition: common.h:37

CTF_int::summation::A
tensor * A
left operand
Definition: summation.h:18

CTF_int::summation
class for execution distributed summation of tensors
Definition: summation.h:15

CTF_int::algstrct::cast_double
virtual void cast_double(double d, char *c) const
c = &d
Definition: algstrct.cxx:150

CTF_int
Definition: model_trainer.cxx:16

CTF_int::contraction::idx_A
int * idx_A
indices of left operand
Definition: contraction.h:31

CTF_int::algstrct::mulid
virtual char const * mulid() const
identity element for multiplication i.e. 1
Definition: algstrct.cxx:93

AS
Definition: common.h:37

CTF_int::symmetrize
void symmetrize(tensor *sym_tsr, tensor *nonsym_tsr)
folds the data of a tensor
Definition: symmetrization.cxx:237

SH
Definition: common.h:37

CTF_int::tensor::name
char * name
name given to tensor
Definition: untyped_tensor.h:84

CTF_int::summation::sum_tensors
int sum_tensors(bool run_diag)
PDAXPY: a*idx_map_A(A) + b*idx_map_B(B) -> idx_map_B(B). Treats symmetric as lower triangular...
Definition: summation.cxx:1384

ctf.core.np
def np(self)
Definition: core.pyx:315

CTF_int::tensor::clear_mapping
void clear_mapping()
zeros out mapping
Definition: untyped_tensor.cxx:2189