ctf/fast__sym__4D_8cxx_source.html

 /*Copyright (c) 2011, Edgar Solomonik, all rights reserved.*/
 #include <ctf.hpp>

 using namespace CTF;

 int fast_sym_4D(int const     n,
                 World    &ctf){
   int rank, num_pes;

   MPI_Comm_rank(MPI_COMM_WORLD, &rank);
   MPI_Comm_size(MPI_COMM_WORLD, &num_pes);

   int len3[] = {n,n,n};
   int len4[] = {n,n,n,n};
   int len5[] = {n,n,n,n,n};
   int NNN[] = {NS,NS,NS};
   int HNNN[] = {SH,NS,NS,NS};
   int YYNNN[] = {SY,SY,NS,NS,NS};

   Tensor<> A(4, len4, HNNN, ctf);
   Tensor<> B(4, len4, HNNN, ctf);
   Tensor<> C(4, len4, HNNN, ctf);
   Tensor<> C_ans(4, len4, HNNN, ctf);

   Tensor<> A_rep(5, len5, YYNNN, ctf);
   Tensor<> B_rep(5, len5, YYNNN, ctf);
   Tensor<> Z(5, len5, YYNNN, ctf);
   Tensor<> As(3, len3, NNN, ctf);
   Tensor<> Bs(3, len3, NNN, ctf);
   Tensor<> Cs(3, len3, NNN, ctf);

   srand48(rank*347+23);

   A.fill_random(-1.0, 1.0);
   B.fill_random(-1.0, 1.0);

   /*{
     int64_t * indices;
     double * values;
     int64_t size;
     srand48(173*rank);

     A.read_local(&size, &indices, &values);
     for (i=0; i<size; i++){
       values[i] = drand48();
     }
     A.write(size, indices, values);
     free(indices);
     free(values);
     B.read_local(&size, &indices, &values);
     for (i=0; i<size; i++){
       values[i] = drand48();
     }
     B.write(size, indices, values);
     free(indices);
     free(values);
   }*/


   C_ans["ijab"] = A["ikal"]*B["kjlb"];

   A_rep["ijkal"] += A["ijal"];
   B_rep["ijklb"] += B["ijlb"];
   Z["ijkab"] += A_rep["ijkal"]*B_rep["ijklb"];
   C["ijab"] += Z["ijkab"];
 /*  Cs["iab"] += A["ikal"]*B["iklb"];
   As["ial"] += A["ikal"];
   Bs["ilb"] += B["iklb"];*/
   C["ijab"] -= ((double)n)*A["ijal"]*B["ijlb"];
   C["ijab"] -= A["ikal"]*B["iklb"];
   C["ijab"] -= A["ikal"]*B["ijlb"];
   C["ijab"] -= A["ijal"]*B["iklb"];
 /*
   A_rep["ijkal"] += A["ijal"];
   A_rep["ijkal"] += A["ikal"];
   A_rep["ijkal"] += A["jkal"];
   B_rep["ijklb"] += B["ijlb"];
   B_rep["ijklb"] += B["iklb"];
   B_rep["ijklb"] += B["jklb"];
   Z["ijkab"] += A_rep["ijkal"]*B_rep["ijklb"];
   C["ijab"] += Z["ijkab"];
   C["ijab"] += Z["ikjab"];
   C["ijab"] += Z["kijab"];
   C["ijab"] -= Z["ijjab"];
   C["ijab"] -= Z["iijab"];
   Cs["iab"] += A["ikal"]*B["iklb"];
   As["ial"] += A["ikal"];
   As["ial"] += A["kial"];
   Bs["ilb"] += B["iklb"];
   Bs["ilb"] += B["kilb"];
   C["ijab"] -= ((double)n)*A["ijal"]*B["ijlb"];
   C["ijab"] -= Cs["iab"];
   C["ijab"] -= Cs["jab"];
   C["ijab"] -= As["ial"]*B["ijlb"];
   C["ijab"] -= A["ijal"]*Bs["jlb"];*/

   if (n<4){
     printf("A:\n");
     A.print();
     printf("B:\n");
     B.print();
     printf("C_ans:\n");
     C_ans.print();
     printf("C:\n");
     C.print();
   }
   Tensor<> Diff(4, len4, HNNN, ctf);
   Diff["ijab"] += C["ijab"];
   Diff["ijab"] -= C_ans["ijab"];
   double nrm = Diff.norm2();
   int pass = (nrm <=1.E-10);

   if (rank == 0){
     MPI_Reduce(MPI_IN_PLACE, &pass, 1, MPI_INT, MPI_MIN, 0, MPI_COMM_WORLD);
     if (pass) printf("{ C[\"(ij)ab\"] = A[\"(ik)al\"]*B[\"(kj)lb\"] } passed\n");
     else      printf("{ C[\"(ij)ab\"] = A[\"(ik)al\"]*B[\"(kj)lb\"] } failed\n");
   } else
     MPI_Reduce(&pass, MPI_IN_PLACE, 1, MPI_INT, MPI_MIN, 0, MPI_COMM_WORLD);
   return pass;
 }

 #ifndef TEST_SUITE
 char* getCmdOption(char ** begin,
                    char ** end,
                    const   std::string & option){
   char ** itr = std::find(begin, end, option);
   if (itr != end && ++itr != end){
     return *itr;
   }
   return 0;
 }


 int main(int argc, char ** argv){
   int rank, np, n;
   int const in_num = argc;
   char ** input_str = argv;

   MPI_Init(&argc, &argv);
   MPI_Comm_rank(MPI_COMM_WORLD, &rank);
   MPI_Comm_size(MPI_COMM_WORLD, &np);

   if (getCmdOption(input_str, input_str+in_num, "-n")){
     n = atoi(getCmdOption(input_str, input_str+in_num, "-n"));
     if (n < 0) n = 6;
   } else n = 6;

   {
     World dw(MPI_COMM_WORLD, argc, argv);
     if (rank == 0){
       printf("Computing C_(ij)ab = A_(ik)al*B_(kj)lb\n");
     }
     int pass = fast_sym_4D(n, dw);
     assert(pass);
   }

   MPI_Finalize();
   return 0;
 }
 #endif

getCmdOption
char * getCmdOption(char **begin, char **end, const std::string &option)
Definition: fast_sym_4D.cxx:129

ctf.hpp

ctf.core.rank
def rank(self)
Definition: core.pyx:312

NS
Definition: common.h:37

CTF::World
an instance of the CTF library (world) on a MPI communicator
Definition: world.h:19

ctf.core.string
string
Definition: core.pyx:456

CTF::Tensor::norm2
dtype norm2()
computes the frobenius norm of the tensor (needs sqrt()!)
Definition: tensor.h:811

CTF::Tensor::fill_random
void fill_random(dtype rmin, dtype rmax)
fills local unique tensor elements to random values in the range [min,max] works only for dtype in {f...
Definition: tensor.cxx:928

CTF::Tensor::print
void print(FILE *fp, dtype cutoff) const
prints tensor data to file using process 0 (modify print(...) overload in set.h if you would like a d...
Definition: tensor.cxx:407

fast_sym_4D
int fast_sym_4D(int const n, World &ctf)
Definition: fast_sym_4D.cxx:12

ctf

CTF
Definition: apsp.cxx:17

CTF::Tensor
an instance of a tensor within a CTF world
Definition: tensor.h:74

SY
Definition: common.h:37

main
int main(int argc, char **argv)
Definition: fast_sym_4D.cxx:140

SH
Definition: common.h:37

ctf.core.np
def np(self)
Definition: core.pyx:315