doc/html/kernels_8h_source.html

 /*
  *  This file is a part of TiledArray.
  *  Copyright (C) 2015  Virginia Tech
  *
  *  This program is free software: you can redistribute it and/or modify
  *  it under the terms of the GNU General Public License as published by
  *  the Free Software Foundation, either version 3 of the License, or
  *  (at your option) any later version.
  *
  *  This program is distributed in the hope that it will be useful,
  *  but WITHOUT ANY WARRANTY; without even the implied warranty of
  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  *  GNU General Public License for more details.
  *
  *  You should have received a copy of the GNU General Public License
  *  along with this program.  If not, see <http://www.gnu.org/licenses/>.
  *
  *  Justus Calvin
  *  Department of Chemistry, Virginia Tech
  *
  *  kernels.h
  *  Jun 1, 2015
  *
  */

 #ifndef TILEDARRAY_TENSOR_KENERLS_H__INCLUDED
 #define TILEDARRAY_TENSOR_KENERLS_H__INCLUDED

 #include <TiledArray/tensor/utility.h>
 #include <TiledArray/tensor/permute.h>
 #include <TiledArray/math/eigen.h>

 namespace TiledArray {

   template <typename, typename> class Tensor;

   namespace detail {

     template <typename T>
     struct transform;

     // -------------------------------------------------------------------------
     // Tensor kernel operations that generate a new tensor


     template <typename TR, typename Op, typename T1, typename... Ts,
         typename std::enable_if<is_tensor<TR, T1, Ts...>::value
             || is_tensor_of_tensor<TR, T1, Ts...>::value>::type* = nullptr>
     inline TR tensor_op(Op&& op, const T1& tensor1, const Ts&... tensors) {
       return TiledArray::detail::transform<TR>()(std::forward<Op>(op), tensor1, tensors...);
     }


     template <typename TR, typename Op, typename T1, typename... Ts,
         typename std::enable_if<(is_tensor<T1, Ts...>::value
             || is_tensor_of_tensor<TR, T1, Ts...>::value)
             && is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>
     inline TR tensor_op(Op&& op, const Permutation& perm, const T1& tensor1,
         const Ts&... tensors)
     {
       return TiledArray::detail::transform<TR>()(std::forward<Op>(op), perm, tensor1, tensors...);
     }

     template <typename T>
     struct transform {
       template <typename Op, typename Tensor, typename ... Tensors>
       T operator()(Op&& op, Tensor&& tensor, Tensors&& ... tensors) const {
         TA_ASSERT(! empty(tensor, tensors...));
         TA_ASSERT(is_range_set_congruent(tensor, tensors...));

         const auto& range = tensor.range();
         T result(range);
         this->operator()(result, std::forward<Op>(op), std::forward<Tensor>(tensor), std::forward<Tensors>(tensors)...);
         return result;
       }

       template <typename Op, typename Tensor, typename ... Tensors>
       void operator()(T& result, Op&& op, Tensor&& tensor, Tensors&& ... tensors) const {
         TA_ASSERT(! empty(result, tensor, tensors...));
         TA_ASSERT(is_range_set_congruent(result, tensor, tensors...));

         const auto& range = result.range();
         for (auto&& i : range)
           result[std::forward<decltype(i)>(i)] = std::forward<Op>(op)(
               std::forward<Tensor>(tensor)[std::forward<decltype(i)>(i)],
               std::forward<Tensors>(tensors)[std::forward<decltype(i)>(i)]...);
       }

       template <typename Op, typename Tensor, typename ... Tensors>
       T operator()(Op&& op, const Permutation& perm, Tensor&& tensor, Tensors&& ... tensors) const {

         TA_ASSERT(! empty(tensor, tensors...));
         TA_ASSERT(is_range_set_congruent(tensor, tensors...));
         TA_ASSERT(perm);
         TA_ASSERT(perm.dim() == tensor.range().rank());

         const auto& range = tensor.range();
         T result(perm ^ range);
         this->operator()(result, std::forward<Op>(op), perm, std::forward<Tensor>(tensor), std::forward<Tensors>(tensors)...);
         return result;
       }

       template <typename Op, typename Tensor, typename ... Tensors>
       void operator()(T& result, Op&& op, const Permutation& perm, Tensor&& tensor, Tensors&& ... tensors) const {
         TA_ASSERT(! empty(result, tensor, tensors...));
         TA_ASSERT(is_range_congruent(result, tensor, perm));
         TA_ASSERT(is_range_set_congruent(tensor, tensors...));
         TA_ASSERT(perm);
         TA_ASSERT(perm.dim() == tensor.range().rank());

         const auto& range = tensor.range();
         for (auto&& i : range)
           result[perm ^ std::forward<decltype(i)>(i)] = std::forward<Op>(op)(
               std::forward<Tensor>(tensor)[std::forward<decltype(i)>(i)],
               std::forward<Tensors>(tensors)[std::forward<decltype(i)>(i)]...);
       }
     };

     // -------------------------------------------------------------------------
     // Tensor kernel operations with in-place memory operations


     template <typename Op, typename TR, typename... Ts,
         typename std::enable_if<is_tensor<TR, Ts...>::value
                  && is_contiguous_tensor<TR, Ts...>::value>::type* = nullptr>
     inline void inplace_tensor_op(Op&& op, TR& result, const Ts&... tensors) {
       TA_ASSERT(! empty(result, tensors...));
       TA_ASSERT(is_range_set_congruent(result, tensors...));

       const auto volume = result.range().volume();

       math::inplace_vector_op(op, volume, result.data(),
           tensors.data()...);
     }


     template <typename Op, typename TR, typename... Ts,
         typename std::enable_if<is_tensor_of_tensor<TR, Ts...>::value
                  && is_contiguous_tensor<TR, Ts...>::value>::type* = nullptr>
     inline void inplace_tensor_op(Op&& op, TR& result, const Ts&... tensors) {
       TA_ASSERT(! empty(result, tensors...));
       TA_ASSERT(is_range_set_congruent(result, tensors...));

       const auto volume = result.range().volume();

       for(decltype(result.range().volume()) i = 0ul; i < volume; ++i) {
         inplace_tensor_op(op, result[i], tensors[i]...);
       }
     }


     template <typename InputOp, typename OutputOp, typename TR, typename T1, typename... Ts,
         typename std::enable_if<is_tensor<TR, T1, Ts...>::value
                && is_contiguous_tensor<TR, T1, Ts...>::value>::type* = nullptr>
     inline void inplace_tensor_op(InputOp&& input_op, OutputOp&& output_op,
         const Permutation& perm, TR& result, const T1& tensor1,
         const Ts&... tensors)
     {
       TA_ASSERT(! empty(result, tensor1, tensors...));
       TA_ASSERT(is_range_congruent(result, tensor1, perm));
       TA_ASSERT(is_range_set_congruent(tensor1, tensors...));
       TA_ASSERT(perm);
       TA_ASSERT(perm.dim() == tensor1.range().rank());

       permute(input_op, output_op, result, perm, tensor1, tensors...);
     }


     template <typename InputOp, typename OutputOp, typename TR, typename T1, typename... Ts,
         typename std::enable_if<is_tensor_of_tensor<TR, T1, Ts...>::value
                && is_contiguous_tensor<TR, T1, Ts...>::value>::type* = nullptr>
     inline void inplace_tensor_op(InputOp&& input_op, OutputOp&& output_op,
         const Permutation& perm, TR& result, const T1& tensor1,
         const Ts&... tensors)
     {
       TA_ASSERT(! empty(result, tensor1, tensors...));
       TA_ASSERT(is_range_congruent(result, tensor1, perm));
       TA_ASSERT(is_range_set_congruent(tensor1, tensors...));
       TA_ASSERT(perm);
       TA_ASSERT(perm.dim() == tensor1.range().rank());

       auto wrapper_input_op = [=] (typename T1::const_reference MADNESS_RESTRICT value1,
         typename Ts::const_reference MADNESS_RESTRICT... values) ->
         typename T1::value_type
         { return tensor_op<TR::value_type>(input_op, value1, values...); };

       auto wrapper_output_op = [=] (typename T1::pointer MADNESS_RESTRICT const result_value,
                                     const typename TR::value_type value)
       { inplace_tensor_op(output_op, *result_value, value); };

       permute(wrapper_input_op, wrapper_output_op, result, perm, tensor1,
           tensors...);
     }


     template <typename Op, typename TR, typename... Ts,
         typename std::enable_if<is_tensor<TR, Ts...>::value
                && ! (is_contiguous_tensor<TR, Ts...>::value)>::type* = nullptr>
     inline void inplace_tensor_op(Op&& op, TR& result, const Ts&... tensors) {
       TA_ASSERT(! empty(result, tensors...));
       TA_ASSERT(is_range_set_congruent(result, tensors...));

       const auto stride = inner_size(result, tensors...);
       const auto volume = result.range().volume();

       for(decltype(result.range().volume()) i = 0ul; i < volume; i += stride)
         math::inplace_vector_op(op, stride, result.data() + result.range().ordinal(i),
           (tensors.data() + tensors.range().ordinal(i))...);
     }


     template <typename Op, typename TR, typename... Ts,
         typename std::enable_if<is_tensor_of_tensor<TR, Ts...>::value
                && ! (is_contiguous_tensor<TR, Ts...>::value)>::type* = nullptr>
     inline void inplace_tensor_op(Op&& op, TR& result, const Ts&... tensors) {
       TA_ASSERT(! empty(result, tensors...));
       TA_ASSERT(is_range_set_congruent(result, tensors...));

       const auto stride = inner_size(result, tensors...);
       const auto volume = result.range().volume();

       auto inplace_tensor_range =
           [=] (typename TR::pointer MADNESS_RESTRICT const result_data,
           typename Ts::const_pointer MADNESS_RESTRICT const... tensors_data)
           {
             for(decltype(result.range().volume()) i = 0ul; i < stride; ++i)
               inplace_tensor_op(op, result_data[i], tensors_data[i]...);
           };

       for(decltype(result.range().volume()) i = 0ul; i < volume; i += stride)
         inplace_tensor_range(result.data() + result.range().ordinal(i),
             (tensors.data() + tensors.range().ordinal(i))...);
     }

     // -------------------------------------------------------------------------
     // Tensor initialization functions for argument tensors with contiguous
     // memory layout


     template <typename Op, typename TR, typename... Ts,
         typename std::enable_if<is_tensor<TR, Ts...>::value
                && is_contiguous_tensor<TR, Ts...>::value>::type* = nullptr>
     inline void tensor_init(Op&& op, TR& result, const Ts&... tensors) {
       TA_ASSERT(! empty(result, tensors...));
       TA_ASSERT(is_range_set_congruent(result, tensors...));

       const auto volume = result.range().volume();

       auto wrapper_op = [=] (typename TR::pointer MADNESS_RESTRICT result,
               typename Ts::const_reference MADNESS_RESTRICT... ts)
           { new(result) typename TR::value_type(op(ts...)); };

       math::vector_ptr_op(wrapper_op, volume, result.data(), tensors.data()...);
     }


     template <typename Op, typename TR, typename... Ts,
         typename std::enable_if<is_tensor_of_tensor<TR, Ts...>::value
                && is_contiguous_tensor<TR, Ts...>::value>::type* = nullptr>
     inline void tensor_init(Op&& op, TR& result, const Ts&... tensors) {
       TA_ASSERT(! empty(result, tensors...));
       TA_ASSERT(is_range_set_congruent(result, tensors...));

       const auto volume = result.range().volume();

       for(decltype(result.range().volume()) i = 0ul; i < volume; ++i) {
         new(result.data() + i)
             typename TR::value_type(tensor_op<typename TR::value_type>(op, tensors[i]...));
       }
     }


     template <typename Op, typename TR, typename T1, typename... Ts,
         typename std::enable_if<is_tensor<TR, T1, Ts...>::value
                && is_contiguous_tensor<TR, T1, Ts...>::value>::type* = nullptr>
     inline void tensor_init(Op&& op, const Permutation& perm, TR& result,
         const T1& tensor1, const Ts&... tensors)
     {
       TA_ASSERT(! empty(result, tensor1, tensors...));
       TA_ASSERT(is_range_set_congruent(perm, result, tensor1, tensors...));
       TA_ASSERT(perm);
       TA_ASSERT(perm.dim() == result.range().rank());

       auto output_op = [=] (typename TR::pointer MADNESS_RESTRICT result,
           typename TR::const_reference  MADNESS_RESTRICT temp)
           { new(result) typename TR::value_type(temp); };

       permute(op, output_op, result, perm, tensor1, tensors...);
     }


     template <typename Op, typename TR, typename T1, typename... Ts,
         typename std::enable_if<is_tensor_of_tensor<TR, T1, Ts...>::value
                && is_contiguous_tensor<TR, T1, Ts...>::value>::type* = nullptr>
     inline void tensor_init(Op&& op, const Permutation& perm, TR& result,
         const T1& tensor1, const Ts&... tensors)
     {
       TA_ASSERT(! empty(result, tensor1, tensors...));
       TA_ASSERT(is_range_set_congruent(perm, result, tensor1, tensors...));
       TA_ASSERT(perm);
       TA_ASSERT(perm.dim() == result.range().rank());

       auto output_op = [=] (typename TR::pointer MADNESS_RESTRICT result,
           typename TR::const_reference  MADNESS_RESTRICT temp)
           { new(result) typename TR::value_type(temp); };
       auto tensor_input_op = [=] (typename T1::const_reference MADNESS_RESTRICT value1,
           typename Ts::const_reference MADNESS_RESTRICT... values) ->
           typename TR::value_type
           { return tensor_op<typename TR::value_type>(op, value1, values...); };

       permute(tensor_input_op, output_op, result, perm, tensor1, tensors...);
     }


     template <typename Op, typename TR, typename T1, typename... Ts,
         typename std::enable_if<is_tensor<TR, T1, Ts...>::value
                  && is_contiguous_tensor<TR>::value
                  && ! is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>
     inline void tensor_init(Op&& op, TR& result, const T1& tensor1,
         const Ts&... tensors)
     {
       TA_ASSERT(! empty(result, tensor1, tensors...));
       TA_ASSERT(is_range_set_congruent(result, tensor1, tensors...));

       const auto stride = inner_size(tensor1, tensors...);
       const auto volume = tensor1.range().volume();

       auto wrapper_op = [=] (typename TR::pointer MADNESS_RESTRICT result_ptr,
               const typename T1::value_type value1,
               const typename Ts::value_type... values)
           { new(result_ptr) typename T1::value_type(op(value1, values...)); };

       for(decltype(tensor1.range().volume()) i = 0ul; i < volume; i += stride)
         math::vector_ptr_op(wrapper_op, stride, result.data() + i,
             (tensor1.data() + tensor1.range().ordinal(i)),
             (tensors.data() + tensors.range().ordinal(i))...);
     }


     template <typename Op, typename TR, typename T1, typename... Ts,
         typename std::enable_if<is_tensor_of_tensor<TR, T1, Ts...>::value
                  && is_contiguous_tensor<TR>::value
                  && ! is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>
     inline void tensor_init(Op&& op, TR& result, const T1& tensor1,
         const Ts&... tensors)
     {
       TA_ASSERT(! empty(result, tensor1, tensors...));
       TA_ASSERT(is_range_set_congruent(result, tensor1, tensors...));

       const auto stride = inner_size(tensor1, tensors...);
       const auto volume = tensor1.range().volume();


       auto inplace_tensor_range =
           [=] (typename TR::pointer MADNESS_RESTRICT const result_data,
               typename T1::const_pointer MADNESS_RESTRICT const tensor1_data,
               typename Ts::const_pointer MADNESS_RESTRICT const... tensors_data)
           {
             for(decltype(result.range().volume()) i = 0ul; i < stride; ++i)
               new(result_data + i)
                   typename TR::value_type(tensor_op<typename TR::value_type>(op,
                       tensor1_data[i], tensors_data[i]...));
           };

       for(decltype(volume) i = 0ul; i < volume; i += stride)
         inplace_tensor_range(result.data() + i,
             (tensor1.data() + tensor1.range().ordinal(i)),
             (tensors.data() + tensors.range().ordinal(i))...);
     }


     // -------------------------------------------------------------------------
     // Reduction kernels for argument tensors


     template <typename ReduceOp, typename JoinOp, typename Scalar, typename T1, typename... Ts,
     typename std::enable_if_t<is_tensor<T1, Ts...>::value
              && is_contiguous_tensor<T1, Ts...>::value>* = nullptr>
     Scalar tensor_reduce(ReduceOp&& reduce_op, JoinOp&& join_op,
         Scalar identity, const T1& tensor1, const Ts&... tensors)
     {
       TA_ASSERT(! empty(tensor1, tensors...));
       TA_ASSERT(is_range_set_congruent(tensor1, tensors...));

       const auto volume = tensor1.range().volume();

       math::reduce_op(reduce_op, join_op, identity, volume, identity,
           tensor1.data(), tensors.data()...);

       return identity;
     }


     template <typename ReduceOp, typename JoinOp, typename Scalar, typename T1, typename... Ts,
         typename std::enable_if<is_tensor_of_tensor<T1, Ts...>::value
             && is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>
     Scalar tensor_reduce(ReduceOp&& reduce_op, JoinOp&& join_op,
         Scalar identity, const T1& tensor1, const Ts&... tensors)
     {
       TA_ASSERT(! empty(tensor1, tensors...));
       TA_ASSERT(is_range_set_congruent(tensor1, tensors...));

       const auto volume = tensor1.range().volume();

       auto result = identity;
       for(decltype(tensor1.range().volume()) i = 0ul; i < volume; ++i) {
         auto temp = tensor_reduce(reduce_op, join_op, identity, tensor1[i],
             tensors[i]...);
         join_op(result, temp);
       }

       return result;
     }


     template <typename ReduceOp, typename JoinOp, typename Scalar, typename T1, typename... Ts,
         typename std::enable_if<is_tensor<T1, Ts...>::value
             && ! is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>
     Scalar tensor_reduce(ReduceOp&& reduce_op, JoinOp&& join_op,
         const Scalar identity, const T1& tensor1, const Ts&... tensors)
     {
       TA_ASSERT(! empty(tensor1, tensors...));
       TA_ASSERT(is_range_set_congruent(tensor1, tensors...));

       const auto stride = inner_size(tensor1, tensors...);
       const auto volume = tensor1.range().volume();

       Scalar result = identity;
       for(decltype(tensor1.range().volume()) i = 0ul; i < volume; i += stride) {
         Scalar temp = identity;
         math::reduce_op(reduce_op,join_op, identity, stride, temp,
             tensor1.data() + tensor1.range().ordinal(i),
             (tensors.data() + tensors.range().ordinal(i))...);
         join_op(result, temp);
       }

       return result;
     }


     template <typename ReduceOp, typename JoinOp, typename Scalar, typename T1, typename... Ts,
         typename std::enable_if<
             is_tensor_of_tensor<T1, Ts...>::value
             && ! is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>
     Scalar tensor_reduce(ReduceOp&& reduce_op, JoinOp&& join_op,
         const Scalar identity, const T1& tensor1, const Ts&... tensors)
     {
       TA_ASSERT(! empty(tensor1, tensors...));
       TA_ASSERT(is_range_set_congruent(tensor1, tensors...));

       const auto stride = inner_size(tensor1, tensors...);
       const auto volume = tensor1.range().volume();

       auto tensor_reduce_range =
           [=] (Scalar& MADNESS_RESTRICT result,
               typename T1::const_pointer MADNESS_RESTRICT const tensor1_data,
               typename Ts::const_pointer MADNESS_RESTRICT const... tensors_data)
           {
             for(decltype(result.range().volume()) i = 0ul; i < stride; ++i) {
               Scalar temp = tensor_reduce(reduce_op, join_op, identity,
                   tensor1_data[i], tensors_data[i]...);
               join_op(result, temp);
             }
           };

       Scalar result = identity;
       for(decltype(tensor1.range().volume()) i = 0ul; i < volume; i += stride) {
         Scalar temp = tensor_reduce_range(result,
             tensor1.data() + tensor1.range().ordinal(i),
             (tensors.data() + tensors.range().ordinal(i))...);
         join_op(result, temp);
       }

       return identity;
     }

   }  // namespace detail
 } // namespace TiledArray

 #endif // TILEDARRAY_TENSOR_KENERLS_H__INCLUDED
TiledArray::detail::is_tensor_of_tensor
Definition: type_traits.h:55

TiledArray::detail::inplace_tensor_op
void inplace_tensor_op(Op &&op, TR &result, const Ts &... tensors)
In-place tensor operations with contiguous data.
Definition: kernels.h:163

TiledArray::detail::transform::operator()
T operator()(Op &&op, const Permutation &perm, Tensor &&tensor, Tensors &&... tensors) const
Definition: kernels.h:118

TiledArray::detail::permute
void permute(InputOp &&input_op, OutputOp &&output_op, Result &result, const Permutation &perm, const Arg0 &arg0, const Args &... args)
Construct a permuted tensor copy.
Definition: permute.h:122

TiledArray::detail::is_range_set_congruent
constexpr bool is_range_set_congruent(const Permutation &perm, const T &tensor)
Test that the ranges of a permuted tensor is congruent with itself.
Definition: utility.h:179

TiledArray::detail::is_range_congruent
bool is_range_congruent(const Left &left, const ShiftWrapper< Right > &right)
Check for congruent range objects with a shifted tensor.
Definition: shift_wrapper.h:122

TiledArray::Tensor
An N-dimensional tensor object.
Definition: foreach.h:40

permute.h

TiledArray::detail::transform::operator()
T operator()(Op &&op, Tensor &&tensor, Tensors &&... tensors) const
creates a result tensor in which element i is obtained by op(tensor[i], tensors[i]...)
Definition: kernels.h:93

TiledArray::detail::tensor_init
void tensor_init(Op &&op, TR &result, const Ts &... tensors)
Initialize tensor with contiguous tensor arguments.
Definition: kernels.h:366

TiledArray::detail::inner_size
T1::size_type inner_size(const T1 &tensor1, const T2 &)
Get the inner size of two tensors.
Definition: utility.h:313

TiledArray::detail::transform
customization point transform functionality to tensor class T, useful for nonintrusive extension of T...
Definition: kernels.h:41

TiledArray
Definition: conjgrad.h:34

TiledArray::Permutation::dim
index_type dim() const
Domain size accessor.
Definition: permutation.h:206

TiledArray::detail::empty
constexpr bool empty()
Test for empty tensors in an empty list.
Definition: utility.h:374

TA_ASSERT
#define TA_ASSERT(a)
Definition: error.h:107

TiledArray::symmetry::identity
T identity()
identity for group of objects of type T

TiledArray::math::reduce_op
void reduce_op(ReduceOp &&reduce_op, JoinOp &&join_op, const Result &identity, const std::size_t n, Result &result, const Args *const ... args)
Definition: vector_op.h:640

TiledArray::detail::transform::operator()
void operator()(T &result, Op &&op, const Permutation &perm, Tensor &&tensor, Tensors &&... tensors) const
Definition: kernels.h:132

TiledArray::math::inplace_vector_op
void inplace_vector_op(Op &&op, const std::size_t n, Result *const result, const Args *const ... args)
Definition: vector_op.h:397

utility.h

TiledArray::Permutation
Permutation of a sequence of objects indexed by base-0 indices.
Definition: permutation.h:119

TiledArray::detail::tensor_op
TR tensor_op(Op &&op, const T1 &tensor1, const Ts &... tensors)
Tensor operations with contiguous data.
Definition: kernels.h:60

TiledArray::detail::is_tensor
Definition: type_traits.h:54

TiledArray::detail::tensor_reduce
Scalar tensor_reduce(ReduceOp &&reduce_op, JoinOp &&join_op, Scalar identity, const T1 &tensor1, const Ts &... tensors)
Reduction operation for contiguous tensors.
Definition: kernels.h:579

TiledArray::math::vector_ptr_op
void vector_ptr_op(Op &&op, const std::size_t n, Result *const result, const Args *const ... args)
Definition: vector_op.h:546

TiledArray::detail::transform::operator()
void operator()(T &result, Op &&op, Tensor &&tensor, Tensors &&... tensors) const
Definition: kernels.h:106

eigen.h