tiledarray/dox-master/kernels_8h_source.html

/*

 *  This file is a part of TiledArray.

 *  Copyright (C) 2015  Virginia Tech

 *

 *  This program is free software: you can redistribute it and/or modify

 *  it under the terms of the GNU General Public License as published by

 *  the Free Software Foundation, either version 3 of the License, or

 *  (at your option) any later version.

 *

 *  This program is distributed in the hope that it will be useful,

 *  but WITHOUT ANY WARRANTY; without even the implied warranty of

 *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

 *  GNU General Public License for more details.

 *

 *  You should have received a copy of the GNU General Public License

 *  along with this program.  If not, see <http://www.gnu.org/licenses/>.

 *

 *  Justus Calvin

 *  Department of Chemistry, Virginia Tech

 *

 *  kernels.h

 *  Jun 1, 2015

 *

 */


#ifndef TILEDARRAY_TENSOR_KENERLS_H__INCLUDED

#define TILEDARRAY_TENSOR_KENERLS_H__INCLUDED


#include <TiledArray/tensor/permute.h>

#include <TiledArray/tensor/utility.h>


namespace TiledArray {


template <typename, typename>

class Tensor;


namespace detail {


template <typename T>

struct transform;


// -------------------------------------------------------------------------

// Tensor kernel operations that generate a new tensor


template <typename TR, typename Op, typename T1, typename... Ts,

          typename std::enable_if<

              is_tensor<TR, T1, Ts...>::value ||

              is_tensor_of_tensor<TR, T1, Ts...>::value>::type* = nullptr>

inline TR tensor_op(Op&& op, const T1& tensor1, const Ts&... tensors) {

  if constexpr (std::is_invocable_r_v<TR, Op, const T1&, const Ts&...>) {

    return std::forward<Op>(op)(tensor1, tensors...);

  } else {

    return TiledArray::detail::transform<TR>()(std::forward<Op>(op), tensor1,

                                               tensors...);

  }

  abort();  // unreachable

}


template <typename TR, typename Op, typename T1, typename... Ts,

          typename std::enable_if<

              (is_tensor<T1, Ts...>::value ||

               is_tensor_of_tensor<TR, T1, Ts...>::value) &&

              is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>

inline TR tensor_op(Op&& op, const Permutation& perm, const T1& tensor1,

                    const Ts&... tensors) {

  if constexpr (std::is_invocable_r_v<TR, Op, const Permutation&, const T1&,

                                      const Ts&...>) {

    return std::forward<Op>(op)(perm, tensor1, tensors...);

  } else {

    return TiledArray::detail::transform<TR>()(std::forward<Op>(op), perm,

                                               tensor1, tensors...);

  }

}


template <typename T>

struct transform {

  template <typename Op, typename Tensor, typename... Tensors>

  T operator()(Op&& op, Tensor&& tensor, Tensors&&... tensors) const {

    TA_ASSERT(!empty(tensor, tensors...));

    TA_ASSERT(is_range_set_congruent(tensor, tensors...));


    const auto& range = tensor.range();

    T result(range);

    this->operator()(result, std::forward<Op>(op), std::forward<Tensor>(tensor),

                     std::forward<Tensors>(tensors)...);

    return result;

  }


  template <typename Op, typename Tensor, typename... Tensors>

  void operator()(T& result, Op&& op, Tensor&& tensor,

                  Tensors&&... tensors) const {

    TA_ASSERT(!empty(result, tensor, tensors...));

    TA_ASSERT(is_range_set_congruent(result, tensor, tensors...));


    const auto& range = result.range();

    for (auto&& i : range)

      result[std::forward<decltype(i)>(i)] = std::forward<Op>(op)(

          std::forward<Tensor>(tensor)[std::forward<decltype(i)>(i)],

          std::forward<Tensors>(tensors)[std::forward<decltype(i)>(i)]...);

  }


  template <typename Op, typename Tensor, typename... Tensors>

  T operator()(Op&& op, const Permutation& perm, Tensor&& tensor,

               Tensors&&... tensors) const {

    TA_ASSERT(!empty(tensor, tensors...));

    TA_ASSERT(is_range_set_congruent(tensor, tensors...));

    TA_ASSERT(perm);

    TA_ASSERT(perm.size() == tensor.range().rank());


    const auto& range = tensor.range();

    T result(perm ^ range);

    this->operator()(result, std::forward<Op>(op), perm,

                     std::forward<Tensor>(tensor),

                     std::forward<Tensors>(tensors)...);

    return result;

  }


  template <typename Op, typename Tensor, typename... Tensors>

  void operator()(T& result, Op&& op, const Permutation& perm, Tensor&& tensor,

                  Tensors&&... tensors) const {

    TA_ASSERT(!empty(result, tensor, tensors...));

    TA_ASSERT(is_range_congruent(result, tensor, perm));

    TA_ASSERT(is_range_set_congruent(tensor, tensors...));

    TA_ASSERT(perm);

    TA_ASSERT(perm.size() == tensor.range().rank());


    const auto& range = tensor.range();

    for (auto&& i : range)

      result[perm ^ std::forward<decltype(i)>(i)] = std::forward<Op>(op)(

          std::forward<Tensor>(tensor)[std::forward<decltype(i)>(i)],

          std::forward<Tensors>(tensors)[std::forward<decltype(i)>(i)]...);

  }

};


// -------------------------------------------------------------------------

// Tensor kernel operations with in-place memory operations


template <typename Op, typename TR, typename... Ts,

          typename std::enable_if<

              is_tensor<TR, Ts...>::value &&

              is_contiguous_tensor<TR, Ts...>::value>::type* = nullptr>

inline void inplace_tensor_op(Op&& op, TR& result, const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensors...));

  TA_ASSERT(is_range_set_congruent(result, tensors...));


  const auto volume = result.range().volume();


  math::inplace_vector_op(std::forward<Op>(op), volume, result.data(),

                          tensors.data()...);

}


template <typename Op, typename TR, typename... Ts,

          typename std::enable_if<

              is_tensor_of_tensor<TR, Ts...>::value &&

              is_contiguous_tensor<TR, Ts...>::value>::type* = nullptr>

inline void inplace_tensor_op(Op&& op, TR& result, const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensors...));

  TA_ASSERT(is_range_set_congruent(result, tensors...));


  const auto volume = result.range().volume();


  for (decltype(result.range().volume()) i = 0ul; i < volume; ++i) {

    inplace_tensor_op(op, result[i], tensors[i]...);

  }

}


template <typename InputOp, typename OutputOp, typename TR, typename T1,

          typename... Ts,

          typename std::enable_if<

              is_tensor<TR, T1, Ts...>::value &&

              is_contiguous_tensor<TR, T1, Ts...>::value>::type* = nullptr>

inline void inplace_tensor_op(InputOp&& input_op, OutputOp&& output_op,

                              const Permutation& perm, TR& result,

                              const T1& tensor1, const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensor1, tensors...));

  TA_ASSERT(is_range_congruent(result, tensor1, perm));

  TA_ASSERT(is_range_set_congruent(tensor1, tensors...));

  TA_ASSERT(perm);

  TA_ASSERT(perm.size() == tensor1.range().rank());


  permute(std::forward<InputOp>(input_op), std::forward<OutputOp>(output_op),

          result, perm, tensor1, tensors...);

}


template <typename InputOp, typename OutputOp, typename TR, typename T1,

          typename... Ts,

          typename std::enable_if<

              is_tensor_of_tensor<TR, T1, Ts...>::value &&

              is_contiguous_tensor<TR, T1, Ts...>::value>::type* = nullptr>

inline void inplace_tensor_op(InputOp&& input_op, OutputOp&& output_op,

                              const Permutation& perm, TR& result,

                              const T1& tensor1, const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensor1, tensors...));

  TA_ASSERT(is_range_congruent(result, tensor1, perm));

  TA_ASSERT(is_range_set_congruent(tensor1, tensors...));

  TA_ASSERT(perm);

  TA_ASSERT(perm.size() == tensor1.range().rank());


  auto wrapper_input_op =

      [&input_op](typename T1::const_reference MADNESS_RESTRICT value1,

                  typename Ts::const_reference MADNESS_RESTRICT... values) ->

      typename T1::value_type {

        return tensor_op<TR::value_type>(std::forward<InputOp>(input_op),

                                         value1, values...);

      };


  auto wrapper_output_op =

      [&output_op](typename T1::pointer MADNESS_RESTRICT const result_value,

                   const typename TR::value_type value) {

        inplace_tensor_op(std::forward<OutputOp>(output_op), *result_value,

                          value);

      };


  permute(std::move(wrapper_input_op), std::move(wrapper_output_op), result,

          perm, tensor1, tensors...);

}


template <typename Op, typename TR, typename... Ts,

          typename std::enable_if<

              is_tensor<TR, Ts...>::value &&

              !(is_contiguous_tensor<TR, Ts...>::value)>::type* = nullptr>

inline void inplace_tensor_op(Op&& op, TR& result, const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensors...));

  TA_ASSERT(is_range_set_congruent(result, tensors...));


  const auto stride = inner_size(result, tensors...);

  const auto volume = result.range().volume();


  for (decltype(result.range().volume()) i = 0ul; i < volume; i += stride)

    math::inplace_vector_op(std::forward<Op>(op), stride,

                            result.data() + result.range().ordinal(i),

                            (tensors.data() + tensors.range().ordinal(i))...);

}


template <typename Op, typename TR, typename... Ts,

          typename std::enable_if<

              is_tensor_of_tensor<TR, Ts...>::value &&

              !(is_contiguous_tensor<TR, Ts...>::value)>::type* = nullptr>

inline void inplace_tensor_op(Op&& op, TR& result, const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensors...));

  TA_ASSERT(is_range_set_congruent(result, tensors...));


  const auto stride = inner_size(result, tensors...);

  const auto volume = result.range().volume();


  auto inplace_tensor_range =

      [&op, stride](

          typename TR::pointer MADNESS_RESTRICT const result_data,

          typename Ts::const_pointer MADNESS_RESTRICT const... tensors_data) {

        for (decltype(result.range().volume()) i = 0ul; i < stride; ++i)

          inplace_tensor_op(op, result_data[i], tensors_data[i]...);

      };


  for (decltype(result.range().volume()) i = 0ul; i < volume; i += stride)

    inplace_tensor_range(result.data() + result.range().ordinal(i),

                         (tensors.data() + tensors.range().ordinal(i))...);

}


// -------------------------------------------------------------------------

// Tensor initialization functions for argument tensors with contiguous

// memory layout


template <typename Op, typename TR, typename... Ts,

          typename std::enable_if<

              is_tensor<TR, Ts...>::value &&

              is_contiguous_tensor<TR, Ts...>::value>::type* = nullptr>

inline void tensor_init(Op&& op, TR& result, const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensors...));

  TA_ASSERT(is_range_set_congruent(result, tensors...));


  const auto volume = result.range().volume();


  auto wrapper_op = [&op](typename TR::pointer MADNESS_RESTRICT result,

                          typename Ts::const_reference MADNESS_RESTRICT... ts) {

    new (result) typename TR::value_type(std::forward<Op>(op)(ts...));

  };


  math::vector_ptr_op(std::move(wrapper_op), volume, result.data(),

                      tensors.data()...);

}


template <

    typename Op, typename TR, typename... Ts,

    typename std::enable_if<is_tensor_of_tensor<TR, Ts...>::value &&

                            is_contiguous_tensor<TR>::value>::type* = nullptr>

inline void tensor_init(Op&& op, TR& result, const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensors...));

  TA_ASSERT(is_range_set_congruent(result, tensors...));


  const auto volume = result.range().volume();


  for (decltype(result.range().volume()) i = 0ul; i < volume; ++i) {

    new (result.data() + i) typename TR::value_type(

        tensor_op<typename TR::value_type>(op, tensors[i]...));

  }

}


template <

    typename Op, typename TR, typename T1, typename... Ts,

    typename std::enable_if<is_tensor<TR, T1, Ts...>::value>::type* = nullptr>

inline void tensor_init(Op&& op, const Permutation& perm, TR& result,

                        const T1& tensor1, const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensor1, tensors...));

  TA_ASSERT(is_range_set_congruent(perm, result, tensor1, tensors...));

  TA_ASSERT(perm);

  TA_ASSERT(perm.size() == result.range().rank());


  auto output_op = [](typename TR::pointer MADNESS_RESTRICT result,

                      typename TR::const_reference MADNESS_RESTRICT temp) {

    new (result) typename TR::value_type(temp);

  };


  permute(std::forward<Op>(op), std::move(output_op), result, perm, tensor1,

          tensors...);

}


template <typename Op, typename TR, typename T1, typename... Ts,

          typename std::enable_if<

              is_tensor_of_tensor<TR, T1, Ts...>::value>::type* = nullptr>

inline void tensor_init(Op&& op, const Permutation& perm, TR& result,

                        const T1& tensor1, const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensor1, tensors...));

  TA_ASSERT(is_range_set_congruent(perm, result, tensor1, tensors...));

  TA_ASSERT(perm);

  TA_ASSERT(perm.size() == result.range().rank());


  auto output_op = [](typename TR::pointer MADNESS_RESTRICT result,

                      typename TR::const_reference MADNESS_RESTRICT temp) {

    new (result) typename TR::value_type(temp);

  };

  auto tensor_input_op =

      [&op](typename T1::const_reference MADNESS_RESTRICT value1,

            typename Ts::const_reference MADNESS_RESTRICT... values) ->

      typename TR::value_type {

        return tensor_op<typename TR::value_type>(std::forward<Op>(op), value1,

                                                  values...);

      };


  permute(std::move(tensor_input_op), output_op, result, perm, tensor1,

          tensors...);

}


template <

    typename Op, typename TR, typename T1, typename... Ts,

    typename std::enable_if<

        is_tensor<TR, T1, Ts...>::value && is_contiguous_tensor<TR>::value &&

        !is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>

inline void tensor_init(Op&& op, TR& result, const T1& tensor1,

                        const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensor1, tensors...));

  TA_ASSERT(is_range_set_congruent(result, tensor1, tensors...));


  const auto stride = inner_size(tensor1, tensors...);

  const auto volume = tensor1.range().volume();


  auto wrapper_op = [&op](typename TR::pointer MADNESS_RESTRICT result_ptr,

                          const typename T1::value_type value1,

                          const typename Ts::value_type... values) {

    new (result_ptr) typename T1::value_type(op(value1, values...));

  };


  for (decltype(tensor1.range().volume()) i = 0ul; i < volume; i += stride)

    math::vector_ptr_op(wrapper_op, stride, result.data() + i,

                        (tensor1.data() + tensor1.range().ordinal(i)),

                        (tensors.data() + tensors.range().ordinal(i))...);

}


template <typename Op, typename TR, typename T1, typename... Ts,

          typename std::enable_if<

              is_tensor_of_tensor<TR, T1, Ts...>::value &&

              is_contiguous_tensor<TR>::value &&

              !is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>

inline void tensor_init(Op&& op, TR& result, const T1& tensor1,

                        const Ts&... tensors) {

  TA_ASSERT(!empty(result, tensor1, tensors...));

  TA_ASSERT(is_range_set_congruent(result, tensor1, tensors...));


  const auto stride = inner_size(tensor1, tensors...);

  const auto volume = tensor1.range().volume();


  auto inplace_tensor_range =

      [&op, stride](

          typename TR::pointer MADNESS_RESTRICT const result_data,

          typename T1::const_pointer MADNESS_RESTRICT const tensor1_data,

          typename Ts::const_pointer MADNESS_RESTRICT const... tensors_data) {

        for (decltype(result.range().volume()) i = 0ul; i < stride; ++i)

          new (result_data + i)

              typename TR::value_type(tensor_op<typename TR::value_type>(

                  op, tensor1_data[i], tensors_data[i]...));

      };


  for (decltype(volume) i = 0ul; i < volume; i += stride)

    inplace_tensor_range(result.data() + i,

                         (tensor1.data() + tensor1.range().ordinal(i)),

                         (tensors.data() + tensors.range().ordinal(i))...);

}


// -------------------------------------------------------------------------

// Reduction kernels for argument tensors


template <

    typename ReduceOp, typename JoinOp, typename Scalar, typename T1,

    typename... Ts,

    typename std::enable_if_t<

        is_tensor<T1, Ts...>::value && is_contiguous_tensor<T1, Ts...>::value &&

        !is_reduce_op_v<std::decay_t<ReduceOp>, std::decay_t<Scalar>,

                        std::decay_t<T1>, std::decay_t<Ts>...>>* = nullptr>

Scalar tensor_reduce(ReduceOp&& reduce_op, JoinOp&& join_op, Scalar identity,

                     const T1& tensor1, const Ts&... tensors) {

  TA_ASSERT(!empty(tensor1, tensors...));

  TA_ASSERT(is_range_set_congruent(tensor1, tensors...));


  const auto volume = tensor1.range().volume();


  math::reduce_op(reduce_op, join_op, identity, volume, identity,

                  tensor1.data(), tensors.data()...);


  return identity;

}


template <

    typename ReduceOp, typename JoinOp, typename Scalar, typename T1,

    typename... Ts,

    typename std::enable_if_t<

        is_tensor<T1, Ts...>::value && is_contiguous_tensor<T1, Ts...>::value &&

        is_reduce_op_v<std::decay_t<ReduceOp>, std::decay_t<Scalar>,

                       std::decay_t<T1>, std::decay_t<Ts>...>>* = nullptr>

Scalar tensor_reduce(ReduceOp&& reduce_op, JoinOp&& join_op, Scalar identity,

                     const T1& tensor1, const Ts&... tensors) {

  reduce_op(identity, &tensor1, &tensors...);

  return identity;

}


template <typename ReduceOp, typename JoinOp, typename Scalar, typename T1,

          typename... Ts,

          typename std::enable_if<

              is_tensor_of_tensor<T1, Ts...>::value &&

              is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>

Scalar tensor_reduce(ReduceOp&& reduce_op, JoinOp&& join_op, Scalar identity,

                     const T1& tensor1, const Ts&... tensors) {

  TA_ASSERT(!empty(tensor1, tensors...));

  TA_ASSERT(is_range_set_congruent(tensor1, tensors...));


  const auto volume = tensor1.range().volume();


  auto result = identity;

  for (decltype(tensor1.range().volume()) i = 0ul; i < volume; ++i) {

    auto temp =

        tensor_reduce(reduce_op, join_op, identity, tensor1[i], tensors[i]...);

    join_op(result, temp);

  }


  return result;

}


template <typename ReduceOp, typename JoinOp, typename Scalar, typename T1,

          typename... Ts,

          typename std::enable_if<

              is_tensor<T1, Ts...>::value &&

              !is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>

Scalar tensor_reduce(ReduceOp&& reduce_op, JoinOp&& join_op,

                     const Scalar identity, const T1& tensor1,

                     const Ts&... tensors) {

  TA_ASSERT(!empty(tensor1, tensors...));

  TA_ASSERT(is_range_set_congruent(tensor1, tensors...));


  const auto stride = inner_size(tensor1, tensors...);

  const auto volume = tensor1.range().volume();


  Scalar result = identity;

  for (decltype(tensor1.range().volume()) i = 0ul; i < volume; i += stride) {

    Scalar temp = identity;

    math::reduce_op(reduce_op, join_op, identity, stride, temp,

                    tensor1.data() + tensor1.range().ordinal(i),

                    (tensors.data() + tensors.range().ordinal(i))...);

    join_op(result, temp);

  }


  return result;

}


template <typename ReduceOp, typename JoinOp, typename Scalar, typename T1,

          typename... Ts,

          typename std::enable_if<

              is_tensor_of_tensor<T1, Ts...>::value &&

              !is_contiguous_tensor<T1, Ts...>::value>::type* = nullptr>

Scalar tensor_reduce(ReduceOp&& reduce_op, JoinOp&& join_op,

                     const Scalar identity, const T1& tensor1,

                     const Ts&... tensors) {

  TA_ASSERT(!empty(tensor1, tensors...));

  TA_ASSERT(is_range_set_congruent(tensor1, tensors...));


  const auto stride = inner_size(tensor1, tensors...);

  const auto volume = tensor1.range().volume();


  auto tensor_reduce_range =

      [&reduce_op, &join_op, &identity, stride](

          Scalar& MADNESS_RESTRICT result,

          typename T1::const_pointer MADNESS_RESTRICT const tensor1_data,

          typename Ts::const_pointer MADNESS_RESTRICT const... tensors_data) {

        for (decltype(result.range().volume()) i = 0ul; i < stride; ++i) {

          Scalar temp = tensor_reduce(reduce_op, join_op, identity,

                                      tensor1_data[i], tensors_data[i]...);

          join_op(result, temp);

        }

      };


  Scalar result = identity;

  for (decltype(tensor1.range().volume()) i = 0ul; i < volume; i += stride) {

    Scalar temp =

        tensor_reduce_range(result, tensor1.data() + tensor1.range().ordinal(i),

                            (tensors.data() + tensors.range().ordinal(i))...);

    join_op(result, temp);

  }


  return identity;

}


}  // namespace detail

}  // namespace TiledArray


#endif  // TILEDARRAY_TENSOR_KENERLS_H__INCLUDED