#ifndef VIENNACL_BICGSTAB_HPP_ #define VIENNACL_BICGSTAB_HPP_ /* ========================================================================= Copyright (c) 2010-2011, Institute for Microelectronics, Institute for Analysis and Scientific Computing, TU Wien. ----------------- ViennaCL - The Vienna Computing Library ----------------- Project Head: Karl Rupp rupp@iue.tuwien.ac.at (A list of authors and contributors can be found in the PDF manual) License: MIT (X11), see file LICENSE in the base directory ============================================================================= */ /** @file bicgstab.hpp @brief The stabilized bi-conjugate gradient method is implemented here */ #include #include #include "viennacl/forwards.h" #include "viennacl/tools/tools.hpp" #include "viennacl/linalg/prod.hpp" #include "viennacl/linalg/inner_prod.hpp" #include "viennacl/traits/clear.hpp" #include "viennacl/traits/size.hpp" #include "viennacl/meta/result_of.hpp" namespace viennacl { namespace linalg { /** @brief A tag for the stabilized Bi-conjugate gradient solver. Used for supplying solver parameters and for dispatching the solve() function */ class bicgstab_tag { public: /** @brief The constructor * * @param tol Relative tolerance for the residual (solver quits if ||r|| < tol * ||r_initial||) * @param max_iterations The maximum number of iterations */ bicgstab_tag(double tol = 1e-8, unsigned int max_iterations = 300) : _tol(tol), _iterations(max_iterations) {}; /** @brief Returns the relative tolerance */ double tolerance() const { return _tol; } /** @brief Returns the maximum number of iterations */ unsigned int max_iterations() const { return _iterations; } /** @brief Return the number of solver iterations: */ unsigned int iters() const { return iters_taken_; } void iters(unsigned int i) const { iters_taken_ = i; } /** @brief Returns the estimated relative error at the end of the solver run */ double error() const { return last_error_; } /** @brief Sets the estimated relative error at the end of the solver run */ void error(double e) const { last_error_ = e; } private: double _tol; unsigned int _iterations; //return values from solver mutable unsigned int iters_taken_; mutable double last_error_; }; /** @brief Implementation of the stabilized Bi-conjugate gradient solver * * Following the description in "Iterative Methods for Sparse Linear Systems" by Y. Saad * * @param matrix The system matrix * @param rhs The load vector * @param tag Solver configuration tag * @return The result vector */ template VectorType solve(const MatrixType & matrix, VectorType const & rhs, bicgstab_tag const & tag) { typedef typename viennacl::result_of::value_type::type ScalarType; typedef typename viennacl::result_of::cpu_value_type::type CPU_ScalarType; unsigned int problem_size = viennacl::traits::size(rhs); VectorType result(problem_size); viennacl::traits::clear(result); VectorType residual = rhs; VectorType p = rhs; VectorType r0star = rhs; VectorType tmp0(problem_size); VectorType tmp1(problem_size); VectorType s(problem_size); CPU_ScalarType ip_rr0star = viennacl::linalg::inner_prod(rhs,r0star); CPU_ScalarType norm_rhs_host = ip_rr0star; CPU_ScalarType beta; CPU_ScalarType alpha; CPU_ScalarType omega; ScalarType inner_prod_temp; //temporary variable for inner product computation ScalarType new_ip_rr0star = 0; for (unsigned int i = 0; i < tag.max_iterations(); ++i) { tag.iters(i+1); tmp0 = viennacl::linalg::prod(matrix, p); //alpha = ip_rr0star / viennacl::linalg::inner_prod(tmp0, r0star); inner_prod_temp = viennacl::linalg::inner_prod(tmp0, r0star); alpha = ip_rr0star / static_cast(inner_prod_temp); //s = residual - alpha*tmp0; s = residual; s -= alpha*tmp0; tmp1 = viennacl::linalg::prod(matrix, s); //omega = viennacl::linalg::inner_prod(tmp1, s) / viennacl::linalg::inner_prod(tmp1, tmp1); inner_prod_temp = viennacl::linalg::inner_prod(tmp1, s); omega = inner_prod_temp; inner_prod_temp = viennacl::linalg::inner_prod(tmp1, tmp1); omega /= inner_prod_temp; //result += alpha * p + omega * s; result += alpha * p; result += omega * s; //residual = s - omega * tmp1; residual = s; residual -= omega*tmp1; new_ip_rr0star = viennacl::linalg::inner_prod(residual,r0star); if (fabs(CPU_ScalarType(viennacl::linalg::inner_prod(residual, residual)) / norm_rhs_host) < tag.tolerance() * tag.tolerance()) break; //beta = new_ip_rr0star / ip_rr0star * alpha/omega; CPU_ScalarType cpu_temp = new_ip_rr0star; //read from device only once beta = cpu_temp / ip_rr0star * alpha/omega; ip_rr0star = cpu_temp; // Execution of // p = residual + beta * (p - omega*tmp0); // without introducing temporary vectors: p -= omega * tmp0; p *= beta; p += residual; } //store last error estimate: tag.error(std::sqrt(fabs(CPU_ScalarType(viennacl::linalg::inner_prod(residual, residual)) / norm_rhs_host))); return result; } template VectorType solve(const MatrixType & matrix, VectorType const & rhs, bicgstab_tag const & tag, viennacl::linalg::no_precond) { return solve(matrix, rhs, tag); } /** @brief Implementation of the preconditioned stabilized Bi-conjugate gradient solver * * Following the description of the unpreconditioned case in "Iterative Methods for Sparse Linear Systems" by Y. Saad * * @param matrix The system matrix * @param rhs The load vector * @param tag Solver configuration tag * @param precond A preconditioner. Precondition operation is done via member function apply() * @return The result vector */ template VectorType solve(const MatrixType & matrix, VectorType const & rhs, bicgstab_tag const & tag, PreconditionerType const & precond) { typedef typename viennacl::result_of::value_type::type ScalarType; typedef typename viennacl::result_of::cpu_value_type::type CPU_ScalarType; unsigned int problem_size = viennacl::traits::size(rhs); VectorType result(problem_size); result.clear(); VectorType residual = rhs; precond.apply(residual); VectorType r0star = residual; //can be chosen arbitrarily in fact VectorType tmp0(problem_size); VectorType tmp1(problem_size); VectorType s(problem_size); VectorType p = residual; CPU_ScalarType ip_rr0star = viennacl::linalg::inner_prod(residual,r0star); CPU_ScalarType norm_rhs_host = ip_rr0star; CPU_ScalarType beta; CPU_ScalarType alpha; CPU_ScalarType omega; ScalarType new_ip_rr0star = 0; ScalarType inner_prod_temp; //temporary variable for inner product for (unsigned int i = 0; i < tag.max_iterations(); ++i) { tag.iters(i+1); tmp0 = viennacl::linalg::prod(matrix, p); precond.apply(tmp0); //alpha = ip_rr0star / viennacl::linalg::inner_prod(tmp0, r0star); inner_prod_temp = viennacl::linalg::inner_prod(tmp0, r0star); alpha = ip_rr0star / static_cast(inner_prod_temp); //s = residual - alpha*tmp0; s = residual; s -= alpha*tmp0; tmp1 = viennacl::linalg::prod(matrix, s); precond.apply(tmp1); //omega = viennacl::linalg::inner_prod(tmp1, s) / viennacl::linalg::inner_prod(tmp1, tmp1); inner_prod_temp = viennacl::linalg::inner_prod(tmp1, s); omega = inner_prod_temp; inner_prod_temp = viennacl::linalg::inner_prod(tmp1, tmp1); omega /= inner_prod_temp; //result += alpha * p + omega * s; result += alpha * p; result += omega * s; //residual = s - omega * tmp1; residual = s; residual -= omega*tmp1; new_ip_rr0star = viennacl::linalg::inner_prod(residual,r0star); if (fabs(CPU_ScalarType(viennacl::linalg::inner_prod(residual, residual) / norm_rhs_host)) < tag.tolerance() * tag.tolerance() ) break; //beta = new_ip_rr0star / ip_rr0star * alpha/omega; CPU_ScalarType cpu_temp = new_ip_rr0star; //read from device only once beta = cpu_temp / ip_rr0star * alpha/omega; ip_rr0star = cpu_temp; // Execution of // p = residual + beta * (p - omega*tmp0); // without introducing temporary vectors: p -= omega * tmp0; p *= beta; p += residual; //std::cout << "Rel. Residual in current step: " << std::sqrt(std::fabs(viennacl::linalg::inner_prod(residual, residual) / norm_rhs_host)) << std::endl; } //store last error estimate: tag.error(std::sqrt(fabs(CPU_ScalarType(viennacl::linalg::inner_prod(residual, residual)) / norm_rhs_host))); return result; } } } #endif