dd/dad/a00005_source.html

// Landau Damping Test, variant with mixed precision.

// In order to avoid eccessive error when scattering from grid-points to the particles,

// the charge and the scalar field are kept in double precision. The Mesh object is also

// in double precision, as it leads to a higher precision without affecting memory negatively.

// Everything else (namely the vector field E and the particle position) are in single

// precision, since the choice increases memory saving, without losing precision.

//    Usage:

//     srun ./LandauDamping

//                  <nx> [<ny>...] <Np> <Nt> <stype>

//                  <lbthres> --overallocate <ovfactor> --info 10

//     nx       = No. cell-centered points in the x-direction

//     ny...    = No. cell-centered points in the y-, z-, ...-direction

//     Np       = Total no. of macro-particles in the simulation

//     Nt       = Number of time steps

//     stype    = Field solver type e.g., FFT

//     lbthres  = Load balancing threshold i.e., lbthres*100 is the maximum load imbalance

//                percentage which can be tolerated and beyond which

//                particle load balancing occurs. A value of 0.01 is good for many typical

//                simulations.

//     ovfactor = Over-allocation factor for the buffers used in the communication. Typical

//                values are 1.0, 2.0. Value 1.0 means no over-allocation.

//     Example:

//     srun ./LandauDamping 128 128 128 10000 10 FFT 0.01 2.0 --info 10

//


#include <Kokkos_MathematicalConstants.hpp>

#include <Kokkos_MathematicalFunctions.hpp>

#include <Kokkos_Random.hpp>

#include <chrono>

#include <iostream>

#include <random>

#include <set>

#include <string>

#include <vector>


#include "Utility/IpplTimings.h"


#include "ChargedParticles.hpp"


constexpr unsigned Dim = 3;


template <typename T>

struct Newton1D {

    double tol   = 1e-12;

    int max_iter = 20;

    T pi         = Kokkos::numbers::pi_v<T>;


    T k, alpha, u;


    KOKKOS_INLINE_FUNCTION Newton1D() {}


    KOKKOS_INLINE_FUNCTION Newton1D(const T& k_, const T& alpha_, const T& u_)

        : k(k_)

        , alpha(alpha_)

        , u(u_) {}


    KOKKOS_INLINE_FUNCTION ~Newton1D() {}


    KOKKOS_INLINE_FUNCTION T f(T& x) {

        T F;

        F = x + (alpha * (Kokkos::sin(k * x) / k)) - u;

        return F;

    }


    KOKKOS_INLINE_FUNCTION T fprime(T& x) {

        T Fprime;

        Fprime = 1 + (alpha * Kokkos::cos(k * x));

        return Fprime;

    }


    KOKKOS_FUNCTION


    void solve(T& x) {

        int iterations = 0;

        while (iterations < max_iter && Kokkos::fabs(f(x)) > tol) {

            x = x - (f(x) / fprime(x));

            iterations += 1;

        }

    }


};


template <typename T, class GeneratorPool, unsigned Dim>

struct generate_random {

    using view_type  = typename ippl::detail::ViewType<T, 1>::view_type;

    using value_type = typename T::value_type;

    // Output View for the random numbers

    view_type x, v;


    // The GeneratorPool

    GeneratorPool rand_pool;


    value_type alpha;


    T k, minU, maxU;


    // Initialize all members


    generate_random(view_type x_, view_type v_, GeneratorPool rand_pool_, value_type& alpha_, T& k_,

                    T& minU_, T& maxU_)

        : x(x_)

        , v(v_)

        , rand_pool(rand_pool_)

        , alpha(alpha_)

        , k(k_)

        , minU(minU_)

        , maxU(maxU_) {}


    KOKKOS_INLINE_FUNCTION void operator()(const size_t i) const {

        // Get a random number state from the pool for the active thread

        typename GeneratorPool::generator_type rand_gen = rand_pool.get_state();


        value_type u;

        for (unsigned d = 0; d < Dim; ++d) {

            u       = rand_gen.drand(minU[d], maxU[d]);

            x(i)[d] = u / (1 + alpha);

            Newton1D<value_type> solver(k[d], alpha, u);

            solver.solve(x(i)[d]);

            v(i)[d] = rand_gen.normal(0.0, 1.0);

        }


        // Give the state back, which will allow another thread to acquire it

        rand_pool.free_state(rand_gen);

    }


};


float CDF(const float& x, const float& alpha, const float& k) {

    float cdf = x + (alpha / k) * std::sin(k * x);

    return cdf;

}


KOKKOS_FUNCTION


double PDF(const Vector_t<double, Dim>& xvec, const double& alpha, const Vector_t<double, Dim>& kw,

           const unsigned Dim) {

    double pdf = 1.0;


    for (unsigned d = 0; d < Dim; ++d) {

        pdf *= (1.0 + alpha * Kokkos::cos(kw[d] * xvec[d]));

    }

    return pdf;

}


const char* TestName = "LandauDamping";


int main(int argc, char* argv[]) {

    ippl::initialize(argc, argv);

    {

        Inform msg("LandauDamping");

        Inform msg2all("LandauDamping", INFORM_ALL_NODES);


        auto start = std::chrono::high_resolution_clock::now();

        int arg    = 1;


        Vector_t<int, Dim> nr;

        for (unsigned d = 0; d < Dim; d++) {

            nr[d] = std::atoi(argv[arg++]);

        }


        static IpplTimings::TimerRef mainTimer        = IpplTimings::getTimer("total");

        static IpplTimings::TimerRef particleCreation = IpplTimings::getTimer("particlesCreation");

        static IpplTimings::TimerRef dumpDataTimer    = IpplTimings::getTimer("dumpData");

        static IpplTimings::TimerRef PTimer           = IpplTimings::getTimer("pushVelocity");

        static IpplTimings::TimerRef RTimer           = IpplTimings::getTimer("pushPosition");

        static IpplTimings::TimerRef updateTimer      = IpplTimings::getTimer("update");

        static IpplTimings::TimerRef DummySolveTimer  = IpplTimings::getTimer("solveWarmup");

        static IpplTimings::TimerRef SolveTimer       = IpplTimings::getTimer("solve");

        static IpplTimings::TimerRef domainDecomposition = IpplTimings::getTimer("loadBalance");


        IpplTimings::startTimer(mainTimer);


        const size_type totalP = std::atoll(argv[arg++]);

        const unsigned int nt  = std::atoi(argv[arg++]);


        msg << "Landau damping" << endl

            << "nt " << nt << " Np= " << totalP << " grid = " << nr << endl;


        using bunch_type = ChargedParticles<PLayout_t<float, Dim>, float, Dim>;


        std::unique_ptr<bunch_type> P;


        ippl::NDIndex<Dim> domain;

        for (unsigned i = 0; i < Dim; i++) {

            domain[i] = ippl::Index(nr[i]);

        }


        std::array<bool, Dim> isParallel;

        isParallel.fill(true);


        // create mesh and layout objects for this problem domain

        Vector_t<float, Dim> kw = 0.5;

        float alpha             = 0.05;

        Vector_t<double, Dim> rmin(0.0);

        Vector_t<double, Dim> rmax = 2 * pi / kw;


        Vector_t<double, Dim> hr = rmax / nr;

        // Q = -\int\int f dx dv

        double Q = std::reduce(rmax.begin(), rmax.end(), -1., std::multiplies<double>());

        Vector_t<double, Dim> origin = rmin;

        const double dt              = 0.5 * hr[0];


        const bool isAllPeriodic = true;

        Mesh_t<Dim> mesh(domain, hr, origin);

        FieldLayout_t<Dim> FL(MPI_COMM_WORLD, domain, isParallel, isAllPeriodic);

        PLayout_t<float, Dim> PL(FL, mesh);


        std::string solver = argv[arg++];

        P = std::make_unique<bunch_type>(PL, hr, rmin, rmax, isParallel, Q, solver);


        P->nr_m = nr;


        P->initializeFields(mesh, FL);


        P->initSolver();

        P->time_m                 = 0.0;

        P->loadbalancethreshold_m = std::atof(argv[arg++]);


        bool isFirstRepartition;


        if ((P->loadbalancethreshold_m != 1.0) && (ippl::Comm->size() > 1)) {

            msg << "Starting first repartition" << endl;

            IpplTimings::startTimer(domainDecomposition);

            isFirstRepartition             = true;

            const ippl::NDIndex<Dim>& lDom = FL.getLocalNDIndex();

            const int nghost               = P->rho_m.getNghost();

            auto rhoview                   = P->rho_m.getView();


            using index_array_type = typename ippl::RangePolicy<Dim>::index_array_type;

            ippl::parallel_for(

                "Assign initial rho based on PDF", ippl::getRangePolicy(rhoview, nghost),

                KOKKOS_LAMBDA(const index_array_type& args) {

                    // local to global index conversion

                    Vector_t<double, Dim> xvec = (args + lDom.first() - nghost + 0.5) * hr + origin;


                    // ippl::apply accesses the view at the given indices and obtains a

                    // reference; see src/Expression/IpplOperations.h

                    ippl::apply(rhoview, args) = PDF(xvec, alpha, kw, Dim);

                });


            Kokkos::fence();


            P->initializeORB(FL, mesh);

            P->repartition(FL, mesh, isFirstRepartition);

            IpplTimings::stopTimer(domainDecomposition);

        }


        msg << "First domain decomposition done" << endl;

        IpplTimings::startTimer(particleCreation);


        typedef ippl::detail::RegionLayout<float, Dim, Mesh_t<Dim>>::uniform_type RegionLayout_t;

        const RegionLayout_t& RLayout                           = PL.getRegionLayout();

        const typename RegionLayout_t::host_mirror_type Regions = RLayout.gethLocalRegions();

        Vector_t<float, Dim> Nr, Dr, minU, maxU;

        int myRank   = ippl::Comm->rank();

        float factor = 1;

        for (unsigned d = 0; d < Dim; ++d) {

            Nr[d] = CDF(Regions(myRank)[d].max(), alpha, kw[d])

                    - CDF(Regions(myRank)[d].min(), alpha, kw[d]);

            Dr[d]   = CDF(rmax[d], alpha, kw[d]) - CDF(rmin[d], alpha, kw[d]);

            minU[d] = CDF(Regions(myRank)[d].min(), alpha, kw[d]);

            maxU[d] = CDF(Regions(myRank)[d].max(), alpha, kw[d]);

            factor *= Nr[d] / Dr[d];

        }


        size_type nloc            = (size_type)(factor * totalP);

        size_type Total_particles = 0;


        MPI_Allreduce(&nloc, &Total_particles, 1, MPI_UNSIGNED_LONG, MPI_SUM,

                      ippl::Comm->getCommunicator());


        int rest = (int)(totalP - Total_particles);


        if (ippl::Comm->rank() < rest) {

            ++nloc;

        }


        P->create(nloc);

        Kokkos::Random_XorShift64_Pool<> rand_pool64((size_type)(42 + 100 * ippl::Comm->rank()));

        Kokkos::parallel_for(

            nloc, generate_random<Vector_t<float, Dim>, Kokkos::Random_XorShift64_Pool<>, Dim>(

                      P->R.getView(), P->P.getView(), rand_pool64, alpha, kw, minU, maxU));


        Kokkos::fence();

        ippl::Comm->barrier();

        IpplTimings::stopTimer(particleCreation);


        P->q = P->Q_m / totalP;

        msg << "particles created and initial conditions assigned " << endl;

        isFirstRepartition = false;

        // The update after the particle creation is not needed as the

        // particles are generated locally


        IpplTimings::startTimer(DummySolveTimer);

        P->rho_m = 0.0;

        P->runSolver();

        IpplTimings::stopTimer(DummySolveTimer);


        P->scatterCIC(totalP, 0, hr);


        IpplTimings::startTimer(SolveTimer);

        P->runSolver();

        IpplTimings::stopTimer(SolveTimer);


        auto Eview = P->getEMirror();


        // gather E field

        P->gatherCIC();


        IpplTimings::startTimer(dumpDataTimer);

        P->dumpLandau(Eview);

        P->gatherStatistics(totalP);

        // P->dumpLocalDomains(FL, 0);

        IpplTimings::stopTimer(dumpDataTimer);


        // begin main timestep loop

        msg << "Starting iterations ..." << endl;

        for (unsigned int it = 0; it < nt; it++) {

            // LeapFrog time stepping https://en.wikipedia.org/wiki/Leapfrog_integration

            // Here, we assume a constant charge-to-mass ratio of -1 for

            // all the particles hence eliminating the need to store mass as

            // an attribute

            // kick


            IpplTimings::startTimer(PTimer);

            P->P = P->P - 0.5 * dt * P->E;

            IpplTimings::stopTimer(PTimer);


            // drift

            IpplTimings::startTimer(RTimer);

            P->R = P->R + dt * P->P;

            IpplTimings::stopTimer(RTimer);


            // Since the particles have moved spatially update them to correct processors

            IpplTimings::startTimer(updateTimer);

            P->update();

            IpplTimings::stopTimer(updateTimer);


            // Domain Decomposition

            if (P->balance(totalP, it + 1)) {

                msg << "Starting repartition" << endl;

                IpplTimings::startTimer(domainDecomposition);

                P->repartition(FL, mesh, isFirstRepartition);

                IpplTimings::stopTimer(domainDecomposition);

                // IpplTimings::startTimer(dumpDataTimer);

                // P->dumpLocalDomains(FL, it+1);

                // IpplTimings::stopTimer(dumpDataTimer);

            }


            // scatter the charge onto the underlying grid

            P->scatterCIC(totalP, it + 1, hr);


            // Field solve

            IpplTimings::startTimer(SolveTimer);

            P->runSolver();

            IpplTimings::stopTimer(SolveTimer);


            P->updateEMirror(Eview);


            // gather E field

            P->gatherCIC();


            // kick

            IpplTimings::startTimer(PTimer);

            P->P = P->P - 0.5 * dt * P->E;

            IpplTimings::stopTimer(PTimer);


            P->time_m += dt;

            IpplTimings::startTimer(dumpDataTimer);

            P->dumpLandau(Eview);

            P->gatherStatistics(totalP);

            IpplTimings::stopTimer(dumpDataTimer);

            msg << "Finished time step: " << it + 1 << " time: " << P->time_m << endl;

        }


        msg << "LandauDamping: End." << endl;

        IpplTimings::stopTimer(mainTimer);

        IpplTimings::print();

        IpplTimings::print(std::string("timing.dat"));

        auto end = std::chrono::high_resolution_clock::now();


        std::chrono::duration<double> time_chrono =

            std::chrono::duration_cast<std::chrono::duration<double>>(end - start);

        std::cout << "Elapsed time: " << time_chrono.count() << std::endl;

    }

    ippl::finalize();


    return 0;

}


main
int main(int argc, char *argv[])
Definition LandauDampingMixedPrecision.cpp:142

CDF
float CDF(const float &x, const float &alpha, const float &k)
Definition LandauDampingMixedPrecision.cpp:124

PDF
KOKKOS_FUNCTION double PDF(const Vector_t< double, Dim > &xvec, const double &alpha, const Vector_t< double, Dim > &kw, const unsigned Dim)
Definition LandauDampingMixedPrecision.cpp:130

Dim
constexpr unsigned Dim
Definition UniformPlasmaTest.cpp:30

ChargedParticles.hpp

pi
const double pi
Definition ChargedParticles.hpp:76

T
double T
Definition BumponTailInstability.cpp:23

Dim
constexpr unsigned Dim
Definition BumponTailInstability.cpp:22

size_type
ippl::detail::size_type size_type
Definition datatypes.h:23

TestName
const char * TestName
Definition BumponTailInstability.cpp:24

FieldLayout_t
ippl::FieldLayout< Dim > FieldLayout_t
Definition datatypes.h:21

Vector_t
ippl::Vector< T, Dim > Vector_t
Definition datatypes.h:38

PLayout_t
typename ippl::ParticleSpatialLayout< T, Dim, Mesh_t< Dim > > PLayout_t
Definition datatypes.h:15

Mesh_t
ippl::UniformCartesian< double, Dim > Mesh_t
Definition datatypes.h:12

endl
Inform & endl(Inform &inf)
Definition Inform.cpp:42

INFORM_ALL_NODES
#define INFORM_ALL_NODES
Definition Inform.h:38

IpplTimings.h

ippl::initialize
void initialize(int &argc, char *argv[], MPI_Comm comm)
Definition Ippl.cpp:16

ippl::finalize
void finalize()
Definition Ippl.cpp:94

ippl::apply
KOKKOS_INLINE_FUNCTION constexpr decltype(auto) apply(const View &view, const Coords &coords)
Definition IpplOperations.h:64

ippl::getRangePolicy
RangePolicy< View::rank, typenameView::execution_space, PolicyArgs... >::policy_type getRangePolicy(const View &view, int shift=0)
Definition ParallelDispatch.h:56

ippl::parallel_for
void parallel_for(const std::string &name, const ExecPolicy &policy, const FunctorType &functor)
Definition ParallelDispatch.h:215

ippl::Comm
std::unique_ptr< mpi::Communicator > Comm
Definition Ippl.h:22

ippl::FieldLayout::getLocalNDIndex
const NDIndex_t & getLocalNDIndex() const
Definition FieldLayout.hpp:116

ippl::Index
Definition Index.h:40

ippl::NDIndex
Definition NDIndex.h:21

ippl::NDIndex::first
KOKKOS_INLINE_FUNCTION Vector< int, Dim > first() const
Definition NDIndex.hpp:170

ippl::detail::RegionLayout
Definition RegionLayout.h:36

ippl::detail::RegionLayout::gethLocalRegions
const host_mirror_type gethLocalRegions() const
Definition RegionLayout.hpp:120

ippl::Vector::begin
KOKKOS_INLINE_FUNCTION constexpr iterator begin()
Definition Vector.hpp:160

ippl::Vector::end
KOKKOS_INLINE_FUNCTION constexpr iterator end()
Definition Vector.hpp:165

ippl::detail::ViewType::view_type
Kokkos::View< typename NPtr< T, Dim >::type, Properties... > view_type
Definition ViewTypes.h:45

Inform
Definition Inform.h:40

IpplTimings::TimerRef
Timing::TimerRef TimerRef
Definition IpplTimings.h:144

IpplTimings::getTimer
static TimerRef getTimer(const char *nm)
Definition IpplTimings.h:150

IpplTimings::stopTimer
static void stopTimer(TimerRef t)
Definition IpplTimings.h:156

IpplTimings::print
static void print()
Definition IpplTimings.h:165

IpplTimings::startTimer
static void startTimer(TimerRef t)
Definition IpplTimings.h:153

ippl::RangePolicy::index_array_type
::ippl::Vector< index_type, Dim > index_array_type
Definition ParallelDispatch.h:30

ChargedParticles
Definition ChargedParticles.hpp:192

Newton1D
Definition LandauDampingMixedExec.cpp:40

Newton1D::k
T k
Definition LandauDampingMixedExec.cpp:45

Newton1D::solve
KOKKOS_FUNCTION void solve(T &x)
Definition LandauDampingMixedPrecision.cpp:72

Newton1D::Newton1D
KOKKOS_INLINE_FUNCTION Newton1D(const T &k_, const T &alpha_, const T &u_)
Definition LandauDampingMixedPrecision.cpp:52

Newton1D::f
KOKKOS_INLINE_FUNCTION T f(T &x)
Definition LandauDampingMixedPrecision.cpp:59

Newton1D::max_iter
int max_iter
Definition LandauDampingMixedExec.cpp:42

Newton1D::tol
double tol
Definition LandauDampingMixedExec.cpp:41

Newton1D::pi
double pi
Definition LandauDampingMixedExec.cpp:43

Newton1D::~Newton1D
KOKKOS_INLINE_FUNCTION ~Newton1D()
Definition LandauDampingMixedPrecision.cpp:57

Newton1D::u
T u
Definition LandauDampingMixedExec.cpp:45

Newton1D::alpha
T alpha
Definition LandauDampingMixedExec.cpp:45

Newton1D::Newton1D
KOKKOS_INLINE_FUNCTION Newton1D()
Definition LandauDampingMixedPrecision.cpp:50

Newton1D::fprime
KOKKOS_INLINE_FUNCTION T fprime(T &x)
Definition LandauDampingMixedPrecision.cpp:65

generate_random
Definition LandauDampingMixedExec.cpp:79

generate_random::v
view_type v
Definition LandauDampingMixedExec.cpp:83

generate_random::operator()
KOKKOS_INLINE_FUNCTION void operator()(const size_t i) const
Definition LandauDampingMixedPrecision.cpp:106

generate_random::maxU
T maxU
Definition LandauDampingMixedExec.cpp:90

generate_random::k
T k
Definition LandauDampingMixedExec.cpp:90

generate_random::x
view_type x
Definition LandauDampingMixedExec.cpp:83

generate_random::minU
T minU
Definition LandauDampingMixedExec.cpp:90

generate_random::rand_pool
GeneratorPool rand_pool
Definition LandauDampingMixedExec.cpp:86

generate_random::value_type
typename T::value_type value_type
Definition LandauDampingMixedExec.cpp:81

generate_random::generate_random
generate_random(view_type x_, view_type v_, GeneratorPool rand_pool_, value_type &alpha_, T &k_, T &minU_, T &maxU_)
Definition LandauDampingMixedPrecision.cpp:96

generate_random::alpha
value_type alpha
Definition LandauDampingMixedExec.cpp:88

generate_random::view_type
typename ippl::detail::ViewType< T, 1 >::view_type view_type
Definition LandauDampingMixedExec.cpp:80