#ifndef INC_4NEURO_ERRORFUNCTION_H
#define INC_4NEURO_ERRORFUNCTION_H

#define ARMA_ALLOW_FAKE_GCC
#include <armadillo>

#include "../settings.h"

#include "../Network/NeuralNetwork.h"
#include "../DataSet/DataSet.h"

//TODO HEAVY refactoring needed!

namespace lib4neuro {

    //TODO write smarter using ErrorFunction abstract class?
    enum ErrorFunctionType {
        ErrorFuncMSE
    };

    class ErrorFunction {
    public:

        /**
         *
         * @param weights
         * @return
         */
        virtual double eval(std::vector<double>* weights = nullptr,
                            bool denormalize_data = false,
                            bool verbose = false) = 0;

        /**
         *
         * @param input
         * @param output
         * @param weights
         * @return
         */
        virtual double eval_on_single_input(std::vector<double>* input,
                                            std::vector<double>* output,
                                            std::vector<double>* weights = nullptr) = 0;

        /**
         *
         * @return
         */
        LIB4NEURO_API virtual size_t get_dimension();

        /**
         *
         * @param params
         * @param grad
         * @param alpha
         * @param batch
         */
        virtual void
        calculate_error_gradient(std::vector<double>& params,
                                 std::vector<double>& grad,
                                 double alpha = 1.0,
                                 size_t batch = 0) = 0;

        /**
         *
         * @param params
         * @param grad
         * @param alpha
         * @param batch
         */
        virtual void
        analyze_error_gradient(std::vector<double>& params,
                               std::vector<double>& grad,
                               double alpha = 1.0,
                               size_t batch = 0) = 0;

        /**
         *
         * @return
         */
        virtual std::vector<double> get_parameters() = 0;

        /**
         *
         * @return
         */
        virtual size_t get_n_data_set() = 0;

        /**
         *
         * @return
         */
        virtual size_t get_n_test_data_set() = 0;

        /**
         *
         * @return
         */
        virtual size_t get_n_outputs() = 0;

        /**
         *
         * @param params
         */
        virtual void set_parameters(std::vector<double>& params) = 0;

        /**
         *
         * @param percent_train
         * @return
         */
        LIB4NEURO_API virtual void divide_data_train_test(double percent_test);

        /**
         *
         * @param percent_train
         * @return
         */
        LIB4NEURO_API virtual size_t divide_data_worst_subset(
            std::vector<size_t> &subset_indices,
            std::vector<int> &active_subset,
            std::vector<float> &entry_errors,
			size_t expansion_len,
			float tolerance
        );

        /**
         *
         */
        LIB4NEURO_API virtual void return_full_data_set_for_training();

        /**
         *
         * @param jacobian
         * @param rhs
         */
        virtual void get_jacobian_and_rhs(std::vector<std::vector<double>>& jacobian,
                                          std::vector<double>& rhs) = 0;

        virtual void get_jacobian_and_rhs(std::vector<std::vector<double>>& jacobian,
                                          std::vector<double>& rhs,
                                          std::vector<std::pair<std::vector<double>, std::vector<double>>>& data) = 0;

        /**
         *
         */
        virtual double eval_on_test_data(std::vector<double>* weights = nullptr,
                                         bool verbose = false) = 0;

        /**
         *
         * @param results_file_path
         * @param weights
         * @return
         */
        virtual double eval_on_test_data(std::string results_file_path,
                                         std::vector<double>* weights = nullptr,
                                         bool verbose = false) = 0;

        /**
         *
         * @param results_file_path
         * @param weights
         * @return
         */
        virtual double eval_on_test_data(std::ofstream* results_file_path,
                                         std::vector<double>* weights = nullptr,
                                         bool verbose = false) = 0;

        /**
         *
         * @param data_set
         * @param weights
         * @return
         */
        virtual double eval_on_data_set(DataSet* data_set,
                                        std::vector<double>* weights = nullptr,
                                        bool verbose = false) = 0;

        /**
         *
         * @param data_set
         * @param weights
         * @param results_file_path
         * @return
         */
        virtual double
        eval_on_data_set(DataSet* data_set,
                         std::string results_file_path,
                         std::vector<double>* weights = nullptr,
                         bool verbose = false) = 0;

        /**
         *
         * @param data_set
         * @param results_file_path
         * @param weights
         * @return
         */
        virtual double eval_on_data_set(DataSet* data_set,
                                        std::ofstream* results_file_path = nullptr,
                                        std::vector<double>* weights = nullptr,
                                        bool verbose = false) = 0;

        /**
         *
         * @param i
         * @param parameter_vector
         * @param error_vector
         * @return
         */
        virtual double eval_single_item_by_idx(size_t i,
                                               std::vector<double>* parameter_vector,
                                               std::vector<double>& error_vector) = 0;

        /**
         *
         * @param error_vector
         * @param gradient_vector
         */
        virtual void calculate_error_gradient_single(std::vector<double>& error_vector,
                                                     std::vector<double>& gradient_vector) = 0;

        /**
         *
         * @param input
         * @param output
         * @param gradient
         * @param h
         */
        virtual void
        calculate_residual_gradient(std::vector<double>* input,
                                    std::vector<double>* output,
                                    std::vector<double>* gradient,
                                    double h = 1e-3) = 0;

        /**
         *
         * @param input
         * @param output
         * @param parameters
         * @return
         */
        virtual double
        calculate_single_residual(std::vector<double>* input,
                                  std::vector<double>* output,
                                  std::vector<double>* parameters = nullptr) = 0;

        /**
         *
         * @param scaling
         */
        virtual void randomize_parameters(double scaling) = 0;

        [[nodiscard]] std::vector<NeuralNetwork*>& get_nets();

        [[nodiscard]] DataSet* get_dataset() const;

        void set_dataset(DataSet* ds);
		
		virtual void add_to_hessian_and_rhs_single(
			arma::Mat<double>& H,
			arma::Col<double>& rhs,
			size_t entry_idx
		);

    protected:

        /**
         *
         */
        size_t dimension = 0;

        /**
         *
         */
        std::vector<NeuralNetwork*> nets;

        /**
         *
         */
        DataSet* ds = nullptr;

        /**
         *
         */
        DataSet* ds_full = nullptr;

        /**
         *
         */
        DataSet* ds_test = nullptr;
    };


    class MSE : public ErrorFunction {
    private:
        bool rescale_error;

    public:
        /**
         * Constructor for single neural network
         * @param net
         * @param ds
         * @param rescale_error if true, the means square error is used, if false, the absolute value of the error is used
         */
        LIB4NEURO_API MSE(NeuralNetwork* net,
                          DataSet* ds,
                          bool rescale_error = true
                          );


        /**
         *
         * @param jacobian
         * @param rhs
         */
        LIB4NEURO_API virtual void get_jacobian_and_rhs(std::vector<std::vector<double>>& jacobian,
                                                        std::vector<double>& rhs) override;

        LIB4NEURO_API virtual void get_jacobian_and_rhs(std::vector<std::vector<double>>& jacobian,
                                                        std::vector<double>& rhs,
                                                        std::vector<std::pair<std::vector<double>, std::vector<double>>>& data) override;
        /**
         *
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval(std::vector<double>* weights = nullptr,
                                  bool denormalize_data = false,
                                  bool verbose = false) override;

        /**
         *
         * @param params
         * @param grad
         * @param alpha
         * @param batch
         */
        LIB4NEURO_API void
        calculate_error_gradient(std::vector<double>& params,
                                 std::vector<double>& grad,
                                 double alpha = 1.0,
                                 size_t batch = 0) override;

        /**
         *
         * @param params
         * @param grad
         * @param alpha
         * @param batch
         */
        LIB4NEURO_API void
        analyze_error_gradient(std::vector<double>& params,
                               std::vector<double>& grad,
                               double alpha = 1.0,
                               size_t batch = 0) override;

        /**
         * Evaluates the function f(x) = 0 - MSE(x) for a
         * specified input x
         *
         * @param input
         * @return
         */
        LIB4NEURO_API
        double calculate_single_residual(std::vector<double>* input,
                                         std::vector<double>* output,
                                         std::vector<double>* parameters) override;

        /**
         * Compute gradient of the residual function f(x) = 0 - MSE(x) for a specific input x.
         * The method uses the central difference method.
         *
         * @param[in] input Vector being a single input
         * @param[out] gradient Resulting gradient
         * @param[in] h Step used in the central difference
         */
        LIB4NEURO_API void
        calculate_residual_gradient(std::vector<double>* input,
                                    std::vector<double>* output,
                                    std::vector<double>* gradient,
                                    double h = 1e-3) override;

        /**
         *
         * @param input
         * @return
         */
        LIB4NEURO_API double eval_on_single_input(std::vector<double>* input,
                                                  std::vector<double>* output,
                                                  std::vector<double>* weights = nullptr) override;

        /**
         *
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_test_data(std::vector<double>* weights = nullptr,
                                               bool verbose = false) override;

        /**
         *
         * @param results_file_path
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_test_data(std::string results_file_path = nullptr,
                                               std::vector<double>* weights = nullptr,
                                               bool verbose = false) override;

        /**
         *
         * @param results_file_path
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_test_data(std::ofstream* results_file_path,
                                               std::vector<double>* weights = nullptr,
                                               bool verbose = false) override;

        /**
         *
         * @param data_set
         * @param results_file_path
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_data_set(DataSet* data_set,
                                              std::ofstream* results_file_path,
                                              std::vector<double>* weights = nullptr,
                                              bool verbose = false) override;

        /**
         *
         * @param data_set
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_data_set(DataSet* data_set,
                                              std::vector<double>* weights = nullptr,
                                              bool verbose = false) override;

        /**
         *
         * @param data_set
         * @param results_file_path
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_data_set(DataSet* data_set,
                                              std::string results_file_path,
                                              std::vector<double>* weights = nullptr,
                                              bool verbose = false) override;

        /**
         *
         * @param i
         * @param parameter_vector
         * @param error_vector
         * @return
         */
        LIB4NEURO_API double eval_single_item_by_idx(size_t i,
                                                     std::vector<double>* parameter_vector,
                                                     std::vector<double>& error_vector) override;

        /**
         *
         * @param error_vector
         * @param gradient_vector
         */
        LIB4NEURO_API void calculate_error_gradient_single(std::vector<double>& error_vector,
                                                           std::vector<double>& gradient_vector) override;

        /**
         *
         * @return
         */
        LIB4NEURO_API virtual std::vector<double> get_parameters() override;

        /**
         *
         * @param params
         */
        LIB4NEURO_API virtual void set_parameters(std::vector<double>& params) override;

        /**
         *
         * @return
         */
        LIB4NEURO_API virtual size_t get_n_data_set() override;

        /**
         *
         * @return
         */
        LIB4NEURO_API virtual size_t get_n_test_data_set() override;

        /**
         *
         * @return
         */
        LIB4NEURO_API virtual size_t get_n_outputs() override;

        /**
         *
         * @param scaling
         */
        LIB4NEURO_API virtual void randomize_parameters(double scaling) override;
    };

    class ErrorSum : public ErrorFunction {
    public:
        /**
         *
         */
        LIB4NEURO_API ErrorSum();

        /**
         *
         */
        LIB4NEURO_API ~ErrorSum();

        /**
         *
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval(std::vector<double>* weights = nullptr,
                                  bool denormalize_data = false,
                                  bool verbose = false);

        LIB4NEURO_API double eval_on_single_input(std::vector<double>* input,
                                                  std::vector<double>* output,
                                                  std::vector<double>* weights = nullptr) override;

        /**
         *
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_test_data(std::vector<double>* weights = nullptr,
                                               bool verbose = false) override;

        /**
         *
         * @param results_file_path
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_test_data(std::string results_file_path,
                                               std::vector<double>* weights = nullptr,
                                               bool verbose = false) override;

        /**
         *
         * @param results_file_path
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_test_data(std::ofstream* results_file_path,
                                               std::vector<double>* weights = nullptr,
                                               bool verbose = false) override;

        /**
         *
         * @param data_set
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_data_set(DataSet* data_set,
                                              std::vector<double>* weights = nullptr,
                                              bool verbose = false) override;

        /**
         *
         * @param data_set
         * @param results_file_path
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_data_set(DataSet* data_set,
                                              std::string results_file_path,
                                              std::vector<double>* weights = nullptr,
                                              bool verbose = false) override;

        /**
         *
         * @param data_set
         * @param results_file_path
         * @param weights
         * @return
         */
        LIB4NEURO_API double eval_on_data_set(DataSet* data_set,
                                              std::ofstream* results_file_path,
                                              std::vector<double>* weights = nullptr,
                                              bool verbose = false) override;

        /**
         *
         * @param i
         * @param parameter_vector
         * @param error_vector
         * @return
         */
        LIB4NEURO_API virtual double eval_single_item_by_idx(size_t i,
                                                             std::vector<double>* parameter_vector,
                                                             std::vector<double>& error_vector) override;

        /**
         *
         * @param error_vector
         * @param gradient_vector
         */
        LIB4NEURO_API virtual void calculate_error_gradient_single(std::vector<double>& error_vector,
                                                                   std::vector<double>& gradient_vector) override;

        /**
         *
         * @param F
         */
        LIB4NEURO_API void add_error_function(ErrorFunction* F,
                                              double alpha = 1.0);

        /**
         *
         * @return
         */
        LIB4NEURO_API size_t get_dimension() override;

        /**
         *
         * @param params
         * @param grad
         * @param alpha
         * @param batch
         */
        LIB4NEURO_API void
        calculate_error_gradient(std::vector<double>& params,
                                 std::vector<double>& grad,
                                 double alpha = 1.0,
                                 size_t batch = 0) override;
        /**
         *
         * @param params
         * @param grad
         * @param alpha
         * @param batch
         */
        LIB4NEURO_API void
        analyze_error_gradient(std::vector<double>& params,
                               std::vector<double>& grad,
                               double alpha = 1.0,
                               size_t batch = 0) override;

        LIB4NEURO_API void
        calculate_residual_gradient(std::vector<double>* input,
                                    std::vector<double>* output,
                                    std::vector<double>* gradient,
                                    double h = 1e-3) override;

        LIB4NEURO_API double
        calculate_single_residual(std::vector<double>* input,
                                  std::vector<double>* output,
                                  std::vector<double>* parameters = nullptr) override;


        /**
         *
         * @return
         */
        LIB4NEURO_API virtual std::vector<double> get_parameters() override;

        /**
         *
         * @param params
         */
        LIB4NEURO_API virtual void set_parameters(std::vector<double>& params) override;

        /**
         *
         * @return
         */
        LIB4NEURO_API virtual size_t get_n_data_set() override;

        /**
         *
         * @return
         */
        LIB4NEURO_API virtual size_t get_n_test_data_set() override;

        /**
         *
         * @return
         */
        LIB4NEURO_API virtual size_t get_n_outputs() override;

        /**
         *
         * @param percent_train
         * @return
         */
        LIB4NEURO_API virtual void divide_data_train_test(double percent_test) override;

        /**
         *
         * @param percent_train
         * @return
         */
        LIB4NEURO_API virtual size_t divide_data_worst_subset(
            std::vector<size_t> &subset_indices,
            std::vector<int> &active_subset,
            std::vector<float> &entry_errors,
			size_t expansion_len,
			float tolerance
        ) override;

        /**
         *
         */
        LIB4NEURO_API virtual void return_full_data_set_for_training() override;

        /**
         *
         * @param jacobian
         * @param rhs
         */
        LIB4NEURO_API virtual void get_jacobian_and_rhs(
            std::vector<std::vector<double>>& jacobian,
            std::vector<double>& rhs) override;

        LIB4NEURO_API virtual void get_jacobian_and_rhs(std::vector<std::vector<double>>& jacobian,
                                                        std::vector<double>& rhs,
                                                        std::vector<std::pair<std::vector<double>, std::vector<double>>>& data) override;

        /**
         *
         * @param scaling
         */
        LIB4NEURO_API virtual void randomize_parameters(double scaling) override;

    protected:
        std::vector<ErrorFunction*>* summand;
        std::vector<double>        summand_coefficient;
    };
}

#endif //INC_4NEURO_ERRORFUNCTION_H