added metric evaluation

gf712 · gf712 · commit 753f8ba16f0f · 2019-05-30T09:20:05.000+01:00
diff --git a/src/shogun/io/openml/OpenMLData.cpp b/src/shogun/io/openml/OpenMLData.cpp
@@ -186,10 +186,8 @@ std::shared_ptr<CFeatures> OpenMLData::get_features(const std::string& label)
 	    copy_feat, result->get_feature_matrix().data(),
 	    m_feature_types.size() * m_cached_features.size());
 
-	result = std::make_shared<CDenseFeatures<float64_t>>(
+	return std::make_shared<CDenseFeatures<float64_t>>(
 	    copy_feat, m_feature_types.size(), n_examples);
-
-	return result;
 }
 
 std::shared_ptr<CLabels> OpenMLData::get_labels()
diff --git a/src/shogun/io/openml/OpenMLRun.cpp b/src/shogun/io/openml/OpenMLRun.cpp
@@ -4,7 +4,6 @@
  * Authors: Gil Hoben
  */
 
-#include <shogun/evaluation/CrossValidationStorage.h>
 #include <shogun/io/openml/OpenMLFile.h>
 #include <shogun/io/openml/OpenMLRun.h>
 #include <shogun/io/openml/ShogunOpenML.h>
@@ -47,7 +46,7 @@ std::shared_ptr<OpenMLRun> OpenMLRun::run_flow_on_task(
 		SG_SERROR("INTERNAL ERROR: failed to cast model to machine!\n")
 	}
 
-	auto* xval_storage = new CrossValidationStorage();
+	auto xval_storage = std::make_shared<CrossValidationStorage>();
 
 	if (task->get_split()->contains_splits())
 	{
@@ -64,11 +63,12 @@ std::shared_ptr<OpenMLRun> OpenMLRun::run_flow_on_task(
 			for (auto fold_idx : range(task->get_num_fold()))
 			{
 				SGVector<index_t> train_i_idx(
-				    train_idx[repeat_idx][fold_idx].data(),
-				    train_idx[repeat_idx][fold_idx].size());
+				    train_idx[repeat_idx][fold_idx].begin(),
+				    train_idx[repeat_idx][fold_idx].end());
 				SGVector<index_t> test_i_idx(
-				    train_idx[repeat_idx][fold_idx].data(),
-				    train_idx[repeat_idx][fold_idx].size());
+				    test_idx[repeat_idx][fold_idx].begin(),
+				    test_idx[repeat_idx][fold_idx].end());
+
 				xval_storage->append_fold_result(
 				    ShogunOpenML::run_model_on_fold(
 				        machine, task, features, labels, train_i_idx,
@@ -93,9 +93,7 @@ std::shared_ptr<OpenMLRun> OpenMLRun::run_flow_on_task(
 	    std::string{},              // setup_id
 	    std::string{},              // setup_string
 	    std::string{},              // parameter_settings
-	    std::vector<float64_t>{},   // evaluations
-	    std::vector<float64_t>{},   // fold_evaluations
-	    std::vector<float64_t>{},   // sample_evaluations
+	    xval_storage,               // xval_storage
 	    std::string{},              // data_content
 	    std::vector<std::string>{}, // output_files
 	    task,                       // task
@@ -119,7 +117,10 @@ void OpenMLRun::to_filesystem(const std::string& directory) const
 	SG_SNOTIMPLEMENTED
 }
 
-void OpenMLRun::publish() const
+void OpenMLRun::publish() const {SG_SNOTIMPLEMENTED}
+
+std::unique_ptr<std::ostream> OpenMLRun::to_xml() const
 {
-	SG_SNOTIMPLEMENTED
+
+	return std::unique_ptr<std::ostream>();
 }
diff --git a/src/shogun/io/openml/OpenMLRun.h b/src/shogun/io/openml/OpenMLRun.h
@@ -8,6 +8,7 @@
 #define SHOGUN_OPENMLRUN_H
 
 #include <shogun/base/SGObject.h>
+#include <shogun/evaluation/CrossValidationStorage.h>
 
 #include <shogun/io/openml/OpenMLFlow.h>
 #include <shogun/io/openml/OpenMLTask.h>
@@ -20,9 +21,7 @@ namespace shogun {
 				const std::string& uploader, const std::string& uploader_name,
 				const std::string& setup_id, const std::string& setup_string,
 				const std::string& parameter_settings,
-				std::vector<float64_t> evaluations,
-				std::vector<float64_t> fold_evaluations,
-				std::vector<float64_t> sample_evaluations,
+				std::shared_ptr<CrossValidationStorage> xval_storage,
 				const std::string& data_content,
 				std::vector<std::string> output_files,
 				std::shared_ptr<OpenMLTask> task, std::shared_ptr<OpenMLFlow> flow,
@@ -31,9 +30,7 @@ namespace shogun {
 				: m_uploader(uploader), m_uploader_name(uploader_name),
 				  m_setup_id(setup_id), m_setup_string(setup_string),
 				  m_parameter_settings(parameter_settings),
-				  m_evaluations(std::move(evaluations)),
-				  m_fold_evaluations(std::move(fold_evaluations)),
-				  m_sample_evaluations(std::move(sample_evaluations)),
+				  m_xval_storage(xval_storage),
 				  m_data_content(data_content),
 				  m_output_files(std::move(output_files)), m_task(std::move(task)),
 				  m_flow(std::move(flow)), m_run_id(run_id),
@@ -55,6 +52,8 @@ namespace shogun {
 
 		void to_filesystem(const std::string& directory) const;
 
+		std::unique_ptr<std::ostream> to_xml() const;
+
 		void publish() const;
 
 	private:
@@ -63,9 +62,7 @@ namespace shogun {
 		std::string m_setup_id;
 		std::string m_setup_string;
 		std::string m_parameter_settings;
-		std::vector<float64_t> m_evaluations;
-		std::vector<float64_t> m_fold_evaluations;
-		std::vector<float64_t> m_sample_evaluations;
+		std::shared_ptr<CrossValidationStorage> m_xval_storage;
 		std::string m_data_content;
 		std::vector<std::string> m_output_files;
 		std::shared_ptr<OpenMLTask> m_task;
diff --git a/src/shogun/io/openml/ShogunOpenML.cpp b/src/shogun/io/openml/ShogunOpenML.cpp
@@ -6,6 +6,8 @@
  * Authors: Gil Hoben
  */
 
+#include <shogun/evaluation/ContingencyTableEvaluation.h>
+#include <shogun/evaluation/MeanAbsoluteError.h>
 #include <shogun/util/factory.h>
 
 #include <shogun/io/openml/ShogunOpenML.h>
@@ -310,6 +312,30 @@ std::unique_ptr<CrossValidationFoldStorage> ShogunOpenML::run_model_on_fold(
 {
 	auto task_type = task->get_task_type();
 
+	CEvaluation* evaluation_criterion = nullptr;
+
+	switch (task_type)
+	{
+	case OpenMLTask::TaskType::SUPERVISED_CLASSIFICATION:
+		evaluation_criterion = new CAccuracyMeasure();
+		break;
+	case OpenMLTask::TaskType::SUPERVISED_REGRESSION:
+		evaluation_criterion = new CMeanAbsoluteError();
+		break;
+	case OpenMLTask::TaskType::LEARNING_CURVE:
+		SG_SNOTIMPLEMENTED
+	case OpenMLTask::TaskType::SUPERVISED_DATASTREAM_CLASSIFICATION:
+		SG_SNOTIMPLEMENTED
+	case OpenMLTask::TaskType::CLUSTERING:
+		SG_SNOTIMPLEMENTED
+	case OpenMLTask::TaskType::MACHINE_LEARNING_CHALLENGE:
+		SG_SNOTIMPLEMENTED
+	case OpenMLTask::TaskType::SURVIVAL_ANALYSIS:
+		SG_SNOTIMPLEMENTED
+	case OpenMLTask::TaskType::SUBGROUP_DISCOVERY:
+		SG_SNOTIMPLEMENTED
+	}
+
 	switch (task_type)
 	{
 	case OpenMLTask::TaskType::SUPERVISED_CLASSIFICATION:
@@ -324,8 +350,6 @@ std::unique_ptr<CrossValidationFoldStorage> ShogunOpenML::run_model_on_fold(
 		//  shared
 		auto* features_clone = features->clone()->as<CFeatures>();
 		auto* labels_clone = labels->clone()->as<CLabels>();
-		// auto* evaluation_criterion =
-		// (CEvaluation*)m_evaluation_criterion->clone();
 
 		/* evtl. update xvalidation output class */
 		fold->set_run_index(repeat_idx);
@@ -371,8 +395,10 @@ std::unique_ptr<CrossValidationFoldStorage> ShogunOpenML::run_model_on_fold(
 		SG_REF(result_labels);
 
 		/* evaluate */
-		// results[i] = evaluation_criterion->evaluate(result_labels, labels);
-		// SG_DEBUG("result on fold %d is %f\n", i, results[i])
+		auto result =
+		    evaluation_criterion->evaluate(result_labels, labels_clone);
+		SG_SINFO(
+		    "result on repeat %d fold %d is %f\n", repeat_idx, fold_idx, result)
 
 		/* evtl. update xvalidation output class */
 		fold->set_test_indices(test_idx);
@@ -381,18 +407,17 @@ std::unique_ptr<CrossValidationFoldStorage> ShogunOpenML::run_model_on_fold(
 		fold->set_test_true_result(true_labels);
 		SG_UNREF(true_labels)
 		fold->post_update_results();
-		// fold->set_evaluation_result(results[i]);
+		fold->set_evaluation_result(result);
 
 		/* clean up, remove subsets */
 		labels->remove_subset();
 		SG_UNREF(cloned_machine);
 		SG_UNREF(features_clone);
 		SG_UNREF(labels_clone);
-		// SG_UNREF(evaluation_criterion);
 		SG_UNREF(result_labels);
+		delete evaluation_criterion;
 		return fold;
 	}
-	break;
 	case OpenMLTask::TaskType::LEARNING_CURVE:
 		SG_SNOTIMPLEMENTED
 	case OpenMLTask::TaskType::SUPERVISED_DATASTREAM_CLASSIFICATION:
@@ -417,6 +442,30 @@ std::unique_ptr<CrossValidationFoldStorage> ShogunOpenML::run_model_on_fold(
 {
 	auto task_type = task->get_task_type();
 
+	CEvaluation* evaluation_criterion = nullptr;
+
+	switch (task_type)
+	{
+	case OpenMLTask::TaskType::SUPERVISED_CLASSIFICATION:
+		evaluation_criterion = new CAccuracyMeasure();
+		break;
+	case OpenMLTask::TaskType::SUPERVISED_REGRESSION:
+		evaluation_criterion = new CMeanAbsoluteError();
+		break;
+	case OpenMLTask::TaskType::LEARNING_CURVE:
+		SG_SNOTIMPLEMENTED
+	case OpenMLTask::TaskType::SUPERVISED_DATASTREAM_CLASSIFICATION:
+		SG_SNOTIMPLEMENTED
+	case OpenMLTask::TaskType::CLUSTERING:
+		SG_SNOTIMPLEMENTED
+	case OpenMLTask::TaskType::MACHINE_LEARNING_CHALLENGE:
+		SG_SNOTIMPLEMENTED
+	case OpenMLTask::TaskType::SURVIVAL_ANALYSIS:
+		SG_SNOTIMPLEMENTED
+	case OpenMLTask::TaskType::SUBGROUP_DISCOVERY:
+		SG_SNOTIMPLEMENTED
+	}
+
 	switch (task_type)
 	{
 	case OpenMLTask::TaskType::SUPERVISED_CLASSIFICATION:
@@ -446,23 +495,24 @@ std::unique_ptr<CrossValidationFoldStorage> ShogunOpenML::run_model_on_fold(
 		SG_SDEBUG("finished evaluation\n")
 
 		/* evaluate */
-		// results[i] = evaluation_criterion->evaluate(result_labels, labels);
-		// SG_DEBUG("result on fold %d is %f\n", i, results[i])
+		auto result =
+		    evaluation_criterion->evaluate(result_labels, labels_clone);
+		SG_SINFO("result is %f\n", result)
 
 		/* evtl. update xvalidation output class */
 		fold->set_test_result(result_labels);
 		auto* true_labels = (CLabels*)labels->clone();
 		fold->set_test_true_result(true_labels);
 		SG_UNREF(true_labels)
 		fold->post_update_results();
-		// fold->set_evaluation_result(results[i]);
+		fold->set_evaluation_result(result);
 
 		// cleanup
 		SG_UNREF(cloned_machine);
 		SG_UNREF(features_clone);
 		SG_UNREF(labels_clone);
-		// SG_UNREF(evaluation_criterion);
 		SG_UNREF(result_labels);
+		delete evaluation_criterion;
 		return fold;
 	}
 	case OpenMLTask::TaskType::LEARNING_CURVE: