QuAcc/quacc/evaluation/method.py

import inspect
from functools import wraps

import numpy as np
from quapy.method.aggregative import CC, PACC, SLD
from quapy.protocol import UPP, AbstractProtocol
from sklearn.linear_model import LogisticRegression

import quacc as qc
from quacc.evaluation.report import EvaluationReport
from quacc.method.model_selection import BQAEgsq, GridSearchAE, MCAEgsq

from ..method.base import BQAE, MCAE, BaseAccuracyEstimator

_methods = {}
_sld_param_grid = {
    "q__classifier__C": np.logspace(-3, 3, 7),
    "q__classifier__class_weight": [None, "balanced"],
    "q__recalib": [None, "bcts"],
    "confidence": [["max_conf"], ["entropy"], ["max_conf", "entropy"]],
}
_pacc_param_grid = {
    "q__classifier__C": np.logspace(-3, 3, 7),
    "q__classifier__class_weight": [None, "balanced"],
    "confidence": [["max_conf", "entropy"]],
}


def method(func):
    @wraps(func)
    def wrapper(c_model, validation, protocol):
        return func(c_model, validation, protocol)

    _methods[func.__name__] = wrapper

    return wrapper


def evaluation_report(
    estimator: BaseAccuracyEstimator,
    protocol: AbstractProtocol,
) -> EvaluationReport:
    method_name = inspect.stack()[1].function
    report = EvaluationReport(name=method_name)
    for sample in protocol():
        e_sample = estimator.extend(sample)
        estim_prev = estimator.estimate(e_sample.eX)
        acc_score = qc.error.acc(estim_prev)
        f1_score = qc.error.f1(estim_prev)
        report.append_row(
            sample.prevalence(),
            acc_score=acc_score,
            acc=abs(qc.error.acc(e_sample.prevalence()) - acc_score),
            f1_score=f1_score,
            f1=abs(qc.error.f1(e_sample.prevalence()) - f1_score),
        )

    return report


@method
def bin_sld(c_model, validation, protocol) -> EvaluationReport:
    est = BQAE(c_model, SLD(LogisticRegression())).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul_sld(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(c_model, SLD(LogisticRegression())).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul3w_sld(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(c_model, SLD(LogisticRegression()), collapse_false=True).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def binc_sld(c_model, validation, protocol) -> EvaluationReport:
    est = BQAE(
        c_model,
        SLD(LogisticRegression()),
        confidence=["max_conf", "entropy"],
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mulc_sld(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(
        c_model,
        SLD(LogisticRegression()),
        confidence=["max_conf", "entropy"],
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul3wc_sld(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(
        c_model,
        SLD(LogisticRegression()),
        confidence=["max_conf", "entropy"],
        collapse_false=True,
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def binmc_sld(c_model, validation, protocol) -> EvaluationReport:
    est = BQAE(
        c_model,
        SLD(LogisticRegression()),
        confidence="max_conf",
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mulmc_sld(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(
        c_model,
        SLD(LogisticRegression()),
        confidence="max_conf",
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul3wmc_sld(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(
        c_model,
        SLD(LogisticRegression()),
        confidence="max_conf",
        collapse_false=True,
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def binne_sld(c_model, validation, protocol) -> EvaluationReport:
    est = BQAE(
        c_model,
        SLD(LogisticRegression()),
        confidence="entropy",
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mulne_sld(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(
        c_model,
        SLD(LogisticRegression()),
        confidence="entropy",
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul3wne_sld(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(
        c_model,
        SLD(LogisticRegression()),
        confidence="entropy",
        collapse_false=True,
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def bin_sld_gs(c_model, validation, protocol) -> EvaluationReport:
    v_train, v_val = validation.split_stratified(0.6, random_state=0)
    model = BQAE(c_model, SLD(LogisticRegression()))
    est = GridSearchAE(
        model=model,
        param_grid=_sld_param_grid,
        refit=False,
        protocol=UPP(v_val, repeats=100),
        verbose=True,
    ).fit(v_train)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul_sld_gs(c_model, validation, protocol) -> EvaluationReport:
    v_train, v_val = validation.split_stratified(0.6, random_state=0)
    model = MCAE(c_model, SLD(LogisticRegression()))
    est = GridSearchAE(
        model=model,
        param_grid=_sld_param_grid,
        refit=False,
        protocol=UPP(v_val, repeats=100),
        verbose=True,
    ).fit(v_train)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul3w_sld_gs(c_model, validation, protocol) -> EvaluationReport:
    v_train, v_val = validation.split_stratified(0.6, random_state=0)
    model = MCAE(c_model, SLD(LogisticRegression()), collapse_false=True)
    est = GridSearchAE(
        model=model,
        param_grid=_sld_param_grid,
        refit=False,
        protocol=UPP(v_val, repeats=100),
        verbose=True,
    ).fit(v_train)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def bin_sld_gsq(c_model, validation, protocol) -> EvaluationReport:
    est = BQAEgsq(
        c_model,
        SLD(LogisticRegression()),
        param_grid={
            "classifier__C": np.logspace(-3, 3, 7),
            "classifier__class_weight": [None, "balanced"],
            "recalib": [None, "bcts", "vs"],
        },
        refit=False,
        verbose=False,
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul_sld_gsq(c_model, validation, protocol) -> EvaluationReport:
    est = MCAEgsq(
        c_model,
        SLD(LogisticRegression()),
        param_grid={
            "classifier__C": np.logspace(-3, 3, 7),
            "classifier__class_weight": [None, "balanced"],
            "recalib": [None, "bcts", "vs"],
        },
        refit=False,
        verbose=False,
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def bin_pacc(c_model, validation, protocol) -> EvaluationReport:
    est = BQAE(c_model, PACC(LogisticRegression())).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul_pacc(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(c_model, PACC(LogisticRegression())).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def binc_pacc(c_model, validation, protocol) -> EvaluationReport:
    est = BQAE(
        c_model,
        PACC(LogisticRegression()),
        confidence=["max_conf", "entropy"],
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mulc_pacc(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(
        c_model,
        PACC(LogisticRegression()),
        confidence=["max_conf", "entropy"],
    ).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def bin_pacc_gs(c_model, validation, protocol) -> EvaluationReport:
    v_train, v_val = validation.split_stratified(0.6, random_state=0)
    model = BQAE(c_model, PACC(LogisticRegression()))
    est = GridSearchAE(
        model=model,
        param_grid=_pacc_param_grid,
        refit=False,
        protocol=UPP(v_val, repeats=100),
        verbose=False,
    ).fit(v_train)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul_pacc_gs(c_model, validation, protocol) -> EvaluationReport:
    v_train, v_val = validation.split_stratified(0.6, random_state=0)
    model = MCAE(c_model, PACC(LogisticRegression()))
    est = GridSearchAE(
        model=model,
        param_grid=_pacc_param_grid,
        refit=False,
        protocol=UPP(v_val, repeats=100),
        verbose=False,
    ).fit(v_train)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def bin_cc(c_model, validation, protocol) -> EvaluationReport:
    est = BQAE(c_model, CC(LogisticRegression())).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )


@method
def mul_cc(c_model, validation, protocol) -> EvaluationReport:
    est = MCAE(c_model, CC(LogisticRegression())).fit(validation)
    return evaluation_report(
        estimator=est,
        protocol=protocol,
    )
update trailing char 2023-11-08 17:26:44 +01:00			`import inspect`
			`from functools import wraps`

			`import numpy as np`
confidence methods added 2023-11-10 01:24:42 +01:00			`from quapy.method.aggregative import CC, PACC, SLD`
update trailing char 2023-11-08 17:26:44 +01:00			`from quapy.protocol import UPP, AbstractProtocol`
			`from sklearn.linear_model import LogisticRegression`

			`import quacc as qc`
			`from quacc.evaluation.report import EvaluationReport`
			`from quacc.method.model_selection import BQAEgsq, GridSearchAE, MCAEgsq`

			`from ..method.base import BQAE, MCAE, BaseAccuracyEstimator`

			`_methods = {}`
			`_sld_param_grid = {`
			`"q__classifier__C": np.logspace(-3, 3, 7),`
			`"q__classifier__class_weight": [None, "balanced"],`
			`"q__recalib": [None, "bcts"],`
gs params updated, methods added 2023-11-16 01:35:49 +01:00			`"confidence": [["max_conf"], ["entropy"], ["max_conf", "entropy"]],`
update trailing char 2023-11-08 17:26:44 +01:00			`}`
			`_pacc_param_grid = {`
			`"q__classifier__C": np.logspace(-3, 3, 7),`
			`"q__classifier__class_weight": [None, "balanced"],`
confidence methods added 2023-11-10 01:24:42 +01:00			`"confidence": [["max_conf", "entropy"]],`
update trailing char 2023-11-08 17:26:44 +01:00			`}`
confidence methods added 2023-11-10 01:24:42 +01:00

update trailing char 2023-11-08 17:26:44 +01:00			`def method(func):`
			`@wraps(func)`
			`def wrapper(c_model, validation, protocol):`
			`return func(c_model, validation, protocol)`

			`_methods[func.__name__] = wrapper`

			`return wrapper`


			`def evaluation_report(`
			`estimator: BaseAccuracyEstimator,`
			`protocol: AbstractProtocol,`
			`) -> EvaluationReport:`
			`method_name = inspect.stack()[1].function`
			`report = EvaluationReport(name=method_name)`
			`for sample in protocol():`
			`e_sample = estimator.extend(sample)`
confidence methods added 2023-11-10 01:24:42 +01:00			`estim_prev = estimator.estimate(e_sample.eX)`
update trailing char 2023-11-08 17:26:44 +01:00			`acc_score = qc.error.acc(estim_prev)`
			`f1_score = qc.error.f1(estim_prev)`
			`report.append_row(`
			`sample.prevalence(),`
			`acc_score=acc_score,`
			`acc=abs(qc.error.acc(e_sample.prevalence()) - acc_score),`
			`f1_score=f1_score,`
			`f1=abs(qc.error.f1(e_sample.prevalence()) - f1_score),`
			`)`

			`return report`


			`@method`
			`def bin_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = BQAE(c_model, SLD(LogisticRegression())).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def mul_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(c_model, SLD(LogisticRegression())).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


mul3w implemented 2023-11-11 18:46:27 +01:00			`@method`
			`def mul3w_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(c_model, SLD(LogisticRegression()), collapse_false=True).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


confidence methods added 2023-11-10 01:24:42 +01:00			`@method`
			`def binc_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = BQAE(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`confidence=["max_conf", "entropy"],`
			`).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def mulc_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`confidence=["max_conf", "entropy"],`
			`).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


mul3w implemented 2023-11-11 18:46:27 +01:00			`@method`
			`def mul3wc_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`confidence=["max_conf", "entropy"],`
			`collapse_false=True,`
			`).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


update trailing char 2023-11-08 17:26:44 +01:00			`@method`
			`def binmc_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = BQAE(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`confidence="max_conf",`
			`).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def mulmc_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`confidence="max_conf",`
			`).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


gs params updated, methods added 2023-11-16 01:35:49 +01:00			`@method`
			`def mul3wmc_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`confidence="max_conf",`
			`collapse_false=True,`
			`).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


update trailing char 2023-11-08 17:26:44 +01:00			`@method`
			`def binne_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = BQAE(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`confidence="entropy",`
			`).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def mulne_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`confidence="entropy",`
			`).fit(validation)`
			`return evaluation_report(`
gs params updated, methods added 2023-11-16 01:35:49 +01:00			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def mul3wne_sld(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`confidence="entropy",`
			`collapse_false=True,`
			`).fit(validation)`
			`return evaluation_report(`
update trailing char 2023-11-08 17:26:44 +01:00			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def bin_sld_gs(c_model, validation, protocol) -> EvaluationReport:`
			`v_train, v_val = validation.split_stratified(0.6, random_state=0)`
			`model = BQAE(c_model, SLD(LogisticRegression()))`
			`est = GridSearchAE(`
			`model=model,`
			`param_grid=_sld_param_grid,`
			`refit=False,`
			`protocol=UPP(v_val, repeats=100),`
			`verbose=True,`
			`).fit(v_train)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def mul_sld_gs(c_model, validation, protocol) -> EvaluationReport:`
			`v_train, v_val = validation.split_stratified(0.6, random_state=0)`
			`model = MCAE(c_model, SLD(LogisticRegression()))`
			`est = GridSearchAE(`
			`model=model,`
			`param_grid=_sld_param_grid,`
			`refit=False,`
			`protocol=UPP(v_val, repeats=100),`
			`verbose=True,`
			`).fit(v_train)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


mul3w implemented 2023-11-11 18:46:27 +01:00			`@method`
			`def mul3w_sld_gs(c_model, validation, protocol) -> EvaluationReport:`
			`v_train, v_val = validation.split_stratified(0.6, random_state=0)`
			`model = MCAE(c_model, SLD(LogisticRegression()), collapse_false=True)`
			`est = GridSearchAE(`
			`model=model,`
			`param_grid=_sld_param_grid,`
			`refit=False,`
			`protocol=UPP(v_val, repeats=100),`
			`verbose=True,`
			`).fit(v_train)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


update trailing char 2023-11-08 17:26:44 +01:00			`@method`
			`def bin_sld_gsq(c_model, validation, protocol) -> EvaluationReport:`
			`est = BQAEgsq(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`param_grid={`
			`"classifier__C": np.logspace(-3, 3, 7),`
			`"classifier__class_weight": [None, "balanced"],`
			`"recalib": [None, "bcts", "vs"],`
			`},`
			`refit=False,`
			`verbose=False,`
			`).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def mul_sld_gsq(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAEgsq(`
			`c_model,`
			`SLD(LogisticRegression()),`
			`param_grid={`
			`"classifier__C": np.logspace(-3, 3, 7),`
			`"classifier__class_weight": [None, "balanced"],`
			`"recalib": [None, "bcts", "vs"],`
			`},`
			`refit=False,`
			`verbose=False,`
			`).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def bin_pacc(c_model, validation, protocol) -> EvaluationReport:`
			`est = BQAE(c_model, PACC(LogisticRegression())).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def mul_pacc(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(c_model, PACC(LogisticRegression())).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
confidence methods added 2023-11-10 01:24:42 +01:00			`def binc_pacc(c_model, validation, protocol) -> EvaluationReport:`
			`est = BQAE(`
			`c_model,`
			`PACC(LogisticRegression()),`
			`confidence=["max_conf", "entropy"],`
			`).fit(validation)`
update trailing char 2023-11-08 17:26:44 +01:00			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
confidence methods added 2023-11-10 01:24:42 +01:00			`def mulc_pacc(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(`
			`c_model,`
			`PACC(LogisticRegression()),`
			`confidence=["max_conf", "entropy"],`
			`).fit(validation)`
update trailing char 2023-11-08 17:26:44 +01:00			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def bin_pacc_gs(c_model, validation, protocol) -> EvaluationReport:`
			`v_train, v_val = validation.split_stratified(0.6, random_state=0)`
			`model = BQAE(c_model, PACC(LogisticRegression()))`
			`est = GridSearchAE(`
			`model=model,`
			`param_grid=_pacc_param_grid,`
			`refit=False,`
			`protocol=UPP(v_val, repeats=100),`
			`verbose=False,`
			`).fit(v_train)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def mul_pacc_gs(c_model, validation, protocol) -> EvaluationReport:`
			`v_train, v_val = validation.split_stratified(0.6, random_state=0)`
			`model = MCAE(c_model, PACC(LogisticRegression()))`
			`est = GridSearchAE(`
			`model=model,`
			`param_grid=_pacc_param_grid,`
			`refit=False,`
			`protocol=UPP(v_val, repeats=100),`
			`verbose=False,`
			`).fit(v_train)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def bin_cc(c_model, validation, protocol) -> EvaluationReport:`
			`est = BQAE(c_model, CC(LogisticRegression())).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`


			`@method`
			`def mul_cc(c_model, validation, protocol) -> EvaluationReport:`
			`est = MCAE(c_model, CC(LogisticRegression())).fit(validation)`
			`return evaluation_report(`
			`estimator=est,`
			`protocol=protocol,`
			`)`