dask-contrib
diff --git a/‎dask_sql/context.py‎
Lines changed: 158 additions & 79 deletions b/‎dask_sql/context.py‎
Lines changed: 158 additions & 79 deletions
diff --git a/‎dask_sql/datacontainer.py‎
Lines changed: 17 additions & 1 deletion b/‎dask_sql/datacontainer.py‎
Lines changed: 17 additions & 1 deletion
diff --git a/‎dask_sql/integrations/fugue.py‎
Lines changed: 5 additions & 1 deletion b/‎dask_sql/integrations/fugue.py‎
Lines changed: 5 additions & 1 deletion
diff --git a/‎dask_sql/java.py‎
Lines changed: 3 additions & 0 deletions b/‎dask_sql/java.py‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎dask_sql/physical/rel/custom/__init__.py‎
Lines changed: 10 additions & 4 deletions b/‎dask_sql/physical/rel/custom/__init__.py‎
Lines changed: 10 additions & 4 deletions
diff --git a/‎dask_sql/physical/rel/custom/analyze.py‎
Lines changed: 2 additions & 3 deletions b/‎dask_sql/physical/rel/custom/analyze.py‎
Lines changed: 2 additions & 3 deletions
diff --git a/‎dask_sql/physical/rel/custom/columns.py‎
Lines changed: 2 additions & 3 deletions b/‎dask_sql/physical/rel/custom/columns.py‎
Lines changed: 2 additions & 3 deletions
diff --git a/‎dask_sql/physical/rel/custom/create_experiment.py‎
Lines changed: 7 additions & 3 deletions b/‎dask_sql/physical/rel/custom/create_experiment.py‎
Lines changed: 7 additions & 3 deletions
diff --git a/‎dask_sql/physical/rel/custom/create_model.py‎
Lines changed: 3 additions & 3 deletions b/‎dask_sql/physical/rel/custom/create_model.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎dask_sql/physical/rel/custom/create_schema.py‎
Lines changed: 40 additions & 0 deletions b/‎dask_sql/physical/rel/custom/create_schema.py‎
Lines changed: 40 additions & 0 deletions
@@ -1,9 +1,15 @@
-from typing import Dict, List, Tuple, Union
+from collections import namedtuple
+from typing import Any, Callable, Dict, List, Tuple, Union
 
 import dask.dataframe as dd
+import pandas as pd
 
 ColumnType = Union[str, int]
 
+FunctionDescription = namedtuple(
+    "FunctionDescription", ["name", "parameters", "return_type", "aggregation"]
+)
+
 
 class ColumnContainer:
     # Forward declaration
@@ -173,3 +179,13 @@ def assign(self) -> dd.DataFrame:
             }
         )
         return df[self.column_container.columns]
+
+
+class SchemaContainer:
+    def __init__(self, name: str):
+        self.__name__ = name
+        self.tables: Dict[str, DataContainer] = {}
+        self.experiments: Dict[str, pd.DataFrame] = {}
+        self.models: Dict[str, Tuple[Any, List[str]]] = {}
+        self.functions: Dict[str, Callable] = {}
+        self.function_lists: List[FunctionDescription] = []
@@ -113,7 +113,11 @@ def median(df:pd.DataFrame) -> pd.DataFrame:
     _global, _local = get_caller_global_local_vars()
 
     dag = FugueSQLWorkflow()
-    dfs = {} if ctx is None else {k: dag.df(v.df) for k, v in ctx.tables.items()}
+    dfs = (
+        {}
+        if ctx is None
+        else {k: dag.df(v.df) for k, v in ctx.schema[ctx.schema_name].tables.items()}
+    )
     result = dag._sql(sql, _global, _local, **dfs)
     dag.run(DaskSQLExecutionEngine(conf=fugue_conf))
 
 
@@ -90,6 +90,9 @@ def _set_or_check_java_home():
 DaskScalarFunction = com.dask.sql.schema.DaskScalarFunction
 DaskSchema = com.dask.sql.schema.DaskSchema
 RelationalAlgebraGenerator = com.dask.sql.application.RelationalAlgebraGenerator
+RelationalAlgebraGeneratorBuilder = (
+    com.dask.sql.application.RelationalAlgebraGeneratorBuilder
+)
 SqlTypeName = org.apache.calcite.sql.type.SqlTypeName
 ValidationException = org.apache.calcite.tools.ValidationException
 SqlParseException = org.apache.calcite.sql.parser.SqlParseException
 
@@ -2,30 +2,36 @@
 from .columns import ShowColumnsPlugin
 from .create_experiment import CreateExperimentPlugin
 from .create_model import CreateModelPlugin
+from .create_schema import CreateSchemaPlugin
 from .create_table import CreateTablePlugin
 from .create_table_as import CreateTableAsPlugin
 from .describe_model import ShowModelParamsPlugin
 from .drop_model import DropModelPlugin
+from .drop_schema import DropSchemaPlugin
 from .drop_table import DropTablePlugin
 from .export_model import ExportModelPlugin
 from .predict import PredictModelPlugin
 from .schemas import ShowSchemasPlugin
 from .show_models import ShowModelsPlugin
+from .switch_schema import SwitchSchemaPlugin
 from .tables import ShowTablesPlugin
 
 __all__ = [
     AnalyzeTablePlugin,
+    CreateExperimentPlugin,
     CreateModelPlugin,
+    CreateSchemaPlugin,
     CreateTableAsPlugin,
     CreateTablePlugin,
     DropModelPlugin,
+    DropSchemaPlugin,
     DropTablePlugin,
+    ExportModelPlugin,
     PredictModelPlugin,
     ShowColumnsPlugin,
+    ShowModelParamsPlugin,
+    ShowModelsPlugin,
     ShowSchemasPlugin,
     ShowTablesPlugin,
-    ShowModelsPlugin,
-    ShowModelParamsPlugin,
-    ExportModelPlugin,
-    CreateExperimentPlugin,
+    SwitchSchemaPlugin,
 ]
@@ -4,7 +4,6 @@
 from dask_sql.datacontainer import ColumnContainer, DataContainer
 from dask_sql.mappings import python_to_sql_type
 from dask_sql.physical.rel.base import BaseRelPlugin
-from dask_sql.utils import get_table_from_compound_identifier
 
 
 class AnalyzeTablePlugin(BaseRelPlugin):
@@ -28,8 +27,8 @@ class AnalyzeTablePlugin(BaseRelPlugin):
     def convert(
         self, sql: "org.apache.calcite.sql.SqlNode", context: "dask_sql.Context"
     ) -> DataContainer:
-        components = list(map(str, sql.getTableName().names))
-        dc = get_table_from_compound_identifier(context, components)
+        schema_name, name = context.fqn(sql.getTableName())
+        dc = context.schema[schema_name].tables[name]
         columns = list(map(str, sql.getColumnList()))
 
         if not columns:
 
@@ -4,7 +4,6 @@
 from dask_sql.datacontainer import ColumnContainer, DataContainer
 from dask_sql.mappings import python_to_sql_type
 from dask_sql.physical.rel.base import BaseRelPlugin
-from dask_sql.utils import get_table_from_compound_identifier
 
 
 class ShowColumnsPlugin(BaseRelPlugin):
@@ -22,8 +21,8 @@ class ShowColumnsPlugin(BaseRelPlugin):
     def convert(
         self, sql: "org.apache.calcite.sql.SqlNode", context: "dask_sql.Context"
     ) -> DataContainer:
-        components = list(map(str, sql.getTable().names))
-        dc = get_table_from_compound_identifier(context, components)
+        schema_name, name = context.fqn(sql.getTable())
+        dc = context.schema[schema_name].tables[name]
 
         cols = dc.column_container.columns
         dtypes = list(map(lambda x: str(python_to_sql_type(x)).lower(), dc.df.dtypes))
 
@@ -98,10 +98,10 @@ def convert(
         self, sql: "org.apache.calcite.sql.SqlNode", context: "dask_sql.Context"
     ) -> DataContainer:
         select = sql.getSelect()
-        experiment_name = str(sql.getExperimentName())
+        schema_name, experiment_name = context.fqn(sql.getExperimentName())
         kwargs = convert_sql_kwargs(sql.getKwargs())
 
-        if experiment_name in context.experiments:
+        if experiment_name in context.schema[schema_name].experiments:
             if sql.getIfNotExists():
                 return
             elif not sql.getReplace():
@@ -175,6 +175,7 @@ def convert(
                 experiment_name,
                 ParallelPostFit(estimator=search.best_estimator_),
                 X.columns,
+                schema_name=schema_name,
             )
 
         if automl_class:
@@ -198,9 +199,12 @@ def convert(
                 experiment_name,
                 ParallelPostFit(estimator=automl.fitted_pipeline_),
                 X.columns,
+                schema_name=schema_name,
             )
 
-        context.register_experiment(experiment_name, experiment_results=df)
+        context.register_experiment(
+            experiment_name, experiment_results=df, schema_name=schema_name
+        )
         cc = ColumnContainer(df.columns)
         dc = DataContainer(dd.from_pandas(df, npartitions=1), cc)
         return dc
@@ -105,10 +105,10 @@ def convert(
         self, sql: "org.apache.calcite.sql.SqlNode", context: "dask_sql.Context"
     ) -> DataContainer:
         select = sql.getSelect()
-        model_name = str(sql.getModelName())
+        schema_name, model_name = context.fqn(sql.getModelName())
         kwargs = convert_sql_kwargs(sql.getKwargs())
 
-        if model_name in context.models:
+        if model_name in context.schema[schema_name].models:
             if sql.getIfNotExists():
                 return
             elif not sql.getReplace():
@@ -162,4 +162,4 @@ def convert(
             y = None
 
         model.fit(X, y, **fit_kwargs)
-        context.register_model(model_name, model, X.columns)
+        context.register_model(model_name, model, X.columns, schema_name=schema_name)
@@ -0,0 +1,40 @@
+import logging
+
+from dask_sql.datacontainer import DataContainer
+from dask_sql.physical.rel.base import BaseRelPlugin
+
+logger = logging.getLogger(__name__)
+
+
+class CreateSchemaPlugin(BaseRelPlugin):
+    """
+    Create a schema with the given name
+    and register it at the context.
+    The SQL call looks like
+
+        CREATE SCHEMA <schema-name>
+
+    Using this SQL is equivalent to just doing
+
+        context.create_schema(<schema-name>)
+
+    but can also be used without writing a single line of code.
+    Nothing is returned.
+    """
+
+    class_name = "com.dask.sql.parser.SqlCreateSchema"
+
+    def convert(
+        self, sql: "org.apache.calcite.sql.SqlNode", context: "dask_sql.Context"
+    ):
+        schema_name = str(sql.getSchemaName())
+
+        if schema_name in context.schema:
+            if sql.getIfNotExists():
+                return
+            elif not sql.getReplace():
+                raise RuntimeError(
+                    f"A Schema with the name {schema_name} is already present."
+                )
+
+        context.create_schema(schema_name)