Added support for generic types in `SqlBackend` #272

nfx · 2024-09-11T13:01:05Z

This PR adds the ability to use rich dataclasses like:

@dataclass
class Foo:
    first: str
    second: bool | None

@dataclass
class Nested:
    foo: Foo
    mapping: dict[str, int]
    array: list[int]

This PR adds the ability to use rich dataclasses like: ```python @DataClass class Foo: first: str second: bool | None @DataClass class Nested: foo: Foo mapping: dict[str, int] array: list[int] ```

github-actions · 2024-09-11T13:08:23Z

❌ 34/35 passed, 1 failed, 3 skipped, 38m35s total

❌ test_appends_complex_types: databricks.sdk.errors.platform.BadRequest: [INSUFFICIENT_PERMISSIONS] Insufficient privileges: (2.218s)

databricks.sdk.errors.platform.BadRequest: [INSUFFICIENT_PERMISSIONS] Insufficient privileges:
User does not have permission CREATE,USAGE on database `TEST_SCHEMA`. SQLSTATE: 42501
16:18 DEBUG [databricks.sdk] Loaded from environment
16:18 DEBUG [databricks.sdk] Ignoring pat auth, because metadata-service is preferred
16:18 DEBUG [databricks.sdk] Ignoring basic auth, because metadata-service is preferred
16:18 DEBUG [databricks.sdk] Attempting to configure auth: metadata-service
16:18 INFO [databricks.sdk] Using Databricks Metadata Service authentication
[gw9] linux -- Python 3.10.14 /home/runner/work/lsql/lsql/.venv/bin/python
16:18 DEBUG [databricks.sdk] Loaded from environment
16:18 DEBUG [databricks.sdk] Ignoring pat auth, because metadata-service is preferred
16:18 DEBUG [databricks.sdk] Ignoring basic auth, because metadata-service is preferred
16:18 DEBUG [databricks.sdk] Attempting to configure auth: metadata-service
16:18 INFO [databricks.sdk] Using Databricks Metadata Service authentication
16:18 DEBUG [databricks.labs.lsql.backends] [api][execute] CREATE TABLE IF NOT EXISTS hive_metastore.TEST_SCHEMA.txrOb (foo STRUCT<first:STRING,second:BOOLEAN>... (134 more bytes)
16:18 DEBUG [databricks.labs.lsql.core] Executing SQL statement: CREATE TABLE IF NOT EXISTS hive_metastore.TEST_SCHEMA.txrOb (foo STRUCT<first:STRING,second:BOOLEAN> NOT NULL, since DATE NOT NULL, created TIMESTAMP NOT NULL, mapping MAP<STRING,LONG> NOT NULL, array ARRAY<LONG> NOT NULL) USING DELTA
16:18 DEBUG [databricks.sdk] POST /api/2.0/sql/statements/
> {
>   "format": "JSON_ARRAY",
>   "statement": "CREATE TABLE IF NOT EXISTS hive_metastore.TEST_SCHEMA.txrOb (foo STRUCT<first:STRING,second:BOOLEAN>... (134 more bytes)",
>   "warehouse_id": "TEST_DEFAULT_WAREHOUSE_ID"
> }
< 200 OK
< {
<   "statement_id": "01ef7059-863c-1703-bf7a-63d64fd1bd7a",
<   "status": {
<     "error": {
<       "error_code": "BAD_REQUEST",
<       "message": "[INSUFFICIENT_PERMISSIONS] Insufficient privileges:\nUser does not have permission CREATE,USAGE o... (37 more bytes)"
<     },
<     "state": "FAILED"
<   }
< }
16:18 DEBUG [databricks.sdk] Loaded from environment
16:18 DEBUG [databricks.sdk] Ignoring pat auth, because metadata-service is preferred
16:18 DEBUG [databricks.sdk] Ignoring basic auth, because metadata-service is preferred
16:18 DEBUG [databricks.sdk] Attempting to configure auth: metadata-service
16:18 INFO [databricks.sdk] Using Databricks Metadata Service authentication
16:18 DEBUG [databricks.labs.lsql.backends] [api][execute] CREATE TABLE IF NOT EXISTS hive_metastore.TEST_SCHEMA.txrOb (foo STRUCT<first:STRING,second:BOOLEAN>... (134 more bytes)
16:18 DEBUG [databricks.labs.lsql.core] Executing SQL statement: CREATE TABLE IF NOT EXISTS hive_metastore.TEST_SCHEMA.txrOb (foo STRUCT<first:STRING,second:BOOLEAN> NOT NULL, since DATE NOT NULL, created TIMESTAMP NOT NULL, mapping MAP<STRING,LONG> NOT NULL, array ARRAY<LONG> NOT NULL) USING DELTA
16:18 DEBUG [databricks.sdk] POST /api/2.0/sql/statements/
> {
>   "format": "JSON_ARRAY",
>   "statement": "CREATE TABLE IF NOT EXISTS hive_metastore.TEST_SCHEMA.txrOb (foo STRUCT<first:STRING,second:BOOLEAN>... (134 more bytes)",
>   "warehouse_id": "TEST_DEFAULT_WAREHOUSE_ID"
> }
< 200 OK
< {
<   "statement_id": "01ef7059-863c-1703-bf7a-63d64fd1bd7a",
<   "status": {
<     "error": {
<       "error_code": "BAD_REQUEST",
<       "message": "[INSUFFICIENT_PERMISSIONS] Insufficient privileges:\nUser does not have permission CREATE,USAGE o... (37 more bytes)"
<     },
<     "state": "FAILED"
<   }
< }
[gw9] linux -- Python 3.10.14 /home/runner/work/lsql/lsql/.venv/bin/python

_{Running from acceptance #383}

JCZuurmond

Have some comments, no implementation changes. Please add an integration test showing that the tables can be created for a dataclass with complex types

src/databricks/labs/lsql/structs.py

JCZuurmond · 2024-09-11T13:41:27Z

src/databricks/labs/lsql/structs.py

+            prefix = f"{prefix}: "
+        raise StructInferError(f"{prefix}unsupported type: {type_ref.__name__}")
+
+    def _infer_nullable(self, type_ref: type, path: list[str]) -> SqlType:


I think we infer a union type here, but we only support the nullable as outcome:

Suggested change

def _infer_nullable(self, type_ref: type, path: list[str]) -> SqlType:

def _infer_union(self, type_ref: type, path: list[str]) -> SqlType:

we're using spark types here

tests/unit/test_backends.py

tests/unit/test_structs.py