New JSON design for query views (#2118)

* Refs #2111, closes #2110 * New Context dataclass/subclass mechanism, refs #2127 * Define QueryContext and extract get_tables() method, refs #2127 * Fix OPTIONS bug by porting DaatbaseView to be a View subclass * Expose async_view_for_class.view_class for test_routes test * Error/truncated aruments for renderers, closes #2130
2025-12-10 16:51:24 +01:00 · 2023-08-07 18:47:39 -07:00 · 2023-08-07 18:47:39 -07:00 · 1377a290cd
commit 1377a290cd
parent 5139c0886a
15 changed files with 579 additions and 112 deletions
--- a/datasette/views/init.py
+++ b/datasette/views/init.py
@ -0,0 +1,3 @@
+class Context:
+    "Base class for all documented contexts"
+    pass
--- a/datasette/views/base.py
+++ b/datasette/views/base.py
@ -309,6 +309,8 @@ class DataView(BaseView):
                table=data.get("table"),
                request=request,
                view_name=self.name,
+                truncated=False,  # TODO: support this
+                error=data.get("error"),
                # These will be deprecated in Datasette 1.0:
                args=request.args,
                data=data,
--- a/datasette/views/database.py
+++ b/datasette/views/database.py
@ -1,17 +1,22 @@
-import os
+from asyncinject import Registry
+from dataclasses import dataclass, field
+from typing import Callable
+from urllib.parse import parse_qsl, urlencode
+import asyncio
 import hashlib
 import itertools
 import json
-from markupsafe import Markup, escape
-from urllib.parse import parse_qsl, urlencode
+import markupsafe
+import os
 import re
 import sqlite_utils
+import textwrap

-import markupsafe
-
+from datasette.database import QueryInterrupted
 from datasette.utils import (
    add_cors_headers,
    await_me_maybe,
+    call_with_supported_arguments,
    derive_named_parameters,
    format_bytes,
    tilde_decode,
@ -28,17 +33,19 @@ from datasette.utils import (
 from datasette.utils.asgi import AsgiFileDownload, NotFound, Response, Forbidden
 from datasette.plugins import pm

-from .base import BaseView, DatasetteError, DataView, _error
+from .base import BaseView, DatasetteError, DataView, View, _error, stream_csv


-class DatabaseView(DataView):
-    name = "database"
+class DatabaseView(View):
+    async def get(self, request, datasette):
+        format_ = request.url_vars.get("format") or "html"

-    async def data(self, request, default_labels=False, _size=None):
-        db = await self.ds.resolve_database(request)
+        await datasette.refresh_schemas()
+
+        db = await datasette.resolve_database(request)
        database = db.name

-        visible, private = await self.ds.check_visibility(
+        visible, private = await datasette.check_visibility(
            request.actor,
            permissions=[
                ("view-database", database),
@ -48,23 +55,23 @@ class DatabaseView(DataView):
        if not visible:
            raise Forbidden("You do not have permission to view this database")

-        metadata = (self.ds.metadata("databases") or {}).get(database, {})
-        self.ds.update_with_inherited_metadata(metadata)
+        sql = (request.args.get("sql") or "").strip()
+        if sql:
+            return await query_view(request, datasette)

-        if request.args.get("sql"):
-            sql = request.args.get("sql")
-            validate_sql_select(sql)
-            return await QueryView(self.ds).data(
-                request, sql, _size=_size, metadata=metadata
-            )
+        if format_ not in ("html", "json"):
+            raise NotFound("Invalid format: {}".format(format_))
+
+        metadata = (datasette.metadata("databases") or {}).get(database, {})
+        datasette.update_with_inherited_metadata(metadata)

        table_counts = await db.table_counts(5)
        hidden_table_names = set(await db.hidden_table_names())
        all_foreign_keys = await db.get_all_foreign_keys()

-        views = []
+        sql_views = []
        for view_name in await db.view_names():
-            view_visible, view_private = await self.ds.check_visibility(
+            view_visible, view_private = await datasette.check_visibility(
                request.actor,
                permissions=[
                    ("view-table", (database, view_name)),
@ -73,45 +80,19 @@ class DatabaseView(DataView):
                ],
            )
            if view_visible:
-                views.append(
+                sql_views.append(
                    {
                        "name": view_name,
                        "private": view_private,
                    }
                )

-        tables = []
-        for table in table_counts:
-            table_visible, table_private = await self.ds.check_visibility(
-                request.actor,
-                permissions=[
-                    ("view-table", (database, table)),
-                    ("view-database", database),
-                    "view-instance",
-                ],
-            )
-            if not table_visible:
-                continue
-            table_columns = await db.table_columns(table)
-            tables.append(
-                {
-                    "name": table,
-                    "columns": table_columns,
-                    "primary_keys": await db.primary_keys(table),
-                    "count": table_counts[table],
-                    "hidden": table in hidden_table_names,
-                    "fts_table": await db.fts_table(table),
-                    "foreign_keys": all_foreign_keys[table],
-                    "private": table_private,
-                }
-            )
-
-        tables.sort(key=lambda t: (t["hidden"], t["name"]))
+        tables = await get_tables(datasette, request, db)
        canned_queries = []
        for query in (
-            await self.ds.get_canned_queries(database, request.actor)
+            await datasette.get_canned_queries(database, request.actor)
        ).values():
-            query_visible, query_private = await self.ds.check_visibility(
+            query_visible, query_private = await datasette.check_visibility(
                request.actor,
                permissions=[
                    ("view-query", (database, query["name"])),
@ -125,7 +106,7 @@ class DatabaseView(DataView):
        async def database_actions():
            links = []
            for hook in pm.hook.database_actions(
-                datasette=self.ds,
+                datasette=datasette,
                database=database,
                actor=request.actor,
                request=request,
@ -137,36 +118,165 @@ class DatabaseView(DataView):

        attached_databases = [d.name for d in await db.attached_databases()]

-        allow_execute_sql = await self.ds.permission_allowed(
+        allow_execute_sql = await datasette.permission_allowed(
            request.actor, "execute-sql", database
        )
-        return (
-            {
-                "database": database,
-                "private": private,
-                "path": self.ds.urls.database(database),
-                "size": db.size,
-                "tables": tables,
-                "hidden_count": len([t for t in tables if t["hidden"]]),
-                "views": views,
-                "queries": canned_queries,
-                "allow_execute_sql": allow_execute_sql,
-                "table_columns": await _table_columns(self.ds, database)
-                if allow_execute_sql
-                else {},
-            },
-            {
-                "database_actions": database_actions,
-                "show_hidden": request.args.get("_show_hidden"),
-                "editable": True,
-                "metadata": metadata,
-                "allow_download": self.ds.setting("allow_download")
-                and not db.is_mutable
-                and not db.is_memory,
-                "attached_databases": attached_databases,
-            },
-            (f"database-{to_css_class(database)}.html", "database.html"),
+        json_data = {
+            "database": database,
+            "private": private,
+            "path": datasette.urls.database(database),
+            "size": db.size,
+            "tables": tables,
+            "hidden_count": len([t for t in tables if t["hidden"]]),
+            "views": sql_views,
+            "queries": canned_queries,
+            "allow_execute_sql": allow_execute_sql,
+            "table_columns": await _table_columns(datasette, database)
+            if allow_execute_sql
+            else {},
+        }
+
+        if format_ == "json":
+            response = Response.json(json_data)
+            if datasette.cors:
+                add_cors_headers(response.headers)
+            return response
+
+        assert format_ == "html"
+        alternate_url_json = datasette.absolute_url(
+            request,
+            datasette.urls.path(path_with_format(request=request, format="json")),
        )
+        templates = (f"database-{to_css_class(database)}.html", "database.html")
+        template = datasette.jinja_env.select_template(templates)
+        context = {
+            **json_data,
+            "database_actions": database_actions,
+            "show_hidden": request.args.get("_show_hidden"),
+            "editable": True,
+            "metadata": metadata,
+            "allow_download": datasette.setting("allow_download")
+            and not db.is_mutable
+            and not db.is_memory,
+            "attached_databases": attached_databases,
+            "database_color": lambda _: "#ff0000",
+            "alternate_url_json": alternate_url_json,
+            "select_templates": [
+                f"{'*' if template_name == template.name else ''}{template_name}"
+                for template_name in templates
+            ],
+        }
+        return Response.html(
+            await datasette.render_template(
+                templates,
+                context,
+                request=request,
+                view_name="database",
+            ),
+            headers={
+                "Link": '{}; rel="alternate"; type="application/json+datasette"'.format(
+                    alternate_url_json
+                )
+            },
+        )
+
+
+@dataclass
+class QueryContext:
+    database: str = field(metadata={"help": "The name of the database being queried"})
+    query: dict = field(
+        metadata={"help": "The SQL query object containing the `sql` string"}
+    )
+    canned_query: str = field(
+        metadata={"help": "The name of the canned query if this is a canned query"}
+    )
+    private: bool = field(
+        metadata={"help": "Boolean indicating if this is a private database"}
+    )
+    # urls: dict = field(
+    #     metadata={"help": "Object containing URL helpers like `database()`"}
+    # )
+    canned_write: bool = field(
+        metadata={"help": "Boolean indicating if this canned query allows writes"}
+    )
+    db_is_immutable: bool = field(
+        metadata={"help": "Boolean indicating if this database is immutable"}
+    )
+    error: str = field(metadata={"help": "Any query error message"})
+    hide_sql: bool = field(
+        metadata={"help": "Boolean indicating if the SQL should be hidden"}
+    )
+    show_hide_link: str = field(
+        metadata={"help": "The URL to toggle showing/hiding the SQL"}
+    )
+    show_hide_text: str = field(
+        metadata={"help": "The text for the show/hide SQL link"}
+    )
+    editable: bool = field(
+        metadata={"help": "Boolean indicating if the SQL can be edited"}
+    )
+    allow_execute_sql: bool = field(
+        metadata={"help": "Boolean indicating if custom SQL can be executed"}
+    )
+    tables: list = field(metadata={"help": "List of table objects in the database"})
+    named_parameter_values: dict = field(
+        metadata={"help": "Dictionary of parameter names/values"}
+    )
+    edit_sql_url: str = field(
+        metadata={"help": "URL to edit the SQL for a canned query"}
+    )
+    display_rows: list = field(metadata={"help": "List of result rows to display"})
+    columns: list = field(metadata={"help": "List of column names"})
+    renderers: dict = field(metadata={"help": "Dictionary of renderer name to URL"})
+    url_csv: str = field(metadata={"help": "URL for CSV export"})
+    show_hide_hidden: str = field(
+        metadata={"help": "Hidden input field for the _show_sql parameter"}
+    )
+    metadata: dict = field(metadata={"help": "Metadata about the query/database"})
+    database_color: Callable = field(
+        metadata={"help": "Function that returns a color for a given database name"}
+    )
+    table_columns: dict = field(
+        metadata={"help": "Dictionary of table name to list of column names"}
+    )
+    alternate_url_json: str = field(
+        metadata={"help": "URL for alternate JSON version of this page"}
+    )
+
+
+async def get_tables(datasette, request, db):
+    tables = []
+    database = db.name
+    table_counts = await db.table_counts(5)
+    hidden_table_names = set(await db.hidden_table_names())
+    all_foreign_keys = await db.get_all_foreign_keys()
+
+    for table in table_counts:
+        table_visible, table_private = await datasette.check_visibility(
+            request.actor,
+            permissions=[
+                ("view-table", (database, table)),
+                ("view-database", database),
+                "view-instance",
+            ],
+        )
+        if not table_visible:
+            continue
+        table_columns = await db.table_columns(table)
+        tables.append(
+            {
+                "name": table,
+                "columns": table_columns,
+                "primary_keys": await db.primary_keys(table),
+                "count": table_counts[table],
+                "hidden": table in hidden_table_names,
+                "fts_table": await db.fts_table(table),
+                "foreign_keys": all_foreign_keys[table],
+                "private": table_private,
+            }
+        )
+    tables.sort(key=lambda t: (t["hidden"], t["name"]))
+    return tables


 async def database_download(request, datasette):
@ -210,6 +320,244 @@ async def database_download(request, datasette):
    )


+async def query_view(
+    request,
+    datasette,
+    # canned_query=None,
+    # _size=None,
+    # named_parameters=None,
+    # write=False,
+):
+    db = await datasette.resolve_database(request)
+    database = db.name
+    # Flattened because of ?sql=&name1=value1&name2=value2 feature
+    params = {key: request.args.get(key) for key in request.args}
+    sql = None
+    if "sql" in params:
+        sql = params.pop("sql")
+    if "_shape" in params:
+        params.pop("_shape")
+
+    # extras come from original request.args to avoid being flattened
+    extras = request.args.getlist("_extra")
+
+    # TODO: Behave differently for canned query here:
+    await datasette.ensure_permissions(request.actor, [("execute-sql", database)])
+
+    _, private = await datasette.check_visibility(
+        request.actor,
+        permissions=[
+            ("view-database", database),
+            "view-instance",
+        ],
+    )
+
+    extra_args = {}
+    if params.get("_timelimit"):
+        extra_args["custom_time_limit"] = int(params["_timelimit"])
+
+    format_ = request.url_vars.get("format") or "html"
+    query_error = None
+    try:
+        validate_sql_select(sql)
+        results = await datasette.execute(
+            database, sql, params, truncate=True, **extra_args
+        )
+        columns = results.columns
+        rows = results.rows
+    except QueryInterrupted as ex:
+        raise DatasetteError(
+            textwrap.dedent(
+                """
+            <p>SQL query took too long. The time limit is controlled by the
+            <a href="https://docs.datasette.io/en/stable/settings.html#sql-time-limit-ms">sql_time_limit_ms</a>
+            configuration option.</p>
+            <textarea style="width: 90%">{}</textarea>
+            <script>
+            let ta = document.querySelector("textarea");
+            ta.style.height = ta.scrollHeight + "px";
+            </script>
+        """.format(
+                    markupsafe.escape(ex.sql)
+                )
+            ).strip(),
+            title="SQL Interrupted",
+            status=400,
+            message_is_html=True,
+        )
+    except sqlite3.DatabaseError as ex:
+        query_error = str(ex)
+        results = None
+        rows = []
+        columns = []
+    except (sqlite3.OperationalError, InvalidSql) as ex:
+        raise DatasetteError(str(ex), title="Invalid SQL", status=400)
+    except sqlite3.OperationalError as ex:
+        raise DatasetteError(str(ex))
+    except DatasetteError:
+        raise
+
+    # Handle formats from plugins
+    if format_ == "csv":
+
+        async def fetch_data_for_csv(request, _next=None):
+            results = await db.execute(sql, params, truncate=True)
+            data = {"rows": results.rows, "columns": results.columns}
+            return data, None, None
+
+        return await stream_csv(datasette, fetch_data_for_csv, request, db.name)
+    elif format_ in datasette.renderers.keys():
+        # Dispatch request to the correct output format renderer
+        # (CSV is not handled here due to streaming)
+        result = call_with_supported_arguments(
+            datasette.renderers[format_][0],
+            datasette=datasette,
+            columns=columns,
+            rows=rows,
+            sql=sql,
+            query_name=None,
+            database=database,
+            table=None,
+            request=request,
+            view_name="table",
+            truncated=results.truncated if results else False,
+            error=query_error,
+            # These will be deprecated in Datasette 1.0:
+            args=request.args,
+            data={"rows": rows, "columns": columns},
+        )
+        if asyncio.iscoroutine(result):
+            result = await result
+        if result is None:
+            raise NotFound("No data")
+        if isinstance(result, dict):
+            r = Response(
+                body=result.get("body"),
+                status=result.get("status_code") or 200,
+                content_type=result.get("content_type", "text/plain"),
+                headers=result.get("headers"),
+            )
+        elif isinstance(result, Response):
+            r = result
+            # if status_code is not None:
+            #     # Over-ride the status code
+            #     r.status = status_code
+        else:
+            assert False, f"{result} should be dict or Response"
+    elif format_ == "html":
+        headers = {}
+        templates = [f"query-{to_css_class(database)}.html", "query.html"]
+        template = datasette.jinja_env.select_template(templates)
+        alternate_url_json = datasette.absolute_url(
+            request,
+            datasette.urls.path(path_with_format(request=request, format="json")),
+        )
+        data = {}
+        headers.update(
+            {
+                "Link": '{}; rel="alternate"; type="application/json+datasette"'.format(
+                    alternate_url_json
+                )
+            }
+        )
+        metadata = (datasette.metadata("databases") or {}).get(database, {})
+        datasette.update_with_inherited_metadata(metadata)
+
+        renderers = {}
+        for key, (_, can_render) in datasette.renderers.items():
+            it_can_render = call_with_supported_arguments(
+                can_render,
+                datasette=datasette,
+                columns=data.get("columns") or [],
+                rows=data.get("rows") or [],
+                sql=data.get("query", {}).get("sql", None),
+                query_name=data.get("query_name"),
+                database=database,
+                table=data.get("table"),
+                request=request,
+                view_name="database",
+            )
+            it_can_render = await await_me_maybe(it_can_render)
+            if it_can_render:
+                renderers[key] = datasette.urls.path(
+                    path_with_format(request=request, format=key)
+                )
+
+        allow_execute_sql = await datasette.permission_allowed(
+            request.actor, "execute-sql", database
+        )
+
+        show_hide_hidden = ""
+        if metadata.get("hide_sql"):
+            if bool(params.get("_show_sql")):
+                show_hide_link = path_with_removed_args(request, {"_show_sql"})
+                show_hide_text = "hide"
+                show_hide_hidden = '<input type="hidden" name="_show_sql" value="1">'
+            else:
+                show_hide_link = path_with_added_args(request, {"_show_sql": 1})
+                show_hide_text = "show"
+        else:
+            if bool(params.get("_hide_sql")):
+                show_hide_link = path_with_removed_args(request, {"_hide_sql"})
+                show_hide_text = "show"
+                show_hide_hidden = '<input type="hidden" name="_hide_sql" value="1">'
+            else:
+                show_hide_link = path_with_added_args(request, {"_hide_sql": 1})
+                show_hide_text = "hide"
+        hide_sql = show_hide_text == "show"
+
+        r = Response.html(
+            await datasette.render_template(
+                template,
+                QueryContext(
+                    database=database,
+                    query={
+                        "sql": sql,
+                        # TODO: Params?
+                    },
+                    canned_query=None,
+                    private=private,
+                    canned_write=False,
+                    db_is_immutable=not db.is_mutable,
+                    error=query_error,
+                    hide_sql=hide_sql,
+                    show_hide_link=datasette.urls.path(show_hide_link),
+                    show_hide_text=show_hide_text,
+                    editable=True,  # TODO
+                    allow_execute_sql=allow_execute_sql,
+                    tables=await get_tables(datasette, request, db),
+                    named_parameter_values={},  # TODO
+                    edit_sql_url="todo",
+                    display_rows=await display_rows(
+                        datasette, database, request, rows, columns
+                    ),
+                    table_columns=await _table_columns(datasette, database)
+                    if allow_execute_sql
+                    else {},
+                    columns=columns,
+                    renderers=renderers,
+                    url_csv=datasette.urls.path(
+                        path_with_format(
+                            request=request, format="csv", extra_qs={"_size": "max"}
+                        )
+                    ),
+                    show_hide_hidden=markupsafe.Markup(show_hide_hidden),
+                    metadata=metadata,
+                    database_color=lambda _: "#ff0000",
+                    alternate_url_json=alternate_url_json,
+                ),
+                request=request,
+                view_name="database",
+            ),
+            headers=headers,
+        )
+    else:
+        assert False, "Invalid format: {}".format(format_)
+    if datasette.cors:
+        add_cors_headers(r.headers)
+    return r
+
+
 class QueryView(DataView):
    async def data(
        self,
@ -404,7 +752,7 @@ class QueryView(DataView):
                        display_value = plugin_display_value
                    else:
                        if value in ("", None):
-                            display_value = Markup("&nbsp;")
+                            display_value = markupsafe.Markup("&nbsp;")
                        elif is_url(str(display_value).strip()):
                            display_value = markupsafe.Markup(
                                '<a href="{url}">{truncated_url}</a>'.format(
@ -755,3 +1103,69 @@ async def _table_columns(datasette, database_name):
    for view_name in await db.view_names():
        table_columns[view_name] = []
    return table_columns
+
+
+async def display_rows(datasette, database, request, rows, columns):
+    display_rows = []
+    truncate_cells = datasette.setting("truncate_cells_html")
+    for row in rows:
+        display_row = []
+        for column, value in zip(columns, row):
+            display_value = value
+            # Let the plugins have a go
+            # pylint: disable=no-member
+            plugin_display_value = None
+            for candidate in pm.hook.render_cell(
+                row=row,
+                value=value,
+                column=column,
+                table=None,
+                database=database,
+                datasette=datasette,
+                request=request,
+            ):
+                candidate = await await_me_maybe(candidate)
+                if candidate is not None:
+                    plugin_display_value = candidate
+                    break
+            if plugin_display_value is not None:
+                display_value = plugin_display_value
+            else:
+                if value in ("", None):
+                    display_value = markupsafe.Markup("&nbsp;")
+                elif is_url(str(display_value).strip()):
+                    display_value = markupsafe.Markup(
+                        '<a href="{url}">{truncated_url}</a>'.format(
+                            url=markupsafe.escape(value.strip()),
+                            truncated_url=markupsafe.escape(
+                                truncate_url(value.strip(), truncate_cells)
+                            ),
+                        )
+                    )
+                elif isinstance(display_value, bytes):
+                    blob_url = path_with_format(
+                        request=request,
+                        format="blob",
+                        extra_qs={
+                            "_blob_column": column,
+                            "_blob_hash": hashlib.sha256(display_value).hexdigest(),
+                        },
+                    )
+                    formatted = format_bytes(len(value))
+                    display_value = markupsafe.Markup(
+                        '<a class="blob-download" href="{}"{}>&lt;Binary:&nbsp;{:,}&nbsp;byte{}&gt;</a>'.format(
+                            blob_url,
+                            ' title="{}"'.format(formatted)
+                            if "bytes" not in formatted
+                            else "",
+                            len(value),
+                            "" if len(value) == 1 else "s",
+                        )
+                    )
+                else:
+                    display_value = str(value)
+                    if truncate_cells and len(display_value) > truncate_cells:
+                        display_value = display_value[:truncate_cells] + "\u2026"
+            display_row.append(display_value)
+        display_rows.append(display_row)
+    return display_rows
--- a/datasette/views/table.py
+++ b/datasette/views/table.py
@ -833,6 +833,8 @@ async def table_view_traced(datasette, request):
            table=resolved.table,
            request=request,
            view_name="table",
+            truncated=False,
+            error=None,
            # These will be deprecated in Datasette 1.0:
            args=request.args,
            data=data,