api/app_analytics/influxdb_wrapper.py

import logging
import typing
from collections import defaultdict

from django.conf import settings
from influxdb_client import InfluxDBClient, Point
from influxdb_client.client.exceptions import InfluxDBError
from influxdb_client.client.write_api import SYNCHRONOUS
from sentry_sdk import capture_exception
from urllib3 import Retry
from urllib3.exceptions import HTTPError

from .dataclasses import FeatureEvaluationData, UsageData
from .influxdb_schema import FeatureEvaluationDataSchema, UsageDataSchema

logger = logging.getLogger(__name__)

url = settings.INFLUXDB_URL
token = settings.INFLUXDB_TOKEN
influx_org = settings.INFLUXDB_ORG
read_bucket = settings.INFLUXDB_BUCKET + "_downsampled_15m"

range_bucket_mappings = {
    "24h": settings.INFLUXDB_BUCKET + "_downsampled_15m",
    "7d": settings.INFLUXDB_BUCKET + "_downsampled_15m",
    "30d": settings.INFLUXDB_BUCKET + "_downsampled_1h",
}
retries = Retry(connect=3, read=3, redirect=3)
# Set a timeout to prevent threads being potentially stuck open due to network weirdness
influxdb_client = InfluxDBClient(
    url=url, token=token, org=influx_org, retries=retries, timeout=3000
)

DEFAULT_DROP_COLUMNS = (
    "organisation",
    "organisation_id",
    "type",
    "project",
    "project_id",
    "environment",
    "environment_id",
    "host",
)


class InfluxDBWrapper:
    def __init__(self, name):
        self.name = name
        self.records = []
        self.write_api = influxdb_client.write_api(write_options=SYNCHRONOUS)

    def add_data_point(self, field_name, field_value, tags=None):
        point = Point(self.name)
        point.field(field_name, field_value)

        if tags is not None:
            for tag_key, tag_value in tags.items():
                point = point.tag(tag_key, tag_value)

        self.records.append(point)

    def write(self):
        try:
            self.write_api.write(bucket=settings.INFLUXDB_BUCKET, record=self.records)
        except (HTTPError, InfluxDBError) as e:
            logger.warning(
                "Failed to write records to Influx: %s",
                str(e),
                exc_info=e,
            )
            logger.debug(
                "Records: %s. Bucket: %s",
                self.records,
                settings.INFLUXDB_BUCKET,
            )

    @staticmethod
    def influx_query_manager(
        date_range: str = "30d",
        date_stop: str = "now()",
        drop_columns: typing.Tuple[str, ...] = DEFAULT_DROP_COLUMNS,
        filters: str = "|> filter(fn:(r) => r._measurement == 'api_call')",
        extra: str = "",
        bucket: str = read_bucket,
    ):
        query_api = influxdb_client.query_api()
        drop_columns_input = str(list(drop_columns)).replace("'", '"')

        query = (
            f'from(bucket:"{bucket}")'
            f" |> range(start: -{date_range}, stop: {date_stop})"
            f" {filters}"
            f" |> drop(columns: {drop_columns_input})"
            f"{extra}"
        )
        logger.debug("Running query in influx: \n\n %s", query)

        try:
            result = query_api.query(org=influx_org, query=query)
            return result
        except HTTPError as e:
            capture_exception(e)
            return []


def get_events_for_organisation(organisation_id: id, date_range: str = "30d") -> int:
    """
    Query influx db for usage for given organisation id

    :param organisation_id: an id of the organisation to get usage for
    :return: a number of request counts for organisation
    """
    result = InfluxDBWrapper.influx_query_manager(
        filters=build_filter_string(
            [
                'r._measurement == "api_call"',
                'r["_field"] == "request_count"',
                f'r["organisation_id"] == "{organisation_id}"',
            ]
        ),
        drop_columns=(
            "organisation",
            "project",
            "project_id",
            "environment",
            "environment_id",
        ),
        extra="|> sum()",
        date_range=date_range,
    )

    total = 0
    for table in result:
        for record in table.records:
            total += record.get_value()

    return total


def get_event_list_for_organisation(organisation_id: int, date_range: str = "30d"):
    """
    Query influx db for usage for given organisation id

    :param organisation_id: an id of the organisation to get usage for

    :return: a number of request counts for organisation in chart.js scheme
    """
    results = InfluxDBWrapper.influx_query_manager(
        filters=f'|> filter(fn:(r) => r._measurement == "api_call") \
                  |> filter(fn: (r) => r["organisation_id"] == "{organisation_id}")',
        extra="|> aggregateWindow(every: 24h, fn: sum)",
        date_range=date_range,
    )
    dataset = defaultdict(list)
    labels = []
    for result in results:
        for record in result.records:
            dataset[record["resource"]].append(record["_value"])
            required_records = int(date_range[:-1]) + 1
            if len(labels) != required_records:
                labels.append(record.values["_time"].strftime("%Y-%m-%d"))
    return dataset, labels


def get_multiple_event_list_for_organisation(
    organisation_id: int,
    project_id: int = None,
    environment_id: int = None,
):
    """
    Query influx db for usage for given organisation id

    :param organisation_id: an id of the organisation to get usage for
    :param project_id: optionally filter by project id
    :param environment_id: optionally filter by an environment id

    :return: a number of requests for flags, traits, identities, environment-document
    """

    filters = [
        'r._measurement == "api_call"',
        f'r["organisation_id"] == "{organisation_id}"',
    ]

    if project_id:
        filters.append(f'r["project_id"] == "{project_id}"')

    if environment_id:
        filters.append(f'r["environment_id"] == "{environment_id}"')

    results = InfluxDBWrapper.influx_query_manager(
        filters=build_filter_string(filters),
        extra="|> aggregateWindow(every: 24h, fn: sum)",
    )
    if not results:
        return results

    dataset = [{} for _ in range(len(results[0].records))]

    for result in results:
        for i, record in enumerate(result.records):
            dataset[i][record.values["resource"].capitalize()] = record.values["_value"]
            dataset[i]["name"] = record.values["_time"].strftime("%Y-%m-%d")
    return dataset


def get_usage_data(
    organisation_id: int, project_id: int = None, environment_id=None
) -> typing.List[UsageData]:
    events_list = get_multiple_event_list_for_organisation(
        organisation_id, project_id, environment_id
    )
    return UsageDataSchema(many=True).load(events_list)


def get_multiple_event_list_for_feature(
    environment_id: int,
    feature_name: str,
    period: str = "30d",
    aggregate_every: str = "24h",
) -> typing.List[dict]:
    """
    Get aggregated request data for the given feature in a given environment across
    all time, aggregated into time windows of length defined by the period argument.

    Example data structure
    [
        {
            "first_feature_name": 13,  // feature name and number of requests
            "datetime": '2020-12-18'
        },
        {
            "first_feature_name": 15,
            "datetime": '2020-11-18'  // 30 days prior
        }
    ]

    :param environment_id: an id of the environment to get usage for
    :param feature_name: the name of the feature to get usage for
    :param period: the influx time period to filter on, e.g. 30d, 7d, etc.
    :param aggregate_every: the influx time period to aggregate the data by, e.g. 24h

    :return: a list of dicts with feature and request count in a specific environment
    """

    results = InfluxDBWrapper.influx_query_manager(
        date_range=period,
        filters=f'|> filter(fn:(r) => r._measurement == "feature_evaluation") \
                  |> filter(fn: (r) => r["_field"] == "request_count") \
                  |> filter(fn: (r) => r["environment_id"] == "{environment_id}") \
                  |> filter(fn: (r) => r["feature_id"] == "{feature_name}")',
        extra=f'|> aggregateWindow(every: {aggregate_every}, fn: sum, createEmpty: false) \
                   |> yield(name: "sum")',
    )
    if not results:
        return []

    dataset = [{} for _ in range(len(results[0].records))]

    # Iterating over Influx data looking for feature_id, and adding proper requests value and datetime to it
    # todo move it to marshmallow schema
    for result in results:
        for i, record in enumerate(result.records):
            dataset[i][record.values["feature_id"]] = record.values["_value"]
            dataset[i]["datetime"] = record.values["_time"].strftime("%Y-%m-%d")

    return dataset


def get_feature_evaluation_data(
    feature_name: str, environment_id: int, period: str = "30d"
) -> typing.List[FeatureEvaluationData]:
    data = get_multiple_event_list_for_feature(
        feature_name=feature_name, environment_id=environment_id, period=period
    )
    return FeatureEvaluationDataSchema(many=True).load(data)


def get_top_organisations(date_range: str, limit: str = ""):
    """
    Query influx db top used organisations

    :param date_range: data range for top organisations
    :param limit: limit for query


    :return: top organisations in descending order based on api calls.
    """
    if limit:
        limit = f"|> limit(n:{limit})"

    bucket = range_bucket_mappings[date_range]
    results = InfluxDBWrapper.influx_query_manager(
        date_range=date_range,
        bucket=bucket,
        filters='|> filter(fn:(r) => r._measurement == "api_call") \
                    |> filter(fn: (r) => r["_field"] == "request_count")',
        drop_columns=("_start", "_stop", "_time"),
        extra='|> group(columns: ["organisation"]) \
              |> sum() \
              |> group() \
              |> sort(columns: ["_value"], desc: true) '
        + limit,
    )

    dataset = {}
    for result in results:
        for record in result.records:
            try:
                org_id = int(record.values["organisation"].partition("-")[0])
                dataset[org_id] = record.get_value()
            except ValueError:
                logger.warning(
                    "Bad InfluxDB data found with organisation %s"
                    % record.values["organisation"].partition("-")[0]
                )

    return dataset


def get_current_api_usage(organisation_id: int, date_range: str) -> int:
    """
    Query influx db for api usage

    :param organisation_id: filtered organisation
    :param date_range: data range for current api usage window

    :return: number of current api calls
    """

    bucket = read_bucket
    results = InfluxDBWrapper.influx_query_manager(
        date_range=date_range,
        bucket=bucket,
        filters=build_filter_string(
            [
                'r._measurement == "api_call"',
                'r["_field"] == "request_count"',
                f'r["organisation_id"] == "{organisation_id}"',
            ]
        ),
        drop_columns=("_start", "_stop", "_time"),
        extra='|> sum() \
               |> group() \
               |> sort(columns: ["_value"], desc: true) ',
    )

    for result in results:
        # Return zero if there are no API calls recorded.
        if len(result.records) == 0:
            return 0

        return sum(r.get_value() for r in result.records)

    return 0


def build_filter_string(filter_expressions: typing.List[str]) -> str:
    return "|> ".join(
        ["", *[f"filter(fn: (r) => {exp})" for exp in filter_expressions]]
    )