FivetranAccessor.procesar_informe_publicitario#

FivetranAccessor.process_ad_reporting(value_columns='impressions', *, date_col='date_day', platform_col='platform', agg='sum', fill_value=0.0, include_missing_dates=False, freq='D', rename_date_to='date')[fuente]#

Procesar las tablas de informes de Fivetran en características amplias y listas para el modelo.

Compatible con las tablas del esquema de informes de anuncios de Fivetran:

ad_reporting__account_report: métricas diarias por cuenta
ad_reporting__campaign_report: métricas diarias por campaña y cuenta
ad_reporting__ad_group_report: métricas diarias por grupo de anuncios, campaña y cuenta
ad_reporting__ad_report: métricas diarias por anuncio, grupo de anuncios, campaña y cuenta

Los datos de entrada deben incluir una columna de fecha, una columna de plataforma (por ejemplo, nombre del proveedor) y una o más columnas de métricas como gasto o impresiones. La salida es un dataframe amplio con una fila por fecha y columnas nombradas {platform}_{metric}.

This function supports multiple DataFrame backends including pandas, polars, and PySpark. The output type will match the input type (type preservation).

Parámetros:

dfDataFrame-like: Input dataframe in long format with at least the date, platform, and metric columns. Accepts pandas.DataFrame, polars.DataFrame, polars.LazyFrame, or pyspark.DataFrame.
value_columns : str o Sequence[str], predeterminado «impressions»python:str o Secuencia[python:str], predeterminado «impressions»: Nombre(s) de columna para agregar y pivotar. Ejemplo: «spend» o [«spend», «impressions»].
date_col : str, predeterminado «date_day»python:str, predeterminado «date_day»: Nombre de la columna de fecha.
platform_col : str, predeterminado «platform»python:str, predeterminado «plataforma»: Nombre de la columna de la plataforma (proveedor).
agg : str, predeterminado «sum»python:str, predeterminado «sum»: Aggregation method applied during groupby. Supported: “sum”, “mean”, “min”, “max”, “count”.
fill_value : float o None, valor por defecto 0.0python:float o python:None, predeterminado 0.0: Valor utilizado para rellenar los valores faltantes en la salida amplia. Si None, los valores faltantes se dejan como NaN.
include_missing_dates : bool, predeterminado Falsebool, valor predeterminado python:False: Si True, incluya un rango de fechas continuo y complete las fechas faltantes utilizando fill_value.
freq : str, predeterminado «D»python:str, predeterminado «D»: Frecuencia utilizada cuando include_missing_dates es True.
rename_date_to : str o None, por defecto «date»python:str o python:None, predeterminado «date»: Si se proporciona, renombre la columna de fecha en el resultado a este valor. Si es None, mantenga date_col.

Devoluciones:

DataFrame-like: A wide-format dataframe with one row per date and columns for each {platform}_{metric} combination. The return type matches the input type.

Notes

Backend-specific implementation notes:

PySpark: Uses native PySpark pivot operations for distributed computing. This is a temporary workaround until narwhals adds LazyFrame.pivot support. See: narwhals-dev/narwhals#1901
pandas/polars: Uses narwhals pivot operations (works on eager DataFrames).
polars.LazyFrame: Input LazyFrames are automatically collected to eager DataFrames for the pivot operation, then results are returned as eager DataFrames.