FivetranAccessor.procesar_informe_publicitario#

FivetranAccessor.process_ad_reporting(value_columns='impressions', *, date_col='date_day', platform_col='platform', agg='sum', fill_value=0.0, include_missing_dates=False, freq='D', rename_date_to='date')[fuente]#

Procesar las tablas de informes de Fivetran en características amplias y listas para el modelo.

Compatible con las tablas del esquema de informes de anuncios de Fivetran:

  • ad_reporting__account_report: métricas diarias por cuenta

  • ad_reporting__campaign_report: métricas diarias por campaña y cuenta

  • ad_reporting__ad_group_report: métricas diarias por grupo de anuncios, campaña y cuenta

  • ad_reporting__ad_report: métricas diarias por anuncio, grupo de anuncios, campaña y cuenta

Los datos de entrada deben incluir una columna de fecha, una columna de plataforma (por ejemplo, nombre del proveedor) y una o más columnas de métricas como gasto o impresiones. La salida es un dataframe amplio con una fila por fecha y columnas nombradas {platform}_{metric}.

This function supports multiple DataFrame backends including pandas, polars, and PySpark. The output type will match the input type (type preservation).

Parámetros:
dfDataFrame-like

Input dataframe in long format with at least the date, platform, and metric columns. Accepts pandas.DataFrame, polars.DataFrame, polars.LazyFrame, or pyspark.DataFrame.

value_columns : str o Sequence[str], predeterminado «impressions»python:str o Secuencia[python:str], predeterminado «impressions»

Nombre(s) de columna para agregar y pivotar. Ejemplo: «spend» o [«spend», «impressions»].

date_col : str, predeterminado «date_day»python:str, predeterminado «date_day»

Nombre de la columna de fecha.

platform_col : str, predeterminado «platform»python:str, predeterminado «plataforma»

Nombre de la columna de la plataforma (proveedor).

agg : str, predeterminado «sum»python:str, predeterminado «sum»

Aggregation method applied during groupby. Supported: “sum”, “mean”, “min”, “max”, “count”.

fill_value : float o None, valor por defecto 0.0python:float o python:None, predeterminado 0.0

Valor utilizado para rellenar los valores faltantes en la salida amplia. Si None, los valores faltantes se dejan como NaN.

include_missing_dates : bool, predeterminado Falsebool, valor predeterminado python:False

Si True, incluya un rango de fechas continuo y complete las fechas faltantes utilizando fill_value.

freq : str, predeterminado «D»python:str, predeterminado «D»

Frecuencia utilizada cuando include_missing_dates es True.

rename_date_to : str o None, por defecto «date»python:str o python:None, predeterminado «date»

Si se proporciona, renombre la columna de fecha en el resultado a este valor. Si es None, mantenga date_col.

Devoluciones:
DataFrame-like

A wide-format dataframe with one row per date and columns for each {platform}_{metric} combination. The return type matches the input type.

Notes

Backend-specific implementation notes:

  • PySpark: Uses native PySpark pivot operations for distributed computing. This is a temporary workaround until narwhals adds LazyFrame.pivot support. See: narwhals-dev/narwhals#1901

  • pandas/polars: Uses narwhals pivot operations (works on eager DataFrames).

  • polars.LazyFrame: Input LazyFrames are automatically collected to eager DataFrames for the pivot operation, then results are returned as eager DataFrames.