FivetranAccessor.procesar_informe_publicitario#
- FivetranAccessor.process_ad_reporting(value_columns='impressions', *, date_col='date_day', platform_col='platform', agg='sum', fill_value=0.0, include_missing_dates=False, freq='D', rename_date_to='date')[fuente]#
Procesar las tablas de informes de Fivetran en características amplias y listas para el modelo.
Compatible con las tablas del esquema de informes de anuncios de Fivetran:
ad_reporting__account_report: métricas diarias por cuenta
ad_reporting__campaign_report: métricas diarias por campaña y cuenta
ad_reporting__ad_group_report: métricas diarias por grupo de anuncios, campaña y cuenta
ad_reporting__ad_report: métricas diarias por anuncio, grupo de anuncios, campaña y cuenta
Los datos de entrada deben incluir una columna de fecha, una columna de plataforma (por ejemplo, nombre del proveedor) y una o más columnas de métricas como
gastooimpresiones. La salida es un dataframe amplio con una fila por fecha y columnas nombradas{platform}_{metric}.This function supports multiple DataFrame backends including pandas, polars, and PySpark. The output type will match the input type (type preservation).
- Parámetros:
- dfDataFrame-like
Input dataframe in long format with at least the date, platform, and metric columns. Accepts pandas.DataFrame, polars.DataFrame, polars.LazyFrame, or pyspark.DataFrame.
- value_columns :
stroSequence[str], predeterminado «impressions»python:str o Secuencia[python:str], predeterminado «impressions» Nombre(s) de columna para agregar y pivotar. Ejemplo: «spend» o [«spend», «impressions»].
- date_col :
str, predeterminado «date_day»python:str, predeterminado «date_day» Nombre de la columna de fecha.
- platform_col :
str, predeterminado «platform»python:str, predeterminado «plataforma» Nombre de la columna de la plataforma (proveedor).
- agg :
str, predeterminado «sum»python:str, predeterminado «sum» Aggregation method applied during groupby. Supported: “sum”, “mean”, “min”, “max”, “count”.
- fill_value :
floatoNone, valor por defecto 0.0python:float o python:None, predeterminado 0.0 Valor utilizado para rellenar los valores faltantes en la salida amplia. Si
None, los valores faltantes se dejan como NaN.- include_missing_dates : bool, predeterminado
Falsebool, valor predeterminado python:False Si
True, incluya un rango de fechas continuo y complete las fechas faltantes utilizandofill_value.- freq :
str, predeterminado «D»python:str, predeterminado «D» Frecuencia utilizada cuando
include_missing_datesesTrue.- rename_date_to :
stroNone, por defecto «date»python:str o python:None, predeterminado «date» Si se proporciona, renombre la columna de fecha en el resultado a este valor. Si es
None, mantengadate_col.
- Devoluciones:
- DataFrame-like
A wide-format dataframe with one row per date and columns for each
{platform}_{metric}combination. The return type matches the input type.
Notes
Backend-specific implementation notes:
PySpark: Uses native PySpark pivot operations for distributed computing. This is a temporary workaround until narwhals adds LazyFrame.pivot support. See: narwhals-dev/narwhals#1901
pandas/polars: Uses narwhals pivot operations (works on eager DataFrames).
polars.LazyFrame: Input LazyFrames are automatically collected to eager DataFrames for the pivot operation, then results are returned as eager DataFrames.